统计学基础课后全部详细答案及讲解Word格式文档下载.docx
《统计学基础课后全部详细答案及讲解Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《统计学基础课后全部详细答案及讲解Word格式文档下载.docx(16页珍藏版)》请在冰豆网上搜索。
5.变量可分为分类变量、顺序变量、数值型变量。
同时数值型变量可
分为离散型变量和连续型变量。
6.离散型变量只能取有限个值,而且其取值都以整位数断开,可以一
一列举,例如“产品数量”、“企业数”。
连续型变量的取值指连续不
断的,不能一一列举。
例如“温度”、“年龄”。
二、练习题
1.
(1)数值型变量
(2)分类变量(3)数值型变量
(4)顺序变量(5)分类变量
2.
(1)这一研究的总体是IT从业者,样本是从IT从业者中抽取的
1000人,样本量是1000
(2)“月收入”是数值型变量
(3)“消费支付方式”是分类变量
3.
(1)这一研究的总体是所有的网上购物者
(2)“消费者在网上购物的原因”是分类变量
第二章
1:
答:
1:
普查的特点:
①:
普查通常是一次性的或周期性的;
②:
普查一般需要规定统一的调查时间;
③:
普查的数据一般比
较准确;
4:
普查的使用范围比较狭窄,只能调查一些最基本的、
特定的现象。
2:
抽样调查的特点:
经济性;
时效性强;
适应面广;
④:
准确性高。
2:
具体收集方法有:
询问调查:
a:
访问调查,b:
邮寄
调查,c:
电话调查,d:
计算机辅助调查,e:
座谈会,f:
个别
深度访问;
观察与实验:
观察法,b:
实验法。
3:
调查方案包括以下几个方面的内容:
调查目的、调查对
象和调查单位、调查项目、调查表等。
4:
⑴:
调查问卷指的是用来收集调查数据的一种工具,是
调查者根据调查目的和要求所设计的,由一系列问题、备选答案、
说明以及码表组成的一种调查形式:
⑵组成:
由开头部分、甄别
部分、主体部分和背景部分组成。
5:
注意的问题:
提问的内容尽可能的短;
用词要确切、
通俗;
一项提问只包括一项内容;
避免诱导性的问题;
⑤:
避免否定式的提问;
⑥:
避免敏感性的问题。
6:
方法主要有:
两项选择法、多项选择法、顺序选择法、评定
尺度法、双向列连法五种。
7:
问题设计时应注意的问题:
问题的安排应该具有逻辑性;
问题的顺序应该先易后难;
能引起被调查者兴趣的问题
先放在前面;
开放性问题放在后面。
第三章
数据预处理内容:
数据审核(完整性和准确性;
适用性和
实效性),数据筛选和数据排序.
区别:
首先:
条形图中的每一个矩形表示一个类别,其
宽度没有意义,而直方图的宽度则表示各组的组距;
其次:
由于
分组数据具有连续性,直方图的各矩形通常是连续排列的,而条
形是分开排列的;
最后:
条形图主要用于展示定性数据,而直方
图则主要是用于展示定量数据。
饼图只能显示一个样本各部分所占的比例,而环
形图可显示多个样本各部分所占的比例。
与直方图相比,茎叶图既能给出数据的分布状态况,又能给
出每一个原始数值,即保留了原始数据的信息。
而直方图虽然能
很好地显示数据的分布,但是不能保留数据的原始数据信息。
应注意的问题:
图标中应包括以下特征:
显示数据、②:
让读者把注意力集中在图形的内容上,而不是在绘制图形的程序
上、③:
避免歪曲、④:
强调数据之间的比较、⑤:
服务于一个
明确的目的、⑥:
有对图形的统计描述和文字说明。
第四章
1、一组数据的分布特征可以从三个方面进行测度:
一是分布的
集中趋势,反映各数据向其中心值靠拢或集中的程度:
二是分布
的离散程度,反映各数据远离其中心值的趋势;
三是分布的形状,
反映数据分布的偏态和峰态。
2、四分位数的计算方法:
四分位数是一组数据排序后处于25%
和75%位置上的值,根据原始数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。
3、几何平均数是指一组数据值的连乘积的数据值个数次方根。
比率数据属于相对数,它不能如绝对数那样对其进行累加,而只能对其进行连乘。
在实际应用中,对于比率数据的平均采用几何平均要比算数平均更合理。
4、众数是一组数据分布的最高峰点所对应的数值,不受极端值
的影响。
如果数据的分布没有明显的最高峰,众数也有可能不存在;
如果有两个或多个最高峰点,也可以有两个或多个众数。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据排序后处于中间位置上的变量值,不受极端值的影响。
主要适合作为顺序数据的集中趋势测度值,在研究收入分配是很有用。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
5、对于顺序数据,主要使用四分位差来测量其离散程度;
对于
数值型数据主要使用方差或标准差来测量其离散程度。
6、有了平均数和标准差之后,可以计算一组数据中每个数值的
标准分数,以测度每个数值在该组数据中的相对位置,并可以用
它来判断一组数据是否有离散点。
7、标准差是反映数据差异水平的绝对值。
一方面,标准差数值
的大小受原始数据绝对值大小的影响,绝对值大的,标准差的值
自然也就大,绝对值小的,标准差的值自然也就小;
另一方面,
标准差与原始数据的计量单位相同,采用不同计量单位计量的数
据,其标准差的值也就不同。
因此,对于不同组别的数据,如果
原始数据的绝对值相差较大或计量单位不同时,就不能用标准差
直接比较其离散程度,这时需要计算离散系数。
1.
(1)M0=10
中位数位置=n+1/2=10+1/2=5.5Me=10
n
xi
=24
1415=96/10=9
x=i1
10
(2)Q25%位置
Q
2.5
25%
4
47
2
5.5
Q75%位置
3n
7.5
75%
1212
12
x
(3)s=
i1
=(29.6)
(159.6)
4.2
1
101
2.
(1)依表数据可知M019M023,将数据排序,可得:
中位数位
置=
所以M=23
13
e
(2)
Q25%位置
25
6.25,Q25%190.25*(1919)19
Q75%位置
3*25
18.75,Q75%
250.75*(27-25)26.5
(3)
19
15
1723
24
(xi
x)
24)2
(23
1062
s
(19
n1
6.65
251
(4)从众数、中位数及平均数看,网民年龄大多在
23~24.标准
差较大,网民间年龄差异较大。
3.
(1)如图所示:
茎
叶
数据个数
5
6
7
8
3
13488
6.6
7.8
63
(2)x
9
s=
(5.5
7)2
(7.8
7)2
4.08
0.714
(3)因为两种排队方式平均数不同,所以只能用离散系数进行比
较。
v1=1.97
0.274;
v2
0.102因为v1>
v2,所以第一种方式离
7.2
散程度更大。
(4)选择第二种方式。
因为第二种的平均等待时间短,离散程度小于第一种,每位顾客等待时间差别小,更具有优势。
4.甲的平均成本=
总成本
2100
3000
1200
6600
19.41
总产量
3255
1500
342
20
30
乙的平均成本=
32551500
6255
18.29
两单位单位成本虽然一致,但乙企业中成本较低的产品比重较大,
从而拉低了总平均成本。
6.
(1)两位调查人员得到的平均身高相差不多,均值的大小并不
受样本大小的影响。
(2)两位调查人员得到的身高的平均差应该相差不打,因为标准差也并不受样本大小影响。
(3)所取样本较大的调查员获得身高最高或最低者的机会更大,因为样本取得越多,变化范围越大。
7.比较男女生体重差异,应用离散系数进行比较:
v女=5/50=0.1v男=5/60=0.08所以女生的体重差异较大。
(2)男生:
女生:
60*2.2
132磅,s
5*2.2
11磅
50*2.2
110磅,s
8.可以通过标准分数进行比较:
z
xAxA
115100
1;
zB
xBxB
425400
A
sB
0.5
sA
50
因为A项测试的平均分数高出
1个标准差,而B只高出0.5个,所
以A项测试比较理想。
9.
根据公式zi=xi
x得
日期周一周二周三周四周五周六周日
标准3-0.6-0.20.4-1.8-2.20
化值z
由图可知,周一和周六两天失去了控制。
10.
(1)应该采用离散系数,它避免了不同数据水平高低对其的影
响。
(2)成年组身高的离散系数:
vs=4.2/172.1=0.024幼儿组身高的离散系数:
vs=2.5/71.3=0.035
因为幼儿组身高的离散系数大于成年组的,所以幼儿组身高的离散程度相对较大。
11.
(1)应该从平均数和标准差两个方面进行评价,在对各种方法的
优劣进行评价时,应该用离散系数。
(2)如图所示:
方法A
方法B
方法C
平均数
165.6
128.73
125.53
中位数
165
129
126
众数
164
128
最大值
170
132
最小值
162
125
116
极差
标准差
2.13
1.75
2.77
离散系数
0.013
0.014
0.022
从三种方法的集中趋势看,A的平均产量、中位数以及众数最高
从离散程度看,A的离散系数最小,应该选择A。
12.
(1)应该用标准差来评价。
(2)从图中两种股票的离散程度可知,商业类股票的收益率的离散程度小,因而投资风险也较小。
(3)从投资获益角度我会选高科技类股票,高风险高回报;
从投
资风险角度,我会选商业类股票,风险较小。
如有侵权请联系告知删除,感谢你们的配合!