应用统计学课后习题与参考答案.docx
《应用统计学课后习题与参考答案.docx》由会员分享,可在线阅读,更多相关《应用统计学课后习题与参考答案.docx(38页珍藏版)》请在冰豆网上搜索。
应用统计学课后习题与参考答案
应用统计学课后习题与参考答案
第一章
、选择题
1.一个统计总体(D)。
A.只能有一个标志B.只能有一个指标
C.可以有多个标志D.可以有多个指标
2.对100名职工的工资收入情况进行调查,则总体单位是(
二、简答题
1.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?
总体是“所有的网上购物者”。
(2)“消费者在网上购物的原因”是定类变量、定序变量还是数值型变量?
分类变量。
(3)研究者所关心的参数是什么?
所有的网上购物者的月平均花费。
(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?
统计量。
(5)研究者所使用的主要是描述统计方法还是推断统计方法?
推断统计方法。
2.要调查某商场销售的全部冰箱情况,试指出总体、个体是什么?
试举若干品质标志、数量标志、数量指标和质量指标。
总体:
该商店销售的所有冰箱。
总体单位:
品质标志:
该商店销售的每一台冰相。
型号、产地、颜色。
数量标志:
容量、外形尺寸;
数量指标:
销售量、销售额。
质量扌曰标:
不合格率、平均每天销售量、每小时电消耗量。
、选择题
1.调查几个重要棉花产地,就可以了解我国棉花生产的基本情况和问题,这种调查属于(D)。
A.重点调查B.典型调查
7.
C.抽样调查D.人口普查
B)。
B.人口普查
D.工业企业基本情况调查
下列调查中,调查单位与填报单位一致的是(
A.企业设备调查
C.农村耕畜调查
、简答题
1.简述市场调查问卷的设计程序。
(1)准备阶段
(2)初步设计阶段
(3)试答和修改阶段
(4)印制问卷阶段
2.简述设置回答问题应注意的问题。
1)答案要穷尽
2)答案须互斥
3)避免问题与答案不一致
三、分析与论述题
结合实际,自选项目并设计一份统计调查问卷。
(答案略)
第三章
、选择题
1.统计数据的预处理不包括(C)。
C.统计数据的分组
2.统计分组的关键在于(C)。
A.确定分组标志
C.确定组距
3.将统计总体按某一标志分组的结果表现为(A)。
A.组内同质性,组间差异性B.组内差异性,组间同质性
C.组内差异性,组间差异性D.组内同质性,组间同质性
4.确定连续型变量的组限时,相邻两组的组限必须(B)。
A.不等B.重叠
C.间断D.没有要求
5.确定离散型变量的组限时,相邻两组的组限必须(C)。
A.
B.重叠
D.没有要求
B.各组分布次数与总次数之比
D.各组比率相互之比
不等
C.间断
6.在频数分布中,比率是指(B)。
A.各组分布次数比率之比
C.各组分布次数相互之比
7.工业企业按经济类型分组和工业企业按职工人数分组,两个统计分组是(D)。
A.按数量标志分组
B.按品质标志分组
C.前者按数量标志分组,后者按品质标志分组
D.前者按品质标志分组,后者按数量标志分组
8.等距数列中,组距的大小与组数的多少成(C)。
A.正比B.等比
C.反比D.不成比例
9.要准确地反映异距数列的实际分布情况,必须计算(D)。
A.次数B.次数密度
C.频率D.累计频率
10.在组距数列中,向下累计到某组的次数是100,这表示总体单位中(B)。
A.大于该组下限的累计次数是100B.小于该组下限的累计次数是100
C.大于该组上限的累计次数是100D.小于该组上限的累计次数是100
11.李明收集了近二十年来我国进出口贸易的相关资料,如果要反映这二十年我国进出口贸易的变化状况,用(D)最合适。
A.直方图B.散点图
C.饼图D.折线图
12.在对数据进行分组时,组距的大小与组数的多少成(B)。
A.正比B.反比
C.等比D.以上各种比例都有可能
、简答题(略)
1.什么是统计数据的预处理?
统计数据的预处理的意义有哪些?
2.什么是统计分组?
统计分组的作用有哪些?
3.简述统计表的构成及设计规则。
4.怎样确定开口组的组中值?
5.简述常见的几种统计图的概念以及应用范围。
三、计算题(参考例3.3)
1.某行业协会所属40个企业2009年的产品销售收入数据(单位:
万元)如下:
1521241291161001039295127104
10511911411587103118142135125
117108105110107137120136117108
9788123115119138112146113126
(1)根据上面的数据进行适当分组,编制频数分布表,并计算出累积频数和累积频率。
(2)按该行业协会有关规定,销售收入在125万元以上为先进企业,115万元〜125万
元为良好企业,105万元〜115万元为一般企业,105万元以下为落后企业,将上述销售收入数据按先进企业、良好企业、一般企业、落后企业进行分组。
2.某百货公司连续40天的商品销售如下(单位:
万元):
41
25
29
47
38
34
30
38
43
40
46
36
45
37
37
36
45
43
33
44
47
35
28
46
34
30
37
44
26
38
48
44
42
36
37
37
49
39
42
32
1)根据上面的数据进行适当的分组,编制频数分布表。
2)利用电子表格绘制频数分布的直方图(包括不可变直方图和可变直方图)和折线图。
第四章
、选择题
1.1990年发表的一篇文章讨论了男性和女性工商管理硕士(MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性工商管理硕士(MBA的平均起薪是54749美元,中
位数是47543美元,标准差是10250美元。
对样本均值可解释为(C)。
A.大多数女性工商管理硕士(MBA的起薪是54749美元
B.最常见到的起薪是54749美元
C.样本起薪的平均值为54749美元
D.有一半的起薪低于54749美元
2.同上题,对样本标准差可解释为(D)。
A.最高起薪与最低起薪之差是10250美元
B.
大多数的起薪在
44
499美元和
64
999美元之间
C.
大多数的起薪在
37
293美元和
57
793美元之间
D.
大多数的起薪在
23
999美元和
85
499美元之间
3.同上题,根据这些数据可以判断,女性工商管理硕士
A.尖峰,对称B.右偏
C.左偏D.均匀
4.美国10家公司在电视广告商的花费如下(百万美元)26.9,25,23.9,23,20,那么,样本方差为(B)。
A.19.5433B.381.939
C.18.5404D.343.745
5.美国10家公司在电视广告上的花费如下(百万美元)
26.9,25,23.9,23,20,那么,样本数据的中位数为(
A.28.46B.30.20
(MBA起薪的分布形状是(B)。
:
72,63.1,54.7,54.3,29,
:
72,63.1,54.7,54.3,29,
C)。
C.27.95D.28.12
6.对于右偏分布,均值、中位数和众数之间的关系是(
B.中位数〉均值〉众数
D.众数〉均值〉中位数
70分,最高分是96分,最低分是62分,根据这些信
B)。
A)。
A.均值〉中位数〉众数
C.众数〉中位数〉均值
7.某班学生的统计学平均成绩是
息,可以计算的离散程度的测度指标是(
A.方差
C.标准差
五所大学新生的教科书费用如下
B)。
A.92.965
C.83.1505
五种新型车的最高时速如下:
A.28.4165
C.25.4165
8.
方差是
9.
B.极差
D.变异系数
元):
200,250,375,125,280。
教科书费用的
D.
100,125,
B.
D.
10.大学生每学期花在教科书上的费用平均为
B.8642.56914.0
115,175,120。
它们的标准差为(A)。
807.5
646.0
280元,标准差为40元。
如果已知学生
在教科书上的花费是尖峰对称分布,则在教科书上的花费在
D)。
160元和320元之间的学生占
A.大约95%
C.大约81.5%
B.大约97.35%
D.大约84%
11•某班学生的平均成绩是180分,标准差是50分。
如果没有成绩分布的其他信息,
可以判断成绩在80到280分的学生占(A)。
A.
B.至少89%
大约95%
C.大约68%D.至少75%
12.
M,中位数M和平均
当某一分布为左偏分布时,测度集中趋势的三个统计量众数数X的关系为(D)。
A.MvMevX
C.xvMvMe
B.MevMvX
D.XvMevM
13.(B)是测度离散趋势的测度值。
A.平均数B.方差
C.中位数D.峰度
下列指标中,易受极端值影响的指标为(
A.众数
B)。
B.平均数
C.四分位数
D.中位数
下列有关变异系数的定义正确的是(
C)。
2
A.丄
2
B.二
n
X
C.g
D.X
15.
16.
s
x
、简答题
1.什么是数据的集中趋势,度量数据集中趋势的指标有哪些?
答题要点:
数据的集中趋势是度量一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的
位置所在。
集中趋势测度也就是寻找数据水平的代表值或中心值。
测度数据集中趋势的统计
量主要包括平均数、众数、中位数和分位数。
2.什么是数据的离散程度,度量数据离散程度的指标有哪些?
答题要点:
数据的离散程度是反映各变量值远离其中心值的程度,因此也称为离中趋势。
度量数据离散程度的指标主要有平均差、方差和标准差、极差、平均差以及变异系数等。
3.试回答在不同分布类型中(对称、左偏和右偏),比较平均数、众数和中位数之间的关系。
(1)如果数据的分布是对称的,那么众数(Mo)、中位数(Me)和平均数(X)必定相等,即Mo=Me=X;
(2)如果数据是左偏分布,那就说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为;
X:
:
Me:
:
M0;
(3)如果数据是右偏分布,那就说明数据存在极大值,必然拉动平均数向极大值一方靠,即Mo:
:
Me:
:
x。
第五章
一、选择题
1.已知总体的均值为100,标准差为10,从该总体中随机抽取容量为100的样本,则
样本均值抽样分布的标准误差为(0。
A.100B.10
C.1D.50
C)。
2•抽样平均误差,确切地说是所有样本指标(样本平均数和样本成数)的(
A.平均数B.全距
C.标准差D.离差系数
3•在不重置抽样中,抽样单位数从5%增加到20%抽样平均误差(C)。
A.增加39.7%B.增加约一半
C.减少约一半D.没有什么变化
4.
1/2,则样本容量(A)。
2倍
1/4倍
"两头小,中间大”分布;
在其他条件不变的情况下,如果允许误差范围缩小为原来的
A.扩大为原来的4倍B.扩大为原来的
C.缩小为原来的1/2倍D.缩小为原来的
5.社会经济现象多呈(甲、对称分布;乙、U型分布;丙、丁、“两头大,中间小”分布)(C)分布。
B.甲、丁
D.乙、丁
6.随机抽出100个工人,占全体工人1%工龄不到一年的比重为10%在概率为0.954
(t=2)时,计算工龄不到一年的工人比重的抽样极限误差
A.0.6%B.6%
C.0.9%D.3%
A.甲、丙
B)。
C.乙、丙
、简答题(略)
1.如何理解总体参数与样本统计量的含义?
2.请举例说明几种常用的抽样方法。
3.什么是抽样分布?
请列举几种常见的抽样分布。
4.样本均值的分布与总体分布的关系是什么?
5.解释中心极限定量的含义。
二、计算题
1.从均值为200、标准差为50的总体中,抽取n=100的简单随机样本,用样本均值X估计总体均值。
(1)X的数学期望是多少?
200
(2)X的标准差是多少?
5
(3)X的抽样分布是什么?
正态分布
(4)样本方差S2的抽样分布是什么?
2(100-1)。
2.假定总体共有1000个单位,均值」=32,标准差二=5。
从中抽取一个样本量为30的简单随机样本用于获得总体信息。
(1)x的数学期望是多少?
32
(2)X的标准差是多少?
0.91。
3•从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。
样本均
值的抽样标准差等于多少?
0.79
4•设总体均值.二=17,标准差-=10。
从该总体中抽取一个样本量为25的随机样本,
其均值为X25;同样,抽取一个样本量为100的随机样本,样本均值为Xeo。
(1)描述X25的抽样分布。
刃5口N(17,2)
(2)描述X100的抽样分布。
X00LIN(17,1)
5.从厂-10的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差:
(1)重复抽样。
1.41
(2)不重复抽样,总体单位数分别为50000、5000、500。
1.41,1.41,1.34
6•假定顾客在超市一次性购物的平均消费是85元,标准差是9元。
从中随机抽取40
个顾客,每个顾客消费金额大于87元的概率是多少?
PX.87[=1_P(X:
:
:
87)=1-:
:
|
7.在校大学生每月的平均支出是448元,标准差是21元。
随机抽取49名学生,样本
均值在441〜446之间的概率是多少?
第八早
分析计算题
1•某加油站64位顾客所组成的样本资料显示,平均加油量是13.6加仑。
若总体标准
差是3.0加仑,则每个人平均加油量95.45%置信区间估计值是多少?
答题要点:
已知样本容量n=64,样本均值又=13.6,总体标准差.:
;•=3,置信水平1一-95.45查表得z-血=2,于是总体平均加油量95.45%的置信区间为:
3
x二z“,2=13.6二213.6二0.75
'寸n"64
2•在由一所大学的90名学生所组成的样本显示,有27名学生会以及格与不及格作为
选课的依据。
(1)以及格与不及格作为选课依据的同学占全体同学比率的点估计为多少?
(2)以及格与不及格作为选课依据的同学占全体同学比率的90%i信区间估计值为多少?
答题要点:
已知样本容量n=90,样本比例p=30%,置信水平1-;.:
-90%
(1)
p=30%。
可见,以及格与不及格作为选课依据的同学占全体同学比率的点估计为
(2)
查表得z./2=1.64,于是总体平均加油量90%勺置信区间为:
0.30.7:
0.3_0.08
90
95.45%的概率
3•在500个抽样产品中,有95%勺一级品。
试测定抽样平均误差,并用估计全部产品非一级品概率的范围。
答题要点:
95.45%的置信区间为:
已知样本容量n=500,样本比例p=1-95%=5%,1y-95.45%查表知,查表得z:
./2=2,于是全部产品非一级品率
p_z_/2p(1二p)0.05_2,0.05—0.950.05_0.02鬥nV500
4.从某农场种植的水稻中随机抽取200亩进行产量调查,测得平均亩产量为380kg,
亩产量的标准差为25kg,要求:
(1)计算平均亩产量的平均抽样误差;
(2)试以99%的置信概率推断全场水稻总产量的所在范围;
(3)如果要求抽样极限误差不超过5kg,亩产量的标准差仍为25kg,则概率为0.99
时,应抽取多少亩进行调查?
答题要点:
已知样本容量n二200,样本均值X=380,样本标准差s=25
(1)平均亩产量的平均抽样误差为:
“n200
(2)查表得z:
/2=2.58,于是全场水稻总产量的99%的置信区间为:
_s25
X-z-/2380—2.58380—4.56
'n■.200
(3)必要的样本容量为:
2222
Z./2S2.5825
52
n22166.41
A
5.某大型企业进行工资调查,从全厂职工中随机抽取100名职工,得其资料如表6.9
所示。
试以95%勺可靠性估计:
(1)全厂平均工资范围;
(2)全厂职工中工资在4000元以上人数比重的区间范围。
表6.9某大型企业职工工资调查数据
工资水平(元)
职工人数(人)
3000以下
15
3000〜4000
20
4000〜5000
50
5000〜6000
10
6000元以上
5
答题要点:
有上面的计算表可知,n-100,样本均值乂=4200,样本标准差s=1004.99,工资
超过4000元的职工所占的比重p=0.65
(1)
于是全厂工资95%勺置信区间为:
(2)全厂职工中工资在4000元以上人数比重的区间范围为:
;p(1_p):
0.65汇0.35
p_z:
/20.65_1.960.65_0.09
6•在由一所大学的100名学生所组成的样本显示,有10名学生四年的综合成绩为优秀。
(1)该大学学生学习成绩优秀比率的点估计为多少?
(2)以95%勺置信水平对该大学学生成绩优秀比率进行区间估计。
答题要点:
10
(1)该大学学生学习成绩优秀比率二的点估计为样本比例p二丄匕=0.1
100
(p-t0.03,pt0.03),即(0.041,0.159)
第七章
分析计算题
1.某品种作物的产量原为亩产400kg,标准差31.5kg。
现于某地推广试种,据抽样取得的81个数据,得平均亩产为394kg,试以0.05的显著性概率判断是否保持了该品种的产量特性。
答案要点:
(1)原假设和备择假设:
H0:
」=400H1:
“十400
(2)统计量及统计值
_乂一卩_394-400_乙_:
二.n~31.581一1"1
(3)拒绝域
—Z:
/2)(Z:
/2,:
:
)
(_:
:
—1.96)U(z:
/2,1.96)
(4)判断与决策
由于—1.96<—1.71<1.96,落入接受域,认为该作物在推广试种过程中保持了该品种的产量特性。
2.某冰箱厂为国内一大型冰箱生产基地,产品质量一直比较稳定,标准返修率为1.1%。
但近年来却不断听消费者抱怨,为了解近年来该厂生产冰箱的质量情况,随机对其国内36
家专卖店及大中型商场专卖柜台中的400台冰箱的返修率进行了调查,结果发现其样本均值
为1.14%。
又由同类产品的经验知其标准差为0.2%,是否可由调查结果判定近年来企业生产
的冰箱出现了质量问题?
(显著性水平为0.05)
答案要点:
(1)原假设和备择假设:
Ho:
心1.1%已:
」.1.1%
(2)统计量及统计值
z乂一卩0.0114-0.0114
~■-/n一0.002/400-
(3)拒绝域
(Z<:
:
)
(1.64,二)
(4)判断与决策
由于4>1.64,落入拒绝域,认为近年来企业生产的冰箱出现了质量问题。
3.某公司年度财务报表的附注中声明,其应收账款的平均计算误差不超过50元。
审计师从该公司年度内应收账款账户中随机抽取17笔进行调查,结果其平均计算误差为56元,
标准差为8元。
试以0.01的显著性水平评估该公司应收账款的平均计算误差是否超过50
元?
答题要点:
(1)原假设和备择假设:
H0「i_50已:
丄乜50
(2)统计量及统计值
t」_J=55_50皿09
s、、n817
(3)拒绝域
(t..(n-1),;)
(2.58,+I
(4)判断与决策
由于3.09>2.58,落入拒绝域,认为该公司应收账款的平均计算误差在0.01的显著性
水平上超过50元。
4•已知罐头蕃茄汁中,维生素C(Vc)含量服从正态分布,按照规定,Vc的平均含量
必须超过21mg才算合格。
现从一批罐头中随机抽取17罐,算出Vc含量的平均值为23mg,
标准差为3.98mg,问该批罐头的Vc含量是否合格?
显著性水平为0.05。
答题要点:
(1)原假设和备择假设:
Hq^<21H1:
“:
:
:
・21
(2)统计量及统计值
乂-」23-21
t2.07
s/•n3.98/17
(3)拒绝域
(t-.(n-1),;)
(1.75,;)
(4)判断与决策
由于2.07>1.75,落入拒绝域,认为该批罐头的Vc含量是合格的。
5•有两组实验结果,一组是采用先进工艺的,另一组是采用普通工艺的,其平均数如下表。
假定两总体近似正态,且其方差相等,以0.05的显著水平,检验两种工艺之间是否
不同。
如表7.6所示为不同工艺的实验结果。
表7.6不同工艺的实验结果
普通工艺
先进工艺
0.452
0.448
0.452
0.445
0.439
0.447
0.451
0.446
0.449
0.441
0.441
0.441
0.442
0.455
0.447
0.435
0.428
0.443
答题要点:
(1)原假设和备择假设:
Ho:
4…2=0比:
4…匕=0
(2)统计量及统计值
t统计
由于已知两个总体服从正态分布,方差未知但相等,且为小样本,因此可以构造量进行检验。
t=(x-x2)-(WLtg-n2-2)
根据表7-6的数据,计算得到只=0.449,区=0.440,s,2^0.0042,£=0.0062
通过得到样本合并方差为
(9-1)(9-1)
S2_(n—1)S2+仏—1)sf_(9—1)0.0042+(9—1)0.0062_0000026p一5一1)仇一1)一一■
(3)拒绝域
rijn2-2))(t.(n1£-2),:
:
)
(—:
:
-2.12)J(2.12,:
:
)
(4)判断与决策
由于3.74>2.12,落入拒绝域,认为两种工艺之间存在显著差异。
6•已知某种延期药静止燃