第九章 统计统计案例汇总.docx
《第九章 统计统计案例汇总.docx》由会员分享,可在线阅读,更多相关《第九章 统计统计案例汇总.docx(16页珍藏版)》请在冰豆网上搜索。
第九章统计统计案例汇总
(时间:
120分钟 满分:
150分)
一、选择题(每小题5分,共60分)
1.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取的5枚导弹编号可能是(B)
A.5,10,15,20,25B.3,13,23,33,43
C.1,2,3,4,5D.2,4,8,16,32
解析 从50枚某型号导弹中随机抽取5枚,采用系统抽样间隔应为
=10,只有B答案中导弹的编号间隔为10,故选B.
2.(2016·海口期中)观察下列关于变量x和y的三个散点图,它们从左到右的对应关系依次是(D)
A.正相关、负相关、不相关
B.负相关、不相关、正相关
C.负相关、正相关、不相关
D.正相关、不相关、负相关
解析 由相关关系的含义易得答案为D.
3.(2015·松原期末)频率分布直方图中最高小矩形的中间位置所对数据的数字特征是(B)
A.中位数B.众数
C.平均数D.标准差
解析 由频率分布直方图知,最高小矩形的中点横坐标是此组数据的众数,故选B.
4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:
[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(B)
A.588B.480
C.450D.120
解析 根据频率分布直方图可知,成绩在60~100分的频率为(0.03+0.025+0.015+0.01)×10=0.8,∴该模块测试成绩不少于60分的学生人数为600×0.8=480.
5.(2015·湖北高考)我国古代数学名著《九章算术》有“米谷粒分”题:
粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为(B)
A.134石B.169石
C.338石D.1365石
解析 依题意,用样本估计总体,这批米内夹谷为
×1534≈169(石),选B.
6.某中学高三年级从甲、乙两个班级各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如下,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,则x+y的值为(D)
甲
乙
89
7
64
65x2
8
11y
64
9
116
A.9B.10
C.11D.13
解析 由平均数的定义求得x=8,由中位数的定义求得y=5,∴x+y=13.故选D.
7.已知一组数据:
a1,a2,a3,a4,a5,a6,a7构成公差为d的等差数列,且这组数据的方差等于1,则公差d等于(B)
A.±
B.±
C.±
D.无法求解
解析 这组数据的平均数为
=
=a4,∵这组数据的方差等于1,∴
[(a1-a4)2+(a2-a4)2+(a3-a4)2+(a4-a4)2+(a5-a4)2+(a6-a4)2+(a7-a4)2]=
=1,即4d2=1,解得d=±
.
8.(2016·西城期末)某校对高一年级学生的数学成绩进行统计,全年级同学的成绩全部介于60分与100分之间,将他们的成绩数据绘制成如图所示的频率分布直方图.现从全体学生中,采用分层抽样的方法抽取60名同学的试卷进行分析,则从成绩在[90,100]内的学生中抽取的人数为(B)
A.24B.18C.15D.12
解析 根据频率分布直方图,成绩在[90,100]内的学生的频率为0.03×10=0.3,所以,从成绩在[90,100]内的学生中抽取的人数为60×0.3=18.故选B.
9.如图是甲、乙两位射击运动员的5次训练成绩(单位:
环)的茎叶图,则成绩较为稳定的运动员是(C)
A.x甲=x乙,甲和乙一样稳定
B.s
<s
,乙稳定
C.s
<s
,甲稳定
D.s
≠s
,甲和乙都不稳定
解析 甲的平均数是x甲=
(87+89+90+91+93)=90,
方差是s
=
[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4;
乙的平均数是x乙=
(78+88+89+96+99)=90,
方差是s
=
[(78-90)2+(88-90)2+(89-90)2+(96-90)2+(99-90)2]=53.2;
∵s
<s
,∴成绩较为稳定的是甲.故选C.
10.2012年2月,国内某网站就“你认为皮纹测试即可测出孩子的潜能及发展方向是‘科学’还是‘不科学’”向广大中学生和大学生网民征集看法.根据回收大学生50人与中学生50人的100份有效帖中,统计了不同年龄段的学生对“皮纹测试”的看法,把所得数据制成如下列联表:
不科学
科学
总计
大学生
40
10
50
中学生
20
30
50
总计
60
40
100
则利用独立性检验,判断相信“认为皮纹测试是否科学与学生所处的阶段有关”的把握是(D)
A.不超过90% B.不超过99%
C.超过95% D.超过99%
解析 K2=
≈16.67>6.635,∴有超过99%的把握判断相信“认为皮纹测试是否科学与学生所处的阶段有关”.故选D.
11.(2015·长沙模拟)某学生为了了解自己步行的大致速度,为此进行了5次试验,收集数据如下:
步行的路程x(千米)
1
2
3
4
5
步行的时间y(分钟)
10
21
29
40
50
经检验,这组样本数据具有线性相关关系,那么对于步行的路程x与步行时间y这两个变量,下列判断正确的是(B)
A.成正相关,其回归直线经过点(3,31)
B.成正相关,其回归直线经过点(3,30)
C.成负相关,其回归直线经过点(3,31)
D.成负相关,其回归直线经过点(3,30)
解析 ∵y随着x的增大而增大,∴y与x成正相关,又x=3,y=30,∴回归直线经过点(3,30).故选B.
12.近年来,多家洋快餐企业爆出“老油门”事件(煎炸食品所用油长期不更新,从而导致过氧化值、酸值超标),令世人震惊.我国某研究机构为此开发了一种用来检测过氧化值、酸值是否超标的新试剂,把500组过氧化值、酸值超标的食品与另外500组上述未超标的食品作比较,提出假设H0:
“这种试剂不能起到检测出过氧化值、酸值超标的作用”,并计算出P(K2≥6.635)≈0.01.对此四名同学作出了以下判断:
①有99%的把握认为“这种试剂能起到检测出过氧化值、酸值超标的作用”;
②随意抽出一组食品,它有99%的可能性是过氧化值、酸值超标;
③这种试剂能起到检测出过氧化值、酸值超标的作用的有效率为99%;
④这种试剂能起到检测出过氧化值、酸值超标的作用的有效率为1%.
则上述判断正确的个数是(A)
A.1B.2C.3D.4
解析 本题中提出假设H0:
“这种试剂不能起到检测出过氧化值、酸值超标的作用”,并计算出P(K2≥6.635)≈0.01,所以在一定程度上,说明假设不合理,我们就有99%的把握拒绝假设,故易知①的判断正确,②③④的判断错误.
二、填空题(每小题5分,共20分)
13.(2015·济南模拟)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为y^=-4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为__
__.
解析 由表中数据得x=6.5,y=80,又(x,y)在直线y^=-4x+a上,可得a=106.经过计算,(5,84)和(9,68)在回归直线的左下方,故所求概率为
=
,故填
.
14.(2015·福建高考)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为__25__.
解析 根据分层抽样的定义,抽样比例为
=
,故应抽取的男生人数为500×
=25,故应填25.
15.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场制作的9个分数的茎叶图中有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为__
__.
8
77
9
4010x91
解析 根据茎叶图知,去掉一个最高分和一个最低分后这组数为87,90,90,91,91,94,90+x,根据平均数可求得x=4,∴这组数据的方差是
=
.
16.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.
(1)若第1组抽出的号码为2,则所有被抽出职工的号码为__2,10,18,26,34__;
(2)分别统计这5名职工的体重(单位:
kg),获得体重数据的茎叶图如图所示,则该样本的方差为__62__.
解析
(1)由题意知,被抽出职工的号码为2,10,18,26,34.
(2)由题中茎叶图知,5名职工体重的平均数x=
=69,则该样本的方差s2=
×[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.
三、解答题(共70分)
17.(10分)某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:
管理
技术开发
营销
生产
总计
老年
40
40
40
80
200
中年
80
120
160
240
600
青年
40
160
280
720
1200
总计
160
320
480
1040
2000
(1)若要抽取40人调查身体状况,则应怎样抽样?
(2)若该单位要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?
(3)若要抽20人调查对某运动会筹备情况的了解,则应怎样抽样?
解析
(1)用分层抽样,按200∶600∶1200=1∶3∶6的比例抽取,∴老年抽取4人,中年抽取12人,青年抽取24人.(3分)
(2)用分层抽样,按160∶320∶480∶1040=2∶4∶6∶13的比例抽取,管理部门抽取2人,技术开发部门抽取4人,营销部门抽取6人,生产部门抽取13人.(6分)
(3)用系统抽样,对2000名职工随机编号,号码从0001~2000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1900,得到容量为20的样本.(10分)
18.(12分)为了普及法律知识达到“法在心中”的目的,邯郸市法制办组织了普法知识竞赛.统计局调查队随机抽取了甲、乙两单位中各5名职工的成绩,成绩如下表所示:
甲单位
87
88
91
91
93
乙单位
85
89
91
92
93
(1)根据表中的数据,分别求出甲、乙两单位5名职工成绩的平均数和方差,并判断哪个单位的职工对法律知识的掌握更为稳定;
(2)用简单随机抽样方法从乙单位5名职工中抽取2名职工的成绩组成一个样本,求抽取的2名职工的分数差值至少是4的概率.
解析
(1)x甲=
(87+88+91+91+93)=90,
x乙=
(85+89+91+92+93)=90;(2分)
s
=
[(87-90)2+(88-90)2+(91-90)2+(91-90)2+(93-90)2]=
,
s
=
[(85-90)2+(89-90)2+(91-90)2+(92-90)2+(93-90)2]=8;(4分)
∵x甲=x乙,s
<s
,∴甲单位的成绩比乙单位稳定.(5分)
∴甲单位的职工对法律知识的掌握更为稳定.(6分)
(2)从乙单位抽取2名职工的分数,所有基本事件的可能结果为(用坐标表示):
(85,89),(85,91),(85,92),(85,93),(89,91),(89,92),(89,93),(91,92),(91,93),(92,93),共10种情况,(8分)
则抽取的2名职工的分数差值至少是4的事件包含:
(85,89),(85,91),(85,92),(85,93),(89,93),共5种情况.(10分)
由古典概型概率公式可知,抽取的2名职工的分数之差的绝对值至少是4的概率为P=0.5.(12分)
19.(12分)(2015·安徽高考)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].
(1)求频率分布图中a的值;
(2)估计该企业的职工对该部门评分不低于80的概率;
(3)从评分在[40,60]的受访职工中,随机抽取2人,求此2人评分都在[40,50)的概率.
解析
(1)由(0.004+a+0.018+0.022×2+0.028)×10=1,得a=0.006.(2分)
(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,
所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(6分)
(3)受访职工评分在[50,60)的有50×0.006×10=3(人),即为A1,A2,A3;
受访职工评分在[40,50)的有:
50×0.004×10=2(人),即为B1,B2.
从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A2,A3),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),又因为所抽取2人的评分都在[40,50)的结果有1种,即(B1,B2),故所求的概率为p=
.(12分)
20.(12分)某学校为了了解学生的日平均睡眠时间(单位:
h),随机选择了n名同学进行调查,下表是这n名同学的睡眠时间的频率分布表.
序号
(i)
分组
(睡眠时间)
频数
(人数)
频率
1
[4,5)
6
0.12
2
[5,6)
0.20
3
[6,7)
a
4
[7,8)
b
5
[8,9]
0.08
(1)求n的值.若a=20,将表中数据补全,并画出频率分布直方图;
(2)统计中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算上述数据的平均值为6.52,求a,b的值,并由此估计该学校学生的日平均睡眠时间在7h以上的概率.
解析
(1)由频率分布表,可得n=
=50.(1分)
补全数据如下表:
序号(i)
分组(睡眠时间)
频数(人数)
频率
1
[4,5)
6
0.12
2
[5,6)
10
0.20
3
[6,7)
20
0.40
4
[7,8)
10
0.20
5
[8,9]
4
0.08
(3分)
频率分布直方图如下:
(6分)
(2)由题意得
解得a=15,b=15.(10分)
设“该学校学生的日平均睡眠时间在7h以上”为事件A,
则P(A)=
=0.38.
故该学校学生的日平均睡眠时间在7h以上的概率约为0.38.(12分)
21.(12分)(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程y^=b^t+a^;
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:
回归方程y^=b^t+a^中,
解析
(1)列表计算如下:
i
t1
y1
t
t1yi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
∑
15
36
55
120
这里n=5,t=
i=
=3,y=
i=
=7.2.
又lnt=
120-5*3*7.2=1.2,a^=y-b^t=7.2-1.2×3=3.6.
故所求回归方程为y^=1.2t+3.6.(9分)
(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y^=1.2×6+3.6=10.8(千亿元).(12分)
22.(12分)某校高三(4)班50名学生进行了一场投篮测试,其中男生30人,女生20人.为了了解其投篮成绩,甲、乙两人分别都对全班的学生进行编号(1~50号),并以不同的方法进行数据抽样,其中一人用的是系统抽样,另一人用的是分层抽样.若此次投篮考试的成绩大于或等于80分视为优秀,小于80分视为非优秀,以下是甲、乙两人分别抽取的样本数据:
甲抽取的样本数据
编号
性别
投篮成绩
2
男
90
7
女
60
12
男
75
17
男
80
22
女
83
27
男
85
32
女
75
37
男
80
42
女
70
47
女
60
乙抽取的样本数据
编号
性别
投篮成绩
1
男
95
8
男
85
10
男
85
20
男
70
23
男
70
28
男
80
33
女
60
35
女
65
43
女
70
48
女
60
(1)观察乙抽取的样本数据,若从男同学中抽取2名,求2名男同学中恰有1名非优秀的概率;
(2)请你根据乙抽取的样本数据完成下列2×2列联表,判断是否有95%以上的把握认为投篮成绩与性别有关?
优秀
非优秀
总计
男
女
总计
10
(3)判断甲、乙各用了何种抽样方法,并根据
(2)的结论判断哪种抽样方法更优?
说明理由.
解析
(1)记“2名乙同学中恰有1名非优秀”为事件A,乙抽取的样本数据中,有4名优秀,记为a,b,c,d,2名非优秀,记为e,f.(2分)
从6名男同学中抽取2名的所有可能结果有(a,b),(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f),共15个,事件A包含的可能结果有(a,e),(b,e),(c,e),(d,e),(a,f),(b,f),(c,f),(d,f),共8个,
∴P(A)=
.(4分)
(2)设投篮与性别无关,由乙抽取的样本数据,得2×2列联表如下:
优秀
非优秀
总计
男
4
2
6
女
0
4
4
总计
4
6
10
(6分)
k2=
≈4.444>3.841,(8分)
∴有95%以上的把握认为投篮成绩与性别有关.(9分)
(3)甲用的是系统抽样,乙用的是分层抽样.(10分)
由
(2)的结论知,投篮成绩与性别有关,并且从样本数据能看出投篮成绩与性别有明显差异,因此分层抽样方法比系统抽样方法更优.(12分)