9 统计与统计案例.docx
《9 统计与统计案例.docx》由会员分享,可在线阅读,更多相关《9 统计与统计案例.docx(12页珍藏版)》请在冰豆网上搜索。
9统计与统计案例
12+4分项练9 统计与统计案例
1.(2018·新乡模拟)某中学有高中生3000人,初中生2000人,男、女生所占的比例如下图所示.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是( )
A.12B.15C.20D.21
答案 A
解析 因为分层抽样的抽取比例为
=
,
所以从初中生中抽取的男生人数是
=12.
2.(2018·赣州模拟)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号:
001,002,…,699,700.从中抽取70个样本,如图提供了随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
3221183429 7864540732 5242064438
1223435677 3578905642
8442125331 3457860736 2530073286
2345788907 2368960804
3256780843 6789535577 3489948375
2253557832 4577892345
A.623B.328C.253D.007
答案 A
解析 从第5行第6列开始向右读取数据,
第一个数为253,第二个数是313,第三个数是457,
下一个数是860,不符合要求,下一个数是736,不符合要求,下一个数是253,重复,
第四个数是007,第五个数是328,第六个数是623.
3.(2018·宁德质检)下图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是( )
A.DB.EC.FD.A
答案 B
解析 因为相关系数的绝对值越大,越接近1,则说明两个变量的相关性越强.因为点E到直线的距离最远,所以去掉点E,余下的5个点所对应的数据的相关系数最大.
4.(2018·河北省衡水中学模拟)若x1,x2,…,x2018的平均数为3,方差为4,且yi=-2
,i=1,2,…,2018,则新数据y1,y2,…,y2018的平均数和标准差分别为( )
A.-4,-4B.-4,16
C.2,8D.-2,4
答案 D
解析 ∵x1,x2,…,x2018的平均数为3,方差为4,
∴
(x1+x2+…+x2018)=3,
[(x1-3)2+(x2-3)2+…+(x2018-3)2]=4.
又yi=-2(xi-2)=-2xi+4,i=1,2,…,2018,
∴
=
[-2(x1+x2+…+x2018)+4×2018]
=-2
+4=-2,
s2=
[(-2x1+4+2)2+(-2x2+4+2)2+…+(-2x2018+4+2)2]
=
[4(x1-3)2+4(x2-3)2+…+4(x2018-3)2]
=4×
[(x1-3)2+(x2-3)2+…+(x2018-3)2]
=16,
∴新数据y1,y2,…,y2018的平均数和标准差分别为-2,4.
5.某班一次测试成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息可确定被抽测的人数及分数在[90,100]内的人数分别为( )
A.20,2B.24,4C.25,2D.25,4
答案 C
解析 由频率分布直方图可知,组距为10,[50,60)的频率为0.008×10=0.08,由茎叶图可知[50,60)的人数为2,设参加本次考试的总人数为N,则N=
=25,根据频率分布直方图可知[90,100]内的人数与[50,60)内的人数一样,都是2.
6.(2018·湛江模拟)从某中学甲、乙两班各随机抽取10名同学,测量他们的身高(单位:
cm),所得数据用茎叶图表示如下,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是( )
A.甲班同学身高的方差较大
B.甲班同学身高的平均值较大
C.甲班同学身高的中位数较大
D.甲班同学身高在175cm以上的人数较多
答案 A
解析 观察茎叶图可知甲班同学数据波动大,则甲班同学身高的方差较大,A选项正确;
甲班同学身高的平均值为
=169.2,
乙班同学身高的平均值为
=171,
则乙班同学身高的平均值大,B选项错误;
甲班同学身高的中位数为
=168,
乙班同学身高的中位数为
=171.5,
则乙班同学身高的中位数大,C选项错误;
甲班同学身高在175cm以上的人数为3,
乙班同学身高在175cm以上的人数为4,
则乙班同学身高在175cm以上的人数多,D选项错误.
7.下列说法错误的是( )
A.回归直线过样本点的中心(
,
)
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.在线性回归方程
=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量
平均增加0.2个单位
D.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小
答案 D
解析 根据相关定义分析知A,B,C正确.D中对分类变量X与Y的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大,故D不正确.
8.某学校为了制定节能减排的目标,调查了日用电量y(单位:
千瓦时)与当天平均气温x(单位:
℃),从中随机选取了4天的日用电量与当天平均气温,并制作了对照表:
x
17
15
10
-2
y
24
34
a
64
由表中数据得到的线性回归方程为
=-2x+60,则a的值为( )
A.34B.36C.38D.42
答案 C
解析
=
=10,
=
,
∵
=-2x+60必过点
,
∴
=-2×10+60,解得a=38.
9.某科研机构为了研究中年人秃头是否与患有心脏病有关,随机调查了一些中年人的情况,具体数据如下表所示:
有心脏病
无心脏病
总计
秃发
20
300
320
不秃发
5
450
455
总计
25
750
775
根据表中数据得K2=
≈15.968,由K2≥10.828,断定秃发与患有心脏病有关,那么这种判断出错的可能性为( )
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.0.1B.0.05C.0.01D.0.001
答案 D
解析 由题意可知,K2≥10.828,根据附表可得判断秃发与患有心脏病有关出错的可能性为0.001.
10.(2018·辽宁省重点高中期末)如图描述的是我国2014年四个季度与2015年前三个季度三大产业GDP累计同比贡献率,以下结论正确的是( )
A.2015年前三个季度中国GDP累计比较2014年同期增速有上升的趋势
B.相对于2014年,2015年前三个季度第三产业对GDP的贡献率明显增加
C.相对于2014年,2015年前三个季度第二产业对GDP的贡献率明显增加
D.相对于2014年,2015年前三个季度第一产业对GDP的贡献率明显增加
答案 B
解析 通过图形可以看出,最后三个条形中,白色条形所占的比重明显比前四个条形所占比重要大,即相对于2014年,2015年前三个季度第三产业对GDP的贡献率明显增加,故选B.
11.对某两名高三学生在连续9次数学测试中的成绩(单位:
分)进行统计得到如下折线图.下面关于这两位同学的数学成绩的分析中,正确的个数为( )
①甲同学的成绩折线图具有较好的对称性,故而平均成绩为130分;
②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间[110,120]内;
③乙同学的数学成绩与考试次号具有比较明显的线性相关性,且为正相关;
④乙同学在这连续九次测验中的最高分与最低分的差超过40分.
A.1B.2C.3D.4
答案 C
解析 ①甲同学的成绩折线图具有较好的对称性,最高130分,平均成绩为低于130分,①错误;②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间[110,120]内,②正确;③乙同学的数学成绩与考试次号具有比较明显的线性相关性,且为正相关,③正确;④乙同学在这连续九次测验中的最高分大于130分且最低分低于90分,最高分与最低分的差超过40分,故④正确.故选C.
12.(2016·北京)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.
学生序号
1
2
3
4
5
6
7
8
9
10
立定跳远(单位:
米)
1.96
1.92
1.82
1.80
1.78
1.76
1.74
1.72
1.68
1.60
30秒跳绳(单位:
次)
63
a
75
60
63
72
70
a-1
b
65
在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则( )
A.2号学生进入30秒跳绳决赛
B.5号学生进入30秒跳绳决赛
C.8号学生进入30秒跳绳决赛
D.9号学生进入30秒跳绳决赛
答案 B
解析 由数据可知,进入立定跳远决赛的8人为1~8号,所以进入30秒跳绳决赛的6人需要从1~8号产生,数据排序后可知第3,6,7号必须进跳绳决赛,另外3人需从63,a,60,63,a-1五个得分中抽取,若63分的人未进决赛,则60分的人就会进入决赛,与事实矛盾,所以63分必进决赛.故选B.
13.(2018·大连模拟)某班共有36人,编号分别为1,2,3,…,36.现用系统抽样的方法,抽取一个容量为4的样本,已知编号3,12,30在样本中,那么样本中还有一个编号是________.
答案 21
解析 由于系统抽样得到的编号组成等差数列,
因为
=9,所以公差为9,
因为编号为3,12,30,所以第三个编号为12+9=21.
14.某学校为了了解住校学生每天在校平均开销情况,随机抽取了500名学生,他们每天在校平均开销都不低于20元且不超过60元,其频率分布直方图如图所示,则其中每天在校平均开销在
元的学生人数为________.
答案 150
解析 由频率分布直方图,得
每天在校平均开销在[50,60]元的学生的频率为
1-(0.01+0.024+0.036)×10=0.3,
∴每天在校平均开销在[50,60]元的学生人数为500×0.3=150.
15.如图是某市某小区100户居民2015年月平均用水量(单位:
t)的频率分布直方图的一部分,则该小区2015年的月平均用水量的中位数的估计值为________.
答案 2.01
解析 由题图可知,前五组的频率依次为0.04,0.08,0.15,0.22,0.25,因此前五组的频数依次为4,8,15,22,25,由中位数的定义,应是第50个数与第51个数的算术平均数,而前四组的频数和为4+8+15+22=49,所以中位数是第五组中第1个数与第2个数的算术平均数,中位数是
[2+2+
×(2.5-2)]≈2.01,故中位数的估计值是2.01.
16.(2018·芜湖模拟)某校开展“爱我家乡”演讲比赛,9位评委给小明同学打分的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字在茎叶图中无法看清,若记分员计算无误,则数字x=________.
答案 1
解析 由题意知,去掉一个最低分88,
若最高分为94时,去掉最高分94,
余下的7个分数的平均分是91,
即
×(89+89+92+93+90+x+92+91)=91,
解得x=1;
若最高分为(90+x)分,去掉最高分90+x,
则余下的7个分数的平均分是
×(89+89+92+93+92+91+94)≠91,不满足题意.