黑龙江省海林市朝鲜族中学人教版高中数学选修12同步练习第一章 统计案例单元测评附答案873990.docx
《黑龙江省海林市朝鲜族中学人教版高中数学选修12同步练习第一章 统计案例单元测评附答案873990.docx》由会员分享,可在线阅读,更多相关《黑龙江省海林市朝鲜族中学人教版高中数学选修12同步练习第一章 统计案例单元测评附答案873990.docx(13页珍藏版)》请在冰豆网上搜索。
黑龙江省海林市朝鲜族中学人教版高中数学选修12同步练习第一章统计案例单元测评附答案873990
单元测评
(一)
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.第Ⅰ卷60分,第Ⅱ卷90分,共150分,考试时间120分钟.
第Ⅰ卷 (选择题 共60分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列有关线性回归的说法不正确的是( )
A.变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫作相关关系
B.在平面直角坐标系中用描点的方法得到的表示具有相关关系的两个变量的一组数据的图形叫作散点图
C.线性回归直线方程最能代表观测值x,y之间的线性相关关系
D.任何一组观测值都能得到具有代表意义的回归直线方程
2.若回归方程为=3-5x,则当变量x增加1个单位时( )
A.y平均增加3个单位B.y平均减少5个单位
C.y平均增加5个单位D.y平均减少3个单位
3.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关试验,并用回归分析方法分别求相关系数r,所得数据如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是( )
A.甲B.乙C.丙D.丁
4.如图C11所示,四个散点图中,不适合用线性回归模型拟合其中两个变量的是( )
图C11
5.班主任对全班50名学生进行了作业量调查,统计数据如下表所示:
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
18
9
27
不喜欢玩电脑游戏
8
15
23
总计
26
24
50
根据表中数据得到K2的观测值k=≈5.059,因为P(K2≥5.024)≈0.025,所以判定是否喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )
A.97.5%B.95%
C.90%D.无充分根据
6.如图C12所示,5组数据(x,y)中去掉D(3,10)后,下列说法错误的是( )
图C12
A.相关系数r变大
B.残差平方和变大
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
7.分类变量X和Y的2×2列联表如下:
Y
X
y1
y2
总计
x1
a
10
a+10
x2
c
30
c+30
总计
60
40
100
对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( )
A.a=45,c=15B.a=40,c=20
C.a=35,c=25D.a=30,c=30
8.下表给出了5组数据(x,y),为选出4组数据使得x与y的线性相关程度最大,且保留第1组数据(-5,-3),则应去掉( )
第i组
1
2
3
4
5
xi
-5
-4
-3
-2
4
yi
-3
-2
4
-1
6
A.第2组数据
B.第3组数据
C.第4组数据
D.第5组数据
9.以下四个命题中是真命题的是( )
A.对随机变量K2的观测值k来说,k越小,判断“分类变量X与Y有关系”的把握程度越大
B.两个随机变量的线性相关性越强,相关系数的绝对值越接近于0
C.若数据x1,x2,x3,…,xn的方差为1,则2x1,2x2,2x3,…,2xn的方差为2
D.在回归分析中,可用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好
10.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的高低,调查结果如下表所示:
杂质高
杂质低
旧设备
37
121
新设备
22
202
根据以上数据可知( )
A.含杂质的高低与设备改造有关
B.含杂质的高低与设备改造无关
C.设备是否改造决定含杂质的高低
D.以上说法都不对
11.从某中学的2014届高三学生中随机选取5名男生,其身高和体重的数据如下表所示:
身高x(cm)
160
165
170
175
180
体重y(kg)
63
66
70
72
74
根据上表可得回归直线方程=0.56x+,据此模型预测身高为172cm的男生的体重为( )
A.70.09kgB.70.12kg
C.70.55kgD.71.05kg
12.给出下列五个命题:
①将A,B,C三种个体按3∶1∶2的比例分层抽样调查,若抽取的A种个体有9个,则样本容量为30;
②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;
③甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中比较稳定的是甲;
④已知具有相关关系的两个变量满足的回归直线方程为=1-2x,则x每增加1个单位,y平均减少2个单位;
⑤统计的10个样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为0.4.
其中是真命题的为( )
A.①②④B.②④⑤C.②③④D.③④⑤
请将选择题答案填入下表:
题号
1
2
3
4
5
6
7
8
9
10
11
12
总分
答案
第Ⅱ卷 (非选择题 共90分)
二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)
13.已知数据点(xi,yi)(i=1,2,3,…,n)在一条直线上,则相关系数r=________.
14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:
在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.
15.从某地区的15000位老人中随机抽取500人,其生活能否自理的情况如下表所示:
男
女
能
178
278
不能
23
21
则该地区中生活不能自理的老人中男性比女性约多________人.
16.某公司的广告费支出x(万元)与销售额y(万元)之间有下表所示的对应数据,由资料显示y对x呈线性相关关系,根据下表提供的数据得到回归方程=x+中的=6.5,
x
2
4
5
6
8
y
30
40
60
50
70
预测销售额为115万元时,约需________万元广告费.
三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)为了调查胃病是否与生活规律有关,对某地540人进行调查,所得结果如下表:
患胃病
未患胃病
总计
生活不规律
60
260
320
生活有规律
20
200
220
总计
80
460
540
根据以上数据,预测有多大的把握认为“患胃病与生活不规律有关”?
18.(本小题满分12分)在某次试验中,两个试验数据x,y的统计结果如下面的表格1所示.
表格1
x
1
2
3
4
5
y
2
3
4
4
5
图C13
(1)在给出的坐标系中画出数据x,y的散点图.
(2)补全表格2,根据表格2中的数据和公式b^=
求下列问题.
①求出y关于x的回归直线方程=x+中的,.
②估计当x=10时,的值是多少?
表格2
序号
x
y
x2
xy
1
1
2
1
2
2
2
3
4
6
3
3
4
9
12
4
4
4
16
16
5
5
5
25
25
∑
19.(本小题满分12分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
9
9.2
9.4
9.6
9.8
10
销量y(件)
100
94
93
90
85
78
(1)求回归直线方程=x+.
(2)预计在今后的销售中,销量与单价仍然服从
(1)中的关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为多少元?
(利润=销售收入-成本)
20.(本小题满分12分)为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,调查结果如下:
性别
是否需要志愿者提供帮助
男
女
需要
40
30
不需要
160
270
(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例.
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据
(2)中的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?
并说明理由.
21.(本小题满分12分)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法收集了300位学生每周平均体育运动时间的样本数据(时间单位:
小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图C14所示),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4个小时的概率.
(3)在样本数据中,有60位女生每周平均体育运动时间超过4个小时,请作出每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生每周平均体育运动时间与性别有关”.
图C14
22.(本小题满分12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,12月1日至12月5日的昼夜温差与实验室每天每100颗种子中的发芽数如下表所示:
日期
12月1日
12月2日
12月3日
12月4日
12月5日
温差x(℃)
10
11
13
12
8
发芽数y(颗)
23
25
30
26
16
该农科所确定的研究方案是:
先从这5组数据中选取2组,用剩下的3组数据求回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻的2组数据的概率.
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求y关于x的线性回归方程=x+.
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问
(2)中所得的线性回归方程是否可靠?
单元测评
(一)
1.D [解析]并不是任何一组观测值都能得到具有代表意义的回归直线方程.
2.B [解析]斜率的估计值是-5,说明x每增加1个单位,y平均减少5个单位.
3.D [解析]由线性相关系数及回归分析的知识可知当线性相关系数r越大时,A,B两变量有更强的线性相关性.
4.A [解析]图A中的点不成线性排列,故两个变量不适合用线性回归模型拟合.故选A.
5.A [解析]∵P(K2≥5.024)≈0.025,∴判定是否喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为1-0.025=97.5%.
6.B [解析]由题中散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
7.A [解析]由题意可得,当与相差越大时,X与Y有关系的可能性越大,分析四组选项,A中的a,c的值最符合题意,故选A.
8.B [解析]画出散点图如图所示,则应去掉第3组数据(-3,4).
9.D [解析]依据线性相关及相关指数的有关知识可以推断,选项D是正确的.
10.A [解析]由已知数据得到如下2×2列联表:
杂质高
杂质低
总计
旧设备
37
121
158
新设备
22
202
224
总计
59
323
382
由公式得k=≈13.11.
由于13.11>6.635,所以有99%的把握认为含杂质的高低与设备改造是有关的,但是否改造设备这一行为并不对含杂质的高低起决定性作用.
11.B [解析]由题意可知,==170,==69.∵回归直线过点(,),∴将点(170,69)代入回归直线方程,得=-26.2,∴=0.56x-26.2,当x=172时,=70.12,故选B.
12.B [解析]①样本容量为9÷=18,①是假命题;②数据1,2,3,3,4,5的平均数为×(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,②是真命题;③乙==7,s=×[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=×(4+1+4+9+4)=4.4,∴s>s,∴乙稳定,③是假命题;④是真命题;⑤数据落在[114.5,124.5)内的有120,122,116,120,共4个,故其频率为0.4,⑤是真命题.
13.±1 [解析]由题易知,相关系数r=±1.
14.99.5% [解析]根据题目中所给的数据可得到2×2列联表(略),再由公式得k=≈10.76.因为10.76>7.879,所以约有99.5%的把握认为“学生的数学成绩和物理成绩有关系”.
15.60 [解析]由表中数据可知,男性不能自理的频率为,
女性不能自理的频率为,故约多15000×=60(人).
16.15 [解析]因为x=×(2+4+5+6+8)=5,y=×(30+40+60+50+70)=50,所以50=6.5×5+,则=17.5,所以当y=115时,6.5x=115-17.5⇒x=15,即需广告费为15万元.
17.解:
k=≈9.638.∵9.638>7.879,∴有99.5%的把握认为“患胃病与生活不规律有关”.
18.解:
(1)数据x,y的散点图如图所示.
(2)表格2如下:
序号
x
y
x2
xy
1
1
2
1
2
2
2
3
4
6
3
3
4
9
12
4
4
4
16
16
5
5
5
25
25
∑
15
18
55
61
1计算得
=3,
=3.6,
=
==0.7,=
-
=3.6-0.7×3=1.5.
②由①知,=0.7x+1.5,
故当x=10时,=8.5.
19.解:
(1)x=
xi=9.5,y=
yi=90,故
=-14,
=0.7,故==-20,从而=
-
=280,因此=-20x+280.
(2)设该产品的单价定为x元,工厂获得的利润为L元,则L=(x-5)(-20x+280)=20(x-5)(14-x)≤20·=405,当且仅当x-5=14-x,即x=9.5时取等号,因此单价应定为9.5元.
20.解:
(1)调查的500位老年人中,有70位需要志愿者提供帮助,因此该地区老年人中需要志愿者提供帮助的比例的估计值为×100%=14%.
(2)k=≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.
(3)由
(2)中的结论知,该地区老年人是否需要志愿者提供帮助与性别有关,并且从样本数据可以看出该地区男性老年人与女性老年人中需要志愿者提供帮助的比例有明显差异,因此,在调查时先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,采用分层抽样方法更好.
21.解:
(1)300×=90,所以应收集90位女生的样本数据.
(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4个小时的概率的估计值为0.75.
(3)由
(2)知,300位学生中有300×0.75=225(位)每周平均体育运动时间超过4个小时,75位每周平均体育运动时间不超过4个小时.因为样本数据中有210个是关于男生的,90个是关于女生的,所以每周平均体育运动时间与性别列联表如下:
男生
女生
总计
每周平均体育运动时间不超过4个小时
45
30
75
每周平均体育运动时间超过4个小时
165
60
225
总计
210
90
300
由列联表可算得k=≈4.762>3.841,
所以有95%的把握认为“该校学生每周平均体育运动时间与性别有关”.
22.解:
(1)设抽到不相邻2组数据为事件A.因为从5组数据中选取2组数据共有10种情况,每种情况是等可能出现的,其中抽到相邻2组数据的情况共有4种,所以P(A)=1-=,故选取的2组数据恰好是不相邻的2组数据的概率为.
(2)利用12月2日至12月4日的数据,求得x=×(11+13+12)=12,y=×(25+30+26)=27,
(xi-
)(y-
)=(-1)×(-2)+1×3+0×(-1)=5
(xi-
)2=(-1)2+12+02=2,
由公式求得=
=,=
-
=-3.
所以y关于x的线性回归方程为=x-3.
(3)当x=10时,=x-3=22,|22-23|<2,同样地,当x=8时,=×8-3=17,|17-16|<2,所以,
(2)中所得到的线性回归方程是可靠的.