故a=8或a=9,即a=8或9时,有90%的把握认为A与B有关系.
22.(本小题满分12分)如图是某地区2003年至2019年环境基础设施投资额Y(单位:
亿元)的折线图.
为了预测该地区2021年的环境基础设施投资额,建立了Y与时间变量T的两个线性回归模型.根据2003年至2019年的数据(时间变量T的值依次为1,2,…,17)建立模型①:
Y=-30.4+13.5T;根据2013年至2019年的数据(时间变量T的值依次为1,2,…,7)建立模型②:
y=99+17.5T.
(1)分别利用这两个模型,求该地区2021年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?
并说明理由.
[解]
(1)利用模型①,该地区2021年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2021年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2003年至2019年的数据对应的点没有随机散布在直线Y=-30.4+13.5T上下,这说明利用2003年至2019年的数据建立的线性模型①不能很好地描述环境基础设施投资额的趋势.2013年相对2012年的环境基础设施投资额有明显增加,2013年至2019年的数据对应的点位于一条直线的附近,这说明从2013年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2013年至2019年的数据建立的线性模型Y=99+17.5T可以较好地描述2013年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2019年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
章末综合测评(六) 统计案例
(满分:
150分时间:
120分钟)
一、选择题(本大题共8小题,每小题5分,共40分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.下列说法中①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1,或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.正确的有( )
A.①② B.②③ C.①③ D.①②③
C [由相关系数的定义可知①③正确.]
2.大学生和研究生毕业的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如下表所示:
学位
性别
学士
硕士
总计
男
162
27
189
女
143
8
151
总计
305
35
340
根据以上数据,则( )
A.获取学位类别与性别有关
B.获取学位类别与性别无关
C.性别决定获取学位的类别
D.以上都是错误的
A [χ2=≈7.343>6.635.故有99%的把握认为获取学位类别与性别有关.]
3.如图所示,有5组数据(x,y),去掉哪组数据后,剩下的4组数据的线性相关系数最大( )
A.A B.B C.C D.D
D [去掉D点,其他四点大致分布在一条直线附近.]
4.已知X与Y之间的一组数据:
X
0
1
2
3
Y
1
3
5
7
则Y与X的线性回归方程Y=bX+a必过点( )
A.(2,2) B.(1.5,0) C.(1,2) D.(1.5,4)
D [线性回归方程Y=bX+a,必过点(,),即(1.5,4).]
5.在一次抽样调查中,经过计算得到χ2=0.27,根据这一数据,我们有理由认为( )
A.两个分类变量关系较弱 B.两个分类变量关系较强
C.两个分类变量无关系 D.以上说法都不正确
C [根据临界值判断.]
6.下列图形中具有相关关系的两个变量是( )
A B
C D
C [A、B中显然任何一个x都有唯一确定的y和它对应,是一种函数关系;C中从散点图中可看出所有点看上去都在一条直线附近波动,具有相关关系,而且是一种线性相关;D中所有的点在散点图中没有显示任何关系,因此变量间是不相关的.]
7.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则线性回归方程是( )
A.Y=1.23X+4 B.Y=1.23X+5
C.Y=1.23X+0.08 D.Y=0.08X+1.23
C [由题知b=1.23,直线经过中心(4,5),则a=0.08,所以线性回归方程为Y=1.23X+0.08.]
8.设两个变量X和Y之间具有线性相关关系,它们的相关系数是r,Y关于X的回归直线的斜率是b,纵截距是a,那么必有( )
A.b与r的符号相同 B.a与r的符号相同
C.b与r的符号相反 D.a与r的符号相反
A [根据b与r的计算公式可知,b与r的符号始终相同.]
二、选择题(本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多项符合题目要求,全部选对得5分,部分选对得3分,有选错的得0分)
9.下列变量关系不是函数关系的是( )
A.人的寿命与性别之间的关系
B.等边三角形的边长与面积之间的关系
C.施肥量与产量之间的关系
D.学习时间与学习成绩之间的关系
ACD [函数关系是一种确定性关系,相关关系是一种非确定性关系.]
10.下面是两个变量的一组样本数据:
X
2
3
4
5
6
Y
2.2
3.8
5.5
6.5
7
根据以上数据,可知下列结论正确的是( )
A.Y与X正相关
B.Y与X负相关
C.Y与X之间的相关系数r约为0.979
D.Y与X之间的相关系数r约为-0.979
AC [x=90,y=140.78,xiyi=112.3,=4,=5,代入公式得r≈0.979.由r>0可知,Y与X正相关.]
11.四名同学根据各自的样本数据研究变量X,Y之间的相关关系,并求得回归直线方程,分别得到以下四个结论,其中一定不正确的结论是( )
A.Y与X负相关且Y=2.347X-6.423
B.Y与X负相关且Y=-3.476X+5.648
C.Y与X正相关且Y=5.437X+8.493
D.Y与X正相关且Y=-4.326X-4.578
AD [由正负相关性的定义知AD一定不正确.]
12.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=bx+1上,则这组样本数据的样本相关系数可能是( )
A.-1 B.0 C. D.1
AD [根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为±1,故选AD.]
三、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上)
13.下表是某厂1~4月份用水量(单位:
百吨)的一组数据:
月份X
1
2
3
4
用水量Y
4.5
4
3
2.5
由散点图可知,用水量Y与月份X之间有较好的线性相关关系,其线性回归直线方程是Y=-0.7X+a,则a=________.
5.25 [=2.5,=3.5,∵回归直线方程过样本点(,),∴3.5=-0.7×2.5+a.∴a=5.25.]
14.某化工厂为预测某产品的回收率Y,需要研究它和原料有效成分含量X之间的相关关系.现取了8对观测值,计算得xi=52,yi=228,x=478,xiyi=1 849,则Y对X的线性回归方程是________.
Y=11.47+2.62X [∵=≈2.62,=-b=11.47,∴线性回归方程为Y=11.47+2.62X.]
15.从散点图上看,点散布在从左下角到右上角的区域内,则两个变量的这种相关关系称为________.
[答案] 正相关
16.为了判断学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:
选修文理情况
性别
理科
文科
男
13
10
女
7
20
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据表中数据,得到χ2=≈4.844.则认为选修文科与性别有关联的把握度是________.
95% [∵χ2=4.844>3.841,∴至少有95%的把握认为是否选修文科与性别有关.]
四、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)在500名患者身上试验某种血清治疗新冠肺炎的作用,与另外500名未用血清的患者进行比较研究,结果如下表:
治疗情况
使用血清情况
治愈
未治愈
总计
用血清治疗
254
246
500
未用血清治疗
223
277
500
总计
477
523
1 000
问该种血清能否起到治疗新冠肺炎的作用?
[解] 由列联表给出的数据,
χ2=≈3.852 2.
因为3.852 2>3.841,所以我们有95%以上的把握认为这种血清能起到治疗新冠肺炎的作用.
18.(本小题满分12分)为了研究数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,现调查了10名同学的数学、物理、语文成绩如下表:
编号
1
2
3
4
5
数学
136
125
122
87
108
物理
107
91
92
76
93
语文
86
114
104
109
100
编号
6
7
8
9
10
数学
113
111
70
94
74
物理
85
82
78
78
73
语文
106
112
104
95
99
由这些数据,你能发现什么规律?
你的根据是什么?
[解] 利用相关系数r的计算公式.可求出物理成绩与数学成绩的相关系数r1≈0.87,接近于1;语文成绩与数学成绩的相关系数r2≈0.092,接近于0,从而认为物理成绩与数学成绩之间具有很强的线性相关关系,语文成绩与数学成绩不具有线性相关关系.
19.(本小题满分12分)某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:
气温X(℃)
26
18
13
10
4
-1
杯数Y
20
24
34
38
50
64
画出散点图并计算相关系数r,判断热茶销售量与气温之间是否具有线性相关关系?
[解] 由表中数据画出散点图,如图所示.
由表中数据得=(26+18+13+10+4-1)≈11.67,
=(20+24+34+38+50+64)≈38.33,
xiyi=26×20+18×24+13×34+10×38+4×50-1×64=1 910,
x=262+182+132+102+42+(-1)2=1 286,
y=202+242+342+382+502+642=10 172,
计算r≈-0.97接近于-1,
所以热茶销售量与气温之间具有较强的线性相关关系.
20.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:
千元)与月储蓄yi(单位:
千元)的数据资料,算得xi=80,yi=20,xiyi=184,x=720.
(1)求家庭的月储蓄Y对月收入X的线性回归方程Y=bX+a;
(2)判断变量X与Y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千