高中数学 第三章 统计案例单元测评A 新人教A版选修23Word格式文档下载.docx
《高中数学 第三章 统计案例单元测评A 新人教A版选修23Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《高中数学 第三章 统计案例单元测评A 新人教A版选修23Word格式文档下载.docx(20页珍藏版)》请在冰豆网上搜索。
5.某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( )
A.72%B.83%
因为当=7.675时,x=≈9.262,
所以≈0.829≈83%.
B
6.已知一个线性回归方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则等于( )
A.60B.46.5
C.58.5D.75
=9,因为回归直线方程过点(),所以=1.5×
+45=1.5×
9+45=58.5.
7.有一组观测数据(x1,y1),(x2,y2),…,(x12,y12)得=1.542,=2.8475,=29.808,=99.208,xiyi=54.243,则回归直线方程为( )
A.=1.218x-0.969
B.=-1.218x+0.969
C.=0.969x+1.218
D.=1.218x+0.969
由公式得≈1.218,≈0.969.
∴回归直线方程为=1.218x+0.969.
D
8.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )
优、良、中
差
总计
实验班
48
2
50
对比班
38
12
86
100
A.有关
B.无关
C.关系不明确
D.以上都不正确
随机变量K2的观测值k=≈8.306>
6.635,则认为“实验效果与教学措施有关”的概率约为0.99.
9.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面列联表:
数学
物理
85~100分
85分以下
37
85
122
35
143
178
72
228
300
现判断数学成绩与物理成绩有关系,则判断的出错率为( )
A.0.5%B.1%
C.2%D.5%
代入公式得K2的观测值
k=≈4.514>
3.841,查表可得,判断的出错率为5%.
10.两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于( )
A.3B.4
C.5D.6
列2×
2列联表如下
x1
x2
y1
21
31
y2
c
d
10+c
21+d
66
故K2的观测值k=≥5.024.
把选项A,B,C,D代入验证可知选A.
二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中横线上)
11.已知某车间加工零件的个数x与所花费时间y(单位:
h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要 h.
当x=600时,=0.01×
600+0.5=6.5.
6.5
12.下面是一个2×
2列联表:
合计
a
70
30
b
则b-d= .
13.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3e2x+1的图象附近,则可通过转换得到的线性回归方程为 .
由y=3e2x+1,得lny=ln(3e2x+1),
即lny=ln3+2x+1.
令u=lny,v=x,则线性回归方程为u=1+ln3+2v.
y=1+ln3+2x
14.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:
年龄
不超过40岁
超过40岁
吸烟量不多于20支/天
15
65
吸烟量多于20支/天
60
40
则在犯错误的概率不超过 的前提下认为吸烟量与年龄有关.
利用题中列联表,代入公式计算.
K2的观测值为k=≈22.16>
10.828,
所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.
0.001
15.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
患慢性气管炎
未患慢性气管炎
吸烟
不吸烟
55
75
根据列联表数据,求得K2= (保留3位有效数字),根据下表,有 的把握(填写相应的百分比)认为患慢性气管炎与吸烟有关.
附:
P(K2≥k)
0.050
0.010
k
3.841
6.635
10.828
K2=.
K2的观测值k=≈22.2>
10.828.
∴有99.9%的把握认为患慢性气管炎与吸烟有关.
22.2 99.9%
三、解答题(本大题共4小题,共25分.解答应写出必要的文字说明、证明过程或演算步骤)
16.(6分)在一次恶劣气候的飞行航程中调查男、女乘客在飞机上晕机的情况,共调查了89位乘客,其中男乘客有24人晕机,31人不晕机;
女乘客有8人晕机,26人不晕机.根据此材料能否在犯错误的概率不超过0.05的前提下认为在恶劣气候飞行中男性比女性更容易晕机?
解:
由已知数据列出2×
晕机
不晕机
男性
24
女性
26
34
32
57
89
根据公式计算得K2的观测值为
k=≈3.689<
3.841.
所以在犯错误的概率不超过0.05的前提下我们不能认为恶劣气候下飞行中男性比女性更容易晕机.
17.(6分)有两个分类变量X与Y的取值分别为{x1,x2},{y1,y2},其2×
2列联表为
20-a
15-a
30+a
其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为X与Y之间有关系?
查表可知,要使在犯错误的概率不超过0.1的前提下认为X与Y之间有关系,则k≥2.706,而
K2的观测值为
k=,
由k≥2.706,
得a>
7.19或a≤2.04.
又a>
5,且15-a>
5,a∈Z,即a=8或9.
故a为8或9时,在犯错误的概率不超过0.1的前提下认为X与Y之间有关系.
18.(6分)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?
设男生人数为x,依题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
男生
女生
若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则k≥3.841,
K2的观测值为k=≥3.841,解得x>
10.24.
∵为整数,
∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,男生至少有12人.
19.(7分)假定某企业的某种产品产量与单位成本数据如下:
产量x(千件)
3
单位成本y(元/件)
73
71
69
68
(1)试确定回归直线方程;
(2)指出产量每增加1000件时,单位成本下降多少元;
(3)假定产量为6000件时,单位成本是多少?
单位成本为70元时,产量应为多少?
(1)xi=21,yi=426,=79,=30268,xiyi=1481,=3.5,=71,
=
=≈-1.818,
≈71+1.818×
3.5=77.363,
∴回归方程为y=77.363-1.818x.
(2)产量每增加1000件时单位成本下降1.818元.
(3)当x=6时,y=66.455;
当y=70时,x≈4.
所以当产量为6000件时,单位成本约为66.455元;
当单位成本为70元时,产量应约为4000件.
2019-2020年高中数学第三章统计案例单元测评B新人教A版选修2-3
1.(xx重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3
B.=2x-2.4
C.=-2x+9.5
D.=-0.3x+4.4
由变量x与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过点(),由此排除B,故选A.
2.(xx福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程x+,其中=0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元B.11.8万元
C.12.0万元D.12.2万元
∵=10,
=8,
∴-0.76=8-0.76×
10=0.4.
∴=0.76x+0.4.
当x=15时,
=0.76×
15+0.4=11.8.
3.(xx湖北武汉调考)根据如下样本数据:
4.0
2.5
-0.5
0.5
-2.0
得到的回归直线方程为x+.若=7.9,则x每增加1个单位,y就( )
A.增加1.4个单位B.减少1.4个单位
C.增加1.2个单位D.减少1.2个单位
(3+4+5+6+7)=5,(4.0+2.5-0.5+0.5-2.0)=0.9,所以样本中心为(5,0.9),代入回归直线方程可得0.9=×
5+7.9⇒=-1.4,所以x每增加1个单位,y就减少1.4个单位,故选B.
4.(xx新课标全国高考改编)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关指数为( )
A.B.0
C.D.1
因为所有的点都在直线上,所以就是确定的函数关系,所以相关指数为1.
5.(xx陕西咸阳模拟)某产品在某零售摊位上的零售价x(元)与每天的销售量y(个)的统计如下表:
16
17
41
据上表可得回归直线方程x+中的=-4,则据此模型预测零售价为15元时,销售量为( )
A.48B.49
C.50D.51
=39.
∵回归直线方程为x+,且=-4,
∴39=-4×
+a,解得a=109.
∴=-4x+109,当x=15时,y=49.
6.(xx河南开封模拟)在一次独立性检验中,得到2×
2列联表如下:
200
800
1000
180
m
180+m
380
800+m
1180+m
且最后发现,两个分类变量X和Y没有任何关系,则m的可能值是( )
A.200B.720
C.100D.180
∵两个变量没有任何关系,∴200m≈180×
800,解得m≈720.
7.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关,且=2.347x-6.423;
②y与x负相关,且=-3.476x+5.648;
③y与x正相关,且=5.437x+8.493;
④y与x正相关,且=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①②B.②③
C.③④D.①④
正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④,故选D.
8.(xx湖北高考)根据如下样本数据:
-3.0
得到的回归方程为x+,则( )
A.>
0,>
0
B.>
0,<
C.<
D.<
由样本数据可知y值总体上是随x值的增大而减少的,故<
0.又回归直线过第一象限,故纵截距>
0.故选B.
9.(xx福建高考改编)已知x与y之间的几组数据如下表:
1
假设根据上表数据所得线性回归直线方程为x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为'
x+'
则以下结论正确的是( )
A.'
'
B.'
C.'
D.'
=-,
'
==2>
=-2<
.
10.(xx江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩
性别
不及格
及格
男
女
22
36
52
表2
视力
好
表3
智商
偏高
正常
表4
阅读量
丰富
不丰富
A.成绩B.视力
C.智商D.阅读量
根据K2=,代入题中数据计算得D选项K2最大.故选D.
11.(xx河北唐山一模)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得如下实验数据,计算得回归直线方程为=0.85x-0.25.由以上信息,得到下表中c的值为 .
天数x/天
繁殖个数y/千个
4.5
∵=5,,∴这组数据的样本中心点是.把样本中心点代入回归直线方程中得=0.85×
5-0.25,解得c=6.
12.(xx辽宁大连双基)已知x,y的取值如下表所示:
如果y与x线性相关,且线性回归方程为x+,则的值为 .
将=3,=5代入到x+中,得=-.
-
13.(xx辽宁高考)调查了某地若干户家庭的年收入x(单位:
万元)和年饮食支出y(单位:
万元).调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元.
家庭收入每增加1万元,对应回归直线方程中的x增加1,相应的的值增加0.254,即年饮食支出平均增加0.254万元.
0.254
14.(xx山东青岛高三月考试题)已知y与x之间具有很强的线性相关关系,现观测得到(x,y)的四组观测值并制作了如下的对照表,由表中数据粗略地得到线性回归直线方程为x+60,其中的值没有写上.当x不小于-5时,预测y的最大值为 .
13
-1
64
由已知,得=10,
=40,
所以40=10+60,=-2,=-2x+60.当x≥-5时,≤70.
15.(xx广东高考)某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm.
由题意父亲身高xcm与儿子身高ycm对应关系如下表:
173
170
176
182
则=173,
=176,
(xi-)(yi-)=(173-173)×
(170-176)+(170-173)×
(176-176)+(176-173)(182-176)=18,
(xi-)2=(173-173)2+(170-173)2+(176-173)2=18.
∴=1.∴=176-173=3.
∴线性回归直线方程x+=x+3.
∴可估计孙子身高为182+3=185(cm).
185
16.(6分)(xx课标全国Ⅱ高考)某地区xx年至xx年农村居民家庭人均纯收入y(单位:
千元)的数据如下表:
年份
xx
年份代号t
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用
(1)中的回归方程,分析xx年至xx年该地区农村居民家庭人均纯收入的变化情况,并预测该地区xx年农村居民家庭人均纯收入.
回归直线的斜率和截距的最小二乘估计公式分别为.
(1)由所给数据计算得
(1+2+3+4+5+6+7)=4,
(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)
=(-3)×
(-1.4)+(-2)×
(-1)+(-1)×
(-0.7)+0×
0.1+1×
0.5+2×
0.9+3×
1.6=14,
=0.5,
=4.3-0.5×
4=2.3,
所求回归方程为=0.5t+2.3.
(2)由
(1)知,=0.5>
0,故xx年至xx年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将xx年的年份代号t=9代入
(1)中的回归方程,得=0.5×
9+2.3=6.8,
故预测该地区xx年农村居民家庭人均纯收入为6.8千元.
17.(6分)(xx安徽高考改编)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法.收集300位学生每周平均体育运动时间的样本数据(单位:
小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.
附K2=.
(1)300×
=90,
所以应收集90位女生的样本数据.
(2)由频率分布直方图得1-2×
(0.100+0.025)=0.75,
所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.
(3)由
(2)知,300位学生中有300×
0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:
每周平均体育运动时间与性别列联表
每周平均体育运动时间
不超过4小时
45
超过4小时
165