创新设计高考数学北师大理科一轮复习练习第章 统计与统计案例 第讲 含答案.docx
《创新设计高考数学北师大理科一轮复习练习第章 统计与统计案例 第讲 含答案.docx》由会员分享,可在线阅读,更多相关《创新设计高考数学北师大理科一轮复习练习第章 统计与统计案例 第讲 含答案.docx(14页珍藏版)》请在冰豆网上搜索。
创新设计高考数学北师大理科一轮复习练习第章统计与统计案例第讲含答案
基础巩固题组
(建议用时:
40分钟)
一、选择题
1.(2016·湖北七市(州)联考)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直y=bx+a近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )
A.线性相关关系较强,b的值为3.25
B.线性相关关系较强,b的值为0.83
C.线性相关关系较强,b的值为-0.87
D.线性相关关系太弱,无研究价值
解析 依题意,注意到题中的相关的点均集中在某条直线的附近,且该直线的斜率小于1,结合各选项知选B.
答案 B
2.
设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )
A.直线l过点(
)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
解析 由样本的中心(
)落在回归直线上可知A正确;x和y的相关系数表示x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,故D错.
答案 A
3.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.y=-10x+200 B.y=10x+200
C.y=-10x-200 D.y=10x-200
解析 由题意知回归方程斜率应为负,故排除B,D,又销售量应为正值,故C不正确,故选A.
答案 A
4.登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
气温(℃)
18
13
10
-1
山高(km)
24
34
38
64
由表中数据,得到线性回归方程y=-2x+a(a∈R).由此请估计山高为72km处气温的度数为( )
A.-10 B.-8
C.-4 D.-6
解析 由表中数据可得
=
=10,
=
=40,所以中心点(10,40)在线性回归直线y=-2x+a上,所以40=-20+a,解得a=60,所以线性回归方程为y=-2x+60,当y=72时,x=-6,故选D.
答案 D
5.(2016·郑州质量预测)通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
若由χ2=
算得
χ2=
≈7.8.
参照附表,得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
解析 依题意,因为χ2=7.8>6.635,因此有99%以上的把握认为“爱好该项运动与性别有关”,故选A.
答案 A
二、填空题
6.已知回归方程y=4.4x+838.19,则可估计x与y的增长速度之比约为________.
解析 x每增长1个单位,y增长4.4个单位,故增长的速度之比约为1∶4.4=5∶22.
事实上所求的比值为回归直线方程斜率的倒数.
答案 5∶22
7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
总计
已知在全部105人中随机抽取1人,成绩优秀的概率为
,则下列说法正确的是________(填序号).
①列联表中c的值为30,b的值为35;
②列联表中c的值为15,b的值为50;
③根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”;
④根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”.
解析 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,①、②错误.
根据列联表中的数据,得到
χ2=
≈6.6>3.841,
因此有95%的把握认为“成绩与班级有关系”.
答案 ③
8.已知x,y之间的一组数据如下表:
x
2
3
4
5
6
y
3
4
6
8
9
对于表中数据,现给出如下拟合直线:
①y=x+1;②y=2x-1;③y=
x-
;④y=
x.则根据最小二乘法的思想求得拟合程度最好的直线是________(填序号).
解析 由题意知
=4,
=6,∴b=
=
,
∴a=
-b
=-
,∴y=
x-
,∴填③.
答案 ③
三、解答题
9.某地区2007年至2013年农村居民家庭人均纯收入y(单位:
千元)的数据如下表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用
(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:
回归直线的斜率和截距的最小二乘估计公式分别为:
b=
,a=
-b
.
解
(1)由所给数据计算得
=
(1+2+3+4+5+6+7)=4,
=
×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-
)2=9+4+1+0+1+4+9=28,
(ti-
)(yi-
)=(-3)×(-1.4)+(-2)×(-1)+
(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
b=
=
=0.5,
a=
-b
=4.3-0.5×4=2.3,
所求回归方程为y=0.5t+2.3.
(2)由
(1)知,b=0.5>0,故2007至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入
(1)中的回归方程,得y=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
10.(2016·深圳调研)某企业通过调查问卷(满分50分)的形式对本企业900名员工的工作满意度进行调查,并随机抽取了其中30名员工(16名女员工,14名男员工)的得分,如下表:
女
47
36
32
48
34
44
43
47
46
41
43
42
50
43
35
49
男
37
35
34
43
46
36
38
40
39
32
48
33
40
34
(1)根据以上数据,估计该企业得分大于45分的员工人数;
(2)现用计算器求得这30名员工的平均得分为40.5分,若规定大于平均得分为“满意”,否则为“不满意”,请完成下列表格:
“满意”的人数
“不满意”的人数
总计
女
16
男
14
总计
30
(3)根据上述表中数据,利用独立性检验的方法判断,能否有99%的把握,认为该企业员工“性别”与“工作是否满意”有关?
解
(1)从表中可知,30名员工中有8名得分大于45分,
所以任选一名员工,他(她)的得分大于45分的概率是
=
,所以估计此次调查中,该单位约有900×
=240名员工的得分大于45分.
(2)由题意可得下列表格:
“满意”的人数
“不满意”的人数
总计
女
12
4
16
男
3
11
14
总计
15
15
30
(3)假设H0:
“性别”与“工作是否满意”无关,
根据表中数据,求得
χ2=
≈8.571>6.635,
∴能有99%的把握认为“性别”与“工作是否满意”有关.
能力提升题组
(建议用时:
20分钟)
11.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程y=3-5x,变量x增加一个单位时,y平均增加5个单位;
③回归方程y=bx+a必过(
,
);
④有一个2×2列联表中,由计算得χ2=13.079,则有99%的把握确认这两个变量间有关系.
其中错误的个数是( )
A.0 B.1
C.2 D.3
解析 一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y=3-5x,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y=bx+a必过点(
,
),③正确;因为χ2=13.079>6.635,故有99%的把握确认这两个变量有关系,④正确.故选B.
答案 B
12.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.b>b′,a>a′ B.b>b′,aC.ba′ D.b
解析 由题意,可知b′=2,a′=-2,
b=
=
.
a=
-b
=
-
×
=-
,
∴ba′,选C.
答案 C
13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:
“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918.对此,四名同学得出了以下的判断:
p:
有95%的把握认为“这种血清能起到预防感冒的作用”;
q:
若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
r:
这种血清预防感冒的有效率为95%;
s:
这种血清预防感冒的有效率为5%.
则下列结论中,真命题的序号是________.
①p且綈q;②綈p且q;③(綈p且綈q)且(r或s);
④(p或綈r)且(綈q或s).
解析 ∵χ2≈3.918>3.841,∴有95%的把握认为“这种血清能起到预防感冒的作用”,即命题p正确,命题q,r,s均不正确.对①②③④依次进行判断,可知①④正确.
答案 ①④
14.某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集了300位学生每周平均体育运动时间的样本数据(单位:
小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
解
(1)300×
=90,所以应收集90位女生的样本数据.
(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.
(3)由
(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:
每周平均体育运动时间与性别列联表
男生
女生
总计
每周平均体育运动时间不超过4小时
45
30
75
每周平均体育运动时间超过4小时
165
60
225
总计
210
90
300
结合列联表可算得χ2=
=
≈4.762>3.841.
所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.