高考数学文二轮备考教学案专题16概率与统计Word格式.docx
《高考数学文二轮备考教学案专题16概率与统计Word格式.docx》由会员分享,可在线阅读,更多相关《高考数学文二轮备考教学案专题16概率与统计Word格式.docx(18页珍藏版)》请在冰豆网上搜索。
![高考数学文二轮备考教学案专题16概率与统计Word格式.docx](https://file1.bdocx.com/fileroot1/2022-10/11/ee11b62a-698b-4837-9a13-113b398ef979/ee11b62a-698b-4837-9a13-113b398ef9791.gif)
图183
A.91,91.5B.91,92
C.91.5,91.5D.91.5,92
(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:
在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人.
【答案】
(1)C
(2)6912
【解析】
(1)中位数为=91.5,平均数为90+=91.5.
(2)根据样本估计总体的思想,可知该地区群众对“键盘侠”持反对态度的概率约为,所以该地区9600人中对“键盘侠”持反对态度的大约有9600×
=6912(人).
【特别提醒】统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.
【变式探究】
(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是[0,5),[5,10),…,[35,40],作出的频率分布直方图如图184所示,则原始的茎叶图可能是( )
图184
图185
(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图186所示,数据分组依次如下:
[70,90),[90,110),[110,130),[130,150].
估计该班数学成绩的平均分数为( )
图186
A.112
B.114
C.116
D.120
(1)B
(2)B
【命题热点突破三】统计案例
例3、某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:
小时).
(1)应收集多少名女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图187所示),其中样本数据分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.
(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
附:
K2=
【解析】:
(1)300×
=90,所以应收集90名女生的样本数据.
(2)由频率分布直方图得每周平均参加体育运动超过4小时的频率为1-2×
(0.100+0.025)=0.75,所以该校学生每周平均参加体育运动时间超过4小时的概率约为0.75.
(3)由
(2)知,300名学生中有300×
0.75=225(名)学生每周平均参加体育运动的时间超过4小时,其余75名学生每周平均参加体育运动的时间不超过4小时.又因为抽取的300名学生中有210名男生、90名女生,所以每周平均参加体育运动时间与性别的列联表如下:
男生
女生
总计
每周平均参加体育运动
的时间不超过4小时
45
30
75
的时间超过4小时
165
60
225
210
90
300
结合列联表可得K2的观测值k==≈4.762>
3.841.
所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.
【特别提醒】在计算K2时要注意公式中各个字母的含义,分子上是总量乘2×
2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.
为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:
小时)与当天投篮命中率y之间的关系.
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
(1)求小李这5天的平均投篮命中率;
(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率.
设线性回归方程为=x+,则由公式可得==
=0.01,
所以=-=0.5-0.01×
3=0.47,
所以=x+=0.01x+0.47.
当x=6时,=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53.
【特别提醒】回归直线一定过样本点的中心(x,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:
正相关时回归直线方程的斜率为正值;
负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.
【高考真题解读】
1.【2017北京高考】
某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:
[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:
(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解:
(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为,所以样本中分数小于70的频率为.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.
所以总体中分数在区间内的人数估计为.
(Ⅲ)由题意可知,样本中分数不小于70的学生人数为,
所以样本中分数不小于70的男生人数为.
所以样本中的男生人数为,女生人数为,男生和女生人数的比例为.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为.
2.【2017安徽高考】
为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:
cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
6
7
8
零件尺寸
9.95
10.12
9.96
10.01
9.92
9.98
10.04
9
10
11
12
13
14
15
16
10.26
9.91
10.13
10.02
9.22
10.05
经计算得,,,,其中为抽取的第i个零件的尺寸,i=1,2,……,16.
(1)求(xi,i)(i=1,2,……,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<
0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
样本的相关系数,.
(1)由样本数据得的相关系数为
.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)(i)由于,由样本数据可以看出抽取的第13个零件的尺寸在以外,因此需对当天的生产过程进行检查.
(ii)剔除离群值,即第13个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值为10.02.
,
剔除第13个数据,剩下数据的样本方差为,
这条生产线当天生产的零件尺寸的标准差的估计值为.
3.【2017贵州高考】
某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:
℃)有关.如果最高气温不低于25,需求量为500瓶;
如果最高气温位于区间[20,25),需求量为300瓶;
如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
36
25
以最高气温位于各区间的频率代替最高气温位于该区间的概率。
(1)求六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为Y(单位:
元),当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为=0.6,所以这种酸奶一天的需求量不超过300瓶的概率估计值为0.6.
(2)当这种酸奶一天的进货量为450瓶时,
若最高气温不低于25,则Y=6450-4450=900;
若最高气温位于区间[20,25),则Y=6300+2(450-300)-4450=300;
若最高气温低于20,则Y=6200+2(450-200)-4450=-100.
所以,Y的所有可能值为900,300,-100.
Y大