高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx
《高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx》由会员分享,可在线阅读,更多相关《高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx(18页珍藏版)》请在冰豆网上搜索。
高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理
16 概率与统计的综合应用
1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是().
A.45B.50
C.55D.60
解析▶由频率分布直方图知,低于60分的频率为(0.010+0.005)×20=0.3,
∴该班学生人数n==50,故选B.
答案▶B
2.有一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5],3.
根据样本的频率分布估计,数据落在[27.5,43.5]内的概率是.
解析▶由条件可知,落在[27.5,43.5]内的数据有11+12+7+3=33(个),故所求概率是=.
答案▶
3.已知某运动员每次投篮命中的概率都为40%,现采用随机模拟的方法估计该运动员三次投篮恰有两次命中的概率:
先由计算机产生0到9之间取整数值的随机数,指定1,2,3,4表示命中,5,6,7,8,9,0表示不命中,再以每三个随机数为一组,代表三次投篮的结果.经随机模拟产生了如下20组随机数:
907966191925271932812458569683
431257393027556488730113537989
据此估计,该运动员三次投篮恰有两次命中的概率为.
解析▶20组随机数中表示三次投篮恰好有两次命中的是191,271,932,812,393,其频率为=0.25,以此估计该运动员三次投篮恰有两次命中的概率为0.25.
答案▶0.25
4.如图所示的茎叶图是甲、乙两人在4次模拟测试中的成绩,其中一个数字被污损,则甲的平均成绩不超过乙的平均成绩的概率为.
解析▶依题意,设题中被污损的数字为x,若甲的平均成绩不超过乙的平均成绩,则有(8+9+2+1)-(5+3+x+5)≤0,解得x≥7,即此时x的可能取值是7,8,9,因此甲的平均成绩不超过乙的平均成绩的概率P==0.3.
答案▶0.3
能力1
▶概率与随机抽样的交汇问题
【例1】已知某中学高三理科班学生的数学与物理的水平测试成绩抽样统计如下表:
x
人数
y
A
B
C
A
14
40
10
B
a
36
b
C
28
8
34
若抽取学生n人,成绩分为A(优秀),B(良好),C(及格)三个等级,设x与y分别表示数学成绩与物理成绩,例如:
表中物理成绩为A等级的共有14+40+10=64(人),数学成绩为B等级且物理成绩为C等级的共有8人.已知x与y均为A等级的概率是0.07.
(1)设在该样本中,数学成绩的优秀率是30%,求a,b的值;
(2)已知a≥7,b≥6,求数学成绩为A等级的人数比C等级的人数多的概率.
解析▶
(1)由题意知=0.07,解得n=200,
∴×100%=30%,解得a=18,
易知a+b=30,∴b=12.
(2)由14+a+28>10+b+34得a>b+2.又a+b=30且a≥7,b≥6,则(a,b)的所有可能结果为(7,23),(8,22),(9,21),…,(24,6),共18种,而a>b+2的可能结果为(17,13),(18,12),…,(24,6),共8种,则所求概率P==.
求解古典概型与抽样方法交汇问题的思路
(1)依据题目中抽样方法的信息,提炼需要的信息.
(2)进行统计与古典概型概率的正确计算.
某险种的基本保费为a(单位:
元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度的出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费(元)
0.85a
a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
≥5
概率
0.30
0.15
0.20
0.20
0.10
0.05
(1)求一续保人本年度的保费比基本保费高出60%的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
解析▶
(1)设A表示事件“一续保人本年度的保费比基本保费高出60%”,则事件A发生即为当且仅当一年内出险次数大于3,故P(A)=0.1+0.05=0.15.
(2)设B表示事件“一续保人本年度的保费高于基本保费”,则事件B发生当且仅当一年内出险次数大于1,故P(B)=0.2+0.2+0.1+0.05=0.55.
又P(AB)=P(A),故P(A|B)====.
(3)记续保人本年度的保费为X,则X的分布列为
X
0.85a
a
1.25a
1.5a
1.75a
2a
P
0.30
0.15
0.20
0.20
0.10
0.05
E(X)=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.
因此续保人本年度的平均保费与基本保费的比值为1.23.
能力2
▶概率与频率分布直方图的综合应用
【例2】PM2.5是衡量空气污染程度的一个指标,为了了解某市空气质量情况,从去年每天的PM2.5值的数据中随机抽取40天的数据,其频率分布直方图如图所示.
现将PM2.5值划分为如下等级
PM2.5值
[0,100)
[100,150)
[150,200)
[200,250]
等级
一级
二级
三级
四级
用频率估计概率.
(1)估计该市在下一年的360天中空气质量为一级的天数;
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值的数据,再从这8个数据中随机抽取5个,求一级、二级、三级、四级天气都有的概率;
(3)如果该市对环境进行治理,治理后经统计,每天PM2.5值X近似满足X~N(115,752),求治理后的PM2.5值的均值比治理前大约下降了多少.
解析▶
(1)由样本空气质量PM2.5的数据的频率分布直方图可知,其频率分布如下表:
PM2.5值
[0,50)
[50,100)
[100,150)
[150,200)
[200,250]
频率
0.125
0.125
0.375
0.25
0.125
由上表可知,如果该市维持现状不变,那么该市下一年的某一天空气质量为一级的概率为0.25,
因此在360天中约有360×0.25=90(天).
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值数据,则这8个数据中一级、二级、三级、四级天气的数据分别有2个、3个、2个、1个.
从这8个数据中随机抽取5个,则这四种天气都有三种情况:
一级天气的数据有2个,其余的均为1个;二级天气的数据有2个,其余的均为1个;三级天气的数据有2个,其余的均为1个.
情况有:
++=24种.
而从8个数据中随机抽取5个,有=56种情况.
故所求概率为=.
(3)如果该市维持现状不变,那么该市的PM2.5值的均值约为
E(Y)=25×0.125+75×0.125+125×0.375+175×0.25+225×0.125=131.25.
如果该市对环境进行治理,那么该市的PM2.5值X的均值为E(X)=115,
因此该市治理后的PM2.5值的均值比治理前大约下降了16.25.
有关古典概型与统计结合的题型是高考考查概率的一个重要题型,已成为高考考查的热点.概率与统计综合题,无论是直接描述还是利用概率分布表、频率分布直方图、茎叶图等给出信息,准确从题中提炼信息是解题的关键.
从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值.由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.
(1)求这些产品质量指标值落在区间[75,85]内的频率;
(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于区间[45,75)内的产品件数为X,求X的分布列.
解析▶
(1)设这些产品质量指标值落在区间[75,85]内的频率为x,则落在区间[55,65),[65,75)内的频率分别为4x,2x.
依题意得(0.004+0.012+0.019+0.030)×10+4x+2x+x=1,解得x=0.05.
所以这些产品质量指标值落在区间[75,85]内的频率为0.05.
(2)由
(1)得,这些产品质量指标值落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p=0.6.
从该企业生产的这种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X服从二项分布B(n,p),其中n=3,p=0.6.
因为X的所有可能取值为0,1,2,3,
且P(X=0)=×0.60×0.43=0.064,
P(X=1)=×0.61×0.42=0.288,
P(X=2)=×0.62×0.41=0.432,
P(X=3)=×0.63×0.40=0.216,
所以X的分布列为
X
0
1
2
3
P
0.064
0.288
0.432
0.216
能力3
▶概率与统计案例的综合应用
【例3】某校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程的选课意向进行调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.
(1)分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;
(2)根据抽取的180名学生的调查结果,完成2×2列联表,并判断能否在犯错误的概率不超过0.025的前提下认为“科类的选择与性别有关”.
选择自然科学类
选择社会科学类
合计
男生
女生
合计
附:
K2=,其中n=a+b+c+d.
P(K2≥k0)
0.500
0.400
0.250
0.150
0.100
k0
0.455
0.708
1.323
2.072
2.706
P(K2≥k0)
0.050
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
解析▶
(1)由条件知,抽取的男生有105人,女生有180-105=75(人),
所以男生选择社会科学类的频率为=,女生选择社会科学类的频率为=.
由题意知,男生总数为1200×=700,女生总数为1200×=500,所以估计选择社会科学类的学生人数为700×+500×=600.
(2)根据统计数据,可得列联表如下:
选择自然科学类
选择社会科学类
合计
男生
60
45
105
女生
30
45
75
合计
90
90
180
则K2的观测值k=≈5.1429>5.024,
所以在犯错误的概率不超过0.025的前提下能认为“科类的选择与性别有关”.
(1)本题常见的错误是对独立性检验思想理解不深刻,做出错误判定.
(2)进行独立性检验时,提出的假设是两者无关.
近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表:
患三高疾病
不患三高疾病
合计
男
6
30
女
合计
36
(1)请将列联表补充完整.若用分层抽样的方法在患三高疾病的人群中抽取9人,其中女性抽取多少人?
(2)为了研究患三高疾病是否与性别有关,请计算出统计量K2的观测值k,并说明是否可以在犯错误的概率不超过0.005的前提下认为“患三高疾病与性别有关”.
临界值表:
P(K2≥k0)
0.150
0.100
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:
K2=,其中n=a+b+c+d.
解析▶
(1)补充列联表如下:
患三高疾病
不患三高疾病
合计
男
24
6
30
女
12
18
30
合计
36
24
60
在患三高疾病的人群中抽取9人,则抽取比例为=,
所以女性应该抽取12×=3(人).
(2)由2×2列联表,得K2的观测值
k==10>7.879,
所以可以在犯错误的概率不超过0.005的前提下认为“患三高疾病与性别有关”.
能力4
▶统计与概率的综合应用
【例4】一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.
将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;
(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列、数学期望E(X)及方差D(X).
解析▶
(1)设A1表示事件“日销售量不低于100个”,A2表示事件“日销售量低于50个”,B表示事件“在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个”,因此
P(A1)=(0.006+0.004+0.002)×50=0.6,
P(A2)=0.003×50=0.15,
P(B)=0.6×0.6×0.15×2=0.108.
(2)X可能取的值为0,1,2,3,相应的概率为
P(X=0)=×(1-0.6)3=0.064,
P(X=1)=×0.6×(1-0.6)2=0.288,
P(X=2)=×0.62×(1-0.6)=0.432,
P(X=3)=×0.63=0.216.
X的分布列为
X
0
1
2
3
P
0.064
0.288
0.432
0.216
因为X~B(3,0.6),所以数学期望E(X)=3×0.6=1.8,
方差D(X)=3×0.6×(1-0.6)=0.72.
二项分布的期望与方差.
(1)如果X~B(n,p),那么用公式E(X)=np;D(X)=np(1-p)求解,可大大减少计算量.
(2)有些随机变量虽然不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aX+b)=aE(X)+b以及E(X)=np求出E(aX+b),同样还可求出D(aX+b).
空气质量指数(AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级:
0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;300以上为严重污染.
一环保人士记录去年某地六月中的10天的AQI的茎叶图如图所示.
(1)利用该样本估计该地六月空气质量为优良(AQI≤100)的天数;
(2)将频率视为概率,从六月中随机抽取3天,记3天中空气质量为优良的天数为ξ,求ξ的分布列.
解析▶
(1)从茎叶图中可以发现样本中空气质量为优的天数为2,空气质量为良的天数为4,
∴该样本中空气质量为优良的频率为=,
从而估计该地六月空气质量为优良的天数为30×=18.
(2)由
(1)估计六月某天空气质量为优良的概率为,
ξ的所有可能取值为0,1,2,3,且ξ~B.
∴P(ξ=0)==,
P(ξ=1)=×=,
P(ξ=2)=×=,
P(ξ=3)==,
故ξ的分布列为
ξ
0
1
2
3
P
一、选择题
1.已知随机变量x,y的值如表所示,如果x与y线性相关且回归直线方程为=bx+,那么实数b=().
x
2
3
4
y
5
4
6
A.-B.
C.-D.
解析▶因为=3,=5,由回归直线过样本点的中心(3,5),得5=3b+,所以b=.
答案▶B
2.把样本容量为20的数据分组,分组区间与频数如下:
[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2.则在区间[10,50)上的数据的频率是().
A.0.05B.0.25
C.0.5D.0.7
解析▶由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为=0.7,故选D.
答案▶D
3.在一个容量为N的总体中抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则().
A.p1=p2C.p1=p3解析▶由于在三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3,故选D.
答案▶D
4.某地区为了解中学生的日平均睡眠时间(单位:
h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n等于().
A.80B.90
C.100D.110
解析▶设第1个小长方形的面积为S,
则4个小长方形的面积之和为4S+×0.1.
由题意知,4S+×0.1=1,故S=0.1.
又因为=0.1,所以n=100,故选C.
答案▶C
二、填空题
5.从某地高中男生中随机抽取100名同学,将他们的体重(单位:
kg)数据绘制成频率分布直方图(如图).由图中数据可知体重的平均值为kg;若要从体重在[60,70),[70,80),[80,90]三组内的男生中,用分层抽样的方法选取12人参加一项活动,再从这12个人中选两人当正副队长,则这两人体重不在同一组内的概率为.
解析▶由频率分布直方图可知,体重在[40,50)内的男生人数为0.005×10×100=5,
同理,体重在[50,60),[60,70),[70,80),[80,90]内的人数分别为35,30,20,10,
所以体重的平均值为
=64.5.
利用分层抽样的方法选取12人,
则从体重在[60,70),[70,80),[80,90]三组内选取的人数分别为12×=6,12×=4,12×=2,则两人体重不在同一组内的概率为=.
答案▶64.5
三、解答题
6.某校从参加高三模拟考试的学生中随机抽取60名分数不低于90分的学生,将其数学成绩(均为整数)分成[90,100),[100,110),…,[140,150]六组后,得到如下部分频率分布直方图,观察图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率;
(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,据此,估计这60名学生本次考试的平均分;
(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率.
解析▶
(1)分数在[120,130)内的频率为
1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3.
(2)估计平均分为
=95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.
(3)由题意,在[110,120)分数段的人数为60×0.15=9.
在[120,130)分数段的人数为60×0.3=18.
∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,
∴需在[110,120)分数段内抽取2人,并分别记为m,n,在[120,130)分数段内抽取4人,并分别记为a,b,c,d.
则从样本中任取2人的基本事件有{m,n},{m,a},{m,b},{m,c},{m,d},{n,a},{n,b},{n,c},{n,d},{a,b},{a,c},{a,d},{b,c},{b,d},{c,d},共15个.
设“从样本中任取2人,至多有1人在分数段[120,130)内”为事件A,
则事件A包含的基本事件有{m,n},{m,a},{m,b},{m,c},{m,d},{n,a},{n,b},{n,c},{n,d},共9个.
∴P(A)==.
7.在数学趣味知识培训活动中,甲、乙两名学生的6次培训成绩如茎叶图所示:
(1)从甲、乙两人中选择一人参加数学趣味知识竞赛,你会选哪位?
请运用统计学的知识说明理由.
(2)从乙的6次成绩中随机选择2次成绩,求选到123分的概率.
解析▶
(1)==112,
==112,
=×[(99-112)2+(107-112)2+(108-112)2+(115-112)2+(119-112)2+(124-112)2]=,
=×[(102-112)2+(105-112)2+(112-112)2+(113-112)2+(117-112)2+(123-112)2]=,
∴=,>.
说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,故选择乙同学.
(2)从6个成绩中随机选择2个,共有15个基本事件,分别是{102,105},{102,112},{102,113},{102,117},{102,123},{105,112},{105,113},{105,117},{105,123},{112,113},{112,117},{112,123},{113,117},{113,123},{117,123},
其中满足条件的基本事件有5个,故所求概率P==.
8.某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:
(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b),其中a和分别表示甲组研发成功和失败;b和分别表示乙组研发成功和失败.
(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平.
(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.
解析▶
(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数==;
方差=×
=.
乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数==;
方差=×
=.
因为>,<,所以甲组的研发水平优于乙组.
(2)记“恰有一组研发成功”为事件E,在所抽得的15个结果中,恰有一组研发