第十四单元145概率与统计的综合应用.docx
《第十四单元145概率与统计的综合应用.docx》由会员分享,可在线阅读,更多相关《第十四单元145概率与统计的综合应用.docx(22页珍藏版)》请在冰豆网上搜索。
第十四单元145概率与统计的综合应用
§14.5 概率与统计的综合应用
题型一
统计图表与数字特征的综合
【例1】长春市统计局对某公司月收入在1000~4000元内的职工进行一次统计,并根据所得数据作出样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示职工月收入在区间[1000,1500)内,单位:
元),如图所示.
(1)请估计该公司的职工月收入在[1000,2000)内的概率;
(2)根据频率分布直方图估计样本数据的中位数和平均数.
【分析】
(1)由频率分布直方图计算可得职工月收入在[1000,2000)内的概率.
(2)利用面积相等可得中位数的估计值;利用平均数计算公式可得平均数的估计值.
【解析】
(1)职工月收入在[1000,2000)内的概率为(0.0002+0.0004)×500=0.3.
(2)由频率分布直方图可知,从左至右小矩形的面积分别是0.1,0.2,0.25,0.25,0.15,0.05.
因此,中位数的估计值为2000+
=2400;
平均数的估计值为1250×0.1+1750×0.2+2250×0.25+2750×0.25+3250×0.15+3750×0.05=2400.
综上可知,中位数和平均数的估计值都是2400.
利用频率分布直方图求众数、中位数和平均数时,应注意三点:
①最高的小长方形底边中点的横坐标是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
【追踪训练1】某厂分别用甲、乙两种工艺生产同一种零件,尺寸在[223,228]内(单位:
mm)的零件为一等品,其余为二等品.在两种工艺生产的零件中,各随机抽取10个,其尺寸的茎叶图如图所示:
(1)分别计算抽取的两种工艺生产的零件尺寸的平均数;
(2)已知甲工艺每天可生产300个零件,乙工艺每天可生产280个零件,一等品利润为30元/个,二等品利润为20元/个.视频率为概率,试根据抽样数据判断采用哪种工艺生产该零件每天获得的利润更高.
【解析】
(1)
=
(217+218+222+225+226+227+228+231+233+234)=226.1;
=
(218+219+221+224+224+225+226+228+230+232)=224.7.
(2)由抽取的样本可知,采用甲工艺生产的产品为一等品的概率为
为二等品的概率为
故采用甲工艺生产该零件每天取得的利润w甲=300×
×30+300×
×20=7200元;
采用乙工艺生产的产品为一等品、二等品的概率均为
故采用乙工艺生产该零件每天取得的利润w乙=280×
×30+280×
×20=7000元.
因为w甲>w乙,所以采用甲工艺生产该零件每天取得的利润更高.
题型二
统计图表与概率的综合
【例2】某水产品经销商销售某种鲜鱼,售价为每公斤20元,成本为每公斤15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价处理完,平均每公斤损失3元.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.
(1)根据频率分布直方图计算该种鲜鱼日需求量的平均数
(同一组中的数据用该组区间的中点值作代表);
(2)该经销商某天购进了300公斤这种鲜鱼,假设当天的需求量为x(0≤x≤500)公斤,利润为Y元.求Y关于x的函数关系式,并结合频率分布直方图估计利润Y不小于700元的概率.
【分析】
(1)每个小长方形底边中点的横坐标与该小长方形的面积相乘后求和,即可得到该种鲜鱼日需求量的平均数;
(2)分两种情况讨论,利用销售额与成本的差可求得y关于x的函数关系式,根据利润Y不小于700元,求出x的取值范围,根据频率分布直方图可得概率.
【解析】
(1)
=50×0.0010×100+150×0.0020×100+250×0.0030×100+350×0.0025×100+450×0.0015×100=265.
(2)当日需求量不低于300公斤时,利润Y=(20-15)×300=1500元;
当日需求量不足300公斤时,利润Y=(20-15)x-(300-x)×3=8x-900元.
故Y=
由Y≥700得200≤x≤500,
所以P(Y≥700)=P(200≤x≤500)
=0.0030×100+0.0025×100+0.0015×100=0.7.
此类问题的解答关键:
(1)正确解读图表,找出解题所需的数据;
(2)能够把题目中的文字信息转化为符号信息.
【追踪训练2】央视传媒为了解央视举办的《朗读者》节目的收视时间情况,随机抽取了某市30名观众进行调查,其中有12名男观众和18名女观众,将这30名观众的收视时间(单位:
分钟)编成如图所示的茎叶图,收视时间在35分钟以上(包括35分钟)的称为“朗读爱好者”,收视时间在35分钟以下(不包括35分钟)的称为“非朗读爱好者”.
(1)若采用分层抽样的方法从“朗读爱好者”和“非朗读爱好者”中随机抽取5名,再从这5名观众中任选2名,求至少选到1名“朗读爱好者”的概率;
(2)若从收视时间在40分钟以上(包括40分钟)的观众中选出男、女观众各1名,求选出的这两名观众收视时间相差5分钟以上的概率.
【解析】
(1)根据茎叶图,可知“朗读爱好者”有12人,“非朗读爱好者”有18人,用分层抽样的方法,每个人被抽到的概率是
=
其中“朗读爱好者”有12×
=2人,记为B,C,“非朗读爱好者”有18×
=3人,记为1,2,3.
记事件A:
至少有一名“朗读爱好者”被选中.从5名观众中任选2名的基本事件有(B,C),(B,1),(B,2),(B,3),(C,1),(C,2),(C,3),(1,2),(1,3),(2,3),共10个,满足A的基本事件有(B,C),(B,1),(B,2),(B,3),(C,1),(C,2),(C,3),共7个,∴P(A)=
.
(2)收视时间在40分钟以上的男观众中,收视时间分别是41,42,44,47,51,收视时间在40分钟以上的女观众中,收视时间分别是40,41,现要各抽1名,则有(41,40),(41,41),(42,40),(42,41),(44,40),(44,41),(47,40),(47,41),(51,40),(51,41),共10种情况.
收视时间相差5分钟以上的有(47,40),(47,41),(51,40),(51,41),共4种情况.
故收视时间相差5分钟以上的概率P=
=
.
题型三
独立性检验与概率的综合
【例3】2017年5月27日当今世界围棋排名第一的柯洁在与AlphaGo的人机大战中中盘弃子认输,至此柯洁与AlphaGo的三场比赛全部结束,柯洁三战全负,这次人机大战再次引发全民对围棋的关注.某学校社团为调查学生学习围棋的情况,随机抽取了100名学生进行调查,根据调查结果绘制的学生日均学习围棋时间的频率分布直方图如图所示,将日均学习围棋时间不低于40分钟的学生称为“围棋迷”.
(1)请根据已知条件完成下面2×2列联表,根据此资料,你是否有95%的把握认为“围棋迷”与性别有关?
非围棋迷
围棋迷
合计
男
女
10
55
合计
(2)为了进一步了解“围棋迷”的围棋水平,从“围棋迷”中按性别分层抽样抽取5名学生组队参加校际交流赛,首轮该校需派2名学生出赛,若从5名学生中随机抽取2人出赛,求2人恰好一男一女的概率.
参考数据:
P(K2
⩾k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
K2=
.
【分析】
(1)由频率分布直方图求得频率与频数,填写2×2列联表,计算观测值,对照临界值表得出结论;
(2)根据分层抽样原理,用列举法求出基本事件数,计算所求的概率值.
【解析】
(1)由频率分布直方图可知,(0.020+0.005)×10×100=25,
所以在抽取的100人中,“围棋迷”有25人,从而2×2列
联表如下:
非围棋迷
围棋迷
合计
男
30
15
45
女
45
10
55
合计
75
25
100
K2的观测值k=
=
≈3.030,
因为3.030<3.841,所以没有95%的把握认为“围棋迷”与性别有关.
(2)由
(1)中列联表可知25名“围棋迷”中有男生15名,女生10名,所以从“围棋迷”中按性别分层抽样抽取的5名学生中,有男生3名,记为B1,B2,B3,有女生2名,记为G1,G2.
则从5名学生中随机抽取2人出赛,基本事件有(B1,B2),(B1,B3),(B1,G1),(B1,G2),(B2,B3),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(G1,G2),共10种,其中2人恰好一男一女的基本事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),共6种.
故2人恰好一男一女的概率P=
=
.
独立性检验的关键:
(1)根据2×2列联表准确计算K2的观测值,若2×2列联表没有列出来,要先列出此表;
(2)K2的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
【追踪训练3】在一次模拟考试中,某校共有100名文科学生参加考试,其中语文考试成绩低于130分的占95%,数学成绩的频率分布直方图如图所示,已知成绩不低于130分为特别优秀.
(1)这100名学生中本次考试语文、数学成绩特别优秀的大约各多少人?
(2)如果语文和数学两科都特别优秀的共有3人.
①从
(1)中的这些同学中随机抽取2人,求这两人两科成绩都特别优秀的概率.
②根据以上数据,完成2×2列联表,并分析是否有99%的把握认为语文特别优秀的同学,数学也特别优秀.
语文特别优秀
语文不特别优秀
合计
数学特别优秀
数学不特别优秀
合计
参考数据:
P(K2
⩾k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
K2=
.
【解析】
(1)该校共有100名文科学生参加考试,其中语文考试成绩低于130分的占95%,∴语文成绩特别优秀的概率为P1=1-0.95=0.05,语文成绩特别优秀的同学有100×0.05=5人.由频率分布直方图可知数学成绩特别优秀的概率为P2=0.002×20=0.04,∴数学成绩特别优秀的同学有100×0.04=4人.
(2)①语文、数学两科都特别优秀的有3人,则单科特别优秀的有3人.
记两科都特别优秀的3人分别为A1,A2,A3,则单科特别优秀的3人分别为B1,B2,B3,从中随机抽取2人,有(A1,A2),(A1,A3),(A2,A3),(B1,B2),(B1,B3),(B2,B3),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3),共15种情况,其中这两人两科成绩都特别优秀的有(A1,A2),(A1,A3),(A2,A3),共3种情况,则这两人两科成绩都特别优秀的概率为P=
=
.
②2×2列联表如下:
语文特别优秀
语文不特别优秀
合计
数学特别优秀
3
1
4
数学不特别优秀
2
94
96
合计
5
95
100
∵K2的观测值k=
=
≈42.982>6.635,
∴有99%的把握认为语文特别优秀的同学,数学也特别优秀.
方法
利用函数思想求解概率和统计问题
利用函数思想求解概率和统计问题,一是要构建相应的数学模型,利用数学公式解决相应的问题,如求平均数、方差等;二是要有一定的阅读理解能力,明晰交汇点,在审题中提取有用的信息,求解概率问题.
【突破训练】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,若备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得柱状图,如图所示.
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:
元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y关于x的函数解析式.
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值.
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
【解析】
(1)当x≤19时,y=3800;当x>19时,y=3800+500(x-19)=500x-5700.
所以y关于x的函数解析式为y=
(x∈N).
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.
(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800,20台的费用为4300,10台的费用为4800,因此这100台机器在购买易损零件上所需费用的平均数为
×(3800×70+4300×20+4800×10)=4000.
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000,10台的费用为4500,因此这100台机器在购买易损零件上所需费用的平均数为
×(4000×90+4500×10)=4050.
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
1.(广东珠海2019届高三9月摸底考试)南方智运汽车公司在我市推出了共享汽车“Warmcar”,有一款车型为“众泰云”新能源共享汽车,其中一种租用方式“分时计费”的规则为0.15元/分钟+0.8元/公里.已知小李家离上班地点为10公里,每天租用该款汽车上、下班各一次,由于堵车及红绿灯等原因每次路上开车花费的时间t(分钟)是一个随机变量,现统计了小李100次上班路上开车花费的时间,在各时间段内的频数分布情况如下表所示:
时间t
(分钟)
(23,25]
(25,27]
(27,29]
(29,31]
(31,33]
(33,35]
(35,37]
频数
2
6
14
36
28
10
4
(1)写出小李上班一次租车费用y(元)与用车时间t(分钟)的函数关系式;
(2)根据上面表格估计小李上班平均每次租车费用;
(3)“众泰云”新能源汽车还有一种租用方式为“按月计费”,规则为每个月收取租金2350元.若小李每个月上班时间平均按21天计算,在不计电费的情况下,请你为小李选择一种省钱的租车方式.
【解析】
(1)y=0.8×10+0.15t=8+0.15t(元).
(2)平均每次用车时间
=
=30.56(分钟).
所以小李上班平均每次租车费用
=8+30.56×0.15=12.584(元).
(3)当租用方式为“分时计费”时,一个月租车总费用为12.584×2×21=528.528(元),
因为528.528<2350,
所以,对小李租车仅用于上下班的情况,采用“分时计费”更省钱.
2.(2018广西柳州高级中学高三模拟)新鲜的荔枝很好吃,但摘下后容易变黑,影响卖相.某超市计划每年六月从精准扶贫户中订购荔枝,每天进货量相同且每公斤20元,当日18时前售价为每公斤24元,18时后以每公斤16元的价格销售完毕.根据往年情况,每天的荔枝需求量与当天平均气温有关,如下表所示:
平均气温t(摄氏度)
<15
[15,20)
[20,25)
⩾25
需求量n(公斤)
50
100
200
300
为了确定今年6月1日至6月30日的日购数量,统计了前三年六月各天的平均气温,得到如下的频数分布表:
平均气温
t(摄氏度)
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
(1)假设该超市在以往三年内的六月每天进货100公斤,求销售荔枝为超市带来的日平均利润.(结果取整数)
(2)若今年该超市每天的进货量为200公斤,以记录的各需求量的频率作为相应的概率,求当天超市能赢利的概率.
【解析】
(1)当需求量n≥100时,当天销售荔枝为该商场带来的利润为4×100=400(元);
当需求量n<100,即n=50时,当天销售荔枝为该商场带来的利润为4×50-4×50=0(元);
所以这90天销售荔枝为该商场带来的日平均利润为
≈391(元).
(2)当需求量n≥200时,当天销售荔枝为该商场带来的利润为4×200=800(元);
当需求量n=100时,当天销售荔枝为该商场带来的利润为4×100-4×100=0(元);
当需求量n=50时,当天销售荔枝为该商场带来的利润为4×50-4×150=-400(元).
所以若当天该商场能赢利,则当天荔枝的需求量为200或300公斤,
所以所求概率P=
=
.
3.(2018曲靖一中月考)当今,手机已经成为人们不可或缺的交流工具,人们常常把喜欢玩手机的人冠上了名号“低头族”,手机已经严重影响了人们的生活.一媒体为调查市民对低头族的认识,从某社区的500名市民中随机抽取n名市民进行调查,样本中市民的年龄情况的频率分布表和频率分布直方图如图所示:
组数
分组(单位:
岁)
频数
频率
1
[20,25)
5
0.05
2
[25,30)
20
0.20
3
[30,35)
a
0.35
4
[35,40)
30
b
5
[40,45]
10
0.10
合计
n
1.00
(1)求出表中a,b,n的值,并补全频率分布直方图;
(2)媒体记者为了做好调查工作,决定在第2,4,5组中用分层抽样的方法抽取6名市民进行问卷调查,再从这6名市民中随机抽取2名接受电视采访,求第2组至少有一名市民接受电视采访的概率.
【解析】
(1)由题意及频率分布表可知,n=5÷0.05=100,
所以a=100×0.35=35,b=
=0.3.
补全频率分布直方图,如图所示.
(2)第2,4,5组总人数为20+30+10=60.
故第2组应抽取的人数为6×
=2,记为1,2,
第4组应抽取的人数为6×
=3,记为a,b,c,
第5组应抽取的人数为6×
=1,记为m.
从这6名市民中随机抽取2名的所有基本事件有(m,a),(m,b),(m,c),(m,1),(m,2),(a,b),(a,c),(a,1),(a,2),(b,c),(b,1),(b,2),(c,1),(c,2),(1,2),共15个,符合条件的有(m,1),(m,2),(a,1),(a,2),(b,1),(b,2),(c,1),(c,2),(1,2),共9个,
故概率P=
=0.6.
4.(安徽六安市第一中学2019届高三模拟)已知某中学高三文科班共800名学生参加了数学与地理的水平测试,学校决定利用随机数表法从中抽取100名学生进行成绩抽样调查,先将800名学生按001,002,…,800进行编号.
(1)如果从第8行第7列的数开始向右读,请你依次写出最先抽查的3个人的编号.
(下面摘取了第7行到第9行)
84
42
17
53
31
57
24
55
06
88
77
04
74
47
67
21
76
33
50
25
83
92
12
06
76
63
01
63
78
59
16
95
56
67
19
98
10
50
71
75
12
86
73
58
07
44
39
52
38
79
33
21
12
34
29
78
64
56
07
82
52
42
07
44
38
15
51
00
13
42
99
66
02
79
54
(2)抽取的100名学生的数学与地理的水平测试成绩如下表所示.成绩分为优秀、良好、及格三个等级;横向和纵向分别表示地理成绩与数学成绩,例如,表中数学成绩为良好的学生共有20+18+4=42人.
人数
数学
优秀
良好
及格
地理
优秀
7
20
5
良好
9
18
6
及格
a
4
b
①若在该样本中,数学成绩的优秀率是30%,求a,b的值.
②在地理成绩及格的学生中,已知a≥11,b≥7,求数学成绩优秀的人数比数学成绩及格的人数少的概率.
【解析】
(1)在随机数表中,从第8行第7列的数开始向右读数,依次可得抽取的学生编号为785,667,199.
(2)①由题意得
=30%,解得a=14,
所以b=100-30-(20+18+4)-(5+6)=17.
故a,b的值分别为14,17.
②由题意得a+b=100-(7+20+5)-(9+18+6)-4=31,因为a≥11,b≥7,所以a,b搭配的所有情况有(11,20),(12,19),(13,18),(14,17),(15,16),(16,15),(17,14),(18,13),(19,12),(20,11),(21,10),(22,9),(23,8),(24,7),共14种.
设“当a≥11,b≥7时,数学成绩优秀的人数比数学成绩及格的人数少”为事件A,即a+5则事件A包含的基本事件有(11,20),(12,19),共2个.
所以P(A)=
=
即数学成绩优秀的人数比数学成绩及格的人数少的概率为
.
5.(陕西咸阳2018年高考5月信息专递)共享单车已成为一种时髦的新型环保交通工具,某共享单车公司为了拓展市场,对A,B两个品牌的共享单车在编号分别为1,2,3,4,5的五个城市的用户人数(单位:
十万)进行统计,得到数据如下表:
城市编号
1
2
3
4
5
A品牌
3
4
12
6
8
B品牌
4
3
7
9
5
(1)若共享单车用户人数超过50万的城市称为“优城”,否则称为“非优城”,据此判断能否有85%的把握认为“优城”和共享