答案 乙
6.(2017·全国Ⅱ卷)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)=________.
解析 有放回地抽取,是一个二项分布模型,其中p=0.02,n=100,则D(X)=np(1-p)=100×0.02×0.98=1.96.
答案 1.96
考点一 离散型随机变量的均值与方差
【例1】(2019·青岛一模)为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:
滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为,;1小时以上且不超过2小时离开的概率分别为,;两人滑雪时间都不会超过3小时.
(1)求甲、乙两人所付滑雪费用相同的概率;
(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:
元),求ξ的分布列与数学期望E(ξ),方差D(ξ).
解
(1)两人所付费用相同,相同的费用可能为0,40,80元,
两人都付0元的概率为p1=×=,
两人都付40元的概率为p2=×=,
两人都付80元的概率为
p3=×=×=,
则两人所付费用相同的概率为p=p1+p2+p3=++=.
(2)由题设甲、乙所付费用之和为ξ,ξ可能取值为0,40,80,120,160,则:
P(ξ=0)=×=;
P(ξ=40)=×+×=;
P(ξ=80)=×+×+×=;
P(ξ=120)=×+×=;
P(ξ=160)=×=.
ξ的分布列为
ξ
0
40
80
120
160
P
E(ξ)=0×+40×+80×+120×+160×=80.
D(ξ)=(0-80)2×+(40-80)2×+(80-80)2×+(120-80)2×+(160-80)2×=.
规律方法
(1)求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算.
(2)注意E(aX+b)=aE(X)+b,D(aX+b)=a2D(X)的应用.
【训练1】(2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为,,.
(1)记X表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X的分布列和数学期望;
(2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率.
解
(1)随机变量X的所有可能取值为0,1,2,3,
P(X=0)=××=,
P(X=1)=××+××+××=,
P(X=2)=××+××+××=,
P(X=3)=××=.
所以,随机变量X的分布列为
X
0
1
2
3
P
随机变量X的数学期望E(X)=0×+1×+2×+3×=.
(2)设Y表示第一辆车遇到红灯的个数,Z表示第二辆车遇到红灯的个数,则所求事件的概率为
P(Y+Z=1)=P(Y=0,Z=1)+P(Y=1,Z=0)
=P(Y=0)P(Z=1)+P(Y=1)P(Z=0)
=×+×=.
所以,这2辆车共遇到1个红灯的概率为.
考点二 二项分布的均值与方差
【例2】(2019·顺德一模)某市市民用水拟实行阶梯水价,每人月用水量不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了100位市民,获得了他们某月的用水量数据,整理得到如下频率分布直方图,并且前四组频数成等差数列.
(1)求a,b,c的值及居民月用水量在2~2.5内的频数;
(2)根据此次调查,为使80%以上居民月用水价格为4元/立方米,应将w定为多少?
(精确到小数点后2位)
(3)若将频率视为概率,现从该市随机调查3名居民的月用水量,将月用水量不超过2.5立方米的人数记为X,求其分布列及均值.
解
(1)∵前四组频数成等差数列,
∴所对应的也成等差数列,
设a=0.2+d,b=0.2+2d,c=0.2+3d,
∴0.5[0.2+(0.2+d)×2+0.2+2d+0.2+3d+0.1×3]=1,
解得d=0.1,∴a=0.3,b=0.4,c=0.5.
居民月用水量在2~2.5内的频率为0.5×0.5=0.25.
居民月用水量在2~2.5内的频数为0.25×100=25.
(2)由题图及
(1)可知,居民月用水量小于2.5的频率为0.7<0.8,
∴为使80%以上居民月用水价格为4元/立方米,
应规定w=2.5+≈2.83.
(3)将频率视为概率,设A(单位:
立方米)代表居民月用水量,
可知P(A≤2.5)=0.7,
由题意,X~B(3,0.7),
P(X=0)=C×0.33=0.027,
P(X=1)=C×0.32×0.7=0.189,
P(X=2)=C×0.3×0.72=0.441,
P(X=3)=C×0.73=0.343,
∴X的分布列为
X
0
1
2
3
P
0.027
0.189
0.441
0.343
∵X~B(3,0.7),∴E(X)=np=2.1.
规律方法 二项分布的均值与方差.
(1)如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量.
(2)有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样还可求出D(aξ+b).
【训练2】(2019·湘潭三模)某饭店从某水产养殖厂购进一批生蚝,并随机抽取了40只统计质量,得到结果如表所示:
质量(g)
[5,15)
[15,25)
[25,35)
[35,45)
[45,55]
数量(只)
6
10
12
8
4
(1)若购进这批生蚝500kg,且同一组数据用该组区间的中点值代表,试估计这批生蚝的数量(所得结果保留整数);
(2)以频率视为概率,若在本次购买的生蚝中随机挑选4个,记质量在[5,25)间的生蚝的个数为X,求X的分布列及数学期望.
解
(1)由表中的数据可以估算一只生蚝的质量为
(6×10+10×20+12×30+8×40+4×50)=28.5(g),
所以购进500kg生蚝,其数量为500000÷28.5≈17544(只).
(2)由表中数据知,任意挑选一只生蚝,质量在[5,25)间的概率为,
由题意知X的可能取值为0,1,2,3,4,
P(X=0)==,
P(X=1)=C=,
P(X=2)=C=,
P(X=3)=C=,
P(X=4)==,
∴X的分布列为
X
0
1
2
3
4
P
∴E(X)=0×+×3+×3+×4=.
考点三 均值与方差在决策问题中的应用
【例3】某投资公司在2019年年初准备将1000万元投资到“低碳”项目上,现有两个项目供选择:
项目一:
新能源汽车.据市场调研,投资到该项目上,到年底可能获利30%,也可能亏损15%,且这两种情况发生的概率分别为和;
项目二:
通信设备.据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为,和.
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由.
解 若按“项目一”投资,设获利为X1万元.则X1的分布列为
X1
300
-150
P
∴E(X1)=300×+(-150)×=200(万元).
若按“项目二”投资,设获利X2万元,
则X2的分布列为:
X2
500
-300
0
P
∴E(X2)=500×+(-300)×+0×=200(万元).
D(X1)=(300-200)2×+(-150-200)2×=35000,
D(X2)=(500-200)2×+(-300-200)2×+(0-200)2×=140000.
所以E(X1)=E(X2),D(X1)这说明虽然项目一、项目二获利相等,但项目一更稳妥.
综上所述,建议该投资公司选择项目一投资.
规律方法 随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.
【训练3】计划在某水库建一座至多安装3台发电机的水电站.过去50年的水文资料显示,水库年入流量X(年入流量:
一年内上游来水与库区降水之和,单位:
亿立方米)都在40以上.其中,不足80的年份有10年,不低于80且不超过120的年份有35年,超过120的年份有5年.将年入流量在以上三段的频率作为相应段的概率,并假设各年的年入流量相互独立.
(1)求未来4年中,至多有1年的年入流量超过120的概率;
(2)水电站希望安装的发电机尽可能运行,但每年发电机最多可运行台数受年入流量X限制,并有如下关系:
年入流量X
4080≤X≤120
X>120
发电机最多可运行台数
1
2
3
若某台发电机运行,则该台发电机年利润为5000万元;若某台发电机未运行,则该台发电机年亏损800万元.欲使水电站年总利润的均值达到最大,应安装发电机多少台?
解
(1)依题意,得p1=P(40p2=P(80≤x≤120)==0.7,
p3=P(X>120)==0.1.
由二项分布,在未来4年中,至多有1年的年入流量超过120的概率为
p=C(1-p3)4+C(1-p3)3p3=+4××=0.9477.
(2)记水电站年总利润为Y(单位:
万元).
①安装1台发电机的情形.
由于水库年入流量总大于40,故一台发电机运行的概率为1,
对应的年利润Y=5000,E(Y)=5000×1=5000.
②安装2台发电机的情形.
依题意,当40由此得Y的分布列如下:
Y
4200
10000
P
0.2
0.8
所以,E(Y)=4200×0.2+10000×0.8=8840.
③安装3台发电机的情形.
依题意,当40当80≤X≤120时,两台发电机运行,此时Y=5000×2-800=9200,因此P(Y=9200)=P(80≤X≤120)=p2=0.7;
当X>120时,三台发电机运行,此时Y=5000×3=15000,因此P(Y=15000)=P(X>120)=p3=0.1.
因此得Y的分布列如下:
Y
3400
9200
15000
P
0.2
0.7
0.1
所以,E(Y)=3400×0.2+9200×0.7+15000×0.1=8620.
综上,欲使水电站年总利润的均值达到最大,应安装发电机2台.
[思维升华]
基本方法
1.已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;
2.已知随机变量X的均值、方差,求X的线性函数Y=aX+b的均值、方差和标准差,可直接用均值、方差的性质求解;
3.如能分析所给随机变量服从常用的分布(如二项分布),可直接利用它们的均值、方差公式求解.
[易错防范]
1.在没有准确判断分布列模型之前不能乱套公式.
2.对于应用问题,必须对实际问题进行具体分析,一般要将问题中的随机变量设出来,再进行分析,求出随机变量的分布列,然后按定义计算出随机变量的均值、方差.
基础巩固题组
(建议用时:
40分钟)
一、选择题
1.已知离散型随机变量X的分布列为
X
1
2
3
P
则X的数学期望E(X)=( )
A.B.2C.D.3
解析 由数学期望公式可得
E(X)=1×+2×+3×=.
答案 A
2.已知离散型随机变量X的概率分布列为
X
1
3
5
P
0.5
m
0.2
则其方差D(X)=( )
A.1B.0.6C.2.44D.2.4
解析 由0.5+m+0.2=1得m=0.3,∴E(X)=1×0.5+3×0.3+5×0.2=2.4,∴D(X)=(1-2.4)2×0.5+(3-2.4)2×0.3+(5-2.4)2×0.2=2.44.
答案 C
3.(2019·宁波期末)一个箱子中装有形状完全相同的5个白球和n(n∈N*)个黑球.现从中有放回的摸取4次,每次都是随机摸取一球,设摸得白球个数为X,若D(X)=1,则E(X)=( )
A.1B.2C.3D.4
解析 由题意,X~B(4,p),∵D(X)=4p(1-p)=1,
∴p=,E(X)=4p=4×=2.
答案 B
4.签盒中有编号为1,2,3,4,5,6的六支签,从中任意取3支,设X为这3支签的号码之中最大的一个,则X的数学期望为( )
A.5B.5.25C.5.8D.4.6
解析 由题意可知,X可以为3,4,5,6,P(X=3)==,P(X=4)==,P(X=5)==,P(X=6)==.由数学期望的定义可求得E(X)=3×+4×+5×+6×=5.25.
答案 B
5.甲、乙两人进行乒乓球比赛,约定每局胜者得1分,负者得0分,比赛进行到有一人比对方多2分或打满6局时停止.设甲在每局中获胜的概率为,乙在每局中获胜的概率为,且各局胜负相互独立,则比赛停止时已打局数X的期望E(X)为( )
A.B.C.D.
解析 依题意,知X的所有可能值为2,4,6,设每两局比赛为一轮,则该轮结束时比赛停止的概率为+=.
若该轮结束时比赛还将继续,则甲、乙在该轮中必是各得一分,此时,该轮比赛结果对下轮比赛是否停止没有影响.从而有P(X=2)=,
P(X=4)=×=,P(X=6)==,
故E(X)=2×+4×+6×=.
答案 B
二、填空题
6.已知随机变量ξ的分布列为
ξ
1
2
3
P
0.5
x
y
若E(ξ)=,则D(ξ)=________.
解析 由分布列性质,得x+y=0.5.
又E(ξ)=,得2x+3y=,可得
D(ξ)=×+×+×=.
答案
7.(2019·杭州期末)在一次随机试验中,事件A发生的概率为p,事件A发生的次数为ξ,则数学期望E(ξ)=______,方差D(ξ)的最大值为________.
解析 记事件A发生的次数ξ可能的值为0,1.
ξ
0
1
P
1-p
p
数学期望E(ξ)=0×(1-p)+1×p=p,
方差D(ξ)=(0-p)2×(1-p)+(1-p)2×p=p(1-p)≤.
故数学期望E(ξ)=p,方差D(ξ)的最大值为.
答案 p
8.一个均匀小正方体的六个面中,三个面上标有数字0、两个面上标有数字1、一个面上标有数字2.将这个小正方体抛掷2次,则向上的数之积X的数学期望是________.
解析 随机变量X的取值为0,1,2,4,
则P(X=0)==,
P(X=1)==,P(X=2)==,
P(X=4)==,因此E(X)=.
答案
三、解答题
9.(2019·天津和平区模拟)某班共50名同学,在一次数学考试中全班同学成绩全部在90分到140分之间.将成绩按如下方式分成五组:
第一组:
[90,100),第二组:
[100,110),……,第五组:
[130,140].按上述分组方法得到的频率分布直方图如图所示.将成绩大于或等于100分且小于120分记为“良好”,120分以上记为“优秀”,不超过100分记为“及格”.
(1)求该班学生在这次数学考试中成绩“良好”的人数;
(2)若从第一、五组中共随机取出两个成绩,记X为取得第一组成绩的个数,求X的分布列与数学期望.
解
(1)由频率分布直方图知,成绩在[100,120)内的人数为50×0.016×10+50×0.038×10=27,
∴该班学生在这次数学考试中成绩“良好”的人数为27.
(2)由频率分布直方图可知第一组有0.006×10×50=3个成绩,第五组有0.008×10×50=4个成绩,即第一、五组中共有7个成绩.
由题意,X的可能取值为0,1,2,
P(X=0)==,P(X=1)==,
P(X=2)==,
则X的分布列为
X
0
1
2
P
E(X)=0×+1×+2×=.
10.(2016·全国Ⅰ卷)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求P(X≤n)≥0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
解
(1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.可知X的所有可能取值为16、17、18、19、20、21、22,
P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04;
所以X的分布列为
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
(2)由
(1)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19.
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:
元).
当n=19时,E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4040.
当n=20时,
E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4080.
可知当n=19时所需费用的期望值小于n=20时所需费用的期望值,故应选n=19.
能力提升题组
(建