8 第8讲 离散型随机变量的均值与方差正态分布Word文件下载.docx
《8 第8讲 离散型随机变量的均值与方差正态分布Word文件下载.docx》由会员分享,可在线阅读,更多相关《8 第8讲 离散型随机变量的均值与方差正态分布Word文件下载.docx(22页珍藏版)》请在冰豆网上搜索。
(5)若X1,X2相互独立,则E(X1·
X2)=E(X1)·
E(X2).
(6)若X服从两点分布,则E(X)=p,D(X)=p(1-p).
(7)若X服从二项分布,即X~B(n,p),则E(X)=np,D(X)=np(1-p).
判断正误(正确的打“√”,错误的打“×
”)
(1)随机变量的均值是常数,样本的平均数是随机变量,它不确定.( )
(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小.( )
(3)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差.( )
(4)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.( )
(5)均值是算术平均数概念的推广,与概率无关.( )
答案:
(1)√
(2)√ (3)√ (4)√ (5)×
已知X的分布列为
-1
1
设Y=2X+3,则E(Y)的值为( )
A. B.4
C.-1D.1
解析:
选A.E(X)=-+=-,
E(Y)=E(2X+3)=2E(X)+3=-+3=.
已知ξ~B,并且η=2ξ+3,则方差D(η)=( )
A.B.
C.D.
选A.由题意知,D(ξ)=4×
×
=,
因为η=2ξ+3,所以D(η)=4·
D(ξ)=4×
=.
已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<4)=( )
A.0.6B.0.4
C.0.3D.0.2
选A.由P(ξ<4)=0.8,得P(ξ≥4)=0.2.
又正态曲线关于x=2对称,则P(ξ≤0)=P(ξ≥4)=0.2,所以P(0<ξ<4)=1-P(ξ≤0)-P(ξ≥4)=0.6.
一个正四面体ABCD的四个顶点上分别标上1分,2分,3分和4分,往地面抛掷一次,记不在地面上的顶点的分数为X,则X的均值为________.
X的分布列为
2
3
4
所以E(X)=1×
+2×
+3×
+4×
一个人将编号为1,2,3,4的四个小球随机放入编号为1,2,3,4的四个盒子,每个盒子放一个小球,球的编号与盒子的编号相同时就放对了,否则就放错了.设放对个数记为ξ,则ξ的期望为________.
将四个不同小球放入四个不同盒子,每个盒子放一个小球,共有A种不同放法,放对的个数ξ可取的值有0,1,2,4,其中P(ξ=0)==,
P(ξ=1)==,P(ξ=2)==,P(ξ=4)==,E(ξ)=0×
+1×
=1.
离散型随机变量的均值与方差(多维探究)
角度一 离散型随机变量的均值与方差的计算
某小组共10人,利用假期参加义工活动.已知参加义工活动次数为1,2,3的人数分别为3,3,4.现从这10人中随机选出2人作为该组代表参加座谈会.
(1)设A为事件“选出的2人参加义工活动次数之和为4”,求事件A发生的概率;
(2)设X为选出的2人参加义工活动次数之差的绝对值,求随机变量X的分布列和数学期望与方差.
【解】
(1)由已知,有P(A)==.
所以事件A发生的概率为.
(2)随机变量X的所有可能取值为0,1,2.
P(X=0)==,
P(X=1)==,
P(X=2)==.
所以随机变量X的分布列为
随机变量X的数学期望E(X)=0×
方差D(X)=(0-1)2+(1-1)2+(2-1)2=.
角度二 二项分布的均值与方差的计算
(2019·
成都第一次诊断性检测)
某部门为了解一企业在生产过程中的用水量情况,对其每天的用水量做了记录,得到了大量该企业的日用水量的统计数据,从这些统计数据中随机抽取12天的数据作为样本,得到如图所示的茎叶图(单位:
吨).若用水量不低于95吨,则称这一天的用水量超标.
(1)从这12天的数据中随机抽取3个,求至多有1天的用水量超标的概率;
(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X为未来这3天中用水量超标的天数,求X的分布列、数学期望和方差.
【解】
(1)记“从这12天的数据中随机抽取3个,至多有1天的用水量超标”为事件A,
则P(A)=+==.
(2)以这12天的样本数据中用水量超标的频率作为概率,易知用水量超标的概率为.
X的所有可能取值为0,1,2,3,
易知X~B,P(X=k)=C,k=0,1,2,3,
则P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=.
数学期望E(X)=3×
=1,D(X)=3×
(1)求离散型随机变量ξ的均值与方差的步骤
①理解ξ的意义,写出ξ可能的全部取值;
②求ξ取每个值的概率;
③写出ξ的分布列;
④由均值的定义求E(ξ);
⑤由方差的定义求D(ξ).
(2)二项分布的期望与方差
如果ξ~B(n,p),则用公式E(ξ)=np;
D(ξ)=np(1-p)求解,可大大减少计算量.
[提醒] 均值E(X)由X的分布列唯一确定,即X作为随机变量是可变的,而E(X)是不变的,它描述X取值的平均水平.
1.(2019·
洛阳市第一次统一考试)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A、B、C三个城市进行治霾落实情况抽查.
(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;
(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.
解:
(1)随机选取,共有34=81种不同方法,
恰有一个城市没有专家组选取的有C(CA+C)=42种不同方法,
故恰有一个城市没有专家组选取的概率为=.
(2)设事件A:
“一个城市需复检”,则P(A)=1-=,X的所有可能取值为0,1,2,3,
P(X=0)=C·
=,P(X=1)=C·
·
=,P(X=2)=C·
=,P(X=3)=C·
所以X的分布列为
X~B,E(X)=3×
2.已知6只小白鼠中有1只感染了病毒,需要对6只小白鼠进行病毒DNA化验来确定哪一只受到了感染.下面是两种化验方案:
方案甲:
逐个化验,直到能确定感染病毒的小白鼠为止.方案乙:
将6只小白鼠分为两组,每组三只,将其中一组的三只小白鼠的待化验物质混合在一起化验,若化验结果显示含有病毒DNA,则表明感染病毒的小白鼠在这三只当中,然后逐个化验,直到确定感染病毒的小白鼠为止;
若化验结果显示不含病毒DNA,则在另外一组中逐个进行化验.
(1)求执行方案乙化验次数恰好为2次的概率;
(2)若首次化验的化验费为10元,第二次化验的化验费为8元,第三次及以后每次化验的化验费都是6元,求方案甲所需化验费的分布列和期望.
(1)执行方案乙化验次数恰好为2次的情况分两种:
第一种,先化验一组,结果显示不含病毒DNA,再从另一组中任取一只进行化验,其恰好含有病毒DNA,此种情况的概率为×
=;
第二种,先化验一组,结果显示含病毒DNA,再从中逐个化验,恰好第一只含有病毒,此种情况的概率为×
所以执行方案乙化验次数恰好为2次的概率为+=.
(2)设用方案甲化验需要的化验费为η(单位:
元),则η的可能取值为10,18,24,30,36.
P(η=10)=,
P(η=18)=×
P(η=24)=×
P(η=30)=×
P(η=36)=×
则化验费η的分布列为
η
10
18
24
30
36
所以E(η)=10×
+18×
+24×
+30×
+36×
=(元).
均值与方差的实际应用(师生共研)
(2018·
高考全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以
(1)中确定的p0作为p的值,已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(ⅰ)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
(ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
【解】
(1)20件产品中恰有2件不合格品的概率为f(p)=Cp2(1-p)18.因此f′(p)=C[2p(1-p)18-18p2(1-p)17]=2Cp(1-p)17(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>
0;
当p∈(0.1,1)时,f′(p)<
0.所以f(p)的最大值点为p0=0.1.
(2)由
(1)知,p=0.1.
(i)令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),
X=20×
2+25Y,即X=40+25Y.
所以EX=E(40+25Y)=40+25EY=490.
(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.
由于EX>
400,故应该对余下的产品作检验.
均值与方差的实际应用
(1)D(X)表示随机变量X对E(X)的平均偏离程度,D(X)越大表明平均偏离程度越大,说明X的取值越分散;
反之,D(X)越小,X的取值越集中在E(X)附近,统计中常用来描述X的分散程度.
(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.
长春质量检测)某市对大学生毕业后自主创业人员给予小额贷款补贴,贷款期限分为6个月、12个月、18个月、24个月、36个月五种,对于这五种期限的贷款政府分别补贴200元、300元、300元、400元、400元,从2016年享受此项政策的自主创业人员中抽取了100人进行调查统计,选择的贷款期限的频数如下表:
贷款期限
6个月
12个月
18个月
24个月
36个月
频数
20
40
以上表中选择的各种贷款期限的频率作为2017年自主创业人员选择的各种贷款期限的概率.
(1)某大学2017年毕业生中共有3人准备申报此项贷款,计算其中恰有2人选择的贷款期限为12个月的概率;
(2)设给某享受此项政策的自主创业人员的补贴为X元,写出X的分布列;
该市政府要做预算,若预计2017年全市有600人申报此项贷款,则估计2017年该市共要补贴多少万元.
(1)由题意知,每人选择的贷款期限为12个月的概率为,
所以3人中恰有2人选择的贷款期限为12个月的概率P=C×
(2)由题意知,享受的补贴为200元的概率p1=,享受的补贴为300元的概率p2=,享受的补贴为400元的概率p3=,所以随机变量X的分布列为
200
300
400
所以E(X)=++=300元,所以2017年该市政府共要补贴w=600×
300=180000(元).
故2017年该市政府需要补贴18万元.
2.(2019·
辽宁五校联合体模拟)某商场决定从2种服装、3种家电、4种日用品中,选出3种商品进行促销活动.
(1)试求选出的3种商品中至少有一种是家电的概率;
(2)该商场对选出的某商品采用抽奖方式进行促销,即在该商品现价的基础上将价格提高60元,规定购买该商品的顾客有3次抽奖机会,若中奖一次,则获得数额为n元的奖金;
若中奖两次,则获得数额为3n元的奖金;
若中奖三次,则获得数额为6n元的奖金.假设顾客每次抽奖中奖的概率都是,请问:
该商场将奖金数额n最高定为多少元,才能使促销方案对该商场有利?
(1)设选出的3种商品中至少有一种是家电为事件A,
从2种服装、3种家电、4种日用品中,选出3种商品,共有C种不同的选法,选出的3种商品中,没有家电的选法有C种,
所以选出的3种商品中至少有一种是家电的概率为
P(A)=1-=1-=.
(2)设顾客三次抽奖所获得的资金总额(单位:
元)为随机变量ξ,
则其所有可能的取值为0,n,3n,6n.
当ξ=0时,表示顾客在三次抽奖中都没有中奖.
所以P(ξ=0)=C=,
P(ξ=n)=C=,
P(ξ=3n)=C=,
P(ξ=6n)=C=.
所以顾客在三次抽奖中所获得的奖金总额的期望值是
E(ξ)=0×
+n×
+3n×
+6n×
由≤60,解得n≤64,
所以该商场将奖金数额n最高定为64元,才能使促销方案对该商场有利.
正态分布(师生共研)
(1)(2019·
惠州市第二次调研)设随机变量ξ服从正态分布N(4,3),若P(ξ<
a-5)=P(ξ>
a+1),则实数a等于( )
A.7 B.6
C.5D.4
(2)已知随机变量X服从正态分布N(1,σ2),若P(X>
2)=0.15,则P(0≤X≤1)=( )
A.0.85B.0.70
C.0.35D.0.15
【解析】
(1)由随机变量ξ服从正态分布N(4,3)可得正态分布密度曲线的对称轴为直线x=4,又P(ξ<
a+1),所以x=a-5与x=a+1关于直线x=4对称,所以(a-5)+(a+1)=8,即a=6.选B.
(2)P(0≤X≤1)=P(1≤X≤2)=0.5-P(X>
2)=0.35.
【答案】
(1)B
(2)C
正态分布下的概率计算常见的两类问题
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,及曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
太原模拟)已知随机变量X服从正态分布N(3,1),且P(X≥4)=0.1587,则P(2<
X<
4)=( )
A.0.6826B.0.3413
C.0.4603D.0.9207
选A.因为随机变量X服从正态分布N(3,1),且P(x≥4)=0.1587,所以P(X≤2)=0.1587,所以P(2<
4)=1-P(X≤2)-P(X≥4)=0.6826,故选A.
2.某校在一次月考中有900人参加考试,数学考试的成绩服从正态分布X~N(90,a2)(a>
0,试卷满分150分),统计结果显示数学考试成绩在70分到110分之间的人数约为总人数的,则此次月考中数学考试成绩不低于110分的学生约有________人.
因为成绩服从正态分布X~N(90,a2),
所以其正态分布曲线关于直线x=90对称,
又因为成绩在70分到110分之间的人数约为总人数的,
由对称性知成绩在110分以上的人数约为总人数的×
=,所以此次数学考试成绩不低于110分的学生约有×
900=180(人).
180
利用期望与方差进行决策
某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买.则每个500元,现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列:
(2)若要求P(X≤n)≥0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一.应选用哪个?
【解】
(1)由柱状图并以频率代替概率可得,
一台机器在三年内需更换的易损零件
数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.
可知X的所有可能取值为16,17,18,19,20,21,22,
P(X=16)=0.2×
0.2=0.04;
P(X=17)=2×
0.2×
0.4=0.16;
P(X=18)=2×
0.2+0.4×
0.4=0.24;
P(X=19)=2×
0.2+2×
0.4×
0.2=0.24;
P(X=20)=2×
0.4+0.2×
0.2=0.2;
P(X=21)=2×
0.2=0.08;
P(X=22)=0.2×
0.2=0.04.
16
17
19
21
22
0.04
0.16
0.24
0.2
0.08
(2)由
(1)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19.
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:
元).
当n=19时,
E(Y)=19×
200×
0.68+(19×
200+500)×
0.2+(19×
200+2×
500)×
0.08+(19×
200+3×
0.04=4040.
当n=20时,
E(Y)=20×
0.88+(20×
0.08+(20×
0.04=4080.
可知当n=19时所需费用的期望值小于n=20时所需费用的期望值,故应选n=19.
利用期望与方差进行决策的方法
(1)若我们希望实际的平均水平较理想时,则先求随机变量ξ1,ξ2的期望,当E(ξ1)=E(ξ2)时,不应误认为它们一样好,需要用D(ξ1),D(ξ2)来比较这两个随机变量的偏离程度,偏离程度小的更好.
(2)若我们希望比较稳定时,应先考虑方差,再考虑均值是否相等或者接近.
(3)若对平均水平或者稳定性没有明确要求时,一般先计算期望,若相等,则由方差来确定哪一个更好.若E(ξ1)与E(ξ2)比较接近,且期望较大者的方差较小,显然该变量更好;
若E(ξ1)与E(ξ2)比较接近且方差相差不大时,应根据不同选择给出不同的结论,即是选择较理想的平均水平还是选择较稳定.
(2019·
洛阳第一次统考)甲、乙两家外卖公司,其送餐员的日工资方案如下:
甲公司,底薪80元,每单送餐员抽成4元;
乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:
甲公司送餐员送餐单数频数表
送餐单数
38
39
41
42
天数
15
5
乙公司送餐员送餐单数频数表
(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率.
(2)若将频率视为概率,回答下列两个问题:
①记乙公司送餐员日工资为X(单位:
元),求X的分布列和数学期望E(X);
②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.
(1)记抽取的3天送餐单数都不小于40为事件M,
则P(M)==.
(2)①设乙公司送餐员的送餐单数为a,
当a=38时,X=38×
6=228,
当a=39时,X=39×
6=234,
当a=40时,X=40×
6=240,
当a=41时,X=40×
6+1×
7=247,
当a=42时,X=40×
6+2×
7=254.
所以X的所有可能取值为228,234,240,247,254.
故X的分布列为
228
234
240
247
254
所以E(X)=228×
+234×
+240×
+247×
+254×
=241.8.
②依题意,甲公司送餐员的日平均送餐单数为38×
0.2+39×
0.3+40×
0.2+41×
0.2+42×
0.1=39.7,
所以甲公司送餐员的日平均工资为80+4×
39.7=238.8元.
由①得乙公司送餐员的日平均工资为2