分布列概念.docx
《分布列概念.docx》由会员分享,可在线阅读,更多相关《分布列概念.docx(17页珍藏版)》请在冰豆网上搜索。
分布列概念
1.分布列定义:
设离散型随机变量所有可能取得的值为xi,x2,…3X…x若取每一个值xi(i=1,2,,-n)
的概率为P(xi)Pi,则称表
X1
X2
Xi
Xn
P
P1
P2
Pi
Pn
为随机变量的概率分布,简称的分布列离散型随机变量的分布列都具有下面两个性质:
(1)Pi>0,i=1,2…,n;
(2)Pi+P2+n+Pn=1
要点四、两类特殊的分布列
1.两点分布
随机变量X的分布列是
E
0
1
P
1P
P
像上面这样的分布列称为两点分布列.
要点诠释:
(1)若随机变量X的分布列为两点分布,则称X服从两点分布,而称P(X=1)为成功率.
(2)两点分布又称为0-1分布或伯努利分布
(3)两点分布列的应用十分广泛,如抽取的彩票是否中奖;买回的一件产品是否为正品;新生
婴儿的性别;
投篮是否命中等等;都可以用两点分布列来研究
2.超几何分布
一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则则事件{X=k}
nN,MN,n,M,NN•
称分布列为超几何分布列.如果随机变量X的分布列为超几何分布列,则称随机变量X服从超几何分布
X
0
1
?
?
?
m
P
C0Cn0CMCNM
?
?
?
?
?
?
qmqnmCMCNM
CnJN
CN
要点一、条件概率的概念
1.定义
设A、B为两个事件,且P(A)0,在已知事件A发生的条件下,事件B发生的概
率叫做条件概率。
用符号P(B|A)表示。
P(B|A)读作:
A发生的条件下B发生的概率。
要点诠释
在条件概率的定义中,事件A在事件B已发生”这个附加条件下的概率与没有这个附加
条件的概率是不同的,应该说,每一个随机试验都是在一定条件下进行的.而这里所说的条
件概率,则是当试验结果的一部分信息已知,求另一事件在此条件下发生的概率.
2.P(A|B)、P(AB)、P(B)的区别
P(A|B)是在事件B发生的条件下,事件A发生的概率。
P(AB)是事件A与事件B同时发生的概率,无附加条件。
P(B)是事件B发生的概率,无附加条件.
它们的联系是:
P(A|B)P(AB).
P(B)
要点诠释
一般说来,对于概率P(A|B)与概率P(A),它们都以基本事件空间Q为总样本,但它们取概率的前提是不相同的。
概率P(A)是指在整个基本事件空间Q的条件下事件A发生的可能性大小,而条件概率P(A|B)是指在事件B发生的条件下,事件A发生的可能性大小。
例如,盒中球的个数如下表。
从中任取一球,记A='取得蓝球”B='取得玻璃球”。
基本
事件空间Q包含的样本点总数为16,事件A包含的样本点总数为11,故P(A)11。
16
玻璃
木质
总计
红
2
3
5
蓝
4
7
11
总计
6
10
16
如果已知取得玻璃球的条件下取得蓝球的概率就是事件B发生的条件下事件A发生的条
件概率,那么在事件B发生的条件下可能取得的样本点总数应为玻璃球的总数”即把样本空间压缩到玻璃球全体。
而在事件B发生的条件下事件A包含的样本点数为蓝玻璃球数,
42
故P(A|B)
63
要点二、条件概率的公式
1•计算事件B发生的条件下事件A发生的条件概率,常有以下两种方式:
1利用定义计算.
先分别计算概率P(AB)及P(B),然后借助于条件概率公式P(A|B)需求解.
2利用缩小样本空间的观点计算.
在这里,原来的样本空间缩小为已知的条件事件B,原来的事件A缩小为事件AB,
典概型中的条件概率求解.
要点诠释
概率P(B|A)与P(AB)的联系与区别:
联系:
事件A,B都发生了。
区别:
1在P(B|A)中,事件A,B发生有时间上的差异,事件A先发生事件B后发生;在P(AB)中,事件A,B同时发生;
2基本事件空间不同在P(B|A)中,事件A成为基本事件空间;在P(AB)中,基本事件空
间仍为原基本事件空间。
2•条件概率公式的变形.
公式P(A|B)P(AB)揭示了P(B)、P(A|B)、P(AB)的关系,常常用于知二求P(B)
一,即要熟练应用它的变形公式如,若P(B)>0,贝UP(AB)=P(B)P(A|B),该式
称为概率的乘法公式.
要点诠释
条件概率也是概率,所以条件概率具有概率的性质•如:
1任何事件的条件概率取值在0到1之间;
2必然事件的条件概率为1,不可能事件的条件概率为0;
3条件概率也有加法公式:
P(BUC|A)=P(B|A)+P(C|A),
其中B和C是两个互斥事件.
要点三、相互独立事件
1.定义:
事件A(或B)是否发生对事件B(或A)发生的概率没有影响,即P(B|A)P(B),
这样的两个事件叫做相互独立事件。
若A与B是相互独立事件,则A与B,A与B,A与B也相互独立。
2.相互独立事件同时发生的概率公式:
对于事件A和事件B,用AB表示事件A、B同时发生。
(1)若A与B是相互独立事件,则P(AB)P(A)P(B);
(2)若事件A,,A2丄,An相互独立,那么这n个事件同时发生的概率,等于每个事件发生的概率的积,
即:
P(AA2LAn)P(A)P(A2)LP(An)。
要点诠释
(1)P(AB)=P(A)P(B)使用的前提是A、B为相互独立事件,也就是说,只有相互独立的两个事件同时发生的概率,才等于每个事件发生的概率的积.
(2)两个事件A、B相互独立事件的充要条件是P(AB)P(A)P(B)。
3.相互独立事件与互斥事件的比较
互斥事件与相互独立事件是两个不同的概念,它们之间没有直接关系。
互斥事件是指两个事件不可能同时发生,而相互独立事件是指一个事件是否发生对另一
个事件发生的概率没有影响。
一般地,两个事件不可能既互斥又相互独立,因为互斥事件是不可能同时发生的,而相互独立事件是以它们能够同时发生为前提的。
相互独立事件同时发生的概率等于每个事件发
生的概率的积,这一点与互斥事件的概率和也是不同的。
4.几种事件的概率公式的比较
已知两个事件A,B,它们发生的概率为P(A),P(B),将A,B中至少有一个发生记为事
件A+B,都发生记为事件AB,都不发生记为事件AB,恰有一个发生记为事件ABAB,至多有一个发生记为事件ABABAB,则它们的概率间的关系如下表所示:
概率
A,B互斥
A,B相互独立
P(A+B)
P(A)+P(B)
1P(A)P(B)
P(AB)
0
P(A)P(B)
P(AB)
1-[P(A)+P(B)]
P(A)P(B)
P(ABAB)
P(A)+P(B)
P(A)P(B)P(A)P(B)
P(ABABAB)
1
1-P(A)P(B)
要点二、独立重复试验的概率公式
1.定义
如果事件A在一次试验中发生的概率为P,那么n次独立重复试验中,事件A恰好发
生k次的概率为:
Pn(k)C;kpk(1p)nk(k=0,1,2,…,n).
令k0得,在n次独立重复试验中,事件A没.有.发.生.的.概.率.为.
00nn
Pn(0)Cn0p0(1p)n(1p)n
令kn得,在n次独立重复试验中,事件A全.部.发.生.的.概.率.为.Pn(n)Cnnpn(1p)0pn。
要点诠释:
1.在公式中,n是独立重复试验的次数,p是一次试验中某事件A发生的概率,k是在
n次独立重复试验中事件A恰好发生的次数,只有弄清公式中n,p,k的意义,才能正确地
运用公式.
2.独立重复试验是相互独立事件的特例,就像对立事件是互斥事件的特例一样,只是有“恰好”字样的用独立重复试验的概率公式计算更方便.
要点三、n次独立重复试验常见实例:
1.反复抛掷一枚均匀硬币
2.已知产品率的抽样
3.有放回的抽样
4.射手射击目标命中率已知的若干次射击
要点诠释:
抽样问题中的独立重复试验模型:
1从产品中有放回地抽样是独立事件,可按独立重复试验来处理;
2从小数量的产品中无放回地抽样不是独立事件,只能用等可能事件计算;
3从大批量的产品中无放回地抽样,每次得到某种事件的概率是不一样的,但由于差别太小,相当于是独立事件,所以一般情况下仍按独立重复试验来处理。
要点四、离散型随机变量的二项分布
1.定义:
在一次随机试验中,事件A可能发生也可能不发生,在n次独立重复试验中事件A发生的次数是一个离散型随机变量•如果在一次试验中事件A发生的概率是p,则此事
件不发生的概率为q1p,那么在n次独立重复试验中事件A恰好发生k次的概率是
kknk
Pn(k)Pn(k)Cnkpkqnk,(k0,1,2,...,n)•
;0
1
k
n
P
、0n
>CnPq
C11r
CnPq
1
小kk「
Cnpq
k
cnn
CnpC
由于表中第二行恰好是二项展开式
(qp)nc0p°qnClp1qn1C:
pkqnkC:
pnq0中各对应项的值,
所以称这样的随机变量服从参数为n,p的二项分布,记作〜B(n,p)•
要点诠释:
判断一个随机变量是否服从二项分布,关键有三:
其一是独立性。
即每次试验的结果是相互独立的;
其二是重复性。
即试验独立重复地进行了n次;
其三是试验的结果的独特性。
即一次试验中,事件发生与不发生,二者必居其一。
2•如何求有关的二项分布
(1)分清楚在n次独立重复试验中,共进行了多少次重复试验,即先确定n的值,然后确定在一次试验中某事件A发生的概率是多少,即确定p的值,最后再确定某事件A恰好发生了多少次,即确定k的值;
(2)准确算出每一种情况下,某事件A发生的概率;
(3)用表格形式列出随机变量的分布列。
要点一、离散型随机变量的期望
1.定义:
一般地,若离散型随机变量的概率分布为
X
X2
Xi
P
p
1p
2…
p
i…
则称EX1p1X2p2…XnPn…为的均值或数学期望,简称期望.
要点诠释:
(1)均值(期望)是随机变量的一个重要特征数,它反映或刻画的是随机变量取值的平均水平.
(2)一般地,在有限取值离散型随机变量的概率分布中,令口p2…pn,则有p1
11
P2…pn-,E(X1X2…xn)—,所以的数学期望又称为平均数、均
nn
值。
(3)随机变量的均值与随机变量本身具有相同的单位.
2.性质:
①E(
)
EE;
②若
a
b(a、b是常数),
是随机变量,则也是随机变量,有
E(ab)
aE
b;
E(a
b)
aEb的推导过程如下:
的分布列为
Xi
X2
Xi
axib
ax2b
axib
P
R
P
于是E(axib)p(ax?
b)p2…(axib)pi…
=a(xiPix2p2…xp…)b(pip2…pi…)=aEb
E(ab)aEb。
要点二:
离散型随机变量的方差与标准差
1•一组数据的方差的概念:
已知一组数据Xi,X2,…,Xn,它们的平均值为x,那么各数据与X的差的平方的平均数
S2-[(xix)2+(x2x)2+…+(xnx)2]叫做这组数据的方差。
n
2•离散型随机变量的方差:
般地,若离散型随机变量的概率分布为
Xi
X2
Xi
P
Pi
P2
Pi
则称D=(XiE)2Pi+(X2E)2P2+…+(XnE)2Pi+…称为随机变量的方差,式中的E是随机变量的期望.
D的算术平方根■■D叫做随机变量的标准差,记作
要点诠释:
⑴随机变量的方差的定义与一组数据的方差的定义式是相同的;
⑵随机变量的方差、标准差也是随机变量E的特征数,它们都反映了随机变量取值的
稳定与波动、集中与离散的程度;方差(标准差)越小,随机变量的取值就越稳定(越靠近平均值).
⑶标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛。
3.期望和方差的关系:
DE
(2)(E)2
4.方差的性质:
若ab(a、b是常数),是随机变量,则也是随机变量,
DD(ab)a2D;
要点三:
常见分布的期望与方差
1、二点分布:
若离散型随机变量服从参数为p的二点分布,则
期望Ep
方差Dp(1p).
证明:
•••P(0)q,P
(1)p,0p1,pq1
二E0q1pp
D(0p)2q(1p)2pp(1p).
2、二项分布:
若离散型随机变量服从参数为n,p的二项分布,即〜B(n,P),则
期望EnP
方差Dnp(1-p)
期望公式证明:
kknkkknk
-P(k)Cnp(1p)Cnpq,
00n11n1
Cnpq1CnPq
3、几何分布:
期望E
22n2kknknn0
2
Cnpq...kCnpq...nCnpq,
验证。
4、超几何分布:
若离散型随机变量服从参数为N,M,n的超几何分布,则
期望E()现
N
要点四:
离散型随机变量的期望与方差的求法及应用
1、求离散型随机变量的期望、方差、标准差的基本步骤:
1理解的意义,写出可能取的全部值;
2求取各个值的概率,写出分布列;
X1
X2
X
P
P1
P2
Pi
3根据分布列,由期望、方差的定义求出E、D、:
EXi®X2P2LXnPnL
222
DXiEPiX2EP2LXnEPnL
注意:
常见分布列的期望和方差,不必写出分布列,直接用公式计算即可.
2•离散型随机变量的期望与方差的实际意义及应用
1离散型随机变量的期望,反映了随机变量取值的平均水平;
2随机变量的方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度。
方
差越大数据波动越大。
3对于两个随机变量1和2,当需要了解他们的平均水平时,可比较E1和E2的大小。
4E1和E2相等或很接近,当需要进一步了解他们的稳定性或者集中程度时,比较D1和
D2,方差值大时,则表明E比较离散,反之,则表明E比较集中•品种的优劣、仪器的
好坏、预报的准确与否、武器的性能等很多指标都与这两个特征数(数学期望、方差)有关.
【典型例题】
正态分布
编稿:
赵雷审稿:
李霞
【学习目标】
1.了解正态分布曲线的特点及曲线所表示的意义。
2.了解正态曲线与正态分布的性质。
【要点梳理】
要点诠释:
要点一、概率密度曲线与概率密度函数
1•概念:
对于连续型随机变量X,位于X轴上方,X落在任一区间(a,b]内的概率等于它与X
轴、直线xa与直线Xb所围成的曲边梯形的面积(如图阴影部分),这条概率曲线叫做X的概率密度曲线,以其作为图象的函数f(x)叫做X的概率密度函数。
1概率密度函数所取的每个值均是非负的。
2
夹于概率密度的曲线与x轴之间的平面图形”勺面积为1
图形”的面积。
要点二、正态分布
1.正态变量的概率密度函数
(0,
2.正态分布
(1)定义
(2)正态分布的期望与方差
要点诠释:
去估计。
是
标准差,它是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计。
(2)经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用
结果之和,它就服从或近似服从正态分布.
在现实生活中,很多随机变量都服从或近似地服从正态分布•例如长度测量误差;
某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗
长、单位面积产量等;正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等);某地每年七月份的平均气温、
平均湿度、降雨量等;一般都服从正态分布.
要点三、正态曲线及其性质:
1.正态曲线
参数(0,
),则称函数f(X)的图象为正态分布密度曲线,简称正态曲线。
fl
2•正态曲线的性质:
1曲线位于X轴上方,与X轴不相交;
2曲线是单峰的,它关于直线X对称;
1
3
曲线在x时达到峰值2
时,以x轴为渐近线,向它无限靠近
5
曲线与X轴之间的面积为1;决定曲线的位置和对称性;
平移。
越大,曲线越矮胖”表示总体的分布越分散。
如下图所示。
/
k
1J1
-3-2-1
P123T
要点诠释:
性质①说明了函数具有值域(函数值为正)及函数的渐近线(x轴)•性质②并且说明了
函数具有对称性;性质③说明了函数在x=时取最值;性质⑦说明越大,总体分布越分散,越小,总体分布越集中.
要点四、求正态分布在给定区间上的概率
1.随机变量取值的概率与面积的关系
若随机变量E服从正态分布N(,2),那么对于任意实数a、b(avb),当随机变量E在区间(a,b]上取值时,其取值的概率与正态曲线与直线x=a,x=b以及x轴所围成的图形
的面积相等•如图
(1)中的阴影部分的面积就是随机变量孝在区间(a,b]上取值的概率.
1
y
yd
/■1
K
y:
|
/K
A
o\
a1bxO\
⑴
a\xO\
(2)
「o:
i
(3)
一般地,当随机变量在区间(一a)上取值时,其取值的概率是正态曲线在x=a左
侧以及x轴围成图形的面积,如图
(2)•随机变量在(a,+R)上取值的概率是正态曲线在x=a右侧以及x轴围成图形的面积,如图(3)•
根据以上概率与面积的关系,在有关概率的计算中,可借助与面积的关系进行求解.
2、正态分布在三个特殊区间的概率值:
上述结果可用下图表示:
要点诠释:
若随机变量X服从正态分布N(,2),则X落在(3,3)内的概率约为
0.997,落在(3,3)之外的概率约为0.003,—般称后者为小概率事件,并认为在
一次试验中,小概率事件几乎不可能发生。
一般的,服从于正态分布N(,2)的随机变量X通常只取(3,3)之间的值,
简称为3原则。
3、求正态分布在给定区间上的概率方法
(1)数形结合,利用正态曲线的对称性及曲线与x轴之间面积为1。
①正态曲线关于直线x对称,与x对称的区间上的概率相等。
例如P(X)P(X);
②P(Xa)1P(Xa);
(2)利用正态分布在三个特殊区间内取值的概率:
【典型例题】