随机变量及其分布Word文档下载推荐.docx
《随机变量及其分布Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《随机变量及其分布Word文档下载推荐.docx(19页珍藏版)》请在冰豆网上搜索。
一般地,我们有以卞定义:
Definition2.1设E为一随机试验,S为他的样本空间,若X=X(0)gwS,为单值实函数,且对于任意实数X,集合{CO\X(CO)<
x}都是随机事件,则称X为随机变量。
(LetEarandomexpeiunent,Sisitssamplespace,ifX=X(0),0wS,isasmglevaluerealfiinctionandtheset|X(6?
)<
x}areallrandomoccunenceforaibitraiyrealvalue,thendefineXisrandomvariable.)
随机变量与普通实函数这两个概念既有联系又有区别,他们都是从一个集合到另一个集合的映射,它们的区别主要在于:
普通实函数无需做试验便可依据自变量的值确定函数值,而随机变量的取值在做实验之前是不确定的,只有在做了试验之后,依据所出现的结果才能确定。
定义中要求对任一实数x,{co\X(a))<
x}都是事件,这说明并非任何定义在S上的函数都是随机变量,而是对着函数有一定的要求。
定义中的要求无非是说,当我们把随机试验的结果数量化时,不可随心所欲,而是应该合乎概率公理体系的规范。
今后,在不必强调Q时,常省去Q,简记X(e)为X,而Q的集合{o)\X{cd)<
x}所表示的事件简记为X<
x.
2.2离散型随机变量及其分布率
(DiscreteRandomVariableanddistributionlaw)
i、离散型随机变量的概率分布(discreterandomvariableandprobabilitydistribution)离散型随机变量X只可能取有限个或可列个值,设x可能取的值为兀,丕,…,兀,….
Definition2.2设离散型随机变量X可能取的值为心心…凡,…,且X取这些值的概率为:
P(X=忑)=久,伙=1,2,…/,…)
则称上述一系列等式为随机变量X的概率分布。
(SupposethevalueforthediscreterandomvariableXinthefollowingsequence:
坷,无,・・・,£
•…,andtheprobabilityofthevalueforXis
P(x=切=以,伙=1,2,…,〃,…)
thendefinethesetofequationsisprobabilitydistributionofX・)
为了直观起见,有时将X的取值及其对应的概率列表如下:
X
兀2
•••
P
P1
Pn
我们称这种表为离散型随机变量X的概率分^(Tableofprobabilitydistribution)o式子P(X=H)=A,伙=1,2,…,〃,…),和概率分布表都称为离散型随机变量X的分布律(Lawofdistribution)o
由概率的定义知,离散型随机变量X的概率分布具有以下两个性质:
(1)以no,伙=1,2,…,〃,…)(非负性)
(2)工1人=1(归一性)
k
这里当X取有限个值并时,记号为X,当X取无限可列个值时,记号为f.
*=1i=l
(3)分布函数F(x)=P(X<
x)=》P(X二兀)二工E,这里和式是对所有满足x,<
x
X^<
XXj<
的i求和。
Example2.3设袋中装有6个球,编号为卜1,2,2,2,3,3},从袋中任取一球,求取到的球的号X的分布律。
Solution因为X可取的值为-1,2,3,而且P(X=—l)=l/6,P(X=3)=l/3,
P(X=2)=l/2,所以X的分布律为
1
2
3
Pk
6
Example2.4在贝努里概型中,"
次独立试验,事件4发生的次数为随机变量X,它的所有可能取值为0,1,2,...,/?
,X的分布律为
P(X=k)=pk=C:
pkq"
~k伙=0丄2,…,“)
二、几种常用的离散型分布(Severalspecialdiscretemodels)
下面介绍几种常用的离散型随机变量的概率分布(简称分布)。
1.两点分布
如果随机变量x只可能取o和1两个值,且它的分布列为
P(X=1)=p,P(X=0)=1—/?
(0<
/?
<
1)>
则称X服从两点分布(Two・pointdistribution)(或0T分布)。
两点分布的概率分布表为:
P1-P
2.二项分布
如果随机变量X只可能取的值为0丄2,…/,它的分布列为
P(X=k)==0丄2,…,n)其中0<
pd,q=l_p•则称X服从参数为
的二项分布(theBinomialDistribution),记为X〜当”=1时,二项分布就是两点
分布。
例2.4本身就是二项分布。
Example2.5某车间有8台5.6T•瓦的车床,每台车床由于工艺上的原因,常要停车。
设各车床停车是相互独立的,每台车床平均每小时停车12分钟。
(1)求在某一指定的时刻车间恰有两台车床停车的概率。
(2)全部车床用电超过30千瓦的可能有多大?
Solution由于每台车床使用是独立的,而且每台车床只有开车与停车两种情况,且开车的概率为12/60二0.2,因此,这是一个8重贝努里试验。
若用X表示任意时刻同时工作
的车床数,则X~B(&
0.2),其分布律为
©
p;
(1一几=(1--)(1--)pK=f'
Ke~Zxdx=[a<
c<
d<
Ab]Xa>
Q9a,x=“/(x)=Ox>
0X-nnJo
呛*虫:
(0»
(0矿乙=0丄2,…,8)
(1)所求概率为
P(X=2)=C;
(0.2尸(0.8)°
=0.2936
(2)由于30T•瓦的电量只能供5台车床同时工作,“用电超过30千瓦”意味着有6台或
6台以上的车床同时工作,这一事件的概率为
P(X>
6)=P(X=6)+P(X=7)+P(X=8)
=C;
(0.2)6(0.8尸+c;
(0.2)7(0.8)+(0.2)3=0.00123
Theorem2.1(Poissontheorem)设随机变量X服从二项分布B(gp“),且1111177P,=z>
0,则一几)e=—e"
•伙=1,2,…)。
(LetXhavethe
n->
xk!
p
Bmoinialdistributionwithparameter11andw,andhmnpn=2>
0,then
oo
lim<
(pn/(l-pfl)w=^-e~\k=1,2,…).)
k!
Proof:
令npfi=,有
c祖Q-pj"
+(金(]一么严
k\nn
=(』(「)••*=執一务(-分
nnnkinn
对任意固定的k(0<
k<
n),当时
(1一丄)(1_Z)...(1_£
z!
)t1,(1一盒尸—I,
nnnn
及
lnn(l—佥)”=lim(l—人)石"
“=不久
>
r/Jn-yx/J
所以
limWC:
(pfl/(l-p„r*=^-e\k=1,2,...)rk!
在应用中,当”很大,且卩很小,而/妙是一个大小适当的数(通常0<
叩<
8)时,有以下的泊松分布近似公式
C”Q-P)”f令厂
其中2=np.而关于ge"
的值,可以查表(见附表)。
k\
3•泊松分布
如果随机变量X所有可能取的值为0,1,2,…,它取各个值的概率为
p(x“)=讨ms
其中几〉0是常数,则称x服从参数为几的泊松分布(Poissondistribution),记为
泊松分布在各领域中有着广泛的应用。
例如某段时间内电话机接到的呼唤次数,候车的乘客数,放射性物质在某段时间内放射的粒子数,纺纱机的断头数,某页书上的印刷错误的个数等等都可以用泊松分布来描述。
前面已知当〃较人、P很小,且,奶是一个大小适当的数(通常0<砂<8),可以用泊松分布近似代替二项分布(取兄=砂)。
Example2.6某商店出售某种商品。
根据经验,此商品的月销售量X服从x=3的泊
松分布。
问在月初进货时要库存多少件此种商品,才能以99%的概率满足顾客要求?
Solution设月初库存M件,依题意
P(X=Z:
)=—e-\(^=0JX..)
那么
m3尺
P(X5M)=工一严》0・99
a=ok!
x屮
y一八<
o.oi
查附表3,可知M最小应是8,即月初进货时要库存8件此种商品,才能以99$的概率满足顾客要求。
Example2.7一本500页的书,共500错字,每个字等可能的出现在每一页上,求在给定的某一页上最多两个错字的概率。
so,ution设X表示在给定的某一页上出现的错字的个数,则恥爲’因为〃很
X,np=\.所以可以用泊松分布近似计算,依题意
-1"
T5
P(X=e-1+e_1+—=-e_1«
0.92
4•超几何分布
设一批产品共有N个,其中有M个次品,现从中任取〃个55N—M),则这〃个
产品中所含的次品数X是一个离散型随机变量,X所有可能的取值为0J2,…(其中
j=min{M,n})9其概率分布为:
P(X=k)=CtC爲IC;
k=0J2,…,j,称之为超几何分布(Supergeometry
distribution)o
5.几何分布
从一批次品率为p的产品中逐个地随机抽取产品进行检验,验后放回再抽取卞一件,直到捕到次品为止。
设检验的次数为X,则X可能取的值为1,2,3,…,其概率分布为:
P(X"
)=伙=1,2,....)
称这种概率分布为几何分布(Geometrydistribution)e
2.3随机变量的分布函数
引入了随机变量之后,随机事件就可以用随机变量来描述,例如,在某城市中考察人II的年龄结构,年龄在80岁以上的长寿者,年龄介于18岁至35岁之间的年轻人,以及不到12岁的儿童,它们各自的比率如何。
从表面上看,这些是孤立事件,但若我们引进一个随机变量X:
X表示随机抽取一个人的年龄;
那末,上述几个事件可以分别表示成
{X>
80}、{18<
X<
35}及{Xv12}.由此可见,随机事件的概念是被包容在随机变量这个更广的概念之内的。
对于随机变量X,我们不只是看它取哪些值,更重要的是看它以多人的概率取那些值。
由随机变量的定义可知,对于每一个实数x,{X<
x}都是一个事件,因此有一个确定的概率P{X<
x}与x相对应,所以,概率P{X<
x}是%的函数。
这个函数在理论和应用中都是很重要的,为此,我们有以下定义:
Definition2.3设X为一个随机变量,x为任意实数,称函数F(x)=P{X的分布函数。
(LetXisarandomvaiiable,xisarbitraryrealvalue,thendefineF(x)=P{X<
x}isthedistributionfunctionofX.)
显然,在上述定义中,当x固定为时,F(x°
)为事件{X<
x0}的概率,当x变化时,概率P{Xvx}便是x的函数。
分布函数的性质(Thepropertyofdistributionfunction)
(1)F(—co)=0,F(+^o)=1.
(2)F(x)是自变量x的非降函数,即当人<
乙时,必有F(xJ<
尸(吃).因为当
时有F(x2)-F{xl)=P(x{<
X<
x2)>
0,从而F(xl)<
F(x2).
(3)F(x)对自变量x右连续,即对任意实数x,F(x+0)=F(x),事实上,
hili[F(x+Av)-尸(x)]=limP(x<
x+Ax)=P(x<
x)=P(V)=0
Av^O*
右连续性是随机变量的分布函数的普遍性质。
对连续的随机变量,尸3)是连续函数。
对离散的随机变量,在可能值兀0=1,2,…)处,F(x)是右连续的。
2.4连续型随机变量及其概率密度
(ProbabilityDensityofContinuousRandomVariable)
除了离散型随机变量外,还有一类重要的随机变屋一一连续型随机变量,这种随机变屋X可以取某个区间[⑦切或(y>
+s)的一切值。
由于这种随机变量的所有可能取值无法像离散型随机变屋那样一一排列,因而也就不能用离散型随机变屋的分布律来描述它的概率分布,刻画这种随机变屋的概率分布可以用分布函数,但在理论上和实践中更常用的方法是用所谓的概率密度。
一、分布密度的概念(Theconceptofdensitydistribution)
Definition2.4设随机变量X的的分布函数为F(x),如果存在一个非负可积函数
/(X),使得对于任意实数X,有:
尸⑴=ff(x)dx
-X
则称X为连续型随机变屋,而/(X)称为X的分布密度函数(或概率密度函数),简称分布密度(或概率密度)。
(SupposedistiibutionfunctionF(x)forlaiidomvariableX,ifthereexistsanoimegativeintegralfunction/(x),suchthatforarbitraryX,thereis
尸⑴=
-oc
thendefineXisacontinuousrandomvariableand/(x)isdensityfunction
distributionalprobabilitydensityfunction),forshortdistributiondensity
(orprobabilitydensity).)
由分布密度的定义及概率的性质可知分布密度/(X)必须满足:
(1)/(x)>
0:
从几何上看,分布密度函数的曲线在横轴的上方;
+x
ff(x)dx=1
(2)y:
这是因为yovxv*o是必然事件,所以
400
Jj\x)dx=P(—8vXv+8)=P(U)=1
—X
从几何上看,对于任一连续型随机变量,分布密度函数与数轴所I制成的面积是1:
(3)对于任意实数a,b,且a<
b有
P{a<
b}=F(b)-F(a)=£
f{x)dx
(4)若/(x)在点x处连续,则有F\x)=f(x).
Note:
(1)对于任意实数d有P(x=a)=0.即连续型随机变量取某一实数值的概率为零。
从而有:
h
P(ci<
X<
b)=P(a<
b)=P(ci<
Z?
)=jf(,x)dx
a
该式说明,当计算连续型随机变量在某一区间上取值的概率时,区河端点对概率无影响。
(2)P(a<
b)=P(X<
b)-P(X<
a)
事实上,因为事件{ci<
b}与事件{X<
a}互不相容,且
{X<
b}={a<
b}^j{X<
a}
P(X<
b)=P{ci<
b)+P{X<
ci)
hab
P(a<
b)~P(X<
a)=jf(x)dx-J*f{x)dx=jf{x)dx
即Y-R“
(3)由定义可知,连续型随机变量就是存在理论分布曲线的随机变量,这一理论分布曲线对应着一个函数/(x),称为连续型随机变量的分布密度函数。
连续型随机变量X落入微小区间[x.x+clr]的概率为P(x<
x+dx)=f(x)dx,称f(x)dx为连续型随机变量X
的概率元。
它起着离散型随机变量分布列中"
类似的作用。
Example2.8设随机变量X具有概率密度
fM=
K严,
0,
x>
x<
(1)试确定常数K;
(3)求F(x).
Solution
(1)f(x)cLv=1,即
C伽"
=fKe-”dx=吉J:
Ke-gx)=j
得k=3.于是X的概率密度
/W=
3严,x>
0、x<
⑵P(X>
O.1)=L/W^JC
/•-toe
j\x)dxf3八2/兀=0.7408
(3)由定义F(x)=当x50时,F(x)=0;
当x>
0时,
F(叽3严心1-严
F(x)=
1-严x>
o.x<
o
二、几个常用的连续型随机变量的分布(Severalspecialcontinuousmodels)
1.均匀分布
如果随机变量X的概率密度为
彳.一-—,a<
b
f(x)=\b-a
〔0,其他
则称X服从[a、b]上的均匀分布(Uniformdistribution)□
如果X服从[匕切上的均匀分布,那末,对于任意满足a<
b的c,d,应有
P(c5X
该式说明X取值于[么切中任意小区间的概率与该小区间的长度成正比,而与该小区间的具体位置无关。
这就是均匀分布的概率意义。
2.指数分布
/«
=
则称X服从指数分布(Indexdistribution)(参数为2)。
指数分布也被称为寿命分布,如电子元件的寿命,电话通话的时间,随机服务系统的服务时间等都可近似看作是服从指数分布的。
3.正态分布
1_厶(人-“):
/(X)=—e2a'
(-OO<
4-00)
其中cr〉0,6〃为常数,则称X服从参数为er,”的正态分布(Normaldistribution),记为X〜N
(2)
由高等数学可知,
(1)当x=P时,/(X)达到最大值厂!
h;
在X=JL1±
(J处,曲线yj2“
y=f(x)有拐点;
(如图2—1)
(2)/(X)的图形对称于直线x=“;
(3)/(x)以x轴为渐近线;
⑷若固定6改变“值,则曲线y=f(x)沿x轴平行移动,曲线的几何图形不变;
(如图2-2)⑸若固定“,改变cr值,由/(X)的最人值可知,当o■越人,/(x)的图形越平坦:
当(T越小,/(X)的图形越陡峭。
(如图2-3)
I何
图2-1图2-2图2-3
特别的,当//=0,CT2=1时,称X服从标准正态分布(Standardnormaldistribution)9
即X~N(0J),密度函数为
1--
0(x)=—=e2,(-qo<
+s)
标准正态分布的分布函数为
①(x)=『(p{x)dx=J'
2dt
对于标准正态分布的分布函数,有下列等式
①(—X)=1-①(X)
对于X〜Ngb、只要设丄二£
=就有
-x
2dt=\
所以,如果XzNgb、那么
P{a<
b}=F(b)-F(ci)=-①
<
7(J
为了应用方便,编制了标准正态分布函数①(x)的函数值表;
对于一般的正态分布函数,可以通过变量替换化为标准正态分布函数。
3°
■规则(3^1aw):
服从正态分布NlT)的随机变量X落在区间(“—36〃+3b)内的概率为0.9973,落在该区间外的概率只有0.0027.也就是说,X几乎不可能在区间(“一36〃+3b)之外取值。
Example2.9设X〜N(0,1),求
(1)P(X<
03);
(2)P(0.2<
0.5);
(3)P(X>
1・5);
(4)
P(X<
-1.2);
(5)P(|X|<
0.34).
Solution查标准正态分布表
(1)P(X50.3)二①(0.3)=0.6179
(2)P(0.2<
0.5)二①(0.5)—①(0.2)=0.6915-0.5793=0.1122
⑶P(X>
1.5)=1-0(1.5)=1-0.9332=0.0668
⑷P(X<
-1.2)=0(-1.2)=1-0(1.2)=1-0.8849=0.1151
(5)P(|X|<
0.34)