随机变量及其概率分布Word文档下载推荐.docx

资源描述

随机变量及其概率分布Word文档下载推荐.docx

《随机变量及其概率分布Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《随机变量及其概率分布Word文档下载推荐.docx（11页珍藏版）》请在冰豆网上搜索。

随机变量及其概率分布Word文档下载推荐.docx

特别注意：

随机变量的取值或取值范围表示随机事件，而我们研究随机变量最主要的就是随机变量的取值或在某个范围内取值的概率（随机变量X本身不是事件）。

或

二．离散型随机变量

如果X的取值（可以有限也可以无限）可以一一列出，即可以排队的，则称X是离散型的随机变量。

设X的可能取值为xk（k=1,2,…,n），并且相应的概率P{X=xk}=pk都知道，则该随机变量的规律就完全搞清楚了。

X的规律是指①弄清可能取值②知道概率。

写成矩阵形式：

～

这个表格称为分布律（分布列）。

分布律应满足以下条件（性质）：

（1）；

（2）

分别叫做概率的非负性和概率的完备性。

例1求a的值，使X的分布律为。

解：

【注】分布律可以列表，也可用公式表示，本质都是以概率为函数值的一种特殊的函数，仅仅是表示的形式不同而已。

例2现有10件产品中，其中有3件次品，现任取两件产品，记X是“抽得的次品数”，求X的分布律。

解X可能取值为0，1，2，（这是关键步骤，常被忽视而致思维受阻）。

概率为

，，

则分布律为～

【注】求分布律，首先弄清X的确切含义及其所有可能取值。

例3一种有奖储蓄，20万户为一开奖组。

设特等奖20名，奖金4000元；

一等奖120名，奖金400元；

二等奖1200名，奖金40元；

末等奖4万名，奖金4元。

求一户得奖额X的分布律。

解X的可能取值为4000，400，40，4，0（最后一值易漏，要特别注意，绝大多数是不中奖的），易求分布律

以下讨论三种常见的分布：

两点分布、二项分布、泊松分布

三．两点分布

X的可能取值仅两点0和1，且P{X=1}=p，则分布律为～

其中，则称X服从参数为p的两点分布（0-1分布）。

例4袋中装6只白球和4只红球，任取一只，为“取得白球数”，求的分布律。

解P{X=1}=0.6，则的分布律为～

【注】任何随机试验都可与两点分布相联系：

设A是试验中某一事件，X是“一次试验中A出现的次数”，若P（A）=p，则X的分布律为（X=0表示A未出现）

四．二项分布

1．贝努里（Bernoulli）试验

将随机试验在相同条件下独立地重复n次，观察事件A出现的次数，称为贝努里试验，或n次重复独立试验。

如：

射击n次，中几次？

有放回的抽样（抽牌、模球、检验产品）。

事件A出现k次的概率记为Pn（k）。

例5产品次品率为0.2，有放回地抽5次，求出现2次次品的概率（可见《贝努里试验》Flash动画演示）。

解即求P5

（2），出现次品为A，5次抽样情况可以是

，

这样的情况共有种，互不相容，其概率都是，所以由加法定理得

。

一般地，在贝努里试验中，出现的概率是p，q=1-p，则

这种概率模型称为贝努里概型。

2．二项分布

X是n次重复独立试验中A事件出现的次数，P（A）=p，则

（）

称X服从参数为n，p的二项分布（或贝努里分布），记X~B（n,p）。

例6，产品次品率为10%，任意抽取5件样品，求最多有2件次品的概率。

解：

产品量很大时，不放回近似于放回，所以这是贝努里概型且p=10%=0.1，现在求P{X≤2}：

【注】要重视应用二项分布的现成结论。

常见的二项分布实际问题：

①有放回或总量大的无放回抽样；

②打枪、投篮问题（试验n次发生k次）；

③设备使用、设备故障问题。

例7螺丝次品率为0.05，十个一包出售，多于一个次品可退货，求退货率。

解螺丝量大，近似于有放回抽样，次品数~，求P{X>

1}。

但直接求很繁，可先求不多于一个次品的概率

（可以查表计算）。

所以退货率为1-0.9139=0.0861=8.6%。

五．泊松（Poisson）分布

若X的可能取值为（无穷）且

则称服从参数为的泊松分布，记为X~。

利用幂级数知识可以证明

泊松分布来自于“排队现象”，刻画稀有事件出现的概率。

如某时间段内的电话呼叫、纱线断头、顾客到来、车辆通过等。

当n很大时，二项分布近似于泊松分布，即

8.2连续型随机变量及其概率密度

一．连续型随机变量

1．概率密度

的取值连成一片（成为一些区间），就是连续型随机变量。

如零件尺寸、电池寿命、降雨量等。

P{a≤X≤b}是连续和，应是定积分（a，可不同，但被积函数相同）

（注意大、小写勿相混）这里函数f（x）称为随机变量X的概率密度函数，简称密度。

密度f（x）决定了X的变化规律，不同的随机变量有不同的密度。

定积分的几何意义是面积，所以概率的几何意义是密度函数曲线下方的面积（见图3）。

2．密度的性质

连续型的概率非负性和概率完备性表现为

（1）

（2）

例1设下列函数是概率密度，求k及P{1≤X≤3}，P{X≤1}

由完备性（注意分段函数的积分处理）

3．单点概率

这说明单点概率为零。

概率为零的事件不一定是不可能事件。

于是

进一步的考虑是当Δx很小时

即单点概率是和密度函数值成正比的无穷小量。

4．概率的几何意义

表明

（1）概率的几何意义是曲线下方的面积。

（2）并且整个曲线下方的面积等于1。

又

说明密度f（x）本身并不是概率，但它表示各点概率（无穷小）之间的比例。

均匀分布、指数分布、正态分布。

二．均匀分布

各点的概率（比例）相同，即f（x）恒等于常数。

若X的概率密度为

则称X服从区间[a,b]上的均匀分布，记为X~U（a,b）。

（见图4）

均匀分布是最简单的连续型分布。

问：

（1）常数为何是区间长度的倒数？

（2）均匀（概率）分布的概率如何简单求得？

三．指数分布

若的密度为则称X服从参数为的指数分布。

显然有

并且

指数分布也来自于“排队现象”，与泊松分布紧密联系。

四．正态分布

最重要的分布，在后面着重讨论。

8.3分布函数与函数的分布

一．分布函数

1．概念

设X是随机变量，x是一个数，则P{X≤x}与x有关，随x的变化而变化，从而是x的函数。

称f（x）=P{X≤x}为X的分布函数。

F（x）是在区间（-∞,x）内的“累积概率”，不要与单点概率混淆。

2．性质

（1）

（2）单调不减

（3）

（4），

这是累积概率之差额。

可见利用分布函数计算概率也很方便。

3．求法

注意对于离散型，F（x）是概率之和；

对于连续型，F（x）是积分。

计算公式分别是

分布函数对于连续型随机变量比较有用：

F（x）连续，且在连续点成立。

例1，设X~U（a,b）（均匀分布）求分布函数F（x）。

当x∈（a,b）时，利用概率的几何意义（面积）得（见图5）

F（x）的图形连续，尖点处无导数，恰为f（x）的间断点。

二．函数的分布

已知X的分布，求Y=g（X）的分布。

如动能对速度，面积对半径。

1．X为离散型随机变量。

例2，已知的分布律如下，求Y=X2的分布律。

X～

事件，概率也相等，但，所以

即Y=g（X）的可能取值为，概率不变。

2．X为连续型随机变量

已知X的分布密度设，求Y=g（X）的密度。

先要求出Y的分布函数，（与y有关），再通过求导得到，由于计算比较复杂，此处从略。

8.4正态分布

一．正态分布的定义与性质

1．定义

若X的概率密度为Gauss函数

则称X服从参数为的正态分布，记为~。

正态分布是最重要的分布。

一方面在自然界中，取值受众多微小独立因素综合影响的随机变量一般都服从正态分布，如测量的误差、质量指数、农作物的收获量、身高体重、用电量、考试成绩、炮弹落点的分布等。

因此大量的随机变量都服从正态分布；

另一方面，许多分布又可以用正态分布来近似或导出，无论在理论上还是在生产实践中，正态分布有着极其广泛的应用。

正态曲线：

正态密度函数的图象，是钟形曲线（见图6）。

2．正态曲线的性质

（1）关于直线对称（偶函数平移）；

（2）时，达最大值（最高点），两侧逐渐降低，有渐近线（轴），对应拐点；

（3）曲线之下的面积为1，即

（计算过程略）。

这个积分称为概率积分，又称高斯积分（高斯曲线）。

（4）注意到对应拐点，所以固定而变动时，曲线左、右平移，形状不变；

不变而变动时，因面积恒定为1，故越大（小），曲线越平坦（陡峭）。

3．标准正态分布

当时，称为标准正态分布，记为X~N（0,1），概率密度为

（是专用记号）对称性、最高点、拐点、渐近线、面积（积分）情况见上。

二．正态分布的概率计算

1．标准正态分布X~N（0,1），其分布函数的图形见图7，表示曲线下方、x左侧的面积，其函数表达式为

已编制了数值表（附表1），但表中只有的数值。

利用图形的对称性和完备性，即,可以查表求出各种概率。

例1，设~，求以下概率

（2）；

（3）

（4）；

（5）；

（6）

（2）

（4）

（5）

（7）已知，求a。

由倒查表得。

2．一般正态分布的概率计算

对于非标准正态分布，可通过线性变换化为标准正态分布来处理。

设~，则有重要结论

这个公式很重要，应牢记。

例2设X~N（0,4），求以下概率，这里。

（3）；

这里两个概率是不对称的。

例3设~，求以下概率

以上称为“3”规则：

正态变量有99.74%的机会落入以3为半径的区间内，因此可以说，正态变量几乎都在区间内取值。

这在统计学中的快速分析中经常会用到。

展开阅读全文