概率的定义与其确定方法doc.docx

资源描述

概率的定义与其确定方法doc.docx

《概率的定义与其确定方法doc.docx》由会员分享，可在线阅读，更多相关《概率的定义与其确定方法doc.docx（17页珍藏版）》请在冰豆网上搜索。

概率的定义与其确定方法doc.docx

概率的定义与其确定方法doc

§1.2概率的定义及其确定方法

在本节，我们要给出概率的定义，这是概率论中最基本的概念。

本节中我们还将介绍几种确定概率的方法。

随机事件的发生有偶然性，但我们常常会觉察到随机事件发生的可能性是有大小之分的。

例如，购买彩票后可能中大奖，可能不中奖，但中大奖的可能性远比不中奖的可能性小。

既然各种事件发生的可能性有大有小，自然使人们想到用一个数字表示事件发生的可能性大小。

这个数字就称为事件的概率。

然而，对于给定的事件A，该用哪个数字作为它的概率呢？

这决定于所研究的随机现象或随机试验以及事件A的特殊性，不能一概而论。

在概率论的发展历史

上，人们针对特定的随机试验提出过不同的概率的定义和确定概率的方法：

古典定义、几何定义和频率定义。

这些概率的定义和确定方法虽然有其合理性，但也只适合于特定的随机现象，有很大的局限性。

那么如何给出适合于一切随机现象的概率的最一般的定义呢?

1900年数学家希尔伯特提出要建立概率的公理化定义以解决这个问题,即以最少的几条本质特性出发去刻画概率的概念.1933年数学家柯尔莫哥洛夫首次提出了概率的公理化定义,这一公理化体系迅速得到举世公认,有了这个定义后,概率论才被正式承认为一个数学分支,并得到迅猛发展.

1.概率的公理化定义

定义1.2.1设为样本空间,F为的某些子集组成的事件域.P（A）（AF）

是定义在事件域F上的实值集函数,如果它满足:

（1）非负性公理对于任一AF,有P（A）0;

（2）正则性公理P（）1;

（3）可列可加性公理若A1,A2,,An,两两互不相容,则

则称P（A）为事件A的概率,称三元总体（,F,P）为概率空间.

概率的公理化定义刻画了概率的本质，概率是集合（事件）的实值函数，若在事件域上给出一个函数，只要这个函数满足上述三条公理就称为概率。

这个定义只涉及样本空间和事件域及概率的最本质的性质而与具体的随机现象无关。

对于具体的随机现象中的给定的事件，其概率如何合理地确定那要依据具

体情况而定。

历史上出现的概率的频率定义、古典定义和几何定义都是特定的场

合下有着各自的确定概率的方法。

在有了概率的公理化定义之后，把它们看作确

定概率的方法是恰当的。

下面介绍这些确定概率的方法。

2.频率方法

设E为一随机试验，A为其中一事件，在相同条件下将E独立重复做n次，记

n（A）为事件A发生的次数（也叫频数），比值

称为事件A在这n次试验中的频率。

容易验证频率满足概率的公理化定义中的三条公理。

一般地，如事件A发生的可能性愈大，那么在多次重复试验中,事件A发生愈频繁即频率fn（A）也愈大.反之,频率fn（A）愈大表明事件A发生的可能性愈大.因此

事件频率的大小与事件发生的可能性大小有密切的联系.但是还不能把事件的频率就确定为概率,因为频率有“波动性”.长期实践表明,随着试验次数n的增加,频率fn（A）会稳定于某一个常数p,这个频率的稳定值是由事件本身决定的并且这样的

稳定值满足概率的公理化定义中的三条公理,因能把这个稳定值确定为事件的概率是合理的.

这种确定概率的方法虽然有其合理性,但其缺点是明显的:

在现实世界里,人们无法把一个试验无限次地重复下去,因此我们无法精确地得到频率的稳定值.尽管有明显的缺点,但这种方法有其重大意义:

一方面,频率具有稳定性这一客观事实给概率提供经验背景.同时频率方法给我们提供了一个可以想象的具体值,并且在试验次数较大时,可用频率给出概率的近似值.例如,工业生产中,依据抽检的一些产品估计产品的废品率.另一方面,它提供了检验理论正确与否的准则.设想依据某一理论或假定算出了某事件A的概率为p,这一理论或假定是否与实际相符,我们并无把握,于

是我们可诉诸试验,即进行大量重复试验以观察事件A的频率fn（A）.若频率fn（A）

与p接近,则可认为试验结果支持了有关理论或假定.若频率fn（A）与p相差较大,

则认为理论可能有误.例如,在抛硬币的试验中,假定正反面出现的可能性相等,则出

现正面的概率与出现反面的概率都是0.5,如果我们多次抛掷硬币,若正面出现的

频率与0.5相差甚远,那么正反面出现的可能性相等这个假定的正确性值得怀疑.

下面是频率稳定性的几个实例.

3.古典方法

确定概率的古典方法是概率论历史上最早研究的情形，它简单、直观、不需做大量重复试验。

先看一个简单试验：

掷一个六面均匀的骰子，这个试验有6个基本结果，如果六个面是平等看待，那么可以认为每个面朝上的可能性相同，即每个点数出现的概率

相等，这样的试验称为古典概型。

在古典概型中，事件的概率应该与事件包含的样本点个数成正比，事件的概率也就能容易地确定。

如果试验E具有下列性质

（1）试验的基本结果只有有限个，即试验的样本空间为有限样本空间；

（2）一切基本事科发生的可能性相等。

则称试验E为古典概型。

设试验E为古典概型，样本空间包含有n个样本点，A为试验E的一事件，且

事件A包含k个样本点，则事件A的概率为

古典方法是概率论发展初期确定概率的常用方法，在古典方法中，为求一个事件A

的概率，需求出试验的等可能的基本结果总数和事件A包含的基本结果数。

例将一硬币抛3次，假设每次抛掷中出现正面和反面的可能性相等，求恰好出现

1次正面的概率。

解：

由于每次抛掷中出现正面和反面的可能性相等，因此该试验的等可能的基本

结果有8个。

即样本空间取为

且各个基本结果具有等可能性，而事件A“恰好出现1次正面”包含1个样本点

“HHH”,即A{HHH},所以所求的概率为

注意,此试验中若我们考虑的样本空间为

{0,1,2,3}

那么

“恰好出现

1次正

面”为

的子事

{1}

但并不能由此得出

A的概率为

1,因为样本空间为

{0,1,2,3}

的各个基本事件不具有等可能性.因此用古典方法确定概率时一定要注意“基本事件的等可能性”.

当样本空间中样本点较多时,我们不必将样本点一一列举出来,而只需求出样本点总数n和事件A包含的样本点个数k,但要注意“等可能性”.下面介绍古典概型

中几件常见的模型.

一、抽样模型（也叫取球模型）

抽样有两种方式：

不放回抽样与放回抽样

1.不放回抽样：

一个总体由两类元素（用A,B表示）组成，共有N元素,其中有M个A类元素,NM个B类元素,从中任取n个元素,我们常关注取出元素A类

成B类元素的个数.求事件Am“取出的n个元素中有m个A类元素”的概

率.

解:

样本空间中样本点的总数为CNn,事件Am包含的样本点个数为CMmCNnmM.由于

是随机抽取的,所以这CNn个基本事件是等可能,故所求的概率是

若引入随机变量X:

取出的A类元素的个数,则可得X的概率分布（或分布列。

随机变量的概率分布就是全面地、动态地描述随机变量取各个可能值的概率规律）为

P（X

m）

CNmCNnmM

max（0,n

N）mmin（n,M）

CNn

为方便,我们约定:

Cmk

0,k

0或k

m,那么上述概率分布可写为

P（X

m）

CMmCNnmM

0,1,

CNn

以上的概率分布称为超几何分布（后面章节会继续讨论这种分布）,这种分布在抽样调查中是很重要的.比如N件产品中有M件不合格品,NM件合格品,从中抽检n件产品.在实际问题中,N的值已知,而M的值未知,要根据抽查的n件产品中的次品件数去推断M的值,这属于统计问题.也有M的值已知,而N的值未知的情况,例如，从某一湖里,捕捉M尾鱼,将这些鱼作上某种标记,然后放回湖中,过一段时间后,再从湖中捕捉出n尾鱼,发现其中有m尾有标记,对该湖中鱼的总数N能作出什么结论?

这个问题在学习数理统计时再来讨论.

注:

1.对以上模型作稍微的改变:

一个袋有7个球,其中5个红球,2个白球.从中依次取3次球,每次取一个,取后不放回.试求下列事件的概率,

（1）A“前2次取到红球,最后1次取到白球”;

（2）B“取到2个红球,1个白球”;

（3）C“第2次取到红球”.

解:

（1）

P（A）

542

错解:

P（A）

C73

（2）

P（B）

或

C52C21

P（B）

C73

在此问题中,两种做法都可得出正确答案,为什么?

（3）

P（C）

或

P（C）

可以看出,第2次取到红球的概率与第

1次取到红球的概率相等,同样地可算出第

3次取到红球的的概率也是

5.这就是“抽签与顺序无关”的原理,从概率论上解

释了“抓阄的公平性”.

2.以上模型可推广至N个元素由多类元素组成的情形,比如,一批产品共N件,

其中有M1件一等品,M2件二等品,M3件三等品

（MMM

123

N）,

从

中任取

n件产品,

则取到

件一等品,

件二等品,

件三等品

（

n）的概率为

教材的例

若引入随机变量

X,Y

分别表示取出的一等品和二等品件数

则

（X,Y）

的

概率分布属于多项超几何分布

2.放回抽样:

一个总体由两类元素（用A,B表示）组成，共有N元素,其中有M

个A类元素,NM个B类元素,从中依次取n次,每次取1个元素,取后放回.求事件Am“取出的n个元素中有m个A类元素”的概率.

解:

样本空间中样本点的总数为Nn,事件Am包含的样本点个数为

CnmMm（NM）nm.由于是随机抽取的,所以这CNn个基本事件是等可能,故所求

的概率是

将上面结果变形为

P（Am）Cnmpm（1p）nm,

其中p

这是什么模型的概率问题（这是你们中学学过的）?

若引入随机变量X:

X表示取出的A类元素的个数,则可得X的概率分布为

P（X

m）

Cnmpm（1p）nm,m0,1，，n,p

以上的概率分布称为二项分布（后面章节会继续讨论这种分布）.二项分布的一种

推广就是多项分布.

二、盒子模型（也叫放球模型）

设有n个球,每个球都等可能地放到N个盒子中的任一个,盒子的容量不限.

（1）设nN,求球放入不同盒子中的概率;

（2）求某指定的盒子为空盒的概率的概率;

（3）求某指定的盒子有k个球的概率的概率

解:

（1）设A表示事件“球放入不同盒子中”,则

（2）设B表示事件“某指定的盒子为空盒”,则

（3）设C表示事件“某指定的盒子有k个球”,则以上结果可变形为

由变形后的结果会想到什么概率模型?

在盒子模型中,我们还会关注于各个盒子的球的数目或球的分布状况.我们看

下面问题:

将6个球随机地放入5个盒子中,5个盒子分别编号1,2,3,4,5.则1号,2号,3

号,4号,5号盒子中分别有2个球,2球,1个球,1个球,和0个球的球的概率为

思考:

个球的分布状况是

2,2,1,1,0（

即有

2个盒子各放

2个球,3

个盒子各放

1个球,1

个盒子没球

）的概率是多少

教材的例

三、补充问题:

重复组合问题及其应用

从n个不同元素中每次取一个,放回后取下一个,如此连续取r次所得的组合称为重复组合（不考虑次序）.那么重复组合数是多少呢?

易见,这个问题等价于将r个不可分辨的球放入n个盒子（盒子是可分辨的）中,可

区分的放球结果有多少种?

为求解此问题,我们先求每个盒子至少有1个球的不同放法的总数（此时要求

rn）.设想将r个球排成一行,相邻两球之间各有一个空格,共有r1个空格,在这r1个空格中任取n1个空格上插入“|”,每种插法一一对应于每个盒子都有

球的一种放法，于是可得每个盒子都有球的放法共有

Crn

11。

再考虑原方问题的求解，设想先在每个盒子中各放

1球，这样将r个不可分辨

的球放入n个盒子中的不同放法总数等于将

rn个不可分辨的球放入

n个盒子

时每个盒子至少有1个球的不同放法的总数，由此可知将r个不可分辨的球放入n个盒子中,可区分的放球结果有Cnn1r1（或Cnrr1）种。

以上问题也等价于方程

共有多少个正整数解及多少个非负整数解的问题。

等价的问题有很多，请思考下面问题。

思考：

（1）同时掷n个相同的骰子，可区分的结果共有多少种？

（2）（xyz）n的展开式中共有多少项？

（3）n元函数uf（x1,x2,,xn）的k阶偏导共有多少个（假定偏导存在且连

续）？

例一个通信系统含有n个天线，顺序地排成一行，只要没有两个连续的天线都

失效，这个系统就可以接收到信息，现已探明这n个天线里，恰有m个天线失效，问此系统仍然有效的概率有多大？

分析：

m个失效天线在n个天线中的排列位置共有Cnm种，从而有Cnm个等可能的

基本事件。

系统有效当且仅当相邻的两个失效天线之间都有有效天线，设想先把

m个失效天线排成一行，然后把nm个有效天线安排在相邻的两个失效天线之间以及头、尾两端（头尾两端可以没有）。

记x1，xm1分别表示头、尾两端的有

效天线数，xi表示第i1个失效天线与第i个失效天线之间的有效天线数

（i2,3,,m）。

这样问题化为求方程

满足x1

0,xm1

0,xi

1（i2,

m）的整数解的个数。

令y1

x11,ym1

xm1

1,yi

xi，上面问题等价于方程

正整数解的个数问题。

由前面的讨论知，该问题的答案是

Cnmm1，

故所求结果为

下面讨论一下游程问题，游程理论可以有很多方式应用于统计中，主要用于

随机性检验和齐次检验（将在第七章讨论）

在由两类元素构成的有序序列中，由同一类元素组成的（没有异类元素隔开）

最大的子序列称为一个游程（或一个连贯）。

例如，6个和4个排成序列

，那么该序列有

3个

游程，

2个游程，总游程数为

5。

设n1个元素和

n2个元素排成一序列，总游程数记为

R，若总游程数过小则

说明同类元素有聚集现象，若过大则说明有混杂现象。

为了从统计上要侦别是否

有某种系统因素造成以上现象，为此需计算在这n（nn1n2）个元素随机排

成一列的假定条件下，游程数R取各个可能值的概率。

即计算P（Rm）。

首先可以看出这n个元素（同类元素不加区分）排成一列时，有Cnn1（或Cnn2）

个可以区分的排列结果，在这n个元素随机排列的条件下，这Cnn1个结果是等概

的。

下面考虑事件（Rm）包含的基本结果数。

若m2k（即m为偶数），则游程

数和游程数均为k，游程数为k的排列结果数为Cnk11（它等于方程

xkn1的正整数解的个数）。

同样地，游程数为k的排列结果数为

Cnk

11，前面的游程可以是

游程也可以是游程。

所以事件“总游程为2k”包

含了2Cnk111Cnk211个基本结果。

故

同样地可得

P（R2k1）

Cnk11Cnk

Cnk

1Cnk11

。

Cnn1

注意以上计算结果中我们都约定：

Cmk0,k0或km。

4.几何方法

古典概率适合的随机试验有两个特点：

（1）试验只有有限个基本结果，即样本空间为有限样本空间，

（2）一切基本事件地位均等，即基本事件具有等可能性。

而在实际中，经常会遇到这样一类随机现象：

基本结果有无穷个且一切基本事件的地

位均等。

例如，从1,2,3,4,5,6中任取一个数，考虑取到的数不小于4的概率，这

是古典概率的问题，如把该问题改为；从区间[1,6]中任取一个数，考虑取到的数不小于4的概率，这个试验的样本空间为区间[1,6]，其基本事件有无穷个，且一切基

本事件的地位均等，即基本事件具有“等可能性”。

容易想到这个试验中事件的概率与事件（即样本空间[1,6]的子集）的长度成正比。

这便是几何概率。

如果试验E的基本结果有无穷个且其样本空间为度量有限的区间或区域（这里

所说的度量是指区间的长度，区域的面积、体积），样本点在样本空间中均匀分布（样

本点在样本空间中均匀分布的详细内容是：

样本点落在中任一有度量的子集中的

可能性大小只与子集的度量成正比），这样的试验称为几何概型。

设试验E为几何概型，样本空间为，A为一事件（即A为一子集），则事件

的概率为

其中L（A）表示A的度量（长度，面积或体积）。

例

（1）从区间[1,6]中任取一个数，求取到的数不小于

（2）从区间[1,6]中任取两个数，求取到的两数之和不小于

例（会面问题）

例（蒲丰投针问题）

4的概率；

8的概率.

例（贝特朗悖论）

5.确定概率的主观方法

展开阅读全文