概率论基础知识及其在matlab中的实现_精品文档Word文档格式.doc
《概率论基础知识及其在matlab中的实现_精品文档Word文档格式.doc》由会员分享,可在线阅读,更多相关《概率论基础知识及其在matlab中的实现_精品文档Word文档格式.doc(10页珍藏版)》请在冰豆网上搜索。
现以联系掷10000次硬币为例,重复做100次试验模拟出现正面的概率。
在matlab中的程序如下:
fori=1:
100
a(i)=sum(sum(round(rand(100))))/10000;
end
mx=max(a);
mn=min(a);
ma=mean(a);
a,mx,mn,ma
在该程序输出的四项中,a为实验100次中每次出现正面的频率,mx和mn分别为100次实验中出现正面频率的最大值和最小值,ma为100次试验出现正面的平均频率。
运行结果如下:
这里要输入结果
下面介绍MATLAB中取整的几个函数命令:
(1)命令格式:
fix(x)
对x朝零方向取整
(2)命令格式:
floor(x)
对x朝负无穷大方向取整
(3)命令格式:
ceil(x)
对x朝正无穷大方向取整
3.1.2统计概率及其模型
由于古典概率是建立在事件发生的等可能基础上的概率,而现实生活中许多现象的出现并不是等可能的。
例如某品种的玉米,当种下一粒后,其发芽与不发芽的机会并不相同。
那么,这个概率就不能建立在等可能基础上,即不能使用古典概率的定义。
而统计概率的定义是建立在频率基础上的,就是说某事件出现频率如果稳定在某数值附近,则称数值为该事件出现的概率。
由于统计概型中的概率是一个理论上的数值,实际问题中根本无法直接得到该数值,因而通常在试验次数充分多时,利用频率值近似代替概率值。
在掷硬币的试验中,在试验次数充分多的情况下,掷硬币出现正面和反面的频率均在0.5左右,故出现正面和反面的概率均为0.5。
下面来看掷硬币时,当样本容量分别为
n=10,100,1000,10000,100000,1000000
时频率的变化。
在MATLAB中实现时程序代码如下:
forI=i:
6
a(i)=sum(round(rand(1,10-i)))/10^I;
运算结果为:
这里输入运算结果
从上面运行的结果中可以看出,当样本容量不够大时,其频率的波动范围很大,即频率不够稳定,即使有时达到0.5,但最大时已达到0.9,然而随着样本容量的增加,频率的波动范围越来越小,相差仅有左右。
3.1.3条件概率、全概率公式与伯努利概率
若事件B的发生会影响到事件A的发生,则事件B发生的条件下,事件A发生的概率称为条件概率,条件的概率的计算公式为:
若事件A的发与事件B的发生与否没有关系,即事件B发生与否不会影响到事件A的发生,反之亦然,则称事件A与事件B是相互独立的,这时有:
例1袋中有10只球,其中白球7只,黑球3只。
分有放回和无放回两种情况,分三次取球,每次取一个,分别求:
(1)第三次摸到了黑球的概率,
(2)第三次才摸到黑球的概率,(3)三次都摸到了黑球的概率。
解当有放回地摸球时,由于三次摸球互不影响,因此三次摸球相互独立,从理论上可以求得:
(1)第三次摸到黑球的概率为;
(2)第三次才摸到黑球的概率为;
(3)三次都摸到黑球的概率为。
在MATLAB中模拟这一过程时,可在[0,1]区间上产生三次随机数来模拟三次摸球,当随机数小于0.7时可认为摸到了白球,否则认为摸到了黑球。
重复次分别求上述三种情况出现的概率。
程序如下:
a=round(rand(1000000,3)–0.2);
fori=1:
b=a(1:
10^i,3;
c(i)=sum(b)/(10^i);
end
c
fori=1:
6
b=(~a(1:
10^i,1))&
(~a(1:
10^i,2))&
a(1:
10^i,3);
d(i)=sum(b)/(10^i);
end
d
forI=1:
b=a(1:
10^i,1)&
10^i,2)&
e(i)=sum(b)/(10^i);
e
运行结果为:
这里加入运行结果
执行结果中c为第三次摸到黑球的概率,d为第三次才摸到黑球的概率,e为三次都摸到黑球的概率.可以看到,随着试验次数的增加,其频率都会逐渐稳定在理论值附近.
当无放回地摸球时,由于第二次摸球会受到第一次的影响,而第三次摸球又会受到前两次的影响,因而三次摸球相互影响,并不独立.从理论上可求得:
(1)第三次摸到黑球的概率为,
(2)第三次才摸到黑球的概率为
(3)三次都摸到了黑球的概率为
用计算机模拟该过程时,在[0,1]区间模拟第一次摸球,当值小于0.7时认为摸到了白球,否则认为摸到了黑球;
第二次摸球时由于少了一个球,故可在区间长度为0.9的区间上模拟,若第一次摸到白球,可将区间设为[0.1,1],否则区间设为[0,0.9];
第三次摸球可依次类推,其模拟程序如下:
a=rand(1000000,3);
a(:
1)=round(a(:
1)–0.2);
2)=round(a(:
2)*0.9–0.2–0.1*((a:
1)–1));
3)=round(a(:
3)*0.8–0.2–0.1*(a(:
1)–1)–0.1*(a(:
2)–1));
fori=1:
b=a(1:
c(i)=sum(b)/(10^i);
end
c
fori=1:
b=(~a(1:
10^i,1))&
(~a(1:
10^i,2))&
a(1:
d(i)=sum(b)/(10^i);
end
d
fori=1:
b=a(1:
10^i,1)&
10^i,2)&
e(i)=sum(b)/(10^i);
end
e
运行结果为
上面在理论上计算第三次摸到黑球的概率时,用到了全概率公式:
若构成一个完备事件组,且事件的发生总是伴随着事件中的某一个发生而发生,则
下面将用到伯努利概型,所谓伯努利概型是指:
在相同条件下,进行次独立重复试验,每次试验只有事件A发生或不发生两种结果,且
这里第三次摸到黑球的四种情况分别是:
{白,白,黑},{白,黑,黑},{黑,白,黑},{黑,黑,黑}.这四种情况构成了完备事件组.现考虑下面问题:
(1)当不放回时,已知第三次摸到了黑球,问前两次是黑球的概率为多少?
(2)若有放回地连续摸10次,则恰有三次摸到黑球的概率是多少?
第一问是一逆概率问题,由逆概率公式即贝叶斯公式得到其概率应为
第二问则属伯努利概型,这里A为{摸到的是黑球},故,.于是由二项概率公式有,10次有放回摸球中,恰有三次摸到黑球的概率为
在MATLAB中实现这两个过程的程序如下:
a=rand(100000,3);
a(:
1)–0.2);
2)=round(a(:
2)*0.9–0.2–0.1*a(:
1)–1));
3)=round(a(:
3)*0.8–0.2–0.1*(a(:
fori=1:
b=a(1:
10^I,3);
c(i)=sum(b);
d(i)=sum(b);
e(i)=d(i)./c(i);
end
这里添加运行结果
a=round(rand(1000000,10)–0.2);
forI=1:
b=sum(a(1:
10^i,:
),2)–3;
c(i)=sum(-b)/910^I);
c
3.2随机变量的分布及其数字特征
随机变量的统计行为完全决定于其概率分布,按随机变量的取值不同,通常可将其分为离散型\连续型和奇异型三大类.由于奇异型在实际应用中很少遇到,因此只讨论离散型和连续型两类随机变量的概率分布及其数字特征.
3.2.1离散型随机变量的分布及其数字特征
如果随机变量X的所有可能取值为有限个或无穷可列个,则称X为离散型随机变量.设X的所有可能值为,并且X取这些值的概率为
则称其为随机变量X的概率分布.它满足下面的性质:
(1),,
(2)
称为累积概率分布.
在研究随机变量时,主要就是研究随机变量的概率分布、累积分布和分布的数字特征。
常用的离散型随机变量的分布有:
二项分布、泊松分布和超几何分布。
1、超几何分布
若随机变量X的所有可能取值为0,1,…,n,其概率分布为
,
其中,则称X服从参数为和的二项分布,记作。
二项分布的数学期望为,方差为。
在MATLAB中提供的二项分布的统计函数有:
binopdf()、binocdf()、binoinv()、binornd()以及计算二项分布均值和方差的函数binostat(),它们命令格式如下:
binopdf(X,N,P)
计算二项分布的密度函数。
其中X为随机变量,N为独立试验的重复数,P为事件发生的概率。
binocdf(X,N,P)
计算二项分布的累积分布函数。
binoinv(X,N,P)
计算二项分布的逆累积分布函数。
其中X为随机变量,N为独立试验的重复数,P为事件发生的概率
binornd(N,P,m,n)
产生服从二项分布的阶随机