第7章 MATLAB在概率统计中的应用.docx

资源描述

第7章 MATLAB在概率统计中的应用.docx

《第7章 MATLAB在概率统计中的应用.docx》由会员分享，可在线阅读，更多相关《第7章 MATLAB在概率统计中的应用.docx（27页珍藏版）》请在冰豆网上搜索。

第7章 MATLAB在概率统计中的应用.docx

第7章MATLAB在概率统计中的应用

一、统计量的数字特征

（一）简单的数学期望和几种均值

●mean（x）平均值函数

当x为向量时，得到它的元素平均值；当x为矩阵时，得到一列向量，每一行值为矩阵行元素的平均值，

举例1：

求矩阵A的平均值。

D=[74.00174.00574.00374.00174.0073.99874.00674.02]

Mean（d）

举例2：

设随机变量x的分布规律如下表，求E（x）和E（3x2+5）的值E（x）的值

-2

0.4

0.3

●E（x）的值：

x=[-202]，pk=[0.40.30.3]

sum（x．*pk）

●E（3x2+5）的值。

x=[-202]，pk=[0.40.30.3]

z=3*x.^2+5

sum（z．*pk）

（二）数据比较

⏹max最大值

⏹min最小值

⏹median中值

⏹sort由小到大排序

（三）求和与积

⏹sum求向量或矩阵的元素累和

⏹prod：

求当前元素与所有前面元素的积

举例：

下面的程序用来求向量各元素的之和

prod=1

varx=[234]

forx=varx

prod=prod*x

end

（四）方差和标准差

为了反映随机变量与其均值的偏离程度

方差表示为

标准差表示为：

样本方差为：

样本标准差为：

●方差函数Var

①Var（x）x为向量，返回向量的样本方差；x为矩阵，则返回矩阵各列的方差。

②Var（x,1）返回向量（矩阵x）的简单方差（即置前因子为

的方差）

③Var（x,w）返回向量（矩阵）x即以w为权的方差。

●Std标准差函数

Std（x）返回向量或矩阵x的样本标准差（置前因子为

）

Std（x,1）返回向量或矩阵x的标准差（置前因子为

）

举例：

d=[74.00174.00574.00374.00174.0073.99874.00674.02]

mean（d）

var（d,1）%方差

var（d）%样本方差

std（d,1）%标准差

std（d）%样本标准差

（五）协方差和相关系数

⏹cov（x）：

x为向量，返回向量的方差，x为矩阵时返回矩阵的协方差矩阵，其中协方差矩阵的对角元素是x矩阵的列向量的方差值。

⏹cov（x,y）：

返回向量x.,y的协方差矩阵，且x，y的维数必须相同。

⏹cov（x,1）：

返回向量x的协方差（矩阵），置前因子为

⏹corrcoef（x,y）：

返回列向量x,y的相关系数。

⏹corrcoef（x）：

返回矩阵x的列元的相关系数矩阵。

举例：

a=[121221]

x1=var（a）%向量的方差

y1=cov（a）%向量的方差

d=rand（2,6）

cov1=cov（d）%矩阵D的样本协方差

c=rand（3,3）

x2=cov（c）%矩阵C的样本协方差

y2=corrcoef（c）%矩阵C各列元的相关系数

二、常用的统计分布量

（一）期望和方差

函数名

调用方式

参数说明

函数注释

Betastat

[M，V]=betastat（A，B）

M为期望值

V为方差值

A、B为β分布参数

β分布的期望方差

Binostat

[M，V]=binostat（N,P）

N主实验次数

P为二次分布概率

二项式分布的期差和方差

Chizstat

[M，v]=Chi2stat（nu）

nu为卡方分布参数

卡方分分布的期望和方差

Expstat

[M，V]=expstat（mu）

mu为指数分布的特征参数

指数分布的期望和方差

Fstat

[M1,V]=fstat（v1,v2）

V1和V2为F分布的两个自由度

F分布的期望和方差

Gamstat

[M，v]=gamstat（A1,B）

A,B为γ分布的参数

γ分布的期望和方差

Geostat

[M，v]=geostat（P）

P为几何分布的几何概率参数

几何分布的期望和方差

Hygestat

[MN,,V]=hygestat（M1,K1,N）

M,K,N为超几何概分布参数

超几何分布的期望和方差

Lonstat

[M,,V]=logstat（mu,sigma）

mu为对数分布的均值,sigma为标准差

Poisstat

[M,V]=Poisstat（

LAMBDN为泊松分布参数

Normstat

[M1,V]=normstat（mu,signa）

Mu为正态分布的均值sinma为标准差

正态分布的期望和方差

Tstat

[M,,V]=tstat（nu）

Nu为T分布参数

Unifstat

[M1,V]=unifstat（A,B）

A,B为均分布区间端点值

举例1：

求参数为0.12和0.34的β分布的期望和方差

[m,v]=betastat（0.12,0.34）m为期望，v为方差

举例2：

求参数为6的泊松分布参数的期望和方差

[m,v]=poisstat（6）m为期望，v为方差

（二）概率密度函数

1．离散型随机变量的分布及其数字特征

（1）基本概念

如果随机变量X的所有可能取值为有限个或无穷可列个，则称X为离散型随机变量．设X的所有可能值为X1，X2，…，并且X取这些值的概率为：

P{X=Xk}=pk，k=1，2，…

则称其为随机变量X的概率分布．它满足以下性质：

（1）pk≥0,k=1，2，…

（2）

称

为累积概率分布

（2）常见类型

●二项式分布

若随机变量X的所有可能取值为0，1，…，n，其概率分布为

其中q=1-p，则称X服从参数为n和p的二项分布，记作X～B（n，p）．显然，两点分布是二项分布的特例．二项分布的数学期望为E（X）=np，方差为D（X）=npq．

在MATLAB中提供有二项分布的统计函数：

binopdf（）、binocdf（）、binoinv（）、binornd（）以及计算二项分布均值和方差的函数binostat（），其使用格式为：

binopdf（X,N,P）二项分布的密度函数

binocdf（X,N,P）二项分布的累积分布函数

binoinv（Y,N,P）二项分布的逆累积分布函数

binornd（N,P,m,n）产生服从二项分布的随机数

binostat（N,P）求二项分布的数学期望与方差

其中X为随机变量；N为独立试验的重复数；P为事件发生的概率；m和n分别是所产生随机矩阵的行数和列数．若不指定m和n，则返回一个随机数，否则返回一个服从二项分布的m×n阶随机矩阵．

举例:

不同试验重复数n和不同概率p下二项分布的函数分布图和累积分布函数图

程序如下:

x=0:

70;

y1=binopdf（x,30,0.67）;z1=binocdf（x,30,0.67）;

y2=binopdf（x,50,0.67）;z2=binocdf（x,50,0.67）;

y3=binopdf（x,80,0.67）;z3=binocdf（x,80,0.67）;

subplot（2,2,1）;plot（x,y1,'k.',x,y2,'k.',x,y3,'k.'）;

subplot（2,2,2）;sstep（x,z1,'k'）;%sstep绘制累积函数分布图

sstep（x,z2,'k'）;sstep（x,z3,'k'）;

y1=binopdf（x,50,0.3）;z1=binocdf（x,50,0.3）;

y2=binopdf（x,50,0.6）;z2=binocdf（x,50,0.6）;

y3=binopdf（x,50,0.9）;z3=binocdf（x,50,0.9）;

subplot（2,2,3）;plot（x,y1,'k.',x,y2,'k.',x,y3,'k.'）;

subplot（2,2,4）;sstep（x,z1,'k'）;

sstep（x,z2,'k'）;sstep（x,z3,'k'）;

运行结果如下:

由于MATLAB不提供绘分段函数图象的命令，故可借助如下函数sstep（）描绘累积函数分布图，其用法如下：

sstep（Y）或sstep（X，Y）

其中X用于指定画线位置，Y表示线相对坐标轴的高度，还可增加线的属性．

function[xo,yo]=sstep（varargin）

error（nargchk（1,3,nargin））;

sym=[];

ifisstr（varargin{nargin}）,

sym=varargin{nargin};

[msg,x,y]=xychk（varargin{1:

nargin-1},'plot'）;

if~isempty（msg）,error（msg）;end

else

[msg,x,y]=xychk（varargin{1:

nargin},'plot'）;

if~isempty（msg）,error（msg）;end

end

ifmin（size（x））==1,x=x（:

）;end

ifmin（size（y））==1,y=y（:

）;end

[n,nc]=size（y）;

ndx=[1:

n;1:

n];

y2=y（ndx（1:

2*n-1）,:

）;

ifsize（x,2）==1,

x2=x（ndx（2:

2*n）,ones（1,nc））;

else

x2=x（ndx（2:

2*n）,:

）;

end

x2（2*n）=2*x2（2*n-1）-x2（2*n-3）;

y2（2*n）=y2（2*n-1）;

if（nargout<2）

ifisempty（sym）,

fori=1:

holdon;plot（x2（2*i-1:

2*i）,y2（2*i-1:

2*i））;

end

holdoff;

else

fori=1:

holdon;plot（x2（2*i-1:

2*i）,y2（2*i-1:

2*i）,sym）;

end

holdoff;

end

else

xo=x2;

yo=y2;

end

●泊松分布

如果随机变量的概率分布为

其中

>0为常数，则称X服从参数为

的泊松分布，记作X～P（

），泊松分布的数学期望E（X）=

，方差D（X）=

在MATLAB中，提供如下有关泊松分布的统计函数，使用格式为：

poisspdf（X,LMD）泊松分布的密度函数

poisscdf（X,LMD）泊松分布的累积分布函数

poissinv（Y,LMD）泊松分布的逆累积分布函数

poissrnd（LMD,M,N）产生服从泊松分布的随机数

poissstat（LMD）求泊松分布的数学期望与方差

其中X为随机变量；Y为显著概率值；LMD为参数，M和Ｎ为产生随机矩阵的行数和列数．例如类似于二项分布可用下述程序绘出服从泊松分布的密度函数和累积分布函数图（见图2）:

图2泊松分布的概率密度与累积概率分布图

举例：

x=0:

y1=poisspdf（x,0.3）;z1=poisscdf（x,0.3）;

y2=poisspdf（x,0.6）;z2=poisscdf（x,0.6）;

y3=poisspdf（x,0.9）;z3=poisscdf（x,0.9）;

subplot（2,1,1）;plot（x,y1,'k.',x,y2,'k.',x,y3,'k.'）;

subplot（2,1,2）;sstep（x,z1,'k'）;

sstep（x,z2,'k'）;sstep（x,z3,'k'）;

利用逆累积概率分布函数求一定显著概率条件下，泊松分布假设检验临界值:

x=0:

0.1:

x=0.00.10.20.30.40.50.60.70.80.91.0

poissinv（x,5）

ans=1234455678Inf

poissinv（x,10）

ans=167891011121314Inf

poissinv（x,100）

ans=187929597100102105108113Inf

poissinv（x,1）

ans=1111111122Inf

求服从泊松分布的随机数及数学期望与方差如下：

poissrnd

（1）ans=1

poissrnd（5）ans=5

poissrnd（5,5,10）

ans=46914107336

7543454652

6438264556

3868881637

44106745423

[e,d]=poisstat（5）e=5d=5

[e,d]=poisstat（10）e=10d=10

●超几何分布

如果随机变量X的所有可能取值为０，１，２，…，Ｌ（L=min{M，N}），X的概率分布为

其中整数M，N>0，且n

MATLAB中有关超几何分布的统计函数为：

hygepdf（M,n,k,N）超几何分布的密度函数

hygepcdf（M,n,k,N）超几何分布的累积分布函数

hygeinv（P,n,k,N）超几何分布的逆累积分布函数

hygestat（n,k,N）超几何分布的数学期望与方差

2．连续型随机变量的分布及其数字特征

（1）基本概念

设随机变量X的分布函数为F（x），若存在非负函数f（x），使对任意实数x，有

≤

则称X为连续型随机变量，并称f（x）为X的概率密度，它满足以下性质：

1f（x）≥0，-∞＜x＜+∞;②

;③P{a

;④P{x=a}=0．

（2）常见的三种连续型随机变量的概率分布

常用的三种连续型随机变量的概率分布是均匀分布、指数分布和正态分布．

●均匀分布

若连续型随机变量X的概率密度为

MATLAB提供的有关均匀分布的函数如下：

unifpdf（X,A,B）均匀分布的密度函数

unifcdf（X,A,B）均匀分布的累积分布函数

unifinv（P,A,B）均匀分布的逆累积分布函数

unirnd（A,B,m,n）均匀分布的随机数发生器

unifstat（A,B）均匀分布的数学期望与方差

其中X为随机变量，P为概率值，A，B为均匀分布参数，m和n为生成随机数矩阵的行数和列数．绘制均匀分布的密度函数及累积分布函数图的程序如下（图5-5）：

●指数分布

如果随机变量X的概率密度为

其中

为常数，则称X服从参数为

的指数分布，记作X～e（

）．

MATLAB提供的有关指数分布的函数如下：

exppdf（X,L）指数分布的密度函数

expcdf（X,L）指数分布的累积分布函数

expinv（P,L）指数分布的逆累积分布函数

exprnd（X,L,m,n）产生服从指数分布的随机数

expstat（L）求指数分布的数学期望与方差

其中X为随机变量，L为参数

，P为显著概率，m和n为随机数矩阵的行数和列数．绘制指数分布密度函数和累积分布函数图形的程序如下（图5-6）：

x=-0.1:

0.001:

0.4;

y=exppdf（x,0.05）;z=expcdf（x,0.05）;

subplot（1,2,1）;plot（x,y,'k'）;

axis（[-0.1,0.4,-0.1,21]）;

subplot（1,2,2）;plot（x,z,'k'）;

axis（[-0.1,0.4,-0.1,1.1]）;

图5-6指数分布的密度函数及累积分布函数图

●标准正态分布

如果随机变量X的概率密度为：

其中

和

均为常数，且

>0，则称X服从参数为

和

2的正态分布，记作X～N（

2）．当

=0，

=1时，称X服从标准正态分布，记作X～N（0,1）．

MATLAB提供的有关正态分布的函数如下：

normpdf（X,M,C）正态分布的密度函数

normcdf（X,M,C）正态分布的累积分布函数

norminv（P,M,C）正态分布的逆累积分布函数

normrnd（M,C,m,n）产生服从正态分布的随机数

normstat（M,C）求正态分布的数学期望和方差

其中X为随机变量，M为正态分布参数

，C为参数

，P为显著概率，m和n为随机矩阵的行数和列数．绘制标准正态分布的密度函数及累积分布函数图（图5-7上）和一般正态分布的密度函数及累积分布函数图（图5-7下）的程序如下：

x=-4:

0.01:

y=normpdf（x,0,1）;z=normcdf（x,0,1）;

subplot（2,2,1）;plot（x,y,'k'）;

axis（[-4,4,-0.1,0.5]）;

subplot（2,2,2）;plot（x,z,'k'）;

axis（[-4,4,-0.1,1.1]）;

x=-4:

0.01:

16;

y1=normpdf（x,6,1）;z1=normcdf（x,6,1）;

y2=normpdf（x,6,4）;z2=normcdf（x,6,4）;

y3=normpdf（x,6,0.6）;z3=normcdf（x,6,0.6）;

subplot（2,2,3）;plot（x,y1,'k',x,y2,'k',x,y3,'k'）;

axis（[-4,16,-0.1,0.8]）;

subplot（2,2,4）;plot（x,z1,'k',x,z2,'k',x,z3,'k'）;

axis（[-4,16,-0.1,1.1]）;

图5-7正态分布的密度函数及累积分布函数图

（3）求解方法

●通用函数介绍.

Pdf计算已选函数的概率密度函数,调用格式为:

Y=Pdf（name,X,A）

Y=Pdf（name,X,A,B）

Y=Pdf（name,X,A,B,C）

Name为上表中取stat后的字符，如beta、bino、chiz、exp等。

●利用专用函数.

Betapdf（X1，A1，B）

Binopaf（X,N,P）

（4）举例

举例1：

计算正态分布N（0，1）下的在点0.7733的值

pdf（'morm',0.7733,0,1）

举例2：

绘制卡方分布密度函数在n分别等于1，5，15时的值

x=0:

0.2:

y1=chi2pdf（x,1）

plot（x,y1,'+'）

holdon

y2=chi2pdf（x,5）

plot（x,y2,'+'）

y2=chi2pdf（x,15）

plot（x,y2,'o'）

axis（[0,30,0,0.2]）

举例3：

3．概率值函数求X点处概率值.

Binocdf（X,N,P）

Betacdf（X,A,B）

Normcdf（X1,mu,sigma）.

数值点函数（逆概率函数,ZNV）---已知概率值求概率分布点时.

函数名+inv（参数）

betainv（P,A,B）

binoinv（Y,N,P）

chixinv（P,v）

举例1：

设x~N（3,22）

求p{22},p{x>3}

a1=normcdf（2,3,2）

a2=normcdf（5,3,2）

p1=a2-a1

p2=normcdf（10,3,2）-normcdf（-4,3,2）

p3=1-normcdf（2,3,2）+normcdf（-2,3,2）

p4=1-normcdf（3,3,2）

三、参数估计

1．参数估计函数表

函数名

调用形式

函数注解

Betafit

Betafit（x）,

[PHAT,PCI]=betafit（X,ALPHA）

返回β分布的最大似然估计值和α水平的置信区间

Binofit

Binofit（X）

[PHAT,PCI]=binofit（x,AaLPHA）

二项式分布最大似然估计，α水平的参数估计和置数区间

Expfit

Expfit（x）

[MUHAT,MUCI]=expfit（x,ALPHA）

指数分布的最大似然估计，α水平的参数估计和α水平的置信区间

Gaamfit

Gamfit（x）

[PHAT,PCI]=gamfit（x,ACPHA）

返回最大似然估计；α水平的期望,方差值和区间的估计

Normfit

Noormfit（x,ALPHA）[MUHAT,SIGAHT,SIGMACI]=normfit（x,ALPHA）

正态分布的最大似然估计,α水平的期望、方差值和区间的估计

Poissfit

Poissfit（x）

[cAMBAHAT，LANBDACI]=poissfit（x，ALPHA）

泊松分布的最大估计；α水平的λ参数和区间估计

Unifit

Unifit（x，ALPHA）

[AHAT，BHAT，ACT，BCI]=unifit（x，ALPHA）

均匀分布的最大估计，α水平的参数及其区间估计

举例1：

假设某种清漆的9个样本，其干燥时间（以小时计）分别为5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0，设干燥时间总体服从正态分布N（μ，σ2），求μ，σ的置信度为0.95的置信区间。

time=[6.05.75.86.57.06.35.66.15.0]

[MUHAT,SIGMAHAT,MUCI,SIGMACI]=normfit（time,0.05）

其中：

MUHAT为μ的估计值，此例为6，MUCI为估计区间[5.5584，6.4416]，SIGMAHAT为σ的估计值，此例为0.57456，此例为，SIGMACI的估计区间[0.38801.1005]。

四、假设检验

（一）单个总体（u，б2）均值的检验。

1．б巳知时的u检验（u检验法）ztest

[H、SIG]=Ztest（X、M、sigma，ALPHA，TAIL）

当标准差sigma巳知时，函数一正态检验来判断是否来自一正态公布的样本的期望值。

M作为评判标分准估计，默认值ALPHA=0．05，TAIL=0

当原假设为“期望值等于M”

当TAIL=0时，备择假设为“期望值不等于M”

当TAIL=0时，备择假设为“期望值大于M”

当TAIL=0时，备择假设为“期望值小于M”

ALPHA为设生产的显若水平，（默认为0．05），sig为当原假设为真时，得到观察的概率样本，

H=0，表示“在显著水平为alpha”情况下，不能拒绝原假设，

H=1，表示“在显著水平为alpha”情况下，可以拒绝原假设。

例1：

x=[0.497

展开阅读全文