LAMBDN为泊松分布参数
Normstat
[M1,V]=normstat(mu,signa)
Mu为正态分布的均值sinma为标准差
正态分布的期望和方差
Tstat
[M,,V]=tstat(nu)
Nu为T分布参数
Unifstat
[M1,V]=unifstat(A,B)
A,B为均分布区间端点值
举例1:
求参数为0.12和0.34的β分布的期望和方差
[m,v]=betastat(0.12,0.34)m为期望,v为方差
举例2:
求参数为6的泊松分布参数的期望和方差
[m,v]=poisstat(6)m为期望,v为方差
(二)概率密度函数
1.离散型随机变量的分布及其数字特征
(1)基本概念
如果随机变量X的所有可能取值为有限个或无穷可列个,则称X为离散型随机变量.设X的所有可能值为X1,X2,…,并且X取这些值的概率为:
P{X=Xk}=pk,k=1,2,…
则称其为随机变量X的概率分布.它满足以下性质:
(1)pk≥0,k=1,2,…
(2)
.
称
为累积概率分布
(2)常见类型
●二项式分布
若随机变量X的所有可能取值为0,1,…,n,其概率分布为
其中q=1-p,则称X服从参数为n和p的二项分布,记作X~B(n,p).显然,两点分布是二项分布的特例.二项分布的数学期望为E(X)=np,方差为D(X)=npq.
在MATLAB中提供有二项分布的统计函数:
binopdf()、binocdf()、binoinv()、binornd()以及计算二项分布均值和方差的函数binostat(),其使用格式为:
binopdf(X,N,P)二项分布的密度函数
binocdf(X,N,P)二项分布的累积分布函数
binoinv(Y,N,P)二项分布的逆累积分布函数
binornd(N,P,m,n)产生服从二项分布的随机数
binostat(N,P)求二项分布的数学期望与方差
其中X为随机变量;N为独立试验的重复数;P为事件发生的概率;m和n分别是所产生随机矩阵的行数和列数.若不指定m和n,则返回一个随机数,否则返回一个服从二项分布的m×n阶随机矩阵.
举例:
不同试验重复数n和不同概率p下二项分布的函数分布图和累积分布函数图
程序如下:
x=0:
70;
y1=binopdf(x,30,0.67);z1=binocdf(x,30,0.67);
y2=binopdf(x,50,0.67);z2=binocdf(x,50,0.67);
y3=binopdf(x,80,0.67);z3=binocdf(x,80,0.67);
subplot(2,2,1);plot(x,y1,'k.',x,y2,'k.',x,y3,'k.');
subplot(2,2,2);sstep(x,z1,'k');%sstep绘制累积函数分布图
sstep(x,z2,'k');sstep(x,z3,'k');
y1=binopdf(x,50,0.3);z1=binocdf(x,50,0.3);
y2=binopdf(x,50,0.6);z2=binocdf(x,50,0.6);
y3=binopdf(x,50,0.9);z3=binocdf(x,50,0.9);
subplot(2,2,3);plot(x,y1,'k.',x,y2,'k.',x,y3,'k.');
subplot(2,2,4);sstep(x,z1,'k');
sstep(x,z2,'k');sstep(x,z3,'k');
运行结果如下:
由于MATLAB不提供绘分段函数图象的命令,故可借助如下函数sstep()描绘累积函数分布图,其用法如下:
sstep(Y)或sstep(X,Y)
其中X用于指定画线位置,Y表示线相对坐标轴的高度,还可增加线的属性.
function[xo,yo]=sstep(varargin)
error(nargchk(1,3,nargin));
sym=[];
ifisstr(varargin{nargin}),
sym=varargin{nargin};
[msg,x,y]=xychk(varargin{1:
nargin-1},'plot');
if~isempty(msg),error(msg);end
else
[msg,x,y]=xychk(varargin{1:
nargin},'plot');
if~isempty(msg),error(msg);end
end
ifmin(size(x))==1,x=x(:
);end
ifmin(size(y))==1,y=y(:
);end
[n,nc]=size(y);
ndx=[1:
n;1:
n];
y2=y(ndx(1:
2*n-1),:
);
ifsize(x,2)==1,
x2=x(ndx(2:
2*n),ones(1,nc));
else
x2=x(ndx(2:
2*n),:
);
end
x2(2*n)=2*x2(2*n-1)-x2(2*n-3);
y2(2*n)=y2(2*n-1);
if(nargout<2)
ifisempty(sym),
fori=1:
n
holdon;plot(x2(2*i-1:
2*i),y2(2*i-1:
2*i));
end
holdoff;
else
fori=1:
n
holdon;plot(x2(2*i-1:
2*i),y2(2*i-1:
2*i),sym);
end
holdoff;
end
else
xo=x2;
yo=y2;
end
●泊松分布
如果随机变量的概率分布为
其中
>0为常数,则称X服从参数为
的泊松分布,记作X~P(
),泊松分布的数学期望E(X)=
,方差D(X)=
在MATLAB中,提供如下有关泊松分布的统计函数,使用格式为:
poisspdf(X,LMD)泊松分布的密度函数
poisscdf(X,LMD)泊松分布的累积分布函数
poissinv(Y,LMD)泊松分布的逆累积分布函数
poissrnd(LMD,M,N)产生服从泊松分布的随机数
poissstat(LMD)求泊松分布的数学期望与方差
其中X为随机变量;Y为显著概率值;LMD为参数,M和N为产生随机矩阵的行数和列数.例如类似于二项分布可用下述程序绘出服从泊松分布的密度函数和累积分布函数图(见图2):
图2泊松分布的概率密度与累积概率分布图
举例:
x=0:
5;
y1=poisspdf(x,0.3);z1=poisscdf(x,0.3);
y2=poisspdf(x,0.6);z2=poisscdf(x,0.6);
y3=poisspdf(x,0.9);z3=poisscdf(x,0.9);
subplot(2,1,1);plot(x,y1,'k.',x,y2,'k.',x,y3,'k.');
subplot(2,1,2);sstep(x,z1,'k');
sstep(x,z2,'k');sstep(x,z3,'k');
利用逆累积概率分布函数求一定显著概率条件下,泊松分布假设检验临界值:
x=0:
0.1:
1;
x=0.00.10.20.30.40.50.60.70.80.91.0
poissinv(x,5)
ans=1234455678Inf
poissinv(x,10)
ans=167891011121314Inf
poissinv(x,100)
ans=187929597100102105108113Inf
poissinv(x,1)
ans=1111111122Inf
求服从泊松分布的随机数及数学期望与方差如下:
poissrnd
(1)ans=1
poissrnd(5)ans=5
poissrnd(5,5,10)
ans=46914107336
7543454652
6438264556
3868881637
44106745423
[e,d]=poisstat(5)e=5d=5
[e,d]=poisstat(10)e=10d=10
●超几何分布
如果随机变量X的所有可能取值为0,1,2,…,L(L=min{M,N}),X的概率分布为
其中整数M,N>0,且nMATLAB中有关超几何分布的统计函数为:
hygepdf(M,n,k,N)超几何分布的密度函数
hygepcdf(M,n,k,N)超几何分布的累积分布函数
hygeinv(P,n,k,N)超几何分布的逆累积分布函数
hygestat(n,k,N)超几何分布的数学期望与方差
2.连续型随机变量的分布及其数字特征
(1)基本概念
设随机变量X的分布函数为F(x),若存在非负函数f(x),使对任意实数x,有
≤
则称X为连续型随机变量,并称f(x)为X的概率密度,它满足以下性质:
1f(x)≥0,-∞<x<+∞;②
;③P{a;④P{x=a}=0.
(2)常见的三种连续型随机变量的概率分布
常用的三种连续型随机变量的概率分布是均匀分布、指数分布和正态分布.
●均匀分布
若连续型随机变量X的概率密度为
MATLAB提供的有关均匀分布的函数如下:
unifpdf(X,A,B)均匀分布的密度函数
unifcdf(X,A,B)均匀分布的累积分布函数
unifinv(P,A,B)均匀分布的逆累积分布函数
unirnd(A,B,m,n)均匀分布的随机数发生器
unifstat(A,B)均匀分布的数学期望与方差
其中X为随机变量,P为概率值,A,B为均匀分布参数,m和n为生成随机数矩阵的行数和列数.绘制均匀分布的密度函数及累积分布函数图的程序如下(图5-5):
●指数分布
如果随机变量X的概率密度为
其中
为常数,则称X服从参数为
的指数分布,记作X~e(
).
MATLAB提供的有关指数分布的函数如下:
exppdf(X,L)指数分布的密度函数
expcdf(X,L)指数分布的累积分布函数
expinv(P,L)指数分布的逆累积分布函数
exprnd(X,L,m,n)产生服从指数分布的随机数
expstat(L)求指数分布的数学期望与方差
其中X为随机变量,L为参数
,P为显著概率,m和n为随机数矩阵的行数和列数.绘制指数分布密度函数和累积分布函数图形的程序如下(图5-6):
x=-0.1:
0.001:
0.4;
y=exppdf(x,0.05);z=expcdf(x,0.05);
subplot(1,2,1);plot(x,y,'k');
axis([-0.1,0.4,-0.1,21]);
subplot(1,2,2);plot(x,z,'k');
axis([-0.1,0.4,-0.1,1.1]);
图5-6指数分布的密度函数及累积分布函数图
●标准正态分布
如果随机变量X的概率密度为:
其中
和
均为常数,且
>0,则称X服从参数为
和
2的正态分布,记作X~N(
2).当
=0,
=1时,称X服从标准正态分布,记作X~N(0,1).
MATLAB提供的有关正态分布的函数如下:
normpdf(X,M,C)正态分布的密度函数
normcdf(X,M,C)正态分布的累积分布函数
norminv(P,M,C)正态分布的逆累积分布函数
normrnd(M,C,m,n)产生服从正态分布的随机数
normstat(M,C)求正态分布的数学期望和方差
其中X为随机变量,M为正态分布参数
,C为参数
,P为显著概率,m和n为随机矩阵的行数和列数.绘制标准正态分布的密度函数及累积分布函数图(图5-7上)和一般正态分布的密度函数及累积分布函数图(图5-7下)的程序如下:
x=-4:
0.01:
4;
y=normpdf(x,0,1);z=normcdf(x,0,1);
subplot(2,2,1);plot(x,y,'k');
axis([-4,4,-0.1,0.5]);
subplot(2,2,2);plot(x,z,'k');
axis([-4,4,-0.1,1.1]);
x=-4:
0.01:
16;
y1=normpdf(x,6,1);z1=normcdf(x,6,1);
y2=normpdf(x,6,4);z2=normcdf(x,6,4);
y3=normpdf(x,6,0.6);z3=normcdf(x,6,0.6);
subplot(2,2,3);plot(x,y1,'k',x,y2,'k',x,y3,'k');
axis([-4,16,-0.1,0.8]);
subplot(2,2,4);plot(x,z1,'k',x,z2,'k',x,z3,'k');
axis([-4,16,-0.1,1.1]);
图5-7正态分布的密度函数及累积分布函数图
(3)求解方法
●通用函数介绍.
Pdf计算已选函数的概率密度函数,调用格式为:
Y=Pdf(name,X,A)
Y=Pdf(name,X,A,B)
Y=Pdf(name,X,A,B,C)
Name为上表中取stat后的字符,如beta、bino、chiz、exp等。
●利用专用函数.
Betapdf(X1,A1,B)
Binopaf(X,N,P)
(4)举例
举例1:
计算正态分布N(0,1)下的在点0.7733的值
pdf('morm',0.7733,0,1)
举例2:
绘制卡方分布密度函数在n分别等于1,5,15时的值
x=0:
0.2:
30
y1=chi2pdf(x,1)
plot(x,y1,'+')
holdon
y2=chi2pdf(x,5)
plot(x,y2,'+')
y2=chi2pdf(x,15)
plot(x,y2,'o')
axis([0,30,0,0.2])
举例3:
3.概率值函数求X点处概率值.
Binocdf(X,N,P)
Betacdf(X,A,B)
Normcdf(X1,mu,sigma).
数值点函数(逆概率函数,ZNV)---已知概率值求概率分布点时.
函数名+inv(参数)
betainv(P,A,B)
binoinv(Y,N,P)
chixinv(P,v)
举例1:
设x~N(3,22)
求p{22},p{x>3}
a1=normcdf(2,3,2)
a2=normcdf(5,3,2)
p1=a2-a1
p2=normcdf(10,3,2)-normcdf(-4,3,2)
p3=1-normcdf(2,3,2)+normcdf(-2,3,2)
p4=1-normcdf(3,3,2)
三、参数估计
1.参数估计函数表
函数名
调用形式
函数注解
Betafit
Betafit(x),
[PHAT,PCI]=betafit(X,ALPHA)
返回β分布的最大似然估计值和α水平的置信区间
Binofit
Binofit(X)
[PHAT,PCI]=binofit(x,AaLPHA)
二项式分布最大似然估计,α水平的参数估计和置数区间
Expfit
Expfit(x)
[MUHAT,MUCI]=expfit(x,ALPHA)
指数分布的最大似然估计,α水平的参数估计和α水平的置信区间
Gaamfit
Gamfit(x)
[PHAT,PCI]=gamfit(x,ACPHA)
返回最大似然估计;α水平的期望,方差值和区间的估计
Normfit
Noormfit(x,ALPHA)[MUHAT,SIGAHT,SIGMACI]=normfit(x,ALPHA)
正态分布的最大似然估计,α水平的期望、方差值和区间的估计
Poissfit
Poissfit(x)
[cAMBAHAT,LANBDACI]=poissfit(x,ALPHA)
泊松分布的最大估计;α水平的λ参数和区间估计
Unifit
Unifit(x,ALPHA)
[AHAT,BHAT,ACT,BCI]=unifit(x,ALPHA)
均匀分布的最大估计,α水平的参数及其区间估计
举例1:
假设某种清漆的9个样本,其干燥时间(以小时计)分别为5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0,设干燥时间总体服从正态分布N(μ,σ2),求μ,σ的置信度为0.95的置信区间。
time=[6.05.75.86.57.06.35.66.15.0]
[MUHAT,SIGMAHAT,MUCI,SIGMACI]=normfit(time,0.05)
其中:
MUHAT为μ的估计值,此例为6,MUCI为估计区间[5.5584,6.4416],SIGMAHAT为σ的估计值,此例为0.57456,此例为,SIGMACI的估计区间[0.38801.1005]。
四、假设检验
(一)单个总体(u,б2)均值的检验。
1.б巳知时的u检验(u检验法)ztest
[H、SIG]=Ztest(X、M、sigma,ALPHA,TAIL)
当标准差sigma巳知时,函数一正态检验来判断是否来自一正态公布的样本的期望值。
M作为评判标分准估计,默认值ALPHA=0.05,TAIL=0
当原假设为“期望值等于M”
当TAIL=0时,备择假设为“期望值不等于M”
当TAIL=0时,备择假设为“期望值大于M”
当TAIL=0时,备择假设为“期望值小于M”
ALPHA为设生产的显若水平,(默认为0.05),sig为当原假设为真时,得到观察的概率样本,
H=0,表示“在显著水平为alpha”情况下,不能拒绝原假设,
H=1,表示“在显著水平为alpha”情况下,可以拒绝原假设。
例1:
x=[0.497