matlab在数理统计中的应用1Word文档格式.docx
《matlab在数理统计中的应用1Word文档格式.docx》由会员分享,可在线阅读,更多相关《matlab在数理统计中的应用1Word文档格式.docx(37页珍藏版)》请在冰豆网上搜索。
1816181920221922182626132113111923182428
1311251517182216131213110915182115121713
1412161008231811162813212212081521181616
1928191214192828281321281911151824181628
1915132214162420281818281413282924281418
1818082116243216281915181810121626181933
0811182723112222132814221826181632272524
1717283316202832192318281524282916171918
·
编写函数文件example1_6_1.m:
function[ni,frequency]=example1_6_1(Y,k)
%Y为试验数据
%k为分组参数
n=length(Y);
m=min(Y);
M=max(Y);
%
(1)下面作频率密度直方图
delta=(M-m)/k;
x=m:
delta:
M;
ni=hist(Y,x);
frequency=ni/n;
density=frequency/delta;
bar(x,density)
%作频率密度直方图
pause
%
(2)下面作经验分布函数图
cdfplot(Y)
编写命令文件example1_6_2.m:
F=[1625192025332423202425171521222615232224....
2014161114281813273125241619232617143021....
1816181920221922182626132113111923182428....
1311251517182216131213110915182115121713....
1412161008231811162813212212081521181616....
1928191214192828281321281911151824181628....
1915132214162420281818281413282924281418....
1818082116243216281915181810121626181933....
0811182723112222132814221826181632272524....
1717283316202832192318281524282916171918];
[ni,frequency]=example1_6_1(F,9)
运行命令文件example1_6_2.m:
example1_6_2
ni=
16
21
34
44
25
23
22
6
frequency=
0.0250
0.0800
0.1050
0.1700
0.2200
0.1250
0.1150
0.1100
0.0200
0.0300
图1-1(a)
图1-1(b)
二、常见的概率分布
表1.1 概率分布分类表
连续随机变量分布
连续统计量分布
离散随机变量分布
分布
二项分布
连续均匀分布
非中心分布
离散均匀分布
(Gamma)分布
几何分布
指数分布
超几何分布
正态分布
负二项分布
对数正态分布
泊松分布
Weibull分布
Rayleigh分布
三、MATLAB为常见分布提供的五类函数
1)概率密度函数(pdf);
2)(累积)分布函数(cdf);
3)逆(累积)分布函数(icdf);
4)随机数发生器(random);
5)均值和方差(stat).
1、概率密度函数
表1.2 概率密度函数(pdf)
函数名称
函数说明
调用格式
normpdf
Y=normpdf(X,MU,SIGMA)
chi2pdf
Y=chi2pdf(X,N)
tpdf
Y=tpdf(X,N)
fpdf
Y=fpdf(X,N1,N2)
Y=normpdf(X,MU,SIGMA)的SIGMA是指标准差,而非.
【例1-2】绘制标准正态分布的概率密度图.
x=-4:
0.1:
4;
y=normpdf(x,0,1);
plot(x,y)
title('
N(0,1)的概率密度曲线图'
)
图1-2
2、累积分布函数
表1.3 累积分布函数(cdf)
normcdf
P=normcdf(X,MU,SIGMA)
chi2cdf
P=chi2cdf(X,N)
tcdf
P=tcdf(X,N)
fcdf
P=fcdf(X,N1,N2)
常见的概率分布(matlab作图)
一、常见的概率分布
二、MATLAB为常见分布提供的五类函数
【例1-3】求服从标准正态分布的随机变量落在区间[-2,2]上的概率.
P=normcdf([-2,2])
ans=
0.0228
0.9772
P
(2)-P
(1)
0.9545
3、逆累积分布函数(用于求分位点)
表1.4 逆累积分布函数(icdf)
norminv
X=norminv(P,MU,SIGMA)
chi2inv
X=chi2inv(P,N)
tinv
X=tinv(P,N)
finv
X=finv(P,N1,N2)
【例1-4】
(书P22例1.13)求下列分位数:
(i);
(ii);
(iii);
(iv).
u_alpha=norminv(0.9,0,1)
u_alpha=
1.2816
t_alpha=tinv(0.25,4)
t_alpha=
-0.7407
F_alpha=finv(0.1,14,10)
F_alpha=
0.4772
X2_alpha=chi2inv(0.025,50)
X2_alpha=
32.3574
4、随机数发生函数
表1.5 随机数发生函数(random)
normrnd
R=normrnd(MU,SIGMA,m,n)
chi2rnd
R=chi2rnd(N,m,n)
trnd
R=trnd(N,m,n)
frnd
R=frnd(N1,N2,m,n)
5、均值和方差
表1.6 常见分布的均值和方差函数(stat)
unifstat
连续均匀分布:
[M,V]=unifstat(A,B)
expstat
指数分布:
[M,V]=expstat(MU)
normstat
正态分布:
[M,V]=normstat(MU,SIGMA)
chi2stat
分布:
[M,V]=chi2stat(N)
tstat
[M,V]=tstat(N)
(N≥2)
fstat
[M,V]=fstat(N1,N2)
binostat
[M,V]=binostat(N,p)
poisstat
泊松分布:
[M,V]=poisstat(LAMBDA)
如果省略调用格式左边的[M,V],则只计算出均值.
三、常用的统计量
表1.7 常用统计量
mean
样本均值
m=mean(X)
range
样本极差
y=range(X)
std
样本标准差
y=std(X)
var
样本方差
y=var(X),y=var(X,1)
corrcoef
相关系数
R=corrcoef(X)
cov
协方差矩阵
C=cov(X),C=cov(X,Y)
moment
任意阶中心矩
m=moment(X,order)
说明:
(1)y=var(X)——计算X中数据的方差..
y=var(X,1)——,得到样本的二阶中心矩(转动惯量).
(2)C=cov(X)——返回一个协方差矩阵,其中输入矩阵X的每列元素代表着一个随机变量的观测值.如果X为n×
m的矩阵,则C为m×
m的矩阵.
(3)var(X)=diag(cov(X)),
std(X)=sqrt(diag(cov(X))).
参数估计(matlab)
参数估计包含两种常用方式:
点估计和区间估计.
Matlab统计工具箱给出了常用概率分布中参数的点估计(采用最大似然估计法)与区间估计,另外还提供了部分分布的对数似然函数的计算功能.
由于点估计中的矩估计法的实质是求与未知参数相应的样本的各阶矩,统计工具箱提供了常用的求矩函数(见第一章),读者可根据需要选择合适的矩函数进行点估计.
表2.1 统计工具箱中的参数估计函数(fit/like)
unifit
均匀分布数据的参数点估计和区间估计
[ahat,bhat,ACI,BCI]=unifit(X,alpha)
expfit
指数分布数据的参数点估计和区间估计
[muhat,muci]=expfit(x,alpha)
normfit
正态分布数据的参数点估计和区间估计
[muhat,sigmahat,muci,sigmaci]
=normfit(X,alpha)
binofit
二项分布数据的参数点估计和区间估计
[phat,pci]=binofit(x,n,alpha)
poissfit
泊松分布数据的参数点估计和区间估计
[lambdahat,lambdaci]
=poissfit(X,alpha)
调用格式只罗列了其中的一种.需另外说明的是:
(1)unifit和normfit的格式与其它函数均不同,此二者要求左边的输出变量必须将参数或分别列出.
(2)binofit(x,n,alpha)根据试验成功的次数x和总的试验次数n,对中的p进行最大似然估计,同时返回置信度为100(1-alpha)%的置信区间pci.
【例2-1】
(书P692.3)使用一测量仪器对同一值进行了12次独立测量,其结果为(单位:
mm)
232.50,
232.48,
232.15,
232.52,
232.53,
232.30,
232.05,
232.45,
232.60,
232.47,
232.30
试用矩法估计测量的真值和方差(设仪器无系统误差).
编写命令文件exercise2_3.m:
%P66_2.3mu与sigma^2的矩估计
x=[232.50,
232.30,...
232.48,
232.30];
mu_ju=mean(x)
sigma2_ju=var(x,1)
运行命令文件exercise2_3.m:
exercise2_3
mu_ju=
232.4025
sigma2_ju=
0.0255
【例2-2】
(书P692.22)随机地从一批零件中抽取16个,测得长度(单位:
cm)为:
2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11
设零件长度的分布为正态的,试求总体均值的90%的置信区间:
(1)若(cm);
(2)若未知.
(1)·
编写函数文件zestimate.m:
%P69_2.22
(1)sigma已知时mu的区间估计
functionmuci=zestimate(x,sigma,alpha)
n=length(x);
xhat=mean(x);
u_alpha=norminv(1-alpha/2,0,1);
delta1=sigma/sqrt(n)*u_alpha;
muci=[xhat-delta1,xhat+delta1];
调用函数文件zestimate.m:
x=[2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11];
sigma=0.01;
alpha=0.1;
muci=zestimate(x,sigma,alpha)
muci=
2.1209
2.1291
(2)·
编写命令文件exercise2_22_2.m:
%P69_2.22
(1)sigma未知时mu的区间估计
x=[2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11];
[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha);
muci
运行命令文件exercise2_22_2.m:
exercise2_22_2
2.1175
2.1325
【例2-3】
(书P66例2.31)对一批产品,欲通过抽样检查其合格率.若产品不合格率在5%以下,则该批产品可出厂.检验时要求结果具有0.95的置信水平.今抽取产品100件,发现不合格品有4件,问这批产品能否出厂?
[phat,pci]=binofit(4,100,0.05)
phat=
0.0400
pci=
0.0110
0.0993
由于置信区间的上限超出了规定指标(不合格率在5%以下),因此不能出厂.
假设检验1
假设检验分为两种:
参数假设检验与分布假设检验.
一、正态总体的参数假设检验
表3.1的说明:
对一个正态总体,抽取样本;
对两个正态总体,,且X与Y独立,分别抽取样本与.
表3.1 正态总体的参数假设检验
检验名称
已知
H0
H1
统计量
否定域
u
检
验
一个正态总体
两个正态总体
t
未知
(成对数据检验)
n对相互独立的观测结果,
F
二、非参数假设检验
表3.2 非参数假设检验
检验法
功能
总体X
类型
总体
参数
优点
缺点
正态概率纸检验
判断单总体
一维,
连续型
快速粗略地估计出总体的某些数字特征
定性分析而非定量分析
皮尔逊拟合检验
检验单总体
;
或检验两个总体的独立性
一维或多维,离散或连续型
已知或未知
可以用于全样本,也可用于截尾样本,还可用于成群数据.
由于分组处理样本的观测值,因此有时虽然不成立,但在某种划分之下,却并不影响统计量的观察值,因而很容易犯第II类错误.
柯尔莫哥洛夫检验
(正态分布与指数分布可未知)
与Pearson检验相比,当总体为一维且理论分布完全已知时,柯尔莫哥洛夫检验优于检验.
柯尔莫哥洛夫检验的适用范围不如检验广.特别对于理论分布含有未知参数时,柯尔莫哥洛夫检验难度较大,目前只对正态分布和指数分布作出了结果.
斯米尔诺夫检验
检验两个总体是否同分布
采用与柯尔莫哥洛夫检验类似的方法,借助经验分布函数构造检验统计量
主要困难在于求统计量的观测值,通常会分组处理样本的观测值.
W检验
适用于小样本()
D检验
适用于大样本()
秩和检验
偏度
峰度
检验
适用于
三、统计工具箱中的假设检验
表3.3 统计工具箱中的假设检验(test/rank)
正态总体的参数检验
ztest
单样本均值的z检验
(总体服从正态分布)
[h,sig,ci,zval]=ztest(x,mu0,sigma,alpha,tail)
ttest
单样本均值t检验
[h,sig,ci,tval]=ttest(x,mu0,alpha,tail)
ttest2
双样本均值差t检验
(两个总体均服从正态分布)
[h,sig,ci,tval]=