ImageVerifierCode 换一换
格式:DOCX , 页数:26 ,大小:249.62KB ,
资源ID:10518449      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10518449.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Matlab学习系列17 数值计算概率篇.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

Matlab学习系列17 数值计算概率篇.docx

1、Matlab 学习系列学习系列 17 数值计算概率篇数值计算概率篇 17.数值计算概率篇 一、计算组合数、排列数 factorial(n)或 prod(1:n)nchoosek(n,k)factorial(n)/factorial(n-k)二、生成随机数 1.rand(m,n)生成 m n 的服从0,1上均匀分布的随机数;用 a+(b-a).*rand(m,n)生成 m n 的服从a,b上均匀分布的随机数。2.二项分布与正态分布随机数 binornd(N,P,m,n)生成 m n 的服从二项分布 B(N,P)的随机数;normrnd(MU,SIGMA,m,n)生成 m n 的服从正态分布 N(

2、MU,SIGMA2)的随机数;3.通用格式:分布缩写+rnd(分布参数,m,n)或 random(分布名或缩写,分布参数,m,n)可以用来生成 m n 该分布的随机数。各种分布名见下图:表 1 一维随机变量概率分布名称表 分布缩写、分布名称 函数说明 beta 或 Beta Beta分布 bino 或 Binomial 二项分布 chi2 或 Chisquare 卡方分布 exp 或 Exponential 指数分布 f 或 F F分布 gam 或 Gamma GAMMA 分布 geo 或 Geometric 几何分布 hyge 或 Hypergeometric 超几何分布 logn 或 Lo

3、gnormal 对数正态分布 nbin 或 Negative Binomial 负二项式分布 ncf 或 Noncentral F 非中心 F分布 nct 或 Noncentral t 非中心 t 分布 ncx2 或 Noncentral Chi-square 非中心卡方分布 norm 或 Normal 正态分布 poiss 或 Poisson 泊松分布 rayl 或 Rayleigh 瑞利分布 t 或 T T分布 unif 或 Uniform 均匀分布 unid 或 Discrete Uniform 离散均匀分布 weib 或 Weibull 威布尔分布 4.使用 randsample 和

4、randsrc函数生成指定离散分布随机数 X=randsample(N,k,replace,w)N相当于1:N,也可以是具有确定值的向量;k 表示生成 k 个随机数;replace=true表示可重复,或false表示不可重复(默认);w是权重向量。X=randsrc(m,n,x;p)生成 m n 的随机矩阵,服从取值为向量 x,对应概率为向量 p 的离散分布。例 1 设离散型随机变量 X服从如下分布:X-2-1 0 1 2 P 0.05 0.2 0.5 0.2 0.05 生成服从 3 5 的该分布的随机数。代码:xvalue=-2-1 0 1 2;xp=0.05 0.2 0.5 0.2 0.

5、05;%调用 randsample 函数生成 100 个服从指定离散分布的随机数 x=randsample(xvalue,15,true,xp);reshape(x,3 5)%调用 randsrc 函数生成 10*10 的服从指定离散分布的随机数矩阵 y=randsrc(3,5,xvalue;xp)运行结果:ans=0 0 1 0 0 0 0 0-1-1 1 1 0 0 1 y=-1-1 1 1-1-1 0 0 2 0-1 0-1 0 0 5.已知概率密度函数,生成服从该分布的随机数 例 2 设随机变量 X 的概率密度函数为(抛物线分布):调用 crnd 函数(来自MATLAB 统计分析与应用

6、 40 个案例分析作者:谢中华),生成 3 5 个服从该分布的随机数。代码:pdffun=6*x*(1-x);%密度函数表达式 x=crnd(pdffun,0 1,3,5)运行结果:x=0.3160 0.6866 0.2724 0.2816 0.1268 0.2681 0.8439 0.1948 0.7999 0.5383 0.7377 0.2040 0.4932 0.1948 0.6909 6.生成多元分布的随机数 mrnd(N,P,m)多项分布,P 为概率向量;mvnrnd(mu,sigma,m)多元正态分布,mu,sigma为 n 元向量;mvtrnd(C,df,m)多元 t 分布;wi

7、shrnd(sigma,df,m)Wishart 分布;iwishrnd(sigma,df,m)逆 Wishart 分布;例 3 利用 mvnrnd 函数生成 3 组的二元正态分布随机数,其中分布的参数为 代码:mu=10 20;sigma=1 3;3 16;xy=mvnrnd(mu,sigma,3)运行结果:xy=11.8336 25.7385 9.0347 17.8026 9.6030 19.5821 三、随机变量的概率密度函数及其图像 概率密度函数,描述随机变量 X在点 x 附近取值的可能性。1.通用格式:pdf(分布名或缩写,x,分布参数)返回该分布在 X=x 处的概率密度值;例如,P

8、k=pdf(bino,3,10,0.4)2.专用函数 分布名缩写+pdf(x,分布参数)例如,binopdf(k,n,p)例 4 绘制卡方分布密度函数在自由度分别为 1、5、15的图形。代码:x=0:0.1:30;y1=chi2pdf(x,1);plot(x,y1,:)hold on y2=chi2pdf(x,3);plot(x,y2,+)y3=chi2pdf(x,10);plot(x,y3,o)axis(0,30,0,0.2)运行结果:四、随机变量的分布函数 分布函数定义为:F(x)=PXx,表示随机变量 X的取值落在(-,x)范围内的概率。引入分布函数的目的,就是可以计算随机变量 X的取值

9、落在任意区间内的概率,例如,Pau=,故 u=norminv(1-,0,1)其它分布的上分位数也是类似的。N(0,1)的双侧 分位数:P|X|u/2=,故 u/2=norminv(1-/2,0,1)注意:-u/2=u1-/2(-u/2 右侧的面积为 1-/2),其它对称分布也成立,例如,t1-(n)=-t(n).六、随机变量的数字特征 注:若要 X中除 NaN(非数)之外的数进行操作,加前缀 nan,例如 nanmean(X).1.几种平均(1)算术平均值(样本均值)适用于性质相同、单峰,且近似服从正态分布的定量数据;代码:mean(X)(若 X为矩阵,返回每列的均值)(2)中位数 代码:me

10、dian(X)(3)几何平均值 适用于对比率数据的平均,并主要用于计算数据平均增长(变化)率;服从正偏态分布(较长右尾),特别是对数正态分布数据(取对数变换后服从正态分布)。代码:geomean(X)(4)调和平均值 即先取倒数,再取算术平均值,再取倒数回来。例如前半段时速60 公里,后半段时速 30 公里(两段距离相等),则其平均速度为两者的调和平均数时速 40 公里。在实际中,往往由于缺乏总体单位数的资料而不能直接计算算术平均数,这时需用调和平均法来求得平均数。代码:harmmean(X)(5)众数 出现次数最多的数,代码:mode(X)2.期望和方差(1)样本数据 mean(X)样本均值

11、 var(X)或 var(X,0)样本方差 var(X,1)方差 std(X)或 std(X,0)样本标准差 S std(X,1)标准差(2)常见分布的期望和方差 通用格式:E,D=分布名缩写+stat(分布参数)返回 E为期望,D 为方差;例如,E,D=normstat(MU,SIGMA)(3)已知离散型随机变量的分布律,求期望和方差 例 5 设离散型随机变量 X服从如下分布:X-2-1 0 1 2 P 0.3 0.1 0.2 0.1 0.3 求 E(X),E(X2-1),D(X).代码:X=-2-1 0 1 2;p=0.3 0.1 0.2 0.1 0.3;EX=sum(X.*p)%或 EX

12、=X*p Y=X.2-1;EY=sum(Y.*p)XX=X.2;EXX=sum(XX.*p);DX=EXX-EX2 运行结果:EX=0EY=1.6000DX=2.6000 3.极差、偏度、峰度 极差,数据的最大值与最小值之差。代码:range(X)偏度,是数据关于均值不对称的指标。若偏度为负,说明均值左边的数据比右边的数据更散;若偏度为正,说明均值右边的数据比左边的数据更散,正态分布的偏度为 0.代码:skewness(X)峰度,是用来反映数据的分布曲线顶端尖峭或扁平程度的指标。代码:kurtosis(X)4.矩 k 阶中心矩m=moment(X,k)k 阶原点矩可以使用下面自编的 Origi

13、nMoment.m function y=OriginMoment(X,k);%X为样本矩阵 n,m=size(X);y=zeros(1,m);for ii=1:m;y(ii)=sum(X(:,ii).k)/n;end 5.协方差(矩阵)、相关系数(矩阵)对于样本数据矩阵:Matlab 将矩阵 X 的每一列 Xj,j=1,n 作为一个随机变量的样本,每一行xj1,xj2,xjn,j=1,2,.,m 作为 n 个随机变量的联合分布的一个样本。由于矩阵 X给出的只是随机变量的样本数据,并不知道这些随机变量的(联合)概率分布,因此是不能计算出这些随机变量的总体期望、方差或协方差的,而只能计算出它们的

14、一个无偏估计,即样本均值、样本方差与样本协方差。样本协方差公式:,其中 称为随机变量 X1,Xn 的协方差矩阵(实对称、非负定)。协方差矩阵是一维随机变量方差、二维随机向量协方差向高维随机向量的推广,常应用于在主成分分析中。相关系数(矩阵)是协方差(矩阵)的标准化,反映了随机变量两两之间的线性关系的强弱程度。代码:cov(X)返回样本矩阵 X的协方差矩阵;corrcoef(X)返回样本矩阵 X的相关系数矩阵;例 6 随机生成样本数据矩阵 X,计算 X的协方差矩阵、相关系数矩阵。代码:M=5;N=3;X=10.*rand(M,N)CovX=cov(X)Cov12=cov(X(:,1),X(:,2

15、)Cov11=cov(X(:,1),X(:,1)var(X(:,1)RhoX=corrcoef(X)运行结果:X=1.0665 8.6869 4.3141 9.6190 0.8444 9.1065 0.0463 3.9978 1.8185 7.7491 2.5987 2.6380 8.1730 8.0007 1.4554 CovX=19.6061-6.3812 5.3900-6.3812 11.6214-5.5894 5.3900-5.5894 9.7937 Cov12=19.6061-6.3812-6.3812 11.6214 Cov11=19.6061 19.6061 19.6061 19

16、.6061 VarX1=19.6061 RhoX=1.0000-0.4227 0.3890-0.4227 1.0000-0.5239 0.3890-0.5239 1.0000 七、频率直方图 1.统计数值或字符出现的频数、频率 设 X为数值型或字符型向量,代码:tabulate(X);输出 X的值、频数、频率的三列表。注意:若 X中的值都是非负整数,则 min(X)与 max(X)之间的任一整数都统计,未出现的频数=0.2.经验分布函数 实际上是累积频率直方图曲线。依据样本以频率估计概率,当 n充分大时,是总体分布函数 的近似。例 7 生成指数分布随机数,计算其经验分布函数值并绘图,并与其分布

17、函数做对比。代码:X=exprnd(3,100,1);fp,xp=ecdf(X);%计算经验分布函数值 subplot(1,2,1)ecdfhist(fp,xp,20);%绘制频率直方图 subplot(1,2,2)plot(xp,fp,r)%绘制经验分布函数图形(连线型)hold on h,stats=cdfplot(X)%绘制经验分布函数图形(阶梯型)x=0:0.01:15;y=expcdf(x,3);plot(x,y,g);legend(连线型经验分布函数,阶梯型经验分布函数,分布函数);运行结果:h=177.0125(图形句柄)stats=min:0.0180 max:27.9801

18、mean:3.2968 median:2.1667 std:3.2969 0510152000.050.10.150.20.250.30.350510152000.10.20.30.40.50.60.70.80.91xF(x)Empirical CDF 连线型经验分布函数阶梯型经验分布函数分布函数3.直方图 定量数据常用直方图来展示某变量取值的分布,利用直方图可以估计总体的概率密度。例 8 随机生成服从 F(3,5)分布的样本数据,绘制直方图并与该分布的真实概率密度曲线做对比。代码:n=5000;X=frnd(3,5,n,1);%生成 F 分布随机数 m=150;%分组区间数 a=min(X)

19、;b=max(X);d=(b-a)/m;%分组宽度 r,xout=hist(X,a:d:b);%或者r,xout=hist(X,m);%计算直方图数据,r 返回每段的频数,xout 返回每段的中心位置 f=r./(n*d);%计算频率 bar(xout,f);%绘制频率直方图 hold on x=0:0.01:10;y=fpdf(x,3,5);plot(x,y,k-);axis(0 10 0 1);title(频率密度直方图);运行结果:注:也可以用例 7 中方法绘制频率直方图:fp,xp=ecdf(X);%计算经验分布函数值 ecdfhist(fp,xp,20);%绘制频率直方图 4.绘制分

20、布的概率图形 normplot(X)绘制 X的正态分布概率图形(若 X为矩阵,则针对每列绘制);可以用来验证数据 X是否服从正态分布,若是,则近似一条直线。类似的还有,weibplot(X)绘制 X的威布尔分布概率图形。例 9 随机生成服从正态分布的随机数据,绘制其正态概率分布图形,验证数据的正态性。代码:X=normrnd(5,1.44,100,1);normplot(X)运行结果:024681000.10.20.30.40.50.60.70.80.91频率密度直方图 八、箱线图 又称为盒形图。在一条数轴上,以数据的上下四分位数(Q1-Q3)为界画一个矩形盒子(中间 50%的数据落在盒内);

21、在数据的中位数位置画一条线段为中位线;默认延长线不超过盒长的 1.5 倍,之外的点认为是异常值(用+标记)。盒形图的主要应用就是,剔除数据的异常值、判断数据的偏态和尾重。代码:boxplot(X,notch,sym,vert,whis)当 notch=1 时,产生一凹盒图,notch=0 时产生一矩箱图;sym表示异常值的标记符号,默认值为“+”;当 vert=0 时,生成水平盒图,vert=1 时,生成竖直盒图(默认值 vert=1);whis 定义“须线”的长度,默认值为 1.5.例 10 绘制箱线图。代码:x1=normrnd(5,1,100,1);x2=normrnd(6,1,100,

22、1);1234567890.0030.010.020.050.100.250.500.750.900.950.980.990.997DataProbabilityNormal Probability Plotx=x1 x2;boxplot(x,0,g+,1,1.5)运行结果:注:若有异常值,应先去掉异常值,再重新绘制修正的箱线图。九、参数估计 刻画总体某方面概率特性的量,称为参数;当某参数未知时,从总体抽取样本,用某种方法(矩估计、最大似然估计)对该未知参数进行估计,就是参数估计。通过构造样本的函数,给出未知参数的估计值(点估计)、取值范围(区间估计)。1.通过格式(基于最大似然估计)phat

23、,pci=分布名缩写+fit(X,alpha)phat 返回参数的点估计值,pci 返回区间估计的两端点;alpha为显著水平,即估计结果具有(1-alpha)100%的置信度。注意:对于二项分布的参数估计需要带参数“N”表示试验次数:phat,pci=binofit(x,N,alpha)2.或者使用 phat,pci=mle(分布名缩写,X,alpha)345678912对于二项分布为:phat,pci=mle(分布名缩写,X,alpha,N)3.求最大对数似然函数值 logL,info=分布名缩写+like(给定参数,X)其中,给定参数为行向量形式,输入的是参数的极大似然估计值;info

24、返回回 Fisher 逆信息矩阵,其对角线为为相应参数的渐近方差。例 11 某厂生产的滚珠随机抽取 10个,测得滚珠直径(mm)如下:15.14 14.81 15.11 15.26 15.08 15.17 15.12 14.95 15.05 14.87 设测定值总体服从 N(,2),和 未知,分别求 和 的最大似然估计以及 95%的置信区间。代码:X=15.14 14.81 15.11 15.26 15.08 15.17 15.12 14.95 15.05 14.87;muhat,sigmaheat,muci,sigmaci=normfit(X,0.05)运行结果:muhat=15.0560s

25、igmahat=0.1397 muci=14.9561 15.1559 sigmaci=0.0961 0.2550 logL=-5.9933 info=0.0020 0.0000 0.0000 0.0011 十、假设检验 实际中,我们只能抽取部分样本,做统计分析得到统计结果,进一步推断总体的特征,但是这种推断必然有可能犯错,犯错的概率为多少时应该接受这种推断呢?为此,统计学家就开发了一些统计方法进行统计检定,通过把所得到的统计检定值,与统计学家树立了一些随机变量的概率分布进行对比,我们可以知道在百分之多少的机遇下会得到目前的结果。倘若经比较后发现,涌现这结果的机率很少,即是说,是在时机很少、很

26、罕有的情况下才出现;那我们便可以有信念地说,这不是巧合,该推断结果是具有统计学上的意义的。否则,就是推断结果不具有统计学意义。假设检验是基于反证法思想:先提出原假设(H0),再用适当的统计方法确定假设成立的可能性(P 值)大小,如可能性小(P),则认为原假设不成立,若可能性大,则还不能认为备择假设(H1)成立。原假设与备择假设是是完备且相互独立的事件组,一般,原假设(H0)研究者想收集证据予以反对的假设;备择假设(H1)研究者想收集证据予以支持的假设;假设检验的 P 值是由检验统计量的样本观察值得出的原假设可被拒绝的最小显著水平。(1)双侧检验(H1:0)I.原假设 H0:=0,备择假设 H1

27、:0;.根据样本数据计算出统计量 t 的观察值 t0;.P 值=P|t|t0|=t0 的双侧尾部的面积;.若 P 值(在右尾部分),则在显著水平 下拒绝 H0;若 P 值,则在显著水平 下接受 H0;注意:为临界值,看 P 值在不在阴影部分(拒绝域),空白部分为接受域。(2)左侧检验(H1:0)I.原假设 H0:0,备择假设 H1:0;.根据样本数据计算出统计量 t 的观察值 t0(,则在显著水平 下接受 H0;(3)右侧检验(H1:0)I.原假设 H0:0,备择假设 H1:0;.根据样本数据计算出统计量 t 的观察值 t0(0);.P 值=Pt t0=t0 的右侧尾部的面积;.若 P 值(在

28、右尾部分),则在显著水平 下拒绝 H0;若 P 值,则在显著水平 下接受 H0;1.总体标准差已知,单个正态总体均值的 U检验 h,p,muci,zval=ztest(X,mu,sigma,alpha,tail)p 返回 p 值,h=1或 palpha时,拒绝 H0;h=0 或 palpha 时接受H0.muci 返回总体均值的 1-alpha置信区间;zval 返回检验统计量的观测值;tail=both或right或left,用来规定双侧、右侧、左侧检验,默认是both.例 12 某切割机正常工作时,切割的金属棒的长度服从 N(100,4),随机抽取 15 根,测得长度(mm)如下:97 1

29、02 105 112 99 103 102 94 100 95 105 98 102 100 103 假设总体方差不变,检验该切割机是否正常,即总体均值是否等于 100mm?显著性水平取=0.05.H0:=0=100,H1:0 代码:X=97 102 105 112 99 103 102 94 100 95 105 98 102 100 103;h,p,muci,zval=ztest(X,100,2,0.05)%h=1 或 p0.05 时,拒绝原假设;h=0 或 p0.05 时,接受原假设 h1,p1,muci1,zval1=ztest(X,100,2,0.05,right)运行结果:h=1

30、p=0.0282 muci=100.1212 102.1455 zval=2.1947(U统计量值)h1=1 p1=0.0141 uci1=100.2839 Inf zval1=2.1947 由于 p 值=0.02820 经检验,p 值=0.0141=0.05,拒绝原假设 H0,故结论是:在显著水平=0.05 下,总体均值大于 100.2.t 检验 t 检验,用来检验“单样本均值与已知均值、两独立样本均值、配对设计资料的均值”是否存在差异,这种差异是否能推论至总体。t 检验适用于样本含量较小(比如 n=0.05,接受原假设,故结论是:在显著水平=0.05 下,每包化肥的平均质量等于 50kg.

31、例 14 甲、乙两台机床加工同一种产品,从这两台机床加工的产品中随机抽取若干件,测得产品直径(mm)如下:甲机床:20.1 20.0 19.3 20.6 20.2 19.9 20.0 19.9 19.1 19.9 乙机床:18.6 19.1 20.0 20.0 20.0 19.7 19.9 19.6 20.2 设甲、乙两机床加工的产品直径分别服从 N(1,12)和 N(2,22),试比较两台机床加工的产品直径是否有差异?显著性水平取=0.05.H0:1=2,H1:12 代码:X=20.1 20.0 19.3 20.6 20.2 19.9 20.0 19.9 19.1 19.9;Y=18.6 1

32、9.1 20.0 20.0 20.0 19.7 19.9 19.6 20.2;h,p,muci,stats=ttest2(X,Y,0.05,both,equal)运行结果:h=0 p=0.3191 muci=-0.2346 0.6791 stats=tstat:1.0263 df:17 sd:0.4713 经检验,p 值=0.3191=0.05,接受原假设,故结论是:在显著水平=0.05 下,两台机床加工的产品直径没有显著差异。3.总体均值未知,单个正态总体方差的 2 检验 卡方的统计原理,是取观察频数与期望频数相比较。当观察频数与期望频数完全一致时,值为 0;观察频数与期望频数越接近,两者之

33、间的差异越小,值越小;观察频数与期望频数差别越大,两者之间的差异越大,值越大。一旦 值大于某一个临界值,即可获得显著的统计结论。配对资料 2 检验 研究两变量之间的关联性或差别性问题。如果两变量无关联(即相互独立),说明对于其中一个变量而言,另一变量多项分类次数上的变化是在无差范围之内;如果两变量有关联,说明二者之间有交互作用存在。两变量之间是否相互关联,也可以看作差别分析,例如说性别与成绩有关,其实意思就是说不同性别的人他们的成绩有差别。这里用 2 检验来检验方差与某方差值是否有差别,代码:h,p,muci,stats=vartest(X,var0,alpha,tail)例 15 还是例 13 中的样本数据,检验每包化肥质量的方差是否等于 1.5?显著性水平取=0.05.H0:2=02=1.5,H1:202 代码:X=49.4 50.5 50.7 51.7 49.8 47.9 49.2

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1