ImageVerifierCode 换一换
格式:PPT , 页数:18 ,大小:247KB ,
资源ID:15041246      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/15041246.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第九讲MATLAB基本统计分析PPT资料.ppt)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第九讲MATLAB基本统计分析PPT资料.ppt

1、normcdf(3,2,0.5)=0.9772;normcdf(2,2,0.5)-normcdf(1,2,0.5)=0.4772 1.计算分布函数与概率密度函数值计算分布函数与概率密度函数值:2.做出密度函数曲线、求分位数做出密度函数曲线、求分位数已知已知X的均值和标准差及概率的均值和标准差及概率p=PXx,求求x的命令为的命令为:X=NORMINV(P,MU,SIGMA)例例2.XN(1,0.04),pXx=0.6827 求求x解:x=norminv(0.6827,1,0.2)=1.0951 NORMSPEC(a,b,MU,SIGMA)用于做出随机变量在区间用于做出随机变量在区间a,b上的正

2、态密度曲线上的正态密度曲线例例3.若若XN(2,4),作出,作出X在在-1,3上的曲线上的曲线解:normspec(-1,3,2,2)图形如右图所示图形如右图所示(图图7.1)二二.数据特征数据特征 设设 是取自总体是取自总体X的一个简单随机样本,的一个简单随机样本,在在n次抽样以后得到样本的一组观测值次抽样以后得到样本的一组观测值 我我们通过对数据的分析研究可以得到总体们通过对数据的分析研究可以得到总体X的有关信息,的有关信息,在在MATLAB中有专门的函数分析数据特征,如下表所中有专门的函数分析数据特征,如下表所示示.位置特征位置特征MATLAB函函数数变异特征变异特征MATLAB函数函数

3、算术平均算术平均mean极差极差range中位数中位数median方差方差var切尾平均切尾平均trimmean标准差标准差std几何平均几何平均geomean四分位极差四分位极差iqr调和平均调和平均harmmean平均绝对偏差平均绝对偏差mad 例例4.已知数据:已知数据:459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659

4、775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851计算该数据特征计算该数据特征.解:a=459 362 624 542 509 584 433 748 815 505 61

5、2 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 4

6、96 468 499 544 645 764 558 378 765 666 763 217 715 310 851;b=a(:);%将矩阵变成数列将矩阵变成数列T=mean(b),median(b),trimmean(b,10),geomean(b),harmmean(b),range(b),var(b),std(b),iqr(b),mad(b)位置特征位置特征计算结果计算结果变异特征变异特征计算结果计算结果算术平均算术平均600极差极差1069中位数中位数599.5方差方差38663.03切尾平均切尾平均600.64标准差标准差196.629几何平均几何平均559.68四分位极差四分位极差

7、243.5调和平均调和平均499.06平均绝对偏差平均绝对偏差150.86计算结果如下:计算结果如下:例例5.已知数据:1,1,1,1,1,1,100;计算其数;计算其数据特征,由此你有何发现?据特征,由此你有何发现?x=1,1,1,1,1,1,100;y=mean(x),median(x),geomean(x),harmmean(x),trimmean(x,25);range(x),var(x),std(x),iqr(x),mad(x)计算结果为:计算结果为:y=15.143 1 1.9307 1.1647 1 99 1400.1 37.418 0 24.245 如果例如果例5的数据全部为的

8、数据全部为1,则各种平均值都应等于,则各种平均值都应等于1,所有的变异特征全部为零,由于有一个异常值,所有的变异特征全部为零,由于有一个异常值100,于是导致上述的一些特征受影响(不稳健),但是中位于是导致上述的一些特征受影响(不稳健),但是中位数、切尾平均与四分位极差没有改变,它们对异常值是数、切尾平均与四分位极差没有改变,它们对异常值是稳健的稳健的.三三.异常值的判别异常值的判别 在探索性数据分析时,有一种判别异常值的简单在探索性数据分析时,有一种判别异常值的简单方法,首先计算数据的下、上截断点,数据中小于下截方法,首先计算数据的下、上截断点,数据中小于下截断点的数据为特小值,大于上截断点

9、的数据为特大值,断点的数据为特小值,大于上截断点的数据为特大值,二者都是异常值二者都是异常值.1.数据的下、上截断点数据的下、上截断点计算上、下截断点的公式如下:计算上、下截断点的公式如下:其中,其中,R为四分位极差,为四分位极差,分别称为下四分位数与分别称为下四分位数与上四分位数上四分位数.对于对于0p0时称正偏,当时称正偏,当s3则表明数则表明数据分布有较厚的尾部据分布有较厚的尾部.变异系数用于刻画数据的变化大小,不同指标的变变异系数用于刻画数据的变化大小,不同指标的变异系数常用来计算客观性权重异系数常用来计算客观性权重.例例7.下表给出了下表给出了15种资产的收益率种资产的收益率ri(%

10、)和风险损失和风险损失率率qi(%),计算峰度与偏度,计算峰度与偏度.Siri(%)qi(%)Siri(%)qi(%)S19.642S933.653.3S218.554S1036.840S349.460S1111.831S423.942S1295.5S58.11.2S133546S61439S149.45.3S740.768S151523S831.233.4解:x=9.6,18.5,49.4,23.9,8.1,14,40.7,31.2,33.6,36.8,11.8,9,35,9.4,15;y=42,54,60,42,1.2,39,68,33.4,53.3,40,31,5.5,46,5.3,23

11、;sx=skewness(x)=0.4624,kx=kurtosis(x)=1.8547,sy=skewness(y)=-0.4215,ky=kurtosis(y)=2.2506从计算结果可知:收益率是正偏,而风险损失率为负偏;从计算结果可知:二者峰度都小于二者峰度都小于3属于平阔峰属于平阔峰.五五.直方图与概率纸检验函数直方图与概率纸检验函数1.直方图:直方图:为了直观地了解随机变量的分布特征,如对称性,为了直观地了解随机变量的分布特征,如对称性,峰值等,直方图是广泛使用的方法峰值等,直方图是广泛使用的方法.格式:格式:hist(data,k).说明:说明:data是原始数据,该命令将区间是

12、原始数据,该命令将区间(min(data),max(data)分成分成k等份,并描绘出频数直方图,等份,并描绘出频数直方图,k的缺省的缺省值为值为10.如果需要事先给出小区间,则将区间的中点存放在向如果需要事先给出小区间,则将区间的中点存放在向量量nb然后用命令:然后用命令:n,x=hist(data),或或n,x=hist(data,k),或或n,x=hist(data,nb),其中,其中,n返回返回k个小区间的频数,个小区间的频数,x返回小区间的中点返回小区间的中点.2.MATLAB中的概率纸检验函数中的概率纸检验函数.格式:normplot(data)%如果数据如果数据data服从正态分

13、布,服从正态分布,则做出的图形基本上都位于一条直线上则做出的图形基本上都位于一条直线上.weibplot(data)%如果数据如果数据data服从威布尔分布,则服从威布尔分布,则做出的图形基本上都位于一条直线上,做出的图形基本上都位于一条直线上,例例8.作出例作出例4 数据的直方图,该数据服从正态分布还数据的直方图,该数据服从正态分布还是威布尔分布?是威布尔分布?输入命令解:输入命令hist(a(:),30)得到图得到图7.2 从图从图7.2所示的直方图发现数据比较接近于正态分布,所示的直方图发现数据比较接近于正态分布,我们用命令我们用命令normplot(a(:)进行检验进行检验.从图从图7

14、.3 中可见数据点基本上都位于直线上,故可认中可见数据点基本上都位于直线上,故可认为该数据服从正态分布,由于已经计算出该数据的均值为该数据服从正态分布,由于已经计算出该数据的均值为为600,标准差为,标准差为196.629,所以数据服从,所以数据服从 图图7.2图图7.3正态分布的检验:正态分布的检验:1.大样本大样本h=jbtest(x),h=0,接受正态分布,接受正态分布,h=1拒绝正态分布拒绝正态分布2.小样本小样本h=lillietest(x),h=0,接受正态分布,接受正态分布,h=1拒绝正态分布拒绝正态分布作业:作业:1.根据下表计算七项指标的均值、方差、偏度与峰度根据下表计算七项指标的均值、方差、偏度与峰度表表7.6 各地区各地区“三资三资”工业企业主要经济效益指标(工业企业

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1