1、数据的基本统计分析方法安徽财经大学统计与数学模型分析实验中心数学软件实验报告实验名称:数据的基本统计分析 使用软件: Matlab 实验目的熟练掌握数据的基本统计分析方法实验内容(具体题目及程序)1.已知,试求:,2. 若XN(2,4),作出X在-1,3上的曲线3. 已知数据:459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659
2、775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851计算该数据特征. 4.判别题3中的数据有无异常值。5.下表给出了15种资产的收益率ri(%)和风险损失率qi(%),计算峰
3、度与偏度. Siri(%)qi(%)Siri(%)qi(%)S19.642S933.653.3S218.554S1036.840S349.460S1111.831S423.942S1295.5S58.11.2S133546S61439S149.45.3S740.768S151523S831.233.46.作出题3数据的直方图,该数据服从正态分布还是威布尔分布?程序如下:1normcdf(3,2,0.5)normcdf(2,2,0.5)- normcdf(1,2,0.5)2.normspec(-1,3,2,2)3.a=459 362 624 542 509 584 433 748 815 505
4、 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 57
5、7 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851;b=a(:); T=mean(b),median(b),trimmean(b,10),geomean(b),harmmean(b),range(b),var(b),std(b),iqr(b),mad(b)4.a=459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513
6、 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851;x=sort(a(:)5.x=9.6,18.5,49.4,23
7、.9,8.1,14,40.7,31.2,33.6,36.8,11.8,9,35,9.4,15;y=42,54,60,42,1.2,39,68,33.4,53.3,40,31,5.5,46,5.3,23;sx=skewness(x)kx=kurtosis(x)sy=skewness(y)ky=kurtosis(y)6.a=459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 47
8、4 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851;hist( a(:),30);normplot(a(:)实验结果分析1.an
9、s = 0.9772ans =0.4772所以分布函数与概率密度函数值为normcdf(3,2,0.5)=0.9772normcdf(2,2,0.5)- normcdf(1,2,0.5)=0.47722.正态密度曲线如下:3.T = 1.0e+004 * Columns 1 through 9 0.0600 0.0600 0.0601 0.0560 0.0499 0.1069 3.8663 0.0197 0.0244 Column 10 0.0151位置特征计算结果变异特征计算结果算术平均600极差1069中位数599.5方差38663.03切尾平均600.64标准差196.629几何平均55
10、9.68四分位极差243.5调和平均499.06平均绝对偏差150.864.x = 84 120 164 217 246 280 292 310 339 358 362 378 388 402 416 428 433 434 447 452 459 468 473 474 484 487 496 499 505 509 512 513 515 527 531 538 539 542 544 552 555 558 564 565 570 577 581 584 593 593 606 608 609 610 612 621 624 628 634 638 640 645 649 653 654
11、 659 666 677 680 687 697 699 706 715 724 734 742 748 755 763 764 765 771 775 781 790 815 824 837 844 851 859 862 885 926 954 960 982 1062 1153得到原数据从小到大的次序统计量,因为np为整数,故有:下四分位数为:Q1=(x(25)+x(26)/2=485.5上四分位数为:Q3=(x(75)+x(76)/2=729四分位极差为:R = 243.5数据的下、上截断点分别为:Q1-1.5R=120.25,Q3+1.5R=1094.25由此可知: 80,120,1
12、153是异常值5.sx = 0.4624kx = 1.8547sy = -0.4215ky = 2.2506sx=skewness(x)= 0.4624, kx=kurtosis(x)= 1.8547, sy=skewness(y)= -0.4215, ky=kurtosis(y)= 2.2506从计算结果可知:收益率是正偏,而风险损失率为负偏;二者峰度都小于3属于平阔峰. 6.从直方图发现数据比较接近于正态分布,用命令normplot(a(:)进行检验. 从图中可见数据点基本上都位于直线上,故可认为该数据服从正态分布,由于已经计算出该数据的均值为600,标准差为196.629,所以数据服从
13、结果分析:写出上述实验中所需用到的Matlab命令,以及命令中应注意的问题分布函数的命令为: P = normcdf(x,mu,sigma) 已知X的均值和标准差及概率p=PXx,求x的命令为: X = norminv(P,MU,SIGMA)算术平均mean极差range中位数median方差var切尾平均trimmean标准差std几何平均geomean四分位极差iqr调和平均harmmean平均绝对偏差madn阶中心矩峰度系数偏度系数变异系数moment(x,n)kurtosis(x)skewness(x)std(x)./abs(mean(x)直方图的命令:格式:hist(data,k). 说明:data是原始数据,该命令将区间(min(data),概率纸检验函数的命令:normplot(data) 成绩
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1