数据的基本统计分析方法.docx
《数据的基本统计分析方法.docx》由会员分享,可在线阅读,更多相关《数据的基本统计分析方法.docx(12页珍藏版)》请在冰豆网上搜索。
数据的基本统计分析方法
安徽财经大学统计与数学模型分析实验中心
《数学软件》实验报告
实验名称:
数据的基本统计分析使用软件:
Matlab
实
验
目
的
熟练掌握数据的基本统计分析方法
实
验
内
容(具体题目及程序)
1.已知
,试求:
2.若X~N(2,4),作出X在[-1,3]上的曲线
3.已知数据:
4593626245425095844337488155056124524349826407425657065936809266531644877346084281153593844527552513781474388824538862659775859755649697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851
计算该数据特征.
4.
判别题3中的数据有无异常值。
5.
下表给出了15种资产的收益率ri(%)和风险损失率qi(%),计算峰度与偏度.
Si
ri(%)
qi(%)
Si
ri(%)
qi(%)
S1
9.6
42
S9
33.6
53.3
S2
18.5
54
S10
36.8
40
S3
49.4
60
S11
11.8
31
S4
23.9
42
S12
9
5.5
S5
8.1
1.2
S13
35
46
S6
14
39
S14
9.4
5.3
S7
40.7
68
S15
15
23
S8
31.2
33.4
6.
作出题3数据的直方图,该数据服从正态分布还是威布尔分布?
程序如下:
1.
normcdf(3,2,0.5)
normcdf(2,2,0.5)-normcdf(1,2,0.5)
2.
normspec([-1,3],2,2)
3.
a=[459362624542509584433748815505612452434982640742565706593680
9266531644877346084281153593844527552513781474388824538862659
775859755649697515628954771609402960885610292837473677358638
699634555570844166061062484120447654564339280246687539790581
621724531512577496468499544645764558378765666763217715310851];
b=a(:
);
T=[mean(b),median(b),trimmean(b,10),geomean(b),
harmmean(b),range(b),var(b),std(b),iqr(b),mad(b)]
4.
a=[459362624542509584433748815505612452434982640742565706593680
9266531644877346084281153593844527552513781474388824538862659
775859755649697515628954771609402960885610292837473677358638
699634555570844166061062484120447654564339280246687539790581
621724531512577496468499544645764558378765666763217715310851];
x=sort(a(:
))
5.
x=[9.6,18.5,49.4,23.9,8.1,14,40.7,31.2,33.6,36.8,11.8,9,35,9.4,15];
y=[42,54,60,42,1.2,39,68,33.4,53.3,40,31,5.5,46,5.3,23];
sx=skewness(x)
kx=kurtosis(x)
sy=skewness(y)
ky=kurtosis(y)
6.
a=[459362624542509584433748815505612452434982640742565706593680
9266531644877346084281153593844527552513781474388824538862659
775859755649697515628954771609402960885610292837473677358638
699634555570844166061062484120447654564339280246687539790581
621724531512577496468499544645764558378765666763217715310851];
hist(a(:
),30);
normplot(a(:
))
实
验
结
果
分
析
1.
ans=
0.9772
ans=
0.4772
所以分布函数与概率密度函数值为
normcdf(3,2,0.5)=0.9772
normcdf(2,2,0.5)-normcdf(1,2,0.5)=0.4772
2.
正态密度曲线如下:
3.
T=
1.0e+004*
Columns1through9
0.06000.06000.06010.05600.04990.10693.86630.01970.0244
Column10
0.0151
位置特征
计算结果
变异特征
计算结果
算术平均
600
极差
1069
中位数
599.5
方差
38663.03
切尾平均
600.64
标准差
196.629
几何平均
559.68
四分位极差
243.5
调和平均
499.06
平均绝对偏差
150.86
4.
x=
84
120
164
217
246
280
292
310
339
358
362
378
388
402
416
428
433
434
447
452
459
468
473
474
484
487
496
499
505
509
512
513
515
527
531
538
539
542
544
552
555
558
564
565
570
577
581
584
593
593
606
608
609
610
612
621
624
628
634
638
640
645
649
653
654
659
666
677
680
687
697
699
706
715
724
734
742
748
755
763
764
765
771
775
781
790
815
824
837
844
851
859
862
885
926
954
960
982
1062
1153
得到原数据从小到大的次序统计量,因为np为整数,故有:
下四分位数为:
Q1=(x(25)+x(26))/2=485.5
上四分位数为:
Q3=(x(75)+x(76))/2=729
四分位极差为:
R=243.5
数据的下、上截断点分别为:
Q1-1.5R=120.25,Q3+1.5R=1094.25
由此可知:
80,120,1153是异常值
5.
sx=
0.4624
kx=
1.8547
sy=
-0.4215
ky=
2.2506
sx=skewness(x)=0.4624,kx=kurtosis(x)=1.8547,
sy=skewness(y)=-0.4215,ky=kurtosis(y)=2.2506
从计算结果可知:
收益率是正偏,而风险损失率为负偏;二者峰度都小于3属于平阔峰.
6.
从直方图发现数据比较接近于正态分布,用命令normplot(a(:
))进行检验.
从图中可见数据点基本上都位于直线上,故可认为该数据服从正态分布,由于已经计算出该数据的均值为600,标准差为196.629,所以数据服从
结果分析:
写出上述实验中所需用到的Matlab命令,以及命令中应注意的问题
分布函数的命令为:
P=normcdf(x,mu,sigma)
已知X的均值和标准差及概率p=P{XX=norminv(P,MU,SIGMA)
算术平均
mean
极差
range
中位数
median
方差
var
切尾平均
trimmean
标准差
std
几何平均
geomean
四分位极差
iqr
调和平均
harmmean
平均绝对偏差
mad
n阶中心矩
峰度系数
偏度系数
变异系数
moment(x,n)
kurtosis(x)
skewness(x)
std(x)./abs(mean(x))
直方图的命令:
格式:
hist(data,k).
说明:
data是原始数据,该命令将区间(min(data),
概率纸检验函数的命令:
normplot(data)
成绩