matlab在统计数据描述性分析的应用Word格式文档下载.docx

资源描述

matlab在统计数据描述性分析的应用Word格式文档下载.docx

《matlab在统计数据描述性分析的应用Word格式文档下载.docx》由会员分享，可在线阅读，更多相关《matlab在统计数据描述性分析的应用Word格式文档下载.docx（10页珍藏版）》请在冰豆网上搜索。

matlab在统计数据描述性分析的应用Word格式文档下载.docx

若x为矩阵，返回结果m是行向量，它包含x每列数据的均值。

2）样本中位数

m=median（x）

若x为向量，返回结果m是x中元素的中位数；

若x为矩阵，返回结果m是行向量，它包含x每列数据的中位数

3）样本标准差

y=std（x）

若x为向量，返回结果y是x中元素的标准差；

若x为矩阵，返回结果y是行向量，它包含x每列数据的标准差

std（x）运用n-1进行标准化处理，n是样本的个数。

4）样本方差

语法：

y=var（x）;

y=var（x,1）

若x为向量，返回结果y是x中元素的方差；

若x为矩阵，返回结果y是行向量，它包含x每列数据的方差

var（x）运用n-1进行标准化处理（满足无偏估计的要求），n是样本的个数。

var（x,1）运用n进行标准化处理，生成关于样本均值的二阶矩。

5）样本的极差（最大之和最小值之差）

z=range（x）

返回结果z是数组x的极差。

6）样本的偏度

s=skewness（x）

说明：

偏度反映分布的对称性，s>

0称为右偏态，此时数据位于均值右边的比左边的多；

0,情况相反；

s接近0则可认为分布是对称的。

7）样本的峰度

k=kurtosis（x）

正态分布峰度是3，若k比3大得多，表示分布有沉重的尾巴，即样本中含有较多远离均值的数据，峰度可以作衡量偏离正态分布的尺度之一。

mean（data）,

ans=

81.8750

median（data）

79.5000

std（data）

6.7915

var（data）

46.1250

range（data）

skewness（data）

0.3218

k=kurtosis（data）

1.4217

作为研究杨树形状的一部分，测定20株杨树树叶，每个叶片测定了四个变量，

下表第一行为叶片长度，第二行为叶片2/3处宽，第三行为叶片1/3处宽，第四行为叶片1/2处宽，计算数据的平均数、标准差、方差、极差及偏度和峰度。

x=[10890130114113120879411590117134150140126118136145161155；

9595958587906766847560737364754355636460；

118117140113121122978811810384104110959659899112100；

11011012510811011488861069676929687905275849483]

mean（x'

）

122.150073.450099.750094.1000

median（x'

119.000073.0000103.500093.0000

std（x'

21.955214.716527.560216.7266>

var（x）,>

range（x）,>

skewness（x'

0.0064-0.0529-1.8406-0.4302

3、几个重要的概率分布

Matlab统计工具箱中有20种概率分布，主要的几种分布命令字符：

norm（正态分布），exp（指数分布），poiss（泊松分布），beta（B分布），weib（威布尔）,chi2（x2卡方分布），t（T分布），f（F分布）

对每一种分布都提供了5类函数，其函数命令的字符是：

pdf（概率密度），cdf（概率分布），inv（逆概率分布），stat（均值和方差），rnd（随机数生成）

当需要一种分布的某一类函数时，将以上所列的分布命令字符和函数命令的字符接起来，并输入自变量和参数就行了，例如

1）计算正态分布概率密度函数：

p=normpdf（x,mu,sigma）

计算均值mu、标准差sigma的正态分布在x点概率密度p=p（x）。

x=-6:

0.01:

y=normpdf（x）;

z=normpdf（x,0,2）;

plot（x,y,x,z）,gtext（'

N（0,1）'

）,gtext（'

N（0,2^2）'

）

x=0:

20;

y=chi2pdf（x,5）;

z=chi2pdf（x,10）;

chi2（5）'

chi2（10）'

y=fpdf（x,10,50）;

z=fpdf（x,10,5）;

F（10,50）'

F（10,5）'

2）计算正态分布的累积分布函数

Y=normcdf（X,musigma）

根据相应的均值mu和方差sigma计算X中每个值的正态分布的累积分布函数值。

P=normcdf

（2）-normcdf（-2）

0.9545

3）计算正态分布的逆累积分布函数

X=norminv（P,musigma）

根据相应的,mu和sigma计算正态分布中累积分布概率值为P的正态分布对应点。

P中的值必须位于[0，1]区间上。

x=norminv（0.5,0,1）

x=norminv（[0.0250.975],0,1）

-1.96001.9600

4）二项分布均值和方差

[m,v]=binostat（N,P）

返回二项分布的均值m和方差v

[m,v]=binostat（500,0.01）

4.9500

5）生成服从正态分布的随机数

R=normrnd（mu,sigma,m,n）

生成m*n形式的正态分布的随机矩阵。

R=normrnd（70,25,30,1）

59.1859

28.3604

73.1333

77.1919

41.3382

99.7729

99.7291

69.0592

78.1823

74.3660

65.3323

88.1448

55.2921

124.5796

66.5901

72.8483

96.6692

71.4820

67.6088

49.1913

77.3603

36.5955

87.8581

110.5891

52.7056

91.4499

101.3500

30.1568

33.9759

84.2787

4、了解EXCEL的假设检验功能

EXCEL：

工具→数据分析→描述统计

5、书上P52页例题用EXCEL做出轮廓图，雷达图

打开EXCEL>

输入数据包括变量名和样品名>

选定数据>

点击菜单栏的插入>

图表>

折线图（轮廓图）>

…

同法，可选雷达图等其他多元数据图示

6、用MATLAB做出调和曲线图

t=-pi:

pi/90:

pi;

f1=563.51/2.^（1/2）+227.78*sin（t）+147.76*cos（t）+235.99*sin（2*t）+510.78*cos（2*t）;

f2=678.92/2.^（1/2）+365.07*sin（t）+112.82*cos（t）+301.46*sin（2*t）+465.88*cos（2*t）;

f3=237.38/2.^（1/2）+174.48*sin（t）+119.78*cos（t）+141.07*sin（2*t）+245.57*cos（2*t）;

f4=253.41/2.^（1/2）+156.13*sin（t）+102.96*cos（t）+108.13*sin（2*t）+212.20*cos（2*t）;

plot（t,f1,'

r-'

t,f2,'

b-'

t,f3,'

y-'

t,f4,'

k-'

title（‘四个地区人均消费支出’）

7、做二元正态分布密度函数立体图

[x,y]=meshgrid（[-2:

0.1:

2]）;

z=1/2*pi*exp（-0.5*x.^2-0.5*y^2）;

plot3（x,y,z）;

或者>

mesh（x,y,z）;

surf（x,y,z）

title（`（X,Y）~N（0,0,1,1,0）立体图`）

gridon

展开阅读全文