matlab与多元统计分析要点.docx

上传人:b****7 文档编号:9330756 上传时间:2023-02-04 格式:DOCX 页数:45 大小:157.01KB
下载 相关 举报
matlab与多元统计分析要点.docx_第1页
第1页 / 共45页
matlab与多元统计分析要点.docx_第2页
第2页 / 共45页
matlab与多元统计分析要点.docx_第3页
第3页 / 共45页
matlab与多元统计分析要点.docx_第4页
第4页 / 共45页
matlab与多元统计分析要点.docx_第5页
第5页 / 共45页
点击查看更多>>
下载资源
资源描述

matlab与多元统计分析要点.docx

《matlab与多元统计分析要点.docx》由会员分享,可在线阅读,更多相关《matlab与多元统计分析要点.docx(45页珍藏版)》请在冰豆网上搜索。

matlab与多元统计分析要点.docx

matlab与多元统计分析要点

Matlab与多元统计分析

胡云峰安庆师范学院

第三章习题

3.1对某地区的6名2周岁男婴的身高、胸围、上半臂进行测量。

得样本数据如表3.1所示。

假设男婴的测量数据X(a)(a=1,…,6)来自正态总体N3(,∑)的随机样本。

根据以往的资料,该地区城市2周岁男婴的这三项的均值向量0=(90,58,16)’,试检验该地区农村男婴与城市男婴是否有相同的均值向量。

表3.1某地区农村2周岁男婴的体格测量数据

男婴

身高(X1)cm

胸围身高(X2)cm

上半臂围身高(X3)cm

1

78

60.6

16.5

2

76

58.1

12.5

3

92

63.2

14.5

4

81

59

14

5

81

60.8

15.5

6

84

59.5

14

1.预备知识∑未知时均值向量的检验:

H0:

=0H1:

≠0

H0成立时

或者

拒绝

或者

接受

这里

2.根据预备知识用matlab实现本例题

算样本协方差和均值

程序x=[7860.616.5;7658.112.5;9263.214.5;8159.014.0;8160.815.5;8459.514.0];

[n,p]=size(x);

i=1:

1:

n;

xjunzhi=(1/n)*sum(x(i,:

));

y=rand(p,n);

forj=1:

1:

n

y(:

j)=x(j,:

)'-xjunzhi';

y=y;

end

A=zeros(p,p);

fork=1:

1:

n;

A=A+(y(:

k)*y(:

k)');

end

xjunzhi=xjunzhi'

S=((n-1)^(-1))*A

输出结果xjunzhi=

82.0000

60.2000

14.5000

S=

31.60008.04000.5000

8.04003.17201.3100

0.50001.31001.900

然后u=[90;58;16];

t2=n*(xjunzhi-u)'*(S^(-1))*(xjunzhi-u)

f=((n-p)/(p*(n-1)))*t2

输出结果t2=

420.4447

f=

84.0889

所以

=420.4447

=84.0889

查表得F3,3(0.05)=9.28<84.0889F3,3(0.01)=29.5<84.0889

因此在a=0.05或a=0.01时拒绝

假设

3.2相应于表3.1再给出该地区9名2周岁女婴的三项指标的测量数据如表3.2所示。

假设女婴的测量数据Y(a)(a=1,…,9)来自正态总体N3(,∑)的随机样本。

试检验2周岁男婴与女婴的均值是有无显著差异

表3.2某地区农村2周岁女婴体格测量数据

 

女婴

身高(X1)cm

胸围身高(X2)cm

上半臂围身高(X3)cm

1

80

58.4

14

2

75

59.2

15

3

78

60.3

15

4

75

57.4

13

5

79

59.5

14

6

78

58.1

14.5

7

75

58

12.5

8

64

55.5

11

9

80

59.2

12.5

1.预备知识

有共同未知协方差阵

成立的情况下且两样本独立

给定检验水平

,查

分布表,使

,可确定出临界值

,再用样本值计算出

,若

,则否定

,否则接受

2.根据预备知识用matlab实现本例题

由上一题知道

xjunzhi=

82.0000

60.2000

14.5000

Sx=

31.60008.04000.5000

8.04003.17201.3100

0.50001.31001.900

类似程序

xjunzhi=[82;60.2;14.5];

Sx=[31.68.040.5;8.043.17201.3100;0.51.311.9];

n=6;

y=[80.058.414.0;75.059.215;7860.315;75.057.413.0;7959.514.0;7858.114.5;7558.012.5;6455.511.0;8059.212.5];

[m,p]=size(y);

i=1:

1:

m;

yjunzhi=(1/m)*sum(y(i,:

));

z=rand(p,m);

forj=1:

1:

m

z(:

j)=y(j,:

)'-yjunzhi';

z=z;

end

B=zeros(p,p);

fork=1:

1:

m;

B=B+(z(:

k)*z(:

k)');

end

Sy=((m-1)^(-1))*B;

yjunzhi=yjunzhi'

S=(1/(n+m-2))*((n-1)*Sx+(m-1)*Sy)

得到结果yjunzhi=

76.0000

58.4000

13.5000

S=

27.23086.56152.8462

6.56152.43231.4000

2.84621.40001.8462

然后

t=((n*m)/(n+m))*((xjunzhi-yjunzhi)')*(S^(-1))*(xjunzhi-yjunzhi)

F=((n+m-p-1)/(p*(n+m-2)))*t

输出结果t=5.3117

F=1.4982

查表得F0.05(3,11)=3.59>1.4982F0.01(3,11)=6.22>1.4982

因此在a=0.05或a=0.01时接受

假设

第四章习题

4.1下表列举某年级任取12名学生的5门主课的期末考试成绩,试绘制学生序号为1、2、11、12的轮廓图、雷达图。

表4.1学生学习成绩

序号

政治

语文

外语

数学

物理

1

99

94

93

100

100

2

99

88

96

99

97

3

100

98

81

96

100

4

93

88

88

99

96

5

100

91

72

96

78

6

90

78

82

75

97

7

75

73

88

97

89

8

93

84

83

68

88

9

87

73

60

76

84

10

95

82

90

62

39

11

76

72

43

67

78

12

85

75

50

34

37

解我们只需要数据如下

1

99

94

93

100

100

2

99

88

96

99

97

11

76

72

43

67

78

12

85

75

50

34

37

1利用matlab画轮廓图

程序x=1:

5;

y1=[999493100100];

y2=[9988969997];

y3=[7672436778];

y4=[8575503437];

plot(x,y1,'k-o','linewidth',1);

holdon;

plot(x,y2,'r--*','linewidth',2);

holdon;

plot(x,y3,'b-.p','linewidth',2);

holdon

plot(x,y4,'k--o','linewidth',2);

xlabel('学科');ylabel('分数');

legend('1','2','11','12');

set(gca,'xtick',[12345])

set(gca,'xticklabel',{'政治','语文','外语','数学','物理'})

 

输出结果

2利用matlab画雷达图

此图用matlab画起来比较复杂

首先我们修改polar函数

在命令窗口输入editpolar结果会出现polar函数的程序

其中我们把

%plotspokes

th=(1:

6)*2*pi/12;

cst=cos(th);snt=sin(th);

cs=[-cst;cst];

sn=[-snt;snt];

line(rmax*cs,rmax*sn,'linestyle',ls,'color',tc,'linewidth',1,...

'handlevisibility','off','parent',cax)

修改为

%plotspokes

th=(1:

3)*2*pi/6;

cst=cos(th);snt=sin(th);

cs=[-cst;cst];

sn=[-snt;snt];

line(rmax*cs,rmax*sn,'linestyle',ls,'color',tc,'linewidth',1,...

'handlevisibility','off','parent',cax)

再将后面的所有程序中的30改为72

然后另存为work中并命名为mypolar.m

然后输入程序

x=[0:

pi/2.5:

2*pi];

y1=[99949310010099];

y2=[998896999799];

y3=[767243677876];

y4=[857550343785];

mypolar(x,y1,'b');

holdon;

mypolar(x,y2,'m');

holdon;

mypolar(x,y3,'g');

holdon;

mypolar(x,y4,'y')

legend('1','2','11','12');

输出结果

 

第五章聚类分析

习题5.3.下表给出我国历年职工人数(单位:

万人),请用有序样品的fisher法聚类。

年份

全民所有制

集体所有制

1952

1580

23

1954

1881

121

1956

2423

554

1958

4532

662

1960

5044

925

1962

3303

1012

1964

3465

1136

1966

3939

1264

1968

4170

1334

1970

4792

1424

1972

5610

1524

1974

6007

1644

1976

6860

1813

1978

7451

2048

1980

8019

2425

解第一步数据标准化后计算直径D

程序:

X=[158023;1881121;2423554;4532662;5044925;33031012;34651136;...

39391264;41701334;47921424;56101524;60071644;68601813;...

74512048;80192425];

stdr=std(X);

[n,m]=size(X);

X=X./stdr(ones(n,1),:

);

[np]=size(X);

D=zeros(n,n);

fori=1:

1:

n;

forj=1:

1:

n;

ifi

t=i:

1:

j;

xgjunzhi=(1/(j-i+1))*sum(X(t,:

));

y=zeros(1,j-i+1);

fors=i:

1:

j

y(s)=(X(s,:

)-xgjunzhi)*(X(s,:

)-xgjunzhi)';

end

s=i:

1:

j;

D(i,j)=sum(y);

else

D(i,j)=0;

end

end

end

D=D'

输出结果矩阵太大,所以用excel处理了一下

D=

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0.022567

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0.44898

0.24578

0

0

0

0

0

0

0

0

0

0

0

0

0

2.0632

1.3981

0.60024

0

0

0

0

0

0

0

0

0

0

0

0

3.9256

2.651

1.1802

0.11098

0

0

0

0

0

0

0

0

0

0

0

4.5022

3.0091

1.4238

0.56953

0.40862

0

0

0

0

0

0

0

0

0

0

5.179

3.4353

1.6648

0.82576

0.53831

0.02044

0

0

0

0

0

0

0

0

0

6.0823

4.021

1.976

1.023

0.63343

0.12781

0.047757

0

0

0

0

0

0

0

0

7.0311

4.6502

2.3255

1.2313

0.755

0.26341

0.11275

0.012456

0

0

0

0

0

0

0

8.3322

5.5762

2.9094

1.6045

1.0531

0.60619

0.33881

0.13122

0.060032

0

0

0

0

0

0

10.312

7.1034

4.0117

2.4126

1.7772

1.3793

0.92314

0.52664

0.31541

0.099401

0

0

0

0

0

12.696

8.9972

5.4422

3.5114

2.7548

2.3553

1.669

1.0457

0.65496

0.25632

0.03671

0

0

0

0

16.291

11.998

7.8688

5.5038

4.5686

4.1193

3.1032

2.1468

1.4707

0.77122

0.30858

0.12762

0

0

0

21.117

16.128

11.321

8.4298

7.2316

6.6487

5.2116

3.8312

2.7793

1.6877

0.8881

0.46016

0.10709

0

0

28

22.167

16.528

12.978

11.386

10.546

8.5596

6.627

5.0716

3.4539

2.1748

1.3443

0.59832

0.19951

0

我们只看下三角所有元素,其它元素理解为空

第二步我们计算损失函数矩阵L

程序:

%设计一个把样品分为两类的程序,以及对应最后一类分割点

D=D';

L=zeros(n-1,n-1);

alp=zeros(n-1,n-1);

form=2:

n;

s=zeros(1,m-1);

forj=2:

m

s(1,j-1)=D(1,j-1)+D(j,m);

end

L(m-1,1)=min(s(1,1:

m-1));

forj=1:

m-1

ifL(m-1,1)==s(1,j);

alp(m-1,1)=j+1;

end

end

end

%分为k类

fork=3:

n;

form=k:

n

s=zeros(1,m-k+1);

forj=k:

m;

s(1,j-k+1)=L(j-2,k-2)+D(j,m);

end

L(m-1,k-1)=min(s(1,1:

m-k+1));

forj=1:

m-k+1

ifL(m-1,k-1)==s(1,j);

alp(m-1,k-1)=j+k-1;

end

end

end

end

输出结果这里由于表太大,用excel处理一下

L=

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0.022567

0

0

0

0

0

0

0

0

0

0

0

0

0

0.44898

0.022567

0

0

0

0

0

0

0

0

0

0

0

0

0.55996

0.13355

0.022567

0

0

0

0

0

0

0

0

0

0

0

1.0185

0.55996

0.13355

0.022567

0

0

0

0

0

0

0

0

0

0

1.2747

0.5804

0.15399

0.043007

0.02044

0

0

0

0

0

0

0

0

0

1.472

0.68777

0.26136

0.15038

0.043007

0.02044

0

0

0

0

0

0

0

0

1.6803

0.82337

0.39696

0.16644

0.055464

0.032897

0.012456

0

0

0

0

0

0

0

2.0535

1.1662

0.71162

0.28521

0.16644

0.055464

0.032897

0.012456

0

0

0

0

0

0

2.8616

1.7797

0.92277

0.49636

0.26584

0.15486

0.055464

0.032897

0.012456

0

0

0

0

0

3.9604

1.9366

1.0797

0.65328

0.32192

0.20315

0.092174

0.055464

0.032897

0.01246

0

0

0

0

5.9528

2.3621

1.4747

1.0202

0.59379

0.32192

0.20315

0.092174

0.055464

0.0329

0.012456

0

0

0

8.7188

2.9416

2.0437

1.1868

0.76037

0.42901

0.31024

0.19927

0.092174

0.05546

0.032897

0.012456

0

0

alp=

2

0

0

0

0

0

0

0

0

0

0

0

0

0

3

3

0

0

0

0

0

0

0

0

0

0

0

0

4

4

4

0

0

0

0

0

0

0

0

0

0

0

4

4

5

5

0

0

0

0

0

0

0

0

0

0

4

6

6

6

6

0

0

0

0

0

0

0

0

0

4

6

6

6

6

7

0

0

0

0

0

0

0

0

4

6

6

6

8

8

8

0

0

0

0

0

0

0

4

6

6

8

8

8

8

9

0

0

0

0

0

0

4

6

8

8

10

10

10

10

10

0

0

0

0

0

4

10

10

10

10

10

11

11

11

11

0

0

0

0

4

10

10

10

11

11

11

12

12

12

12

0

0

0

4

11

11

11

11

13

13

13

13

13

13

13

0

0

10

11

13

13

13

13

13

13

14

14

14

14

14

0

10

12

13

14

15

15

15

15

15

15

15

15

15

15

在这里解释一下这两个矩阵行表示分为k类,k从2到15;列表示样本数m,m从2到15

我们只看下三角所有元素,其它元素理解为空,接下来我们根据结果分析

如果我们要把样品分为三类,则第一个分割点为11,然后第二个分割点为6

得到

第一类:

{1952,1954,1956,1958,1960}

第二类:

{1962,1964,1966,1968,1970}

第三类:

{1972,1974,1976,1978,1980}

第六章判别分析

例6.6对全国30个省市自治区1994年影响各地区经济增长差异的制度变量x1—经济增长率,x2—非国有化水平,x3—开放度,x4—市场化程度作贝叶斯判别分析。

类别

序号

地区

x1

x2

x3

x4

第一组

1

辽宁

11.2

57.25

13.47

73.41

2

河北

14.9

67.19

7.89

73.09

3

天津

14.3

64.74

19.41

72.33

4

北京

13.5

55.63

20.59

77.33

5

山东

16.2

75.51

11.06

72.08

6

上海

14.3

57.63

22.51

77.35

7

浙江

20

83.4

15.99

89.5

8

福建

21.8

68.03

39.42

71.9

9

广东

19

78.31

83.03

80.75

10

广西

16

57.11

12.57

60.91

11

海南

11.9

49.97

30.7

69.2

第二组

12

黑龙江

8.7

30.72

15.41

60.25

13

吉林

14.3

37.65

12.95

66.42

14

内蒙古

10.1

34.63

7.68

62.96

15

山西

9.1

56.33

10.3

66.01

16

河南

13.8

65.23

4.69

64.24

17

湖北

15.3

55.62

6.06

54.74

18

湖南

11

55.55

8.02

67.47

19

江西

18

62.85

6.4

58.83

20

甘肃

10.4

30.01

4.61

60.26

21

宁夏

8.2

29.28

6.11

50.71

22

四川

11.4

62.88

5.31

61.49

23

云南

11.6

28.57

9.08

68.47

24

贵州

84

30.23

6.03

55.55

25

青海

8.2

15.96

8.04

40.26

26

新疆

10.9

24.75

8.34

46.01

27

西藏

15.6

21.44

28.62

46.01

待判样品

28

江苏

16.5

80.05

8.81

73.04

29

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 天文地理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1