完整版多元统计分析实例汇总.docx

上传人:b****8 文档编号:30537297 上传时间:2023-08-16 格式:DOCX 页数:27 大小:67.19KB
下载 相关 举报
完整版多元统计分析实例汇总.docx_第1页
第1页 / 共27页
完整版多元统计分析实例汇总.docx_第2页
第2页 / 共27页
完整版多元统计分析实例汇总.docx_第3页
第3页 / 共27页
完整版多元统计分析实例汇总.docx_第4页
第4页 / 共27页
完整版多元统计分析实例汇总.docx_第5页
第5页 / 共27页
点击查看更多>>
下载资源
资源描述

完整版多元统计分析实例汇总.docx

《完整版多元统计分析实例汇总.docx》由会员分享,可在线阅读,更多相关《完整版多元统计分析实例汇总.docx(27页珍藏版)》请在冰豆网上搜索。

完整版多元统计分析实例汇总.docx

完整版多元统计分析实例汇总

多元统计分析实例

院系:

商学院

学号:

姓名:

 

多元统计分析实例

本文收集了2012年31个省市自治区的农林牧渔和相关农业数据,通过对对

收集的数据进行比较分析对31个省市自治区进行分类.选取了6个指标农业产值,

林业产值.牧业总产值,渔业总产值,农村居民家庭拥有生产性固定资产原值,农

村居民家庭经营耕地面积.

数据如下表:

地区农业总产值林业总产■{牧业总产■{渔业总产侬村居民家庭拥有生产性匡

京津北西蒙宁林龙海苏江徽建西东南北南东西南庆川州南藏西肃海夏疆

北天河山内辽吉黒上江浙安福江山河湖湖广广海重四贵云西陕甘青宁新

166.29

54,33

154.16

12.98

12?

67.09

0.5

195.99

2.7S

105.01

61.66

1Y508.57

1.58

3095.29

77,3S

1747.66

177.74

1V904.83

L39

34?

.41

79.0?

293.E3

&42

^SOS.38

Z5

1171.^7

57.7G

iiis.es

戈&OS

加宪9.旳

10.4

1539-65

128.68

162L23

618.74

24997.92

3.TS

1166.E3

90.1

1130.3G

34.14

24937.06

S.27

2315.64

134.5

1350.63

92

31507.91

IM56

171.43

9.55

72.59

57.45

4L46.13

0.26

2966.72

99.75

1226.13

1235.4

14541.03

L35

1229.3&

142.L4

549・01

637.05

22747.83

0.54

1867.G4

209.5

1119.73

334.43

1E134.35

1.39

1263.71

256.45

^81.23

903.36

11S21.38

(X?

3

1003.21

22S.91

7S2.es

333.06

gggg.3i

1.57

3960.62

107*01

2285.22

12G7.07

mea.iq

L64

3958.95

140.85

2255.ei

86.4

12980.72

1.62

2438.06

100.05

1334.04

626.23

10313.13

LT1

2S51.^9

259.97

1483.E8

即994

8904.32

1.22

2229.2T

222,74

1134,14

914,05

S516.72

0.53

1724

245.56

1072.77

331.74

11851.56

1.37

460.72

137.35

214.14

236.27

113S7.05

0.33

341.S1

43胡S

4539

躬.99

12295.T4

L29

2764.9

151.5

2269.E5

153.77

13759.17

1.14

364.S&

541勺

^21.55

2&21

11957.31

LIS

1398.IT

225.S3

912.9?

63.1

IWO.92

1.6

53.39

2.5B

59.02

0.22

52935.OT

L39

1526.23

58.44

593.72

14”61

12273.06

1.52

9S4.24

20.07

231.72

1.8

1948E・44

2.72

117.09

4.5?

137.03

a56

21919.铀

L33

240.4&

9.77

105.72

13.36

24265.19

3・69

1675

43.04

^85.37

15.26

35070.31

5*76

.聚类法

 

设定4个群聚,采用了系统聚类法.下表为SPSS分析之后的结果.

聚类表

群集组合

首次出现阶群集

群集1

群集2

系数

群集1

群集2

下一阶

1

5

7

226.381

0

0

13

2

2

9

1715.218

0

0

C

J

3

22

24

1974.098

0

0

7

4

1

29

5392.690

0

0

6

5

2

30

6079.755

2

0

6

6

1

2

11120.902

4

5

8

7

4

22

21528.719

0

3

11

8

1

26

23185.444

6

0

14

9

12

20

26914.251

0

0

19

10

27

31

35203.443

0

0

20

11

4

28

50321.121

7

0

22

12

11

13

65624.068

0

0

24

13

5

25

114687.756

1

0

17

14

1

21

169600.075

8

0

22

15

8

18

188500.814

0

0

21

16

17

19

204825.463

0

0

21

17

5

14

268125.103

13

0

20

18

3

23

387465.457

0

0

26

19

6

12

425667.984

0

9

23

20

5

27

459235.019

17

10

23

21

8

17

499195.430

15

16

25

22

1

4

559258.810

14

11

28

23

5

6

708176.881

20

19

24

24

5

11

854998.386

23

12

28

25

8

10

1042394.608

21

0

26

26

3

8

1222229.597

18

25

29

27

15

16

1396048.280

0

0

29

28

1

5

1915098.014

22

24

30

29

3

15

3086204.552

26

27

30

30

1

3

6791755.637

28

29

0

 

10

152025

Label

Num

^^"—————————+—————————+—————————+—————————+—————————^^"

 

 

内蒙

5

-+

吉林

7

-+

云南

25

-+-+

江西

14

-++-+

陕西

27

-+-+|

新疆

31

-++-+

安徽

12

-+-+11

广西

20

—++—++———————+

辽宁

6

---+||

浙江

11

-+——+|

福建

13

-+1

重庆

22

-++

贵州

24

-+1

山西

4

-+—+|

甘肃

28

-+||

北京

1

-+||

青海

29

-+++

天津

2

-+1

上海

9

-+1

宁夏

30

-+—+

西藏

26

-+

海南

21

-+

河北

3

———+—————^^"

四川

23

+|

黑龙江

8

-+-++

湖南

18

-++---+|

湖北

17

-+-++-+

广东

19

-+||

江苏

10

+

山东

15

+

河南

16

+

+

|

+,

|

|

+

群集成员

案例

4群集

1:

北京

1

2:

天津

1

3:

河北

1

4:

山西

1

5:

内蒙

2

6:

辽宁

1

7:

吉林

2

8:

黑龙江

2

9:

上海

1

10:

江苏

1

11:

浙江

1

12:

安徽

1

13:

福建

1

14:

江西

1

15:

山东

3

16:

河南

1

17:

湖北

1

18:

湖南

1

19:

广东

1

20:

广西

1

21:

海南

1

22:

重庆

1

23:

四川

1

24:

贵州

1

25:

云南

1

26:

西藏

4

27:

陕西

1

28:

甘肃

1

29:

青海

1

30:

宁夏

1

31:

新疆

2

从SPSS分析结果可以得到,内蒙,吉林,黑龙江,新疆为第2族群,这一族群的特点是农业收入可能不高,但是农民的固定资产,和耕地面积非常高,农民的富余程度或者机械化程度较高;山东是第3族群,这一族群中六个指标都处于较高水平,

农林牧渔四项收入都处于较高水平而且农民富余;西藏处于第4族群,这是因为,

西藏人员较少,自然条件恶劣,可使用耕地少,但是,由于国家的扶持,农民的固定资产较多,农民相对而言比较富足;大多数省份属于第1族群,这一族群的特点在于六项指标都没有较为突出的一项,或者农林牧渔收入的本来就少,或者是农民的虽然比较辛苦,总体的农业收入较高,但是农民的收入水平比较低,固定资产较

三.判别法

Xi,X2,X3,X4,X5,X6分别代表农业产值,林业产值.牧业总产值,渔业总产

值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积.

分析案例处理摘要

未加权案例

N

百分比

有效

31

100.0

排除的

缺失或越界组代码

0

.0

至少一个缺失判别变量

0

.0

缺失或越界组代码还有至少一

个缺失判别变量

0

.0

合计

0

.0

合计

31

100.0

实验结果分析:

组统计量

AverageLinkage(BetweenGroups)

有效的N(列表状态)

均值

标准差

未加权的

已加权的

1

农业总产值

1463.8900

1062.03486

25

25.000

林业总产值

118.5768

87.02052

25

25.000

牧业总产值

830.3664

671.10440

25

25.000

渔业总产值

291.4128

346.71902

25

25.000

农村居民家庭拥有生产性固定

资产原值

14432.3400

5287.92950

25

25.000

农村居民家庭经营耕地面积

1.5496

.88484

25

25.000

2

农业总产值

1582.2975

543.92851

4

4.000

林业总产值

93.3500

37.71131

4

4.000

牧业总产值

1021.3175

372.88255

4

4.000

渔业总产值

38.3500

27.49067

4

4.000

农村居民家庭拥有生产性固定

资产原值

30226.4175

4233.77839

4

4.000

农村居民家庭经营耕地面积

9.4975

3.30626

4

4.000

3

农业总产值

3960.6200

1

1.000

林业总产值

107.0100

1

1.000

牧业总产值

2285.9200

1

1.000

渔业总产值

1267.0700

1

1.000

农村居民家庭拥有生产性固定

资产原值

19168.1400

1

1.000

农村居民家庭经营耕地面积

1.6400

1

1.000

4

农业总产值

53.3900

1

1.000

林业总产值

2.5600

1

1.000

牧业总产值

59.0200

1

1.000

渔业总产值

.2200

1

1.000

农村居民家庭拥有生产性固定

资产原值

52935.0700

1

1.000

农村居民家庭经营耕地面积

1.8900

1

1.000

从表上可以看出,组均值之间差值很大.各个分组,在6项指标上均值有较明

显的差异.

组均值的均等性的检验

Wilks的Lambda

F

df1

df2

Sig.

农业总产值

.773

2.640

3

27

.070

林业总产值

.928

.699

3

27

.561

牧业总产值

.801

2.238

3

27

.107

渔业总产值

.691

4.019

3

27

.017

农村居民家庭拥有生产性固定

资产原值

.253

26.538

3

27

.000

组均值的均等性的检验

Wilks的Lambda

F

df1

df2

Sig.

农业总产值

.773

2.640

3

27

.070

林业总产值

.928

.699

3

27

.561

牧业总产值

.801

2.238

3

27

.107

渔业总产值

.691

4.019

3

27

.017

农村居民家庭拥有生产性固定

资产原值

.253

26.538

3

27

.000

农村居民家庭经营耕地面积

.190

38.263

3

27

.000

由表中可以知道,13456指标之间的sig值较小,2指标sig值有0.561较大,

不过仍说明接受原假设,各指标族群间差异较大.

汇聚的组内矩阵

农业总产值

林业总产值

牧业总产值

渔业总产值

相关性

农业总产值

1.000

.449

.895

.400

林业总产值

.449

1.000

.489

.481

牧业总产值

.895

.489

1.000

.294

渔业总产值

.400

.481

.294

1.000

农村居民家庭拥有生产性固定

资产原值

-.093

-.262

-.052

-.040

农村居民家庭经营耕地面积

.056

-.033

.181

-.104

汇聚的组内矩阵

农村居民家庭拥

有生产性固定资

产原值

农村居民家庭经

营耕地面积

相关性

农业总产值

-.093

.056

林业总产值

-.262

-.033

牧业总产值

-.052

.181

渔业总产值

-.040

-.104

农村居民家庭拥有生产性固定

资产原值

1.000

.326

农村居民家庭经营耕地面积

.326

1.000

从表中可以知道,检验结果P值>0.05,此时,说明协方差矩阵相等,可以进

行bayes检验.

Fisher分析法

协方差矩阵的均等性的箱式检验

对数行列式

Average

Linkage(Between

Groups)

对数行列式

1

6

61.125

2

a

b

3

c

b

4

c

b

汇聚的组内

6

62.351

打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。

典型判别式函数摘要

特征值

函数

特征值

方差的%

累积%

正则相关性

1

4.874a

64.2

64.2

.911

2

2.084a

27.4

91.6

.822

3

.638a

8.4

100.0

.624

由表中看出,函数1,2的特征值达到0.911,0.822比较大,对判别的贡献大..

标准化的典型判别式函数系数

函数

1

2

3

农业总产值

.500

-.196

.000

林业总产值

.234

.164

-.742

牧业总产值

-.639

.143

.649

渔业总产值

-.185

-.130

.869

农村居民家庭拥有生产性

固定资产原值

.370

1.022

.071

农村居民家庭经营耕地面积

.865

-.676

.051

典型判别式函数系数

函数

1

2

3

农业总产值

.000

.000

.000

林业总产值

.003

.002

-.009

牧业总产值

.000

.000

.001

渔业总产值

.000

.000

.003

农村居民家庭拥有生产性固定资产原值

.000

.000

.000

农村居民家庭经营耕地面积

.626

-.489

.037

(常量)

-2.928

-2.269

-.975

典型判别式函数系数

函数

1

2

3

农业总产值

.000

.000

.000

林业总产值

.003

.002

-.009

牧业总产值

.000

.000

.001

渔业总产值

.000

.000

.003

农村居民家庭拥有生产性固定资产原值

.000

.000

.000

农村居民家庭经营耕地面积

.626

-.489

.037

(常量)

-2.928

-2.269

-.975

非标准化系数

由表中可知,

3个Fishe判别函数分别为:

农村居民家庭拥有生产性固定资产原值对判别数据所属群体无用.

结构矩阵

函数

1

2

3

农村居民家庭经营耕地面积

.909*

-.319

.126

农村居民家庭拥有生产

性固定资产原值

.585

.775*

.213

林业总产值

-.068

-.162*

-.027

渔业总产值

-.164

-.059

.695*

农业总产值

-.026

-.179

.591*

牧业总产值

.007

-.166

.547*

判别变量和标准化典型判别式函数之间的汇聚组间相关性

按函数内相关性的绝对大小排序的变量。

*.每个变量和任意判别式函数间最大的绝对相关性

该表是原始变量与典型变量(标准化的典型判别函数)的相关系数,相关系数的

绝对值越大,说明原始变量与这个判别函数的相关性越强.从表中可以看出相关

性较强.符合较好.

组质心处的函数

AverageLinkage(Between

Groups)

函数

1

2

3

1

-.859

-.159

-.170

2

5.184

-.860

.085

3

-1.262

.162

4.058

4

2.013

7.257

-.144

在组均值处评估的非标准化典型判别式函数

由上表可知各类别重心的位置,通过计算观测值与各重心的距离,距离最小的即为该观测值的分类.

贝叶斯分析法

分类函数系数

AverageLinkage(BetweenGroups)

1

2

3

4

农业总产值

.003

.006

.002

.003

林业总产值

.029

.042

-.010

.051

牧业总产值

-.003

-.009

.002

-.004

渔业总产值

-.002

-.004

.010

-.006

农村居民家庭拥有生产性

固定资产原值

.001

.001

.001

.002

农村居民家庭经营耕地面积

.153

4.286

-.100

-1.675

(常量)

-8.418

-38.180

-20.732

-61.646

分类函数系数

1

AverageLinkage(BetweenGroups)

该表为贝叶斯函数判别函数的取值,从图中可以知道三类贝叶斯函数.

 

第四类:

y4

0.003x10.051x20.004x30.006x40.002x51.675x661.646

将各样品的自变量值代入上述4个BayeS判别函数,得到函数值。

比较函数值,哪个函数值比较大就可以判断该样品判入哪一类判别结果检验

按照案例顺序的统计量

案例数

最高组

P(D>d|G=g)

实际组

预测组

P

df

初始

1

1

1

.684

3

2

1

1

.945

3

3

1

1

.724

3

4

1

1

.390

3

5

2

2

.961

3

6

1

1

.117

3

7

2

2

.533

3

8

2

2

.013

3

9

1

1

.172

3

10

1

3**

.585

3

11

1

1

.219

3

12

1

1

.975

3

13

1

1

.980

3

14

1

1

.699

3

15

3

3

1.000

3

16

1

1

.900

3

17

1

1

.313

3

18

1

1

.773

3

19

1

1

.468

3

20

1

1

.868

3

21

1

1

.742

3

22

1

1

.949

3

23

1

1

.672

3

24

1

1

.910

3

25

1

1

.268

3

26

4

4

1.000

3

27

1

1

.929

3

28

1

1

.568

3

29

1

1

.526

3

30

1

1

.182

3

31

2

2

.030

3

错误分类的案例

 

 

分类结果a

Average

Linkage(Between

Groups)

预测组成员

1

2

3

初始

计数

1

24

0

1

2

0

4

0

3

0

0

1

4

0

0

0

%

1

96.0

.0

4.0

2

.0

100.0

.0

3

.0

.0

100.0

 

从上图可以看出本次判别分析的结果比较贴近,只有第10统计量在分布上出现不

同.从总体而言,判别效果较好.

3.主成分分析

通过SPSS主成分统计分析,得到如下数据.

公因子方差

初始

提取

农业总产值

1

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1