多元统计分析实例讲解.docx

资源描述

多元统计分析实例讲解.docx

《多元统计分析实例讲解.docx》由会员分享，可在线阅读，更多相关《多元统计分析实例讲解.docx（23页珍藏版）》请在冰豆网上搜索。

多元统计分析实例讲解.docx

多元统计分析实例讲解

多元统计分析实例

院系:

商学院学号:

姓名:

多元统计分析实例

本文收集了2012年31个省市自治区的农林牧渔和相关农业数据,通过对对收集的数据进行比较分析对31个省市自治区进行分类.选取了6个指标农业产值林业产值.牧业总产值,渔业总产值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积.

数据如下表:

.聚类法

设定4个群聚,采用了系统聚类法.下表为spss分析之后的结果.

聚类表

阶

群集组合

首次出现阶群集

群集1

群集2

系数

群集1

群集2

下一阶

226.381

1715.218

1974.098

5392.690

6079.755

11120.902

21528.719

23185.444

26914.251

35203.443

50321.121

65624.068

114687.756

169600.075

188500.814

204825.463

268125.103

387465.457

425667.984

459235.019

499195.430

559258.810

708176.881

854998.386

1042394.608

1222229.597

1396048.280

1915098.014

3086204.552

6791755.637

RescaledDistanceClusterCombine

CASE0510152025

内蒙

吉林

云南

-+-+

江西

-++-+

陕西

-+-+|

新疆

-++-+

安徽

-+-+||

广西

-++-+++

辽宁

---+||

浙江

-++|

福建

-+|

重庆

-++

贵州

-+|

山西

-+---+|

甘肃

-+||

北京

-+||

青海

-+++

天津

-+|

上海

-+|

宁夏

-+---+

西藏

海南

河北

---++

四川

---+|

黑龙江

-+-+++

湖南

-++---+||

湖北

-+-++-++

广东

-+||

江苏

山东

河南

群集成员

案例

4群集

北京

天津

河北

山西

内蒙

辽宁

吉林

黑龙江

上海

10:

江苏

11:

浙江

12:

安徽

13:

福建

14:

江西

15:

山东

16:

河南

17:

湖北

18:

湖南

19:

广东

20:

广西

21:

海南

22:

重庆

23:

四川

24:

贵州

25:

云南

26:

西藏

27:

陕西

28:

甘肃

29:

青海

30:

宁夏

31:

新疆

从SPSS分析结果可以得到,内蒙,吉林,黑龙江,新疆为第2族群,这一族群的特点是农业收入可能不高,但是农民的固定资产,和耕地面积非常高,农民的富余程度或者机械化程度较高;山东是第3族群,这一族群中六个指标都处于较高水平农林牧渔四项收入都处于较高水平而且农民富余;西藏处于第4族群,这是因为,

西藏人员较少,自然条件恶劣,可使用耕地少,但是,由于国家的扶持,农民的固定资产较多,农民相对而言比较富足;大多数省份属于第1族群,这一族群的特点在于六项指标都没有较为突出的一项,或者农林牧渔收入的本来就少,或者是农民的虽然比较辛苦,总体的农业收入较高,但是农民的收入水平比较低,固定资产较少.

三.判别法

X1,X2,X3,X4,X5,X6分别代表农业产值,林业产值.牧业总产值,渔业总产

值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积

分析案例处理摘要

未加权案例

百分比

有效

100.0

排除的

缺失或越界组代码

至少一个缺失判别变量

缺失或越界组代码还有至少一

个缺失判别变量

合计

100.0

实验结果分析:

组统计量

AverageLinkage（BetweenGroups）

有效的N（列表状态）

均值

标准差

未加权的

已加权的

农业总产值

1463.8900

1062.03486

25.000

林业总产值

118.5768

87.02052

25.000

牧业总产值

830.3664

671.10440

25.000

渔业总产值

291.4128

346.71902

25.000

农村居民家庭拥有生产性固定

资产原值

14432.3400

5287.92950

25.000

农村居民家庭经营耕地面积

1.5496

.88484

25.000

农业总产值

1582.2975

543.92851

4.000

林业总产值

93.3500

37.71131

4.000

牧业总产值

1021.3175

372.88255

4.000

渔业总产值

38.3500

27.49067

4.000

农村居民家庭拥有生产性固定

资产原值

30226.4175

4233.77839

4.000

农村居民家庭经营耕地面积

9.4975

3.30626

4.000

农业总产值

3960.6200

1.000

林业总产值

107.0100

1.000

牧业总产值

2285.9200

1.000

渔业总产值

1267.0700

1.000

农村居民家庭拥有生产性固定

资产原值

19168.1400

1.000

农村居民家庭经营耕地面积

1.6400

1.000

农业总产值

53.3900

1.000

林业总产值

2.5600

1.000

牧业总产值

59.0200

1.000

渔业总产值

.2200

1.000

农村居民家庭拥有生产性固定

资产原值

52935.0700

1.000

农村居民家庭经营耕地面积

1.8900

1.000

从表上可以看出,组均值之间差值很大.各个分组,在6项指标上均值有较明显的差异.

组均值的均等性的检验

Wilks的Lambda

df1

df2

Sig.

农业总产值

.773

2.640

.070

林业总产值

.928

.699

.561

牧业总产值

.801

2.238

.107

渔业总产值

.691

4.019

.017

农村居民家庭拥有生产性固定

资产原值

.253

26.538

.000

组均值的均等性的检验

Wilks的Lambda

df1

df2

Sig.

农业总产值

.773

2.640

.070

林业总产值

.928

.699

.561

牧业总产值

.801

2.238

.107

渔业总产值

.691

4.019

.017

农村居民家庭拥有生产性固定

资产原值

.253

26.538

.000

农村居民家庭经营耕地面积

.190

38.263

.000

由表中可以知道,13456指标之间的sig值较小,2指标sig值有0.561较大,不过仍说明接受原假设,各指标族群间差异较大.

汇聚的组内矩阵

农业总产值

林业总产值

牧业总产值

渔业总产值