聚类分析报告.docx

上传人:b****2 文档编号:610897 上传时间:2022-10-11 格式:DOCX 页数:7 大小:75.20KB
下载 相关 举报
聚类分析报告.docx_第1页
第1页 / 共7页
聚类分析报告.docx_第2页
第2页 / 共7页
聚类分析报告.docx_第3页
第3页 / 共7页
聚类分析报告.docx_第4页
第4页 / 共7页
聚类分析报告.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

聚类分析报告.docx

《聚类分析报告.docx》由会员分享,可在线阅读,更多相关《聚类分析报告.docx(7页珍藏版)》请在冰豆网上搜索。

聚类分析报告.docx

基于层次聚类分析的我国居民收入状况地区比较分析

摘要:

在国家统计局关于居民收入的统计指标基础上,采用层次聚类分析对我国各地区居民收入的状况进行了比较分析,并得出各主要聚类群。

在此基础上认为目前我国居民还是以工薪收入为主,各地区其他收入方面均有不同情况。

  关键词:

层次聚类分析居民收入地区比较

  

  一、引言

  

  目前,深化收入分配制度改革,增加城乡居民收入是我国综合实力发展所要解决的一个非常重要的问题。

党的十七大报告中明确指出:

“逐步提高居民收入在国民收入分配中的比重,提高劳动报酬在初次分配中的比重。

着力提高低收入者收入,逐步提高扶贫标准和最低工资标准,建立企业职工工资正常增长机制和支付保障机制。

创造条件让更多群众拥有财产性收入。

保护合法收入,调节过高收入,取缔非法收入。

扩大转移支付,强化税收调节,打破经营垄断,创造机会公平,整顿分配秩序,逐步扭转收入分配差距扩大趋势。

”为此,我们非常有必要按照居民收入的不同种类将收入状况趋同的地区进行分类,以找到解决当前面临的增加居民收入的突破口。

  

  二、模型选择

  

  层次聚类分析是一种多元数理统计方法。

它并没有事先设定样本分类的标准,而是通过对样本和变量数据的不同特征指标值进行差异程度计算,根据变量或样本间不同的差异程度大小重新结合分类,产生一个更有效的分类。

其优点在于可以对分类变量进行聚类,提供的距离测量方法和结果表示方法也非常丰富。

它的实现过程如下:

  1.由于本文所选用数据存在极大的量纲,所以必须进行无量纲化处理。

  2.将各组数据作为独立的一类(设为n类),按照所定义的距离计算各数据点之间的距离,形成一个距离阵。

  3.将距离最近的两组数据并为一类,从而形成n-1个类别,计算新产生的类别与其他各个类别之间的距离或者相似度,形成新的距离阵。

这种方法的思想来自于方差分析,使用该方法的目的是使得各个类别间的样本量尽可能接近。

  4.按照与第二步相同的原则,再将距离最接近的两个类别合并,一直重复该步骤直到所有数据被合并为一个类别为止。

  

  三、实证分析

  

  1.数据来源及说明。

按照国家统计口径的划分,将居民收入划分为四类:

工薪收入、经营性收入、财产性收入、转移性收入。

工资性收入指居民受雇于单位或个人,靠出卖劳动而获得的收入;经营收入指居民以家庭为生产经营单位进行生产筹划和管理而获得的收入;财产性收入指金融资产或有形非生产性资产的所有者向其他机构单位提供资金或将有形非生产性资产供其支配,作为回报而从中获得的收入;转移性收入指居民无须付出任何对应物而获得的货物、服务、资金或资产所有权等,不包括无偿提供的用于固定资本形成的资金。

一般情况下,是指居民在二次分配中的所有收入。

  以上所有指标数据,均来自《中国统计年鉴》原始数据或换算得到。

  2.结果解释。

根据模型实现过程,通过多次聚类可以得出谱系图(Dendrogram)。

由于篇幅限制,在此就不再逐步进行了,只给出最后结果。

在谱系图中,聚类的全过程可以直观的表现出来,它把类间的最大距离算做相对距离为25,其余的距离均换算成与之相比的相对距离大小。

  3.结果的验证和进一步说明。

以上是层次聚类分析产生的结果,但是我们发现通过上述分析还是很难确定如何将这31个省市分类。

为了确定分类的个数,我们需要对聚类结果进行进一步分析。

我们在确定分类过程中,总是希望能够进行“等分”,所以从表1中可以直观的看到,将31个省份分为四类相对合适,这个时候最大的类别和特点突出的类别都划分较为明确,适合进一步的分析。

  在确定各类别说之后,我们要进一步检验各个类别是否存在显著差异,以及各个类别具有怎么样的特征。

表2中可以看出,各个类别之间在各变量上都是有显著差异的,且这种差异具有统计意义。

原始数据

地区

工薪收入

经营性收入

财产性收入

转移性收入

北京

13666.34

213.7

190.44

5462.85

天津

8174.64

665.53

148.15

4574.99

河北

6346.53

643.84

117.46

2508.96

山西

7103.45

350.96

136.38

1947.77

内蒙古

6669.48

857.63

161.25

1876.78

辽宁

6103.41

486.03

65.6

3152.17

吉林

5905.86

712.86

80.7

2423.57

黑龙江

5478.03

858.68

72.97

2312.8

上海

14280.65

798.07

292.17

5232

江苏

8397.15

1028.69

240.4

3663.68

浙江

11941.09

1921.75

552.94

3461.58

安徽

6425.54

620.71

124.59

2013.71

福建

8791.56

839.36

447.98

3328.7

江西

6222.55

532.56

81.19

2206.16

山东

9026.55

492.12

151.86

1937.29

河南

6095.49

660.88

95.77

2293.83

湖北

6576.92

419.74

112.34

2286.09

湖南

6805.3

872.3

195.6

2232.87

广东

12265.04

1043.51

417.25

2524.09

广西

6975.39

519.87

176.13

2351

海南

6071.2

661.59

198.15

1739.21

重庆

7848.52

492.44

188.22

2549.97

四川

5838.27

515.49

211.41

2438.41

贵州

5516.18

790.84

90.25

1987.8

云南

6170.93

595.45

428.07

2800.2

西藏

10401.71

43.2

10.41

204

陕西

6347.81

179.34

135.15

2239.96

甘肃

6486.84

373.84

39.58

1837.84

青海

5613.79

513.41

62.08

2577.4

宁夏

5771.58

956.65

64.44

1952.2

新疆

6553.47

522.14

54.51

1563.54

  Spss数据分析

案例处理汇总a,b

案例

有效

缺失

总计

N

百分比

N

百分比

N

百分比

31

100.0

0

.0

31

100.0

a.平方Euclidean距离已使用

b.平均联结(组之间)

表示参与个数是31个

平均联结(组之间)

聚类表

群集组合

系数

首次出现阶群集

下一阶

群集1

群集2

群集1

群集2

1

14

16

40508.871

0

0

6

2

7

23

60828.655

0

0

7

3

24

30

94655.632

0

0

10

4

28

31

101895.842

0

0

11

5

17

27

112931.825

0

0

12

6

3

14

115410.224

0

1

12

7

7

29

120554.413

2

0

17

8

5

12

135731.590

0

0

11

9

18

20

167471.291

0

0

15

10

8

24

168928.065

0

3

17

11

5

28

213940.110

8

4

14

12

3

17

220310.717

6

5

18

13

6

25

271799.069

0

0

21

14

5

21

304649.784

11

0

18

15

4

18

327291.142

0

9

19

16

10

13

346706.154

0

0

23

17

7

8

361805.974

7

10

21

18

3

5

441178.767

12

14

19

19

3

4

599283.474

18

15

22

20

1

9

782505.788

0

0

28

21

6

7

919333.053

13

17

22

22

3

6

1102291.908

19

21

27

23

2

10

1537167.906

0

16

26

24

15

22

1764453.615

0

0

26

25

11

19

1773548.376

0

0

28

26

2

15

3556491.040

23

24

27

27

2

3

7290330.277

26

22

29

28

1

11

10695080.353

20

25

30

29

2

26

20612868.362

27

0

30

30

1

2

47318309.811

28

29

0

群集成员

案例

5群集

4群集

3群集

1:

北京

1

1

1

2:

天津

2

2

2

3:

河北

3

2

2

4:

山西

3

2

2

5:

内蒙古

3

2

2

6:

辽宁

3

2

2

7:

吉林

3

2

2

8:

黑龙江

3

2

2

9:

上海

1

1

1

10:

江苏

2

2

2

11:

浙江

4

3

1

12:

安徽

3

2

2

13:

福建

2

2

2

14:

江西

3

2

2

15:

山东

2

2

2

16:

河南

3

2

2

17:

湖北

3

2

2

18:

湖南

3

2

2

19:

广东

4

3

1

20:

广西

3

2

2

21:

海南

3

2

2

22:

重庆

2

2

2

23:

四川

3

2

2

24:

贵州

3

2

2

25:

云南

3

2

2

26:

西藏

5

4

3

27:

陕西

3

2

2

28:

甘肃

3

2

2

29:

青海

3

2

2

30:

宁夏

3

2

2

31:

新疆

3

2

2

表示假如分别分成5类4类3类,各成员分别是在哪一类

下面我们将主要根据树状图进行分析,由图可知如何对各城市分类。

  

四、结论

 

综合以上的分析

1.如果分为两类

第一类:

北京、上海、浙江、广东。

第二类:

其他城市。

2.如果分为三类城市

第一类:

北京、上海、浙江、广东。

第二类:

西藏

第三类:

其他城市。

3.如果分为四类城市

第一类:

北京、上海。

第二类:

浙江、广东。

第三类:

西藏。

第四类:

其他城市。

4.如果分为五类

第一类:

北京、上海。

第二类:

浙江、广东。

第三类:

西藏。

第四类:

江苏、福建、天津、重庆、山东。

第五类:

其他城市。

详细分析分为四类的情况

第一类:

北京、上海这两个城市的工薪收入明显高于其他城市,都是超过了13000,转移性收入也是各地区中最突出的,由此可以看出这两个地区的二次分配是相对较

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > 财会金融考试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1