中国各地区农村居民家庭人均现金支出指标的聚类分析张楠Word下载.docx
《中国各地区农村居民家庭人均现金支出指标的聚类分析张楠Word下载.docx》由会员分享,可在线阅读,更多相关《中国各地区农村居民家庭人均现金支出指标的聚类分析张楠Word下载.docx(11页珍藏版)》请在冰豆网上搜索。
1172.9
203.3
699.5
69.9
1.2
1896.1
6.0
121.6
河北
2289.6
779.6
725.0
362.7
226.2
54.6
3.1
1361.7
14.9
130.3
山西
2080.9
500.0
441.3
254.4
126.3
58.7
0.7
1431.2
4.0
145.1
内蒙古
3338.7
1426.9
1223.5
865.7
316.6
1.7
1617.3
52.2
240.6
辽宁
3926.2
1671.2
1546.2
719.9
754.5
125.0
3.8
1803.7
38.7
408.9
吉林
4517.7
2129.9
1836.9
1404.1
393.3
293.1
5.1
1741.0
202.9
438.7
黑龙江
4424.6
2047.0
1812.2
1405.0
368.8
234.8
2.9
1699.1
301.8
373.9
上海
5487.1
241.3
229.9
37.3
32.6
11.4
0.1
4616.7
1.4
627.6
江苏
3412.9
632.1
561.8
236.1
137.5
70.3
12.8
2438.9
5.5
323.7
浙江
5437.2
1320.2
1192.4
159.4
724.4
127.8
3587.7
23.7
500.1
安徽
2390.0
554.9
490.7
297.2
116.7
64.2
1666.2
3.0
159.9
福建
3026.0
626.4
566.8
251.0
208.1
59.6
2168.2
10.8
219.8
江西
2199.8
680.6
591.7
339.7
160.4
89.0
4.5
1328.0
163.2
山东
3060.9
969.5
842.4
423.3
314.6
127.1
5.7
1885.7
16.7
183.3
河南
2163.8
583.9
523.9
237.1
228.8
60.0
0.6
1448.6
129.3
湖北
2222.2
677.5
601.9
266.8
195.9
75.6
3.9
1471.3
4.6
64.8
湖南
2418.9
555.8
497.8
196.7
175.2
58.0
1587.9
2.8
268.5
广东
2895.2
576.3
547.4
171.3
216.3
29.0
2155.6
9.5
152.0
广西
1900.9
697.4
589.5
348.5
187.6
107.9
1125.6
1.6
73.6
海南
1902.8
656.1
639.2
324.3
165.4
16.9
0.3
1187.2
2.1
57.1
重庆
1773.4
449.1
406.3
188.7
172.8
42.8
2.5
1107.3
0.9
213.5
四川
2514.5
612.8
533.5
178.0
270.7
79.3
6.1
1669.5
7.0
219.1
贵州
1432.8
412.5
324.7
167.7
122.2
87.7
846.3
1.0
171.6
云南
1837.1
623.0
532.9
277.2
185.6
90.1
1.5
1089.9
6.8
115.9
西藏
1022.3
203.9
92.3
53.2
8.8
111.5
0.2
800.7
17.5
陕西
2261.3
580.1
442.6
128.4
1496.8
175.9
甘肃
1622.3
473.2
391.2
298.3
74.4
82.0
1068.2
4.3
75.7
青海
1753.8
447.9
348.0
190.1
92.5
99.8
1196.5
7.4
100.3
宁夏
2592.8
1029.8
870.5
406.2
359.3
159.3
1325.6
31.3
205.8
新疆
2705.0
1444.4
1109.7
813.2
236.6
334.7
1126.0
44.4
89.2
表1中国2009年上半年各地区农村居民家庭人均现金支出指标值
注:
X1是期内现金支出指标,X2是生产费用支出指标,X3是家庭经营费用支出指标,X4是农业生产支出指标,X5是牧业生产支出指标,X6是购买生产性固定资产支出指标,X7是税费支出指标,X8是生活消费现金支出指标,X9是财产性支出指标,X10是转移性支出指标。
二、各地农村居民消费水平的聚类分析
(一)聚类分析的基本思想
聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类,当计算新类于其他类之间的距离,在选择相近的并类,每合并一次减少一类,继续这一过程,直到所有样本被合并成一类为止。
所以,聚类分析依赖于对观测值的接近程度(距离)或相似程度,为此须定义距离。
定义不同的距离和相似性量度会产生不同的聚类结果。
本文所定义的距离是系统聚类分析当中的常用方法——中间距离。
聚类分析分R型聚类分析和Q型聚类分析,前者用于指标分类,后者用于样本即个体聚类。
(二)聚类分析的相关理论
选取个样品,这个样品具有个不同数值的相同指标,计算出各指标的均值、标准差和极差,列表2如下:
指标
样品
…………
均值
标准差
极差
表2样品指标的均值、标准差和极差
其中,均值标准差。
对样品指标作标准化变换:
,,定义个样品间的距离欧氏距离,。
计算个样品间的距离,得样品间的距离矩阵。
开始个样品各自构成一类,这个类为此时类间距离就是样品间的距离。
合并类间距离最小的两类为一新类,此时类的总个数减少1类,计算新类与其他类间的距离,得到新的距离矩阵。
一直合并到类的总个数为1。
(三)聚类分析过程
本文的目的是把31个地区进行分类,反映不同地区消费水平的差异,把距离相近的归为一类。
本文利用SAS软件,选用中间距离来度量类与类之间的相似程度,聚类方法使用R型聚类分析。
其聚类程序如下:
dataZ;
inputgroup$X1-X10;
cards;
北京5318.9730.2606.4124.2232.5123.71.94093.223.5470.2
天津3267.81242.81172.9203.3699.569.91.21896.16.0121.6
河北2289.6779.6725.0362.7226.254.63.11361.714.9130.3
山西2080.9500.0441.3254.4126.358.70.71431.24.0145.1
内蒙古3338.71426.91223.5865.7316.6203.31.71617.352.2240.6
辽宁3926.21671.21546.2719.9754.5125.03.81803.738.7408.9
吉林4517.72129.91836.91404.1393.3293.15.11741.0202.9438.7
黑龙江4424.62047.01812.21405.0368.8234.82.91699.1301.8373.9
上海5487.1241.3229.937.332.611.40.14616.71.4627.6
江苏3412.9632.1561.8236.1137.570.312.82438.95.5323.7
浙江5437.21320.21192.4159.4724.4127.85.53587.723.7500.1
安徽2390.0554.9490.7297.2116.764.26.01666.23.0159.