用spss分析我国各省城镇居民消费水平差异.docx

上传人:b****6 文档编号:3359168 上传时间:2022-11-22 格式:DOCX 页数:17 大小:78.23KB
下载 相关 举报
用spss分析我国各省城镇居民消费水平差异.docx_第1页
第1页 / 共17页
用spss分析我国各省城镇居民消费水平差异.docx_第2页
第2页 / 共17页
用spss分析我国各省城镇居民消费水平差异.docx_第3页
第3页 / 共17页
用spss分析我国各省城镇居民消费水平差异.docx_第4页
第4页 / 共17页
用spss分析我国各省城镇居民消费水平差异.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

用spss分析我国各省城镇居民消费水平差异.docx

《用spss分析我国各省城镇居民消费水平差异.docx》由会员分享,可在线阅读,更多相关《用spss分析我国各省城镇居民消费水平差异.docx(17页珍藏版)》请在冰豆网上搜索。

用spss分析我国各省城镇居民消费水平差异.docx

用spss分析我国各省城镇居民消费水平差异

用spss分析我国各省城镇居民消费水平差异分析

文章结构

 

1研究背景及意义

我国地域广阔,各省份的经济发展很不平衡,各省之间的居民消费水平差距较大。

经济快速发展的同时我国居民收入稳步增加,各省居民的消费支出也强劲增长,消费结构发生了巨大变化。

为了正确引导消费,进一步改善消费结构,提高我国城市居民的消费水平和生活的质量,有必要对全国各省居民消费结构之间的异同进行考察并做比较研究,以期发现经济水平和城市居民的消费水平之间的关系.

2研究方法

本文运用多元统计分析中的主成分分析方法和聚类分析方法,将描述各省份城镇居民全年现金消费支出的八个指标压缩成两个综合指标(称为主成分),这两个主成分保留了原始八个指标的绝大部分信息,在指标压缩的同时能够最大限度地反映出各省份城镇居民消费水平差异。

在综合因子基础上进行层次聚类分析,根据消费差异将全国31个省分为四类。

因子分析模型是根据变量间的相关性大小,把变量分组,利用同组内的变量之间相关性较高而不同组的变量之间相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。

因子分析的出发点是用较少的相互独立的因子变量来代替原来变量的大部分信息,可以通过下面的数学模型来表示:

X1=α11F1+α12F2+…+α1mFm+α1ε1,

X2=α21F1+α222+…+α2mFm+α2ε2,

Xp=αp1F1+αp2F2+…+αpmFm+αpεp,

其中:

x1,x2,x3,…,xp为p个原有变量,是均值为零、标准差为1的标准化变量;F1,F2,F3,…,Fm为m个因子变量,m小于p,表示成矩阵形式为

X=AF+αε,

其中:

F=(F1,F2,…,Fm)为因子变量或公共因子;ε=(ε1,ε2,…,εp)为特殊因子;F与ε均为不可观测的随机变量.A=(αij)p×m为因子载荷矩阵,αj称为第j个因子对第i个变量的载荷系数.在模型中,特殊因子起着残差的作用,被定义为彼此不相关且与公因子也不相关。

系统聚类分析的基本思想是认为所研究的样品(或指标)之间存在不同程度的相似性.把一些相似程度较大的样品(或指标)聚合为一类,把另外一些相似程度较大的样品(或指标)又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有样品都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。

利用SPSS中的聚类分析,以层次分析法结果中的因子得分为基础,在聚类分析中采用离差平方和法及欧氏平方距离对综合因子得分进行最优分割,将31个省按城市居民消费水平的高低分成4类。

3数据来源与数据处理

2012年我国“分地区城镇居民家庭平均每人全年现金消费支出”,来自于中国统计年鉴全国31个省、直辖市和自治区(港、澳、台不在其中)的城镇居民年平均现金消费支出的97项主要指标(单位:

元),指标代码和指标名称列于表1,原始数据列于表2。

表1指标名称及代码

指标代码

指标名称

指标代码

指标名称

X1

食品

X5

交通通讯

X2

衣服

X6

文教娱乐

X3

居住

X7

医疗保险

X4

家庭设备

表2原始数据

地区

X1

X2

X3

X4

X5

X6

X7

上海

9655.6

2111.17

1790.48

1906.49

4563.8

3723.74

1016.65

北京

7535.29

2638.9

1970.94

1610.7

3781.51

3695.98

1658.37

广东

8258.44

1520.59

2099.75

1467.2

4176.66

2954.13

1048.28

浙江

7552.02

2109.58

1551.69

1161.39

4133.5

2996.59

1228.02

天津

7343.64

1881.43

1854.22

1151.16

3083.37

2254.22

1556.35

江苏

6658.37

1915.97

1437.08

1288.42

2689.51

3077.76

1058.11

内蒙古

5463.18

2730.23

1583.56

1242.64

2572.93

1971.78

1354.09

福建

7317.42

1634.21

1753.86

1254.71

2961.78

2104.83

773.22

辽宁

5809.39

2042.4

1433.28

1069.65

2323.29

1843.89

1309.62

山东

5201.32

2196.98

1572.35

1125.99

2370.23

1655.91

1005.25

重庆

6870.23

2228.76

1177.02

1196.03

1903.24

1470.64

1101.56

吉林

4635.27

2044.8

1594.14

871.46

1780.67

1642.7

1447.5

陕西

5550.71

1789.06

1322.22

986.82

1788.38

2078.52

1212.44

安徽

5814.92

1540.66

1396.97

811.23

1809.72

1932.74

1142.96

湖南

5441.63

1624.57

1301.6

1034.3

2084.15

1737.64

918.41

湖北

5837.93

1783.41

1371.15

978.26

1476.98

1651.92

1029.55

四川

6073.86

1651.14

1284.09

1097.93

1946.72

1587.43

772.75

广西

5552.56

1146.46

1377.26

1125.39

2088.64

1626.05

883.56

河南

4607.47

1885.99

1190.81

1145.42

1730.35

1525.33

1085.47

宁夏

4768.91

1875.7

1193.37

929.01

2110.41

1515.91

1063.09

海南

6556.1

864.96

1521.04

777.2

2004.34

1319.54

993.24

新疆

5238.89

2031.14

1166.59

950.17

1660.27

1280.81

1027.6

河北

4211.16

1541.99

1502.41

876.1

1723.75

1203.8

1047.28

黑龙江

4687.23

1806.92

1336.85

742.22

1462.61

1216.56

1180.67

甘肃

4602.33

1631.4

1287.93

833.15

1575.67

1388.21

1049.65

山西

3855.56

1529.47

1438.88

832.52

1672.29

1506.2

905.88

云南

5468.17

1759.89

973.76

634.09

2264.23

1434.3

939.13

江西

5071.61

1476.63

1173.91

966.23

1501.34

1487.3

670.71

青海

4667.34

1512.24

1232.39

923.7

1549.76

1097.21

906.14

贵州

4992.85

1399

1013.53

849.94

1891.03

1396

654.53

西藏

5517.69

1361.57

845.18

474.69

1387.45

550.48

467.23

4.实证分析

4.1因子分析

表3描述统计量

均值

标准差

分析N

食品

5832.8094

1299.82194

31

衣服

1782.8135

388.89271

31

居住

1411.2358

283.12264

31

家庭设备

1042.3939

283.24540

31

交通通讯

2260.2768

861.61451

31

文教娱乐

1836.3910

739.15111

31

医疗保险

1048.6229

253.74984

31

食品、衣服等七个消费支出指标的描述性统计量,可以看出,食品支出消费所占的比重最大,其次是交通通讯。

在所有的消费支出中,医疗保险支出所占比重最小。

表4KMO和Bartlett的检验

取样足够度的Kaiser-Meyer-Olkin度量。

.698

Bartlett的球形度检验

近似卡方

187.287

df

21

Sig.

.000

表5公因子方差

初始

提取

食品

1.000

.865

衣服

1.000

.780

居住

1.000

.706

家庭设备

1.000

.829

交通通讯

1.000

.911

文教娱乐

1.000

.902

医疗保险

1.000

.844

提取方法:

主成份分析。

通过SPSS软件得出Bartlett值为21,P值<0.05,可考虑进行因子分析;KMO值为0.698,接近1,适合进行因子分析。

变量的绝大部分信息(70%以上)都可以被因子解释,这些变量信息丢失较少,本次因子提取的总体效果理想。

表6解释的总方差

成份

初始特征值

提取平方和载入

旋转平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

合计

方差的%

累积%

1

4.623

66.048

66.048

4.623

66.048

66.048

3.881

55.448

55.448

2

1.214

17.345

83.392

1.214

17.345

83.392

1.956

27.945

83.392

3

.563

8.042

91.435

4

.257

3.667

95.102

5

.148

2.109

97.211

6

.140

1.994

99.204

7

.056

.796

100.000

提取方法:

主成份分析。

第一个因子的特征根值为4.623,解释了原有8个变量总方差的55.448%,第二个因子的特征根值为1.214,解释了原有8个变量总方差的27.945,前两个因子的累计方差贡献率为83.392%,并且只有他们的取值大于1,说明前两个公因子基本上包含来全部变量的主要信息,选择前两个因子为主因子即可。

图1碎石图

碎石图横坐标为因子数目,纵坐标为特征根,可以看出第一个因子的特征值很高,对解释原油变量的贡献率极大,第二个以后的特征根值都很小,取值都小于1,说明他们对解释原有变量的共享率极小。

表7成份矩阵a

成份

1

2

文教娱乐

.944

-.101

交通通讯

.920

-.255

家庭设备

.902

-.120

居住

.840

-.008

食品

.823

-.434

医疗保险

.597

.698

衣服

.576

.670

提取方法:

主成份。

a.已提取了2个成份。

旋转前的因子载荷矩阵,从结果看,大部分因子解释性很好,但是仍有少部分指标解释能力较差。

如医疗保险和衣服在两个因子的载荷系数区别不大,因此接着采用因子旋转方法使得因子载荷系数向着0和1两极分化,使大的载荷更大,小的载荷更小,使结果更具有解释性。

表8旋转成份矩阵a

成份

1

2

交通通讯

.933

.203

食品

.930

.000

文教娱乐

.882

.351

家庭设备

.854

.315

居住

.747

.385

医疗保险

.202

.896

衣服

.197

.861

提取方法:

主成份。

旋转法:

具有Kaiser标准化的正交旋转法。

a.旋转在3次迭代后收敛。

旋转后因子载荷矩阵,因子载荷系数向着0和1两极分化,更有意义。

可以看出,第一个公因子主要反映了交通通讯、食品、文教娱乐、家庭设备和居住上有较大的载荷,说明第一个公因子主要反映这几方面的差异情况。

其中,差异大小排序依次为交通通讯>食品>文教娱乐>家庭设备>居住;第二个因子反映了在医疗保险和衣服上有较大的载荷,说明第二公因子主要反映医疗保险和衣服两方面的差异情况,其中医疗保险>衣服。

表9成份得分系数矩阵

成份

1

2

食品

.324

-.233

衣服

-.147

.546

居住

.164

.079

家庭设备

.219

.004

交通通讯

.274

-.093

文教娱乐

.220

.021

医疗保险

-.154

.569

提取方法:

主成份。

旋转法:

具有Kaiser标准化的正交旋转法。

构成得分。

根据表中的内容,可以写出以下因子得分函数:

F1=0.324*X1-0.147*X2+0.164*X3+0.219*X4+0.274*X5+0.220*X6-0.154*X7

F2=-0.233*X1+0.546*X2+0.079*X3+0.004*X4-0.093*X5+0.021*X6+0.569*X7

有了F1和F2的合理解释,可以将各省的相关数据代入因子模型中计算出各因子得分.同时,以各因子的方差贡献率占2个因子总方差贡献率的比重为权重加权汇总,得出各省的综合因子得分F,即F=0.55448F1+0.27945F2得到的各因子及综合因子的得分数值及排序见表.表中因子得分情况及其正负仅表示该城市与平均水平的相对位置。

表10因子及综合因子得分数值及排名

地区

F1

F1排名

F2

F2排名

F

F排名

上海

3.02862

1

-0.37344

21

1.57

1

北京

1.5295

3

2.31666

1

1.5

2

广东

2.37253

2

-0.78112

24

1.1

3

浙江

1.30964

4

0.4249

11

0.84

4

天津

0.75736

7

1.05422

4

0.71

5

江苏

0.85997

6

0.06022

14

0.49

6

内蒙古

-0.24202

15

2.10182

2

0.45

7

福建

1.25892

5

-1.06226

26

0.4

8

辽宁

-0.20651

14

0.9538

5

0.15

9

山东

-0.14855

12

0.62602

6

0.09

10

重庆

-0.18138

13

0.52346

8

0.05

11

吉林

-0.87617

29

1.57183

3

-0.05

12

陕西

-0.34483

17

0.45924

9

-0.06

13

安徽

-0.27165

16

-0.08056

18

-0.17

14

湖南

-0.11365

11

-0.4585

22

-0.19

15

湖北

-0.36402

18

0.02441

16

-0.2

16

四川

0.0731

10

-0.85478

25

-0.2

17

广西

0.19853

8

-1.20919

28

-0.23

18

河南

-0.67591

22

0.43522

10

-0.25

19

宁夏

-0.6658

21

0.29833

13

-0.29

20

海南

0.18502

9

-1.50236

30

-0.32

21

新疆

-0.79803

27

0.38729

12

-0.33

22

河北

-0.74658

26

0.01241

17

-0.41

23

黑龙江

-1.08771

31

0.57895

7

-0.44

24

甘肃

-0.83402

28

0.03426

15

-0.45

25

山西

-0.74158

24

-0.26244

19

-0.48

26

云南

-0.70268

23

-0.35135

20

-0.49

27

江西

-0.38569

19

-1.13609

27

-0.53

28

青海

-0.74245

25

-0.48647

23

-0.55

29

贵州

-0.45204

20

-1.35804

29

-0.63

30

西藏

-0.99194

30

-1.94644

31

-1.09

31

分析F1,上海、广东、北京具有较高的消费水平,公共因子得分为正的城市有10个城市,且都具有比较发达的经济发展水平,在经济发展到一定水平后,人们的消费理念也上升到了较高的层次。

黑龙江、西藏等经济欠发达的省份,居民的消费也会受到一定的制约。

居民在食品、交通通讯、家庭设备、居住和文教娱乐5个方面的消费水平与经济发展水平有密切的相关性。

分析F2,北京、内蒙古、吉林和天津等省市的消费水平高,西藏、海南、贵州和广西等地区消费水平低。

而上海、广东两个较为发达的省市排在第21、24位.这说明衣服和医疗保险等方面的消费水平与地区的经济水平虽然有一定的相关性,但也受其它因素的影响。

分析分析综合因子得分F,居民消费水平较高的是上海、北京、广东、浙江和天津等省市,较低的为西藏、贵州、青海和江西等省,得分为正的有11个省,说明各省城市居民消费水平发展不均衡。

4.2聚类分析

表11聚类表

群集组合

系数

首次出现阶群集

下一阶

群集1

群集2

群集1

群集2

1

19

20

.003

0

0

17

2

16

25

.005

0

0

3

3

16

22

.010

2

0

9

4

7

15

.020

0

0

11

5

23

27

.033

0

0

17

6

3

9

.046

0

0

22

7

12

30

.060

0

0

13

8

10

28

.080

0

0

18

9

16

18

.104

3

0

18

10

2

14

.137

0

0

15

11

7

17

.173

4

0

21

12

6

8

.211

0

0

16

13

12

13

.249

7

0

23

14

1

21

.313

0

0

28

15

2

26

.380

10

0

25

16

5

6

.456

0

12

22

17

19

23

.534

1

5

20

18

10

16

.620

8

9

23

19

4

11

.725

0

0

24

20

19

29

.857

17

0

21

21

7

19

1.050

11

20

26

22

3

5

1.289

6

16

27

23

10

12

1.550

18

13

27

24

4

24

1.856

19

0

25

25

2

4

2.655

15

24

28

26

7

31

3.456

21

0

29

27

3

10

4.498

22

23

29

28

1

2

6.219

14

25

30

29

3

7

8.444

27

26

30

30

1

3

16.162

28

29

0

Spss首先给出了进行系统聚类分析过程表,第一列列出了聚类过程的步骤号,第二列和第三列列出了某一步骤中那些省市进行了合并,例如从结果中可以看出,19和20首先被合并在一起。

第四列列出每一步骤的聚类系数,这一数值表示被合并的两个类别之间的距离大小,第五列和第六列表示参与合并的省市在第几步中第一次出现,0代表该记录是第一次出现在聚类过程中,第七列表示在这一过程中合并的类别,下一次将在第几步中与其他类进行再一次合并。

得到以下结果:

表12群集成员

案例

4群集

1:

北京

1

2:

内蒙古

2

3:

吉林

3

4:

天津

2

5:

辽宁

3

6:

山东

3

7:

黑龙江

4

8:

重庆

3

9:

陕西

3

10:

河南

3

11:

浙江

2

12:

新疆

3

13:

宁夏

3

14:

江苏

2

15:

甘肃

4

16:

湖北

3

17:

河北

4

18:

安徽

3

19:

山西

4

20:

云南

4

21:

上海

1

22:

湖南

3

23:

青海

4

24:

广东

2

25:

四川

3

26:

福建

2

27:

江西

4

28:

广西

3

29:

贵州

4

30:

海南

3

31:

西藏

4

图2树状图

第一类:

北京、上海

第二类:

内蒙古、天津、浙江、江苏、广东、福建

第三类:

吉林、辽宁、山东、重庆、陕西、河南、新疆、宁夏、湖北、安徽、湖南、四川、广西、海南

第四类:

黑龙江、甘肃、河北、山西、云南、青海、江西、贵州、西藏

为了进一步分析4大类省市在各个消费领域支出的变化情况,计算各类省市在各个消费领域的平均支

出。

表134大类省市在各个消费领域支出情况

地区

X1

X2

X3

X4

X5

X6

X7

第一类

支出

8595.445

2375.035

1880.71

1758.595

4172.655

3709.86

1337.51

比重

0.360701

0.099667

0.078923

0.073798

0.175102

0.155681

0.056128

第二类

支出

5722.438

1711.903

1363.402

1016.387

2573.515

2067.53

994.965

比重

0.370381

0.110802

0

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1