基于SPSS因子分析在地区经济发展综合评价中的应用.docx
《基于SPSS因子分析在地区经济发展综合评价中的应用.docx》由会员分享,可在线阅读,更多相关《基于SPSS因子分析在地区经济发展综合评价中的应用.docx(43页珍藏版)》请在冰豆网上搜索。
基于SPSS因子分析在地区经济发展综合评价中的应用
基于SPSS因子分析在地区经济发展综合评价中的应用
一、研究背景与研究意义
地区经济是国民经济的基础层次,任何国家的地区经济发展失衡都会使其面临严峻的挑战。
而我国各地区由于各种原因,经济发展水平有较大差异,尽管我国地区经济发展的不平衡通常是地区经济快速发展的特征之一,但缩小和规避内部差异是地区经济一体化和地区可持续发展的关键。
促进地区经济的发展,需要对经济能力、稳定的专业化生产力和地区经济目标的新机遇有充分的理解。
这一认识是规划加强地区经济发展和竞争力必备的基础要素,这些因素包括:
人力资源、技术和创新、基础设施、管理、经营环境和市场定位。
导致地区发展不平衡的因素是多样化的,所以有必要用定量化的方法来进行评价并提出对策,从而正确选择重点投资区、实施重点地带(或城市)开发布局和带动战略。
这是促进我国经济持续发展、进一步缩小地区差异的重要途径之一,而对各地区经济进行综合评价是实现这一目标的科学参考和基本工作。
本文通过对《中国统计年鉴2007》中的我国各地区主要指标统计数据为依据,从地区经济实力水平、地区经济实力水平、产业结构、地区对外开放水平、地区文化教育和卫生水平、高等教育水平;、地区交通水平以及映地区环境保护水平等几个方面选取了28个指标,来反映我国地区经济发展水平的并应用因子分析方法对这些指标进行降维分析。
二、问题提出与变量选取
由于地区经济复合系统结构非常复杂,单靠一个或几个指标往往难以客观评估一个地区的经济发展水平,所以需要建立指标体系来描述系统的发展状况。
指标太少或过于简单不能反映可持续发展的内涵,指标过少会对评估结果的精度产生影响,指标过多和过于复杂则不利于评估工作的开展。
本文从衡量地区发展的各类指标中选取了28个指标,如表01所示。
表21变量符号及含义
序号
变量符号
变量含义
1
X1
人均GDP(元)
2
X2
固定资本形成总额(亿元)
3
X3
工业企业单位个数(个)
4
X4
第一产业生产总值占比
5
X5
第三产业生产总值占比
6
X6
地方财政收入(万元)
7
X7
财政支出(万元)
8
X8
人均粮食占有量(公斤)
9
X9
居民消费支出(亿元)
10
X10
平均货币工资(元)
11
X11
总人口(万人)
12
X12
城镇人口比例
13
X13
各地区国际旅游外汇收入(亿美元)
14
X14
入境旅游人数(万人次)
15
X15
外商投资企业年底注册登记投资总额(亿美元)
16
X16
高等学校数(所)
17
X17
每十万人口在校生数(人)
18
X18
普通高等学校教职工数(人)
19
X19
各地区图书馆数(个)
20
X20
图书馆总藏量(千册)
21
X21
卫生机构数(个)
22
X22
铁路营业里程(公里)
23
X23
交通运输业客运量(万人)
24
X24
交通运输业货运量(万吨)
25
X25
邮电业务总量(亿元)
26
X26
城市人口密度(人每平方公里)
27
X27
生活垃圾无害化处理率(%)
28
X28
工业废水排放达标量(万吨)
这里指标X2-X12主要是反映地区经济实力水平,X3-X5其中反映了产业结构;X13-X15主要是反映地区对外开放水平;X16-X21主要是反映地区文化教育和卫生水平,其中X16和X18反映了高等教育水平;X22-X25主要是反映地区交通邮电水平,从属于X5;X26-X28主要是反映地区环境保护水平。
三、原始数据收集
3.1原始数据来源
本文选取2007年我国31个省、直辖市及自治区的统计资料作为数据源。
统计数据来源于《中国统计年鉴2008》等。
统计数据见表附录
(一)各地区主要指标统计数据。
3.2数据标准化处理
为了消除变量间的量纲关系,从而使数据具有可比性,首先将原始数据进行标准化处理。
可以直接使用SPSS进行数据标准化处理,这里采用的是Z标准化,即使均值为0,方差为1。
标准化后的数据见标准化数据SAV文件。
四、因子分析
因子分析的目的是从众多指标中,抽取少数几个综合性指标来反映原指标所包含的主要信息。
用少数几个因子来描述众多指标之间的联系,并反映原始数据的大部分信息,通过公共因子的提取可以简化变量间的复杂关系。
因子分析的过程如下。
1.
2.
3.
4.
4.1变量相关性检验
因子分析的前提是变量间有较强的相关性。
因此,为确定变量是否适合做因子分析,即变量间是否有意义的关系,首先需要对变量进行相关性分析。
4.1.1相关系数矩阵
首先观察相关系数矩阵,这里仅列出前18个变量的相关系数矩阵,如图41所示:
相关矩阵
相关
ZX1
ZX2
ZX3
ZX4
ZX5
ZX6
ZX7
ZX8
ZX9
ZX10
ZX11
ZX12
ZX13
ZX14
ZX15
ZX16
ZX17
ZX18
…
.
.
.
.
.
.
…
ZX1
1.000
.408
.433
-.768
.562
.688
.499
-.417
.393
.743
-.077
.938
.689
.391
.633
.283
-.538
.403
ZX2
.408
1.000
.876
-.389
-.146
.844
.900
.010
.907
.035
.790
.294
.556
.518
.683
.827
-.244
.812
ZX3
.433
.876
1.000
-.432
-.041
.851
.800
-.222
.891
.156
.622
.316
.653
.628
.767
.672
-.137
.625
ZX4
-.768
-.389
-.432
1.000
-.351
-.598
-.441
.323
-.372
-.593
.024
-.717
-.571
-.371
-.480
-.296
.344
-.376
ZX5
.562
-.146
-.041
-.351
1.000
.234
.046
-.476
-.022
.814
-.372
.517
.459
.211
.203
-.100
-.209
.068
ZX6
.688
.844
.851
-.598
.234
1.000
.937
-.324
.911
.392
.556
.589
.884
.770
.888
.714
-.254
.727
ZX7
.499
.900
.800
-.441
.046
.937
1.000
-.117
.944
.171
.769
.403
.749
.699
.747
.845
-.252
.825
ZX8
-.417
.010
-.222
.323
-.476
-.324
-.117
1.000
-.165
-.503
.121
-.297
-.447
-.318
-.348
-.013
-.242
-.011
ZX9
.393
.907
.891
-.372
-.022
.911
.944
-.165
1.000
.094
.806
.304
.757
.782
.758
.822
-.104
.759
ZX10
.743
.035
.156
-.593
.814
.392
.171
-.503
.094
1.000
-.339
.626
.512
.256
.385
-.096
-.333
.046
ZX11
-.077
.790
.622
.024
-.372
.556
.769
.121
.806
-.339
1.000
-.168
.291
.414
.340
.841
.062
.720
ZX12
.938
.294
.316
-.717
.517
.589
.403
-.297
.304
.626
-.168
1.000
.645
.390
.576
.224
-.551
.355
ZX13
.689
.556
.653
-.571
.459
.884
.749
-.447
.757
.512
.291
.645
1.000
.910
.846
.482
-.137
.492
ZX14
.391
.518
.628
-.371
.211
.770
.699
-.318
.782
.256
.414
.390
.910
1.000
.742
.443
.081
.385
ZX15
.633
.683
.767
-.480
.203
.888
.747
-.348
.758
.385
.340
.576
.846
.742
1.000
.514
-.182
.522
ZX16
.283
.827
.672
-.296
-.100
.714
.845
-.013
.822
-.096
.841
.224
.482
.443
.514
1.000
-.217
.926
ZX17
-.538
-.244
-.137
.344
-.209
-.254
-.252
-.242
-.104
-.333
.062
-.551
-.137
.081
-.182
-.217
1.000
-.300
ZX18
.403
.812
.625
-.376
.068
.727
.825
-.011
.759
.046
.720
.355
.492
.385
.522
.926
-.300
1.000
Sig.单侧
ZX1
.011
.008
.000
.001
.000
.002
.010
.014
.000
.340
.000
.000
.015
.000
.061
.001
.012
ZX2
.011
.000
.015
.217
.000
.000
.478
.000
.425
.000
.054
.001
.001
.000
.000
.093
.000
ZX3
.008
.000
.008
.413
.000
.000
.114
.000
.201
.000
.042
.000
.000
.000
.000
.232
.000
ZX4
.000
.015
.008
.026
.000
.006
.038
.020
.000
.448
.000
.000
.020
.003
.053
.029
.019
ZX5
.001
.217
.413
.026
.102
.402
.003
.453
.000
.020
.001
.005
.127
.137
.296
.130
.358
ZX6
.000
.000
.000
.000
.102
.000
.038
.000
.014
.001
.000
.000
.000
.000
.000
.084
.000
ZX7
.002
.000
.000
.006
.402
.000
.265
.000
.178
.000
.012
.000
.000
.000
.000
.086
.000
ZX8
.010
.478
.114
.038
.003
.038
.265
.188
.002
.258
.052
.006
.040
.028
.472
.095
.476
ZX9
.014
.000
.000
.020
.453
.000
.000
.188
.307
.000
.048
.000
.000
.000
.000
.289
.000
ZX10
.000
.425
.201
.000
.000
.014
.178
.002
.307
.031
.000
.002
.082
.016
.303
.033
.402
ZX11
.340
.000
.000
.448
.020
.001
.000
.258
.000
.031
.183
.056
.010
.031
.000
.371
.000
ZX12
.000
.054
.042
.000
.001
.000
.012
.052
.048
.000
.183
.000
.015
.000
.112
.001
.025
ZX13
.000
.001
.000
.000
.005
.000
.000
.006
.000
.002
.056
.000
.000
.000
.003
.232
.002
ZX14
.015
.001
.000
.020
.127
.000
.000
.040
.000
.082
.010
.015
.000
.000
.006
.332
.016
ZX15
.000
.000
.000
.003
.137
.000
.000
.028
.000
.016
.031
.000
.000
.000
.002
.163
.001
ZX16
.061
.000
.000
.053
.296
.000
.000
.472
.000
.303
.000
.112
.003
.006
.002
.120
.000
ZX17
.001
.093
.232
.029
.130
.084
.086
.095
.289
.033
.371
.001
.232
.332
.163
.120
.050
ZX18
.012
.000
.000
.019
.358
.000
.000
.476
.000
.402
.000
.025
.002
.016
.001
.000
.050
……
图41相关系数矩阵
相关系数值越大表明两变量间相关性越强,较弱。
相关系数小于0.3时表明相关性较弱。
由上图看出,大部分相关系数为大于0.3,大部分单边检验值小于0.05,可以初步判定变量间有较强的相关性,适合做因子分析。
4.1.2KMO与Bartlett检验
下面进一步做KMO与Bartlett检验,进行变量相关性检验,检验结果如图42所示:
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.627
Bartlett的球形度检验
近似卡方
1372.245
df
378
Sig.
.000
图42KMO与Bartlett检验
由图看出,KMO度量值为0.627>0.5,样本大小达到要求,虽然度量值未达到0.7,属于较差的范围,但变量间仍存在共同因素,可以做因子分析。
同时,Bartlett球度检验中,近似卡方值为1372.245,显著水平值为0.000<0.005,达到显著性水平要求,表明相关系数矩阵与单位矩阵有显著差异,即原始变量间可能存在有意义的关系,可进一步做因子分析。
1.
2.
3.
4.
4.1.
4.2抽取因子
接下来抽取变量间的共同因子。
这里利用SPSS,采用常用的主成分法进行因子抽取。
所谓主成分法就是以较少的成分,解释原始变量方差较大的部分。
4.2.1公因子方差
首先得到公因子方差表,如图43所示:
公因子方差
初始
提取
Zscore(X1人均GDP(元))
1.000
.945
Zscore(X2固定资本形成总额(亿元))
1.000
.921
Zscore(X3工业企业单位个数)
1.000
.871
Zscore(X4第一产业生产总值占比)
1.000
.659
Zscore(X5第三产业生产总值占比)
1.000
.652
Zscore(X6地方财政收入(万元))
1.000
.984
Zscore(X7财政支出(万元))
1.000
.963
Zscore(X8人均粮食占有量(公斤))
1.000
.846
Zscore(X9居民消费支出(亿元))
1.000
.980
Zscore(X10平均货币工资(元))
1.000
.814
Zscore(X11总人口(万人))
1.000
.922
Zscore(X12城镇人口比例)
1.000
.875
Zscore(X13各地区国际旅游外汇收入(亿美元))
1.000
.965
Zscore(X14入境旅游人数(万人次))
1.000
.946
Zscore(X15外商投资企业年底注册登记投资总额(亿美元))
1.000
.821
Zscore(X16高等学校数(所))
1.000
.869
Zscore(X17每十万人口在校生数(人))
1.000
.841
Zscore(X18普通高等学校教职工数(人))
1.000
.804
Zscore(X19各地区图书馆数(个))
1.000
.867
Zscore(X20图书馆总藏量(千册))
1.000
.761
Zscore(X21卫生机构数(个))
1.000
.824
Zscore(X22铁路营业里程(公里))
1.000
.866
Zscore(X23交通运输业客运量(万人))
1.000
.863
Zscore(X24交通运输业货运量(万吨))
1.000
.764
Zscore(X25邮电业务总量(亿元))
1.000
.968
Zscore(X26城市人口密度(人每平方公里))
1.000
.890
Zscore(X27生活垃圾无害化处理率(百分比))
1.000
.797
Zscore(X28工业废水排放达标量(万吨))
1.000
.873
提取方法:
主成份分析。
图43公因子方差
公因子方差表示了变量中能够被公因子所解释的部分,公因子方差越大,变量能够被因子解释的程度越高。
公因子方差越大,变量能够被因子解释的程度越高。
表中大部分变量的公因子方差均大于0.8,各个变量丢失的信息都较少,因此本次因子分析的因子抽取效果较为理想。
4.2.2因子解释的总方差
进一步,通过因子解释的总方差,观察因子抽取的效果,如图44所示:
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
13.215
47.195
47.195
13.215
47.195
47.195
11.033
39.405
39.405
2
6.371
22.755
69.950
6.371
22.755
69.950
5.427
19.383
58.788
3
2.227
7.955
77.905
2.227
7.955
77.905
3.179
11.355
70.143
4
1.281
4.576
82.481
1.281
4.576
82.481
3.118
11.135
81.278
5
1.058
3.777
86.258
1.058
3.777
86.258
1.394
4.980
86.258
6
.817
2.917
89.176
7
.624
2.227
91.403
8
.464
1.657
93.060
9
.406
1.449
94.509
10
.323
1.154
95.663
11
.242
.866
96.529
12
.205
.731
97.260
13
.179
.641
97.900
14
.147
.523
98.424
15
.122
.434
98.858
16
.093
.331
99.189
17
.071
.254
99.443
18
.050
.180
99.623
19
.039
.139
99.763
20
.021
.076
99.839
21
.018
.064
99.903
22
.009
.032
99.935
23
.008
.028
99.964
24
.005
.019
99.982
25
.003
.010
99.992
26
.002
.006
99.998
27
.000
.001
99.999
28
.000
.001
100.000
提取方法:
主成份分析。
图44解释的总方差
特征值反映了每个变量在某一公因子上的因子负荷的平方总和,特征值大的因子将先被提取,从而以最少的因子量解释最大的变异信息量。
由上图看出,初始特征值大于1的因子有5个,累计贡献率为86.258%,即5个因子共解释了原始变量总信息量的86.258%,大于80%。
可以认为提取的5个公因子反映了原始变量的大量信息,有较好的解释能力。
4.3因子载荷矩阵及因子旋转
4.3.1原始因子载荷矩阵
原始因子载荷矩阵如图46所示:
成份矩阵a
成份
1
2
3
4
5
Zscore(X9居民消费支出(亿元))
.974
.094
.118
.020
-.090
Zscore(X7财政支出(万元))
.970
.056
-.081
.109
.021
Zscore(X6地方财政收入(万元))
.959
-.245
.006