SPSS因子分析和主成分分析论文.docx
《SPSS因子分析和主成分分析论文.docx》由会员分享,可在线阅读,更多相关《SPSS因子分析和主成分分析论文.docx(10页珍藏版)》请在冰豆网上搜索。
SPSS因子分析和主成分分析论文
SPSS因子分析和主成分分析论文
LT
新疆
147.72
284.41
422.80
1128.49
3067.12
7732.30
2108.15
275.61
49843.00
5884.50
三、数据分析过程
(一)相关性分析
用SPSS21.0数据处理系统将10项经济指标处理后,得到相关系数矩阵、巴特利特球度检验和KMO检验方法进行分析。
分析结果见表2和表3。
表2相关矩阵
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
X1
1
0.472
0.39
0.313
0.538
0.702
0.546
0.077
-0.505
0.403
X2
0.472
1
0.829
0.766
0.846
0.887
0.858
0.536
-0.163
0.772
X3
0.39
0.829
1
0.959
0.895
0.758
0.955
0.846
0.199
0.923
X4
0.313
0.766
0.959
1
0.905
0.718
0.923
0.886
0.315
0.951
X5
0.538
0.846
0.895
0.905
1
0.854
0.92
0.683
0.019
0.918
X6
0.702
0.887
0.758
0.718
0.854
1
0.86
0.378
-0.263
0.748
X7
0.546
0.858
0.955
0.923
0.92
0.86
1
0.764
0.034
0.953
X8
0.077
0.536
0.846
0.886
0.683
0.378
0.764
1
0.445
0.846
X9
-0.505
-0.163
0.199
0.315
0.019
-0.263
0.034
0.445
1
0.173
X10
0.403
0.772
0.923
0.951
0.918
0.748
0.953
0.846
0.173
1
根据表2原有变量的相关系数矩阵,可以看到:
大部分的相关系数都较均大于0.3,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表3KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.740
Bartlett的球形度检验
近似卡方
541.977
df
45
Sig.
.000
Bartlett检验的F值等于541.977,F值显著,Sig.(显著性)小于0.005,表明所取的数据满足正态总体分布;KMO值等于0.74,大于0.7,说明变量之间的相关性可以被其他变量解释,因此适合做因子分析。
(二)提取主因子
根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征值,得出公因子差和分析结果如下表4。
表4公因子差
初始
提取
X1
1.000
.768
X2
1.000
.826
X3
1.000
.959
X4
1.000
.983
X5
1.000
.923
X6
1.000
.918
X7
1.000
.973
X8
1.000
.886
X9
1.000
.843
X10
1.000
.944
从表中可以看出,10个变量的共同度基本都在80%以上,即这些变量的信息丢失较少,变量都能被因子解释,本次因子提取的总体效果较理想。
一般情况下,确定因子个数时,累计贡献率达到85%以上,本文提取特征值大于1的特征值,得到2个主因子代替原来的10个因子累计贡献率达90.22%,因此取出的2个主因子基本上包括了X1~X10的大量信息。
分析结果见表5。
表5解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
7.068
70.681
70.681
7.068
70.681
70.681
6.842
68.417
68.417
2
1.954
19.541
90.222
1.954
19.541
90.222
2.180
21.805
90.222
3
.397
3.971
94.193
4
.291
2.912
97.106
5
.122
1.221
98.327
6
.074
.743
99.070
7
.049
.485
99.555
8
.032
.323
99.878
9
.008
.078
99.956
10
.004
.044
100.000
由表5可知,第一个公因子的方差贡献率为70.681%,前两个公共因子的累计方差献率已达到90.22>85%,即前两个公共因子已代表了原始数据的绝大部分信息。
因子分析效果较理想。
在因子旋转后总的累计方差贡献率没有改变,没有影响到原有变量的共同度,但重新分配了各个因子解释原有变量的方差,改变了各因子的方差贡献,使得因子更易于理解。
图1
图1中,横坐标为因子数目,纵坐标为特征值。
可以看到:
第一个因子的特征值较高,对解释变量的贡献最大;第三个以后的因子特征值都较小,对解释原有变量的贡献很小,已经成为可被忽略的“高山脚下的碎石”,因此提取两个因子适合的。
(三)因子旋转及公因子命名
因为因子意义不明显,对初始因子进行旋转。
本文采用旋转因子模型的方法是方差最大正交旋转,旋转后,得到因子载荷矩阵(见表6)。
由旋转后的因子载荷矩阵可以看出,第1主因子第二产业增加值(X2)、第三产业增加值(X3)、地方财政预算收入(X4)、地方财政预算支出(X5)、社会消费品零售总额(X7)、货物进出口总额(X8)、城乡居民储蓄年末余额(X10)这7个指标上的载荷较大,集中反映了第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄这7个方面,因此将其定义为Fac1。
第2主因子在在岗职工平均工资(X9)这个指标上的载荷较大,因此,第2因子可定义为在岗职工工资Fac2。
这2个主因子的性质及其顺序较好地体现了影响我国各省、直辖市、自治区经济发展的因素,也完全符合社会经济发展的规律。
另外还可以看到:
这两个因子的实际含义比较模糊。
表6旋转后因子模型
成份
1
2
X1
.362
.798
X2
.815
.402
X3
.978
.051
X4
.989
-.062
X5
.923
.267
X6
.754
.591
X7
.957
.239
X8
.876
-.346
X9
-.261
.880
X10
.970
.060
(四)计算因子得分
为了考察各省、直辖市、自治区的经济发展状况,并对其进行分析和综合评价,采用回归法求出因子得分函数,由系数矩阵将2个主因子表示为10项指标的线性组合。
因子得分的函数为:
2个主因子分别从不同的方面反映了我国各省、直辖市、自治区经济发展状况,但单独使某一主因子并不能对我国各省、直辖市、自治区经济发展状况作出综合的评价,因此按各公因子对应的方差贡献率为权数计算综合统计量为:
通过计算可以得到综合因子得分,并对各城市的综合因子得分排序(见表7)。
表7主因子得分、综合因子得分及排名
地区
Fac1
名次
Fac2
名次
Fac
名次
北京
0.82
5
-2.70
7
-0.03
5
天津
-0.18
15
-1.21
16
-0.39
17
河北
0.12
11
1.23
3
0.35
8
山西
-0.54
22
-0.17
21
-0.41
24
内蒙古
-0.45
19
0.11
17
-0.28
20
辽宁
0.45
8
0.62
6
0.44
6
吉林
-0.62
23
0.14
29
-0.39
23
黑龙江
-0.63
24
1.07
4
-0.20
22
上海
0.79
6
-2.72
31
-0.05
14
江苏
2.39
2
0.25
14
1.69
2
浙江
1.05
4
-0.35
23
0.64
4
安徽
-0.07
14
0.50
8
0.06
11
福建
-0.02
13
0.24
15
0.04
12
江西
-0.43
18
0.32
13
-0.22
18
山东
1.67
3
1.76
1
1.53
3
河南
0.37
9
1.47
2
0.58
13
湖北
0.13
10
0.92
5
0.29
9
湖南
0.08
12
0.43
11
0.15
10
广东
3.04
1
-0.72
27
1.93
1
广西
-0.51
21
0.50
9
-0.24
19
海南
-1.15
30
-0.38
24
-0.87
28
重庆
-0.40
17
-0.29
22
-0.33
21
四川
0.49
7
0.44
10
0.43
7
贵州
-0.66
25
0.05
18
-0.44
25
云南
-0.45
20
0.60
30
-0.18
16
西藏
-1.12
28
-1.19
28
-1.02
31
陕西
-0.28
16
0.34
12
-0.12
15
甘肃
-0.91
27
0.01
19
-0.62
27
青海
-1.15
31
-0.61
25
-0.92
29
宁夏
-1.15
29
-0.66
26
-0.93
30
新疆
-0.71
26
-0.02
20
-0.49
26
从上述因子分析看第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄、在岗职工平均工资成为我国各省、直辖市、自治区2013年经济发展差异的主要解释成分,从统计意义上看,它们解释了这种差异90.22%的程度。
深入分析还可以得出因子中的第一产业、外贸是我国各省、直辖市、自治区发展的前提条件,反映地方财政收入与支出可以理解国家、地方实施西部大开策略的资金投入力度。
表7是由加权的最后因子得分表达式计算出的我国各省、直辖市、自治区的综合因子得分,从结果看,还是符合我国西部城市经济发展实际情况的。
第一主因子反映第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄方面,广东、江苏、山东排在前3位;第二主因子反映在岗职工平均工资方面,山东、河南、河北排在前3位。
2个主要因子的综合因子得分中,广东、江苏、山东、浙江、北京排在前5位,这也是中国各省、直辖市、自治区沿海经济发展较好的地区,这