SPSS因子分析实例操作步骤.docx
《SPSS因子分析实例操作步骤.docx》由会员分享,可在线阅读,更多相关《SPSS因子分析实例操作步骤.docx(12页珍藏版)》请在冰豆网上搜索。
SPSS因子分析实例操作步骤
SPSS因子分析实例操作步骤
实验目的:
引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:
以年份,合计(单位:
千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。
实验方法:
因子分析法
软件:
spss19.0
操作过程:
第一步:
导入Excel数据文件
1.opendatadocument——opendata——open;
2.Openingexceldatasource——OK.
第二步:
1.数据标准化:
在最上面菜单里面选中Analyze——DescriptiveStatistics——OK (变量选择除年份、合计以外的所有变量).
2.降维:
在最上面菜单里面选中Analyze——DimensionReduction——Factor ,变量选择标准化后的数据.
3.点击右侧Descriptive,勾选CorrelationMatrix选项组中的Coefficients和KMOandBartlett’stextofsphericity,点击Continue.
4.点击右侧Extraction,勾选ScreePlot和fixednumberwithfactors,默认3个,点击Continue.
5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的LodingPlot(s);点击Continue.
6.点击右侧Scores,勾选Method选项组中的Regression;勾选Displayfactorscorecoefficientmatrix;点击Continue.
7.点击右侧Options,勾选CoefficientDisplayFormat选项组中所有选项,将Absolutevalueblow改为0.60,点击Continue.
8.返回主对话框,单击OK.
输出结果分析:
1.描述性统计量
DescriptiveStatistics
N
Minimum
Maximum
Mean
Std.Deviation
农、林、牧、渔业
11
3.27
9.73
7.6645
1.97515
采矿业
11
.6
9.5
5.008
2.7092
制造业
11
.44
7.07
2.6900
2.22405
电力、热力、燃气及水生产和供应业
11
3.36
15.05
10.3545
3.22751
建筑业
11
1.79
23.51
7.8955
6.18302
批发和零售业
11
2.10
18.52
9.1018
5.50553
交通运输、仓储和邮政业
11
.82
8.39
2.7891
2.20903
ValidN(listwise)
11
该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
2.KMO和球形Bartlett检验
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.744
Bartlett'sTestofSphericity
Approx.Chi-Square
97.122
df
21
Sig.
.000
该表给出了因子分析的KMO和Bartlett检验结果。
从表中可以看出,Bartlett球度检验的概率p值为0.000,即假设被拒绝,也就是说,可以认为相关系数矩阵与单位矩阵有显著差异。
同时,KMO值为0.744,根据KMO度量标准可知,原变量适合进行因子分析。
3.因子分析的共同度
Communalities
Initial
Extraction
Zscore(农、林、牧、渔业)
1.000
.883
Zscore:
采矿业
1.000
.741
Zscore:
制造业
1.000
.974
Zscore(电力、热力、燃气及水生产和供应业)
1.000
.992
Zscore:
建筑业
1.000
.987
Zscore(批发和零售业)
1.000
.965
Zscore(交通运输、仓储和邮政业)
1.000
.935
ExtractionMethod:
PrincipalComponentAnalysis.
表格所示是因子分析的共同度。
表格第二列显示初始共同度,全部为1.000;第三列是按照提取3个公因子得到的共同度,可以看到只有“采矿业”的共同度稍低,说明其信息丢失量稍严重。
4.因子分析的总方差解释
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
RotationSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
3.079
43.992
43.992
3.079
43.992
43.992
2.660
37.999
37.999
2
2.353
33.608
77.600
2.353
33.608
77.600
2.346
33.517
71.516
3
1.046
14.941
92.541
1.046
14.941
92.541
1.472
21.025
92.541
4
.413
5.905
98.446
5
.098
1.399
99.845
6
.011
.152
99.997
7
.000
.003
100.000
ExtractionMethod:
PrincipalComponentAnalysis.
该表由3部分组成,分别为初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。
InitialEigenvalues部分描述了初始因子解的状况。
第一个因子的特征根为3.079,解释7个原始变量总方差的43.992%;第二个因子的特征根为2.353,解释7个原始变量总方差的33.608%,累计方差贡献率为77.600%;第三个因子的特征根为1.046,解释7个原始变量总方差的14.941%,累计方差贡献率为92.541%,也就是说,三个变量解释了所有7各变量的90%以上,且也只有这三个变量的特征值大于1。
ExtractionSumsofSquaredLoadings部分和RotationSumsofSquaredLoadings部分描述了因子提取后和旋转后的因子解。
从表中看出,有三个因子提取和旋转,其累计解释总方差百分比和初始解的前三个变量相同,但经旋转后的因子重新分配各个因子的解释原始变量的方差,使得因子的方差更接近,也更易于解释。
5.碎石图
利用因子分析的碎石图可以更加直观的发现最优因子的数量。
在碎石图中,横坐标表示因子数目,纵坐标表示特征根。
从图中可以看出,前三个因子的特征跟都很大,从第四个开始,因子的特征根都小于一,且连线变得较平缓,及前三个因子对解释变量的贡献最大,
6.旋转前的因子载荷矩阵
ComponentMatrixa
Component
1
2
3
Zscore(电力、热力、燃气及水生产和供应业)
.871
Zscore(交通运输、仓储和邮政业)
-.860
Zscore:
采矿业
.857
Zscore(农、林、牧、渔业)
.704
Zscore(批发和零售业)
.726
.569
Zscore:
建筑业
.687
.364
Zscore:
制造业
.600
.793
ExtractionMethod:
PrincipalComponentAnalysis.
a.3componentsextracted.
该表空白处表示相应载荷小于0.3。
因子载荷矩阵中给出每一个变量在三个因子上的载荷。
在旋转前的载荷矩阵中所有变量在第一个因子上的载荷都较高,即与第一个因子的相关程度较高,第一个因子解释了大部分变量的信息;而后面两个因子与原始变量的相关程度较小,对原始变量的解释效果不明显,没有旋转的因子的含义很难解释。
7.旋转后的因子载荷矩阵
RotatedComponentMatrixa
Component
1
2
3
Zscore(农、林、牧、渔业)
.899
Zscore(交通运输、仓储和邮政业)
-.716
-.3.41
Zscore:
采矿业
.771
.352
Zscore(电力、热力、燃气及水生产和供应业)
.749
.440
.441
Zscore:
建筑业
.985
Zscore(批发和零售业)
.961
Zscore:
制造业
.873
ExtractionMethod:
PrincipalComponentAnalysis.
RotationMethod:
VarimaxwithKaiserNormalization.
该表空白处表示相应载荷小于0.3。
因子载荷矩阵中给出每一个变量在三个因子上的载荷。
在旋转后的载荷矩阵中可以看出,与第一产业相关的产业在第一个因子上的载荷较高,与第二产业相关的产业在第二个因子上的载荷较高,与第三产业相关的产业在第三个因子上的载荷较高。
和没旋转相比,因子的含义清楚很多。
8.旋转空间的因子图
该图为可以看做是旋转后的载荷矩阵的图形表示。
从图中又一次验证了前面旋转后的载荷矩阵对因子的解释。
8.因子得分系数
ComponentScoreCoefficientMatrix
Component
1
2
3
Zscore(农、林、牧、渔业)
.445
.075
-.350
Zscore:
采矿业
.261
-.054
.093
Zscore:
制造业
-.180
.008
.761
Zscore(电力、热力、燃气及水生产和供应业)
.201
.182
.263
Zscore:
建筑业
-.074
.429
.156
Zscore(批发和零售业)
.071
.402
-.130
Zscore(交通运输、仓储和邮政业)
-.322
.204
.050
ExtractionMethod:
PrincipalComponentAnalysis.
RotationMethod:
VarimaxwithKaiserNormalization.
ComponentScores.
列出了采用回归法估算的因子得分系数,根据表中的内容可以写出因子得分函数
F1=0.445*Zscore1+0.261*Zscore2-0.180*Zscore3+0.201*Zscore4-0.074*Zscore5+0.071*Zscore6-0.322*Zscore7
F2=0.075*Zscore1-0.054*Zscore2+0.008*Zscore3+0.182*Zscore4-0.429*Zscore5+0.402*Zscore6-0.204*Zscore7
F3=-0.350*Zscore1+0.093*Zscore2+0.761*Zscore3+0.263*Zscore4+0.156*Zscore5-0.130*Zscore6+0.050*Zscore7
不仅如此,原数据文件中增加了变量FAC_1和FAC_2、FAC_3,表示3个因子在不同年份的得分值。
9.总因子得分及排序
附件:
原始数据:
标准化后的数据: