统计专业实验实验7因子分析和综合评价Word文档下载推荐.docx
《统计专业实验实验7因子分析和综合评价Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《统计专业实验实验7因子分析和综合评价Word文档下载推荐.docx(10页珍藏版)》请在冰豆网上搜索。
答:
因子分析和主成分分析有许多相似之处,但这两种模型又存在明显的不同。
两者均是降维、简化数据的分析方法。
主成分分析:
它的数学模型本质上是一种线性变换,是将原始坐标变换到变异程度大的方向上去,相当于从空间上转换观看数据的角度,突出数据的变异方向,归纳重要信息。
数学表达式:
因子分析:
从本质上看是从显在变量去“提炼”潜在因子的过程。
通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。
2.变量共同度和公因子的方差贡献率的数学形式?
变量共同度:
,即第行因子载荷的平方和,它描述的是全部公共因子对变量的总方差所做的贡献,反映了公共因子对变量的影响程度。
公因子的方差贡献率:
,即第列的因子载荷的平方和,表示同一公共因子对各个变量所提供的方差贡献之和,它是衡量每一个公共因子相对重要性的一个尺度。
实验运行程序、基本步骤及运行结果:
1.选择合适的分析变量
本实验是对2008年重庆市40个区县经济发展基本情况进行分析,分别从经济实力、工业化水平、经济潜在活力和效益三个层面对经济发展水平进行分析。
选取了10个指标:
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
地区生产总值(万元)
一般预算收入(万元)
农林牧渔业总 产 值(万元)
工业总产值(万元)
建筑业总产值(万元)
全社会固定资产投资(万元)
社会消费品零售总额(万元)
城乡居民储蓄
公路货运量(万吨)
城镇就业人员(万人)
2.进行因子分析
(1)选择Analyze→DataReduction→Factor,打开FactorAnalysis主界面,并将变量X1~X8,移入Variables框中;
(2)点击Descriptives按钮,选Coefficients复选框,输出相关系数;
选中KMOandBartlett’stestofsphericity复选框,检验因子分析的适用条件;
按Continue按钮返回主界面。
(3)点Extraction按钮,设置因子提取的选项。
选ScreePlot复选框,输出碎石图,按Continue按钮返回主界面。
(4)点Rotation按钮,设置因子旋转方法。
选Varimax复选框,选择方差最大化旋转方法,按Continue按钮返回主界面。
(5)单击Scores按钮,设置因子得分的选项。
选Displayfactorscorecoefficientmatrix显示因子得分函数系数矩阵,选Saveasvariable,保存因子得分,按Continue按钮返回主界面。
(6)点OK按钮开始因子分析过程。
得到的数据结果如下:
相关系数矩阵:
由相关系数矩阵看出各个变量之间存在较强的相关性,所以可以采用因子分析方法进行降维。
CorrelationMatrix
Correlation
1.000
.815
.090
.805
.929
.809
.896
.940
.535
.932
-.128
.715
.779
.836
.862
.840
.508
.804
-.097
.047
.085
-.149
-.016
.049
-.030
.831
.612
.659
.531
.721
.835
.838
.874
.461
.911
.699
.744
.605
.764
.970
.416
.913
.448
.939
.484
KMOandBartlett'
sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.821
Bartlett'
sTestofSphericity
Approx.Chi-Square
568.556
df
45
Sig.
.000
可以看到变量共同度都很高,表面因子对变量的影响程度高。
Communalities
Initial
Extraction
.945
.832
.937
.889
.819
.879
.410
.897
特征根与方差贡献率:
有两个因子的特征值超过1,且前两个的累积方差贡献率已经超过了百分之八十,因此应该提取两个因子。
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
RotationSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
1
7.107
71.074
71.071
2
1.088
10.885
81.959
1.089
10.888
3
.792
7.920
89.879
4
.466
4.657
94.536
5
.279
2.792
97.328
6
.116
1.158
98.486
7
.060
.602
99.088
8
.598
99.686
9
.017
.168
99.854
10
.015
.146
100.000
因子载荷矩阵本实验中旋转前后得到的因子载荷阵中个系数都有明显的两极分化。
第一个公共因子在指标上有较大载荷,说明这个9个指标有较强的相关性,可归为一类,他们都属于衡量经济发展水平的正向指标。
第二个公共因子在上有较大载荷,单独一类。
农业产值随经济发展水平的提高,会减少,它属于逆向指标。
ComponentMatrixa
.968
.092
.902
-.133
-.023
-.010
.941
.891
.159
.916
-.199
-.056
.229
.946
-.041
RotatedComponentMatrixa
.086
.901
-.139
-.015
.053
.892
.153
.915
-.205
-.063
.599
.225
-.048
因子转换矩阵:
若用表示旋转前的因子载荷阵,用表示因子转换矩阵,用表示旋转后的因子载荷阵,则有:
ComponentTransformationMatrix
-.007
.007
因子得分系数矩阵:
根据每个观测值的各因子的的分数,可以将旋转后的因子得分表达式写成:
ComponentScoreCoefficientMatrix
.137
.084
.126
-.123
.003
.118
.133
.054
.128
-.183
.132
-.053
.210
-.039
(7)分析各公因子的含义,并进行命名。
:
非农业因子(反映的是除农业以外的正向经济指标)
农业因子(反映的是农业总产值经指标)
(8)使用Compute命令计算综合因子得分,以特征值为各公因子的权数。
刚刚已经将因子得分作为新变量保存在数据文件中,变量名分别为fact_1、fact_2,现在可以直接使用。
Transform->
ComputeVariables,调出计算界面,目标变量命名为“综合因子得分”,将上面的公式带入,计算得到各个区县的综合得分。
对分数进行排序,得到最终结果如下:
区县
因子1得分
因子2得分
综合得分
排序
渝北区
2.294
0.619
2.071
大足县
-0.446
0.577
-0.310
21
九龙坡区
2.428
-0.942
1.980
潼南县
-0.509
0.608