SPSS因子分析法2Word格式.docx
《SPSS因子分析法2Word格式.docx》由会员分享,可在线阅读,更多相关《SPSS因子分析法2Word格式.docx(20页珍藏版)》请在冰豆网上搜索。
zi
ln%
112x2
点1
1m2x2
无论是哪一种因子分析方法,
其相应的因子解都不是唯一的,主因子解仅仅
是无数因子解中之一。
zi与zj相互无关;
z1是x1,x2,…,xp的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…的所有线性组合中方差最大者。
贝U,新变量指标z1,z2,…分别称为原变量指标的第一,第二,…主成分。
Z为因子变量或公共因子,可以理解为在高维空间中互相垂直的m个坐标
主成分分析实质就是确定原来变量xj(j=1,2,…,p)在各主成分zi(i=1,2,…,m)上的荷载lij。
从数学上容易知道,从数学上也可以证明,它们分别是相关矩阵的m个较
大的特征值所对应的特征向量。
分析步骤
第一步:
确定待分析的原有若干变量是否适合进行因子分析
r
♦j
(xki,)(■xj)
k1
因子分析是从众多的原始变量中重构少数几个具有代表意义的因子变量的过程。
其潜在的要求:
原有变量之间要具有比较强的相关性。
因此,因子分析需要先进行相关分析,计算原始变量之间的相关系数矩阵。
如果相关系数矩阵在进行统计检验时,大部分相关系数均小丁0.3且未通过检验,则这些原始变量就不太适合进行因子分析。
♦11
r12
♦1
p
R
r21
♦22
♦2
♦p1
♦p2
♦pp
n
又)2(xkjxj)2
进行原始变量的相关分析之前,需要对输入的原始数据进行标准化计算(一
股采用标准差标准化方法,标准化后的数据均值为0,方差为1)。
SPSS在因子分析中还提供了几种判定是否适合因子分析的检验方法。
主要有以下3种:
巴特利特球形检验(BartlettTestofSphericity)
反映象相关矩阵检验(Anti-imagecorrelationmatrix)
KMO(Kaiser-Meyer-Olkin)检验
(1)巴特利特球形检验
该检验以变量的相关系数矩阵作为出发点,它的零假设H0为相关系数矩阵是一个单位阵,即相关系数矩阵对角线上的所有元素都为1,而所有非对角线上的元素都为0,也即原始变量两两之间不相关。
巴特利特球形检验的统计量是根据相关系数矩阵的行列式得到。
如果该值较
大,且其对应的相伴概率值小丁用户指定的显著性水平,那么就应拒绝零假设H0,认为相关系数不可能是单位阵,也即原始变量问存在相关性。
(2)反映象相关矩阵检验
该检验以变量的偏相关系数矩阵作为出发点,将偏相关系数矩阵的每个元素取反,得到反映象相关矩阵。
偏相关系数是在控制了其他变量影响的条件下计算出来的相关系数,如果变
量之间存在较多的重叠影响,那么偏相关系数就会较小,这些变量越适合进行因子分析。
(3)KMO(Kaiser-Meyer-Olkin)检验
该检验的统计量用丁比较变量之间的简单相关和偏相关系数。
KMO值介丁0-1,越接近1,表明所有变量之间简单相关系数平■方和远大丁偏相关系数平方和,越适合因子分析。
其中,Kaiser给出一个KMO检验标准:
KMO>
0.9,非常适合;
0.8<
KMO<
0.9,适合;
0.7<
0.8,一般;
0.6<
0.7,不太适合;
0.5,不适合。
第二步:
构造因子变量
因子分析中有很多确定因子变量的方法,如基丁主成分模型的主成分分析和基丁因子分析模型的主轴因子法、极大似然法、最小二乘法等。
前者应用最为广泛。
主成分分析法(Principalcomponentanalysis:
该方法通过坐标变换,将原有变量作线性变化,转换为另外一组不相关的变量Zi(主成分)。
求相关系数矩阵的特征根入i(入1,入2,…,入p>
0)和相应的标准正交的特征向量li;
根据相关系数矩阵的特征根,即公共因子Zj的方差贡献(等丁因子载荷矩阵L中第j列各元素的平方和),计算公共因子Zj的方差贡献率与累积贡献率。
主成分分析是在一个多维坐标轴中,将原始变量组成的坐标系进行平■移变
换,使得新的坐标原点和数据群点的重心重合。
新坐标第一轴与数据变化最大方向对应。
通过计算特征根(方差贡献)和方差贡献率与累积方差贡献率等指标,来判断选取公共因子的数量和公共因子(主成分)所能代表的原始变量信息。
公共因子个数的确定准则:
1)根据特征值的大小来确定,一般取大丁1的特征值对应的几个公共因子/主成分。
2)根据因子的累积方差贡献率来确定,一般取累计贡献率达85-95%的特征值所对应的第一、第二、…、第m(mVp)个主成分。
也有学者认为累积方差贡献率应在80%以上。
第三步:
因子变量的命名解释
因子变量的命名解释是因子分析的另一个核心问题。
经过主成分分析得到的公共因子/主成分Z1,Z2,…,Zm是对原有变量的综合。
原有变量是有物理含义的变量,对它们进行线性变换后,得到的新的综合变量的物理含义到底是什么?
在实际的应用分析中,主要通过对载荷矩阵进行分析,得到因子变量和原有变量之间的关系,从而对新的因子变量进行命名。
利用因子旋转方法能使因子变量更具有可解释性。
计算主成分载荷,构建载荷矩阵A。
aj<,-ilij(i,j1,2,,p)
*
如.
..a〔m
Iii,1
2..
.hm、m
.a21
A=
a21.
..a2m
l21,1
l212..
.hm、;
m
...
....
.....
ir
.....
....
ap1
ap1.
..apm
lp11
1lp1\2..
1J.lp^m
载荷矩阵A中某一行表示原有变量Xi与公共因子/因子变量的相关关系。
载荷矩阵A中某一列表示某一个公共因子/因子变量能够解释的原有变量Xi的信息量。
有时因子载荷矩阵的解释性不太好,通常需要进行因子旋转,使原有因子变量更具有可解释性。
因子旋转的主要方法:
正交旋转、斜交旋转。
an
a12.
"
11
22..
L,.1m•.m
.a21
.1.1
l2V2..
.bm\m
l.
lp1V1
l、
.pmm
正交旋转和斜交旋转是因子旋转的两类方法。
前者由丁保持了坐标轴的正交性,因此使用最多。
正交旋转的方法很多,其中以方差最大化法最为常用。
方差最大正交旋转(varimaxorthogonalrotation)基本思想:
使公共因
子的相对负荷的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。
可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。
斜交旋转(obliquerotation)因子斜交旋转后,各因子负荷发生了变化,
出现了两极分化。
各因子问不再相互独立,而是彼此相关。
各因子对各变量的贡献的总和也发生了改变。
斜交旋转因为因子间的相关性而不受欢迎。
但如果总体中各因子问存在明显的相关关系则应该考虑斜交旋转。
适用丁大数据集的因子分析。
无论是正交旋转还是斜交旋转,因子旋转的目的:
是使因子负荷两极分化,要么接近丁0,要么接近丁1。
从而使原有因子变量更具有可解释性。
第四步计算因子变量得分
因子变量确定以后,对丁每一个样本数据,我们希望得到它们在不同因子上的具体数据值,即因子得分。
估计因子得分的方法主要有:
回归法、Bartlette法
等。
计算因子得分应首先将因子变量表示为原始变量的线性组合。
即:
Z1
l11x1
l12X2
l1pXp
Z2
l21X1
l22X2
l2pXp
Zm
lm1X1
lm2X2
lmpXp
回归法,即Thomson法:
得分是由贝叶斯Bayes思想导出的,得到的因子得分是有偏的,但计算结果误差较小。
贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。
Bartlett法:
Bartlett因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。
因子得分可用丁模型诊断,也可用作进一步分析如聚类分析、回归分析等的原始资料。
关丁因子得分的进一步应用将在案例介绍一节分析。
5.5结果的分析解释
此部分详细见案例分析
Spss实现
【1】在“Analyze”菜单"
DimensionReduction”中选择“Factor”命令,如下图所示。
・1即加1日£
,了
咨华*他。
*日4里51口>
QN0MyillM*440^111他*密H4M
而却压►
口HCFEt5UIWC3t
1驾阐圜
1成
|1«
Taom>
CflnnwNtanp>
vtl_*色*折L.•:
补E
Un*arbfsdpl>
1&
171£
W
Gerer-ilzeG-rwsJMls-卜
1B10W
T7
Nhtdir-^deh,
17141!
1?
特1tfl
德
Bw碰。
>
L心he#>
rNzMlN烛5*1
1514W
19i|IT
Ta
151CIS
26
1B1118
j4,
?
«
nUh4d
询
0kwnxn命■*01站・
►
J,Ftwr
19
JP^0«
nri*n^«
-虹*丽
T5
gOptnd0*安
饰
IB11曜
17
Bj~avq1卜
14iah
T4
N£
nplsR«
s^4ns«
P
151(IT
1血
乙Nl*!
.ng=
17M17
惨
Nunpitimu^Kfi1
U1Cu
倡1«
H
aujihMorM>
i?
isrt
革HT1$
【2】在弹出的下图所示的FactorAnalysis对话框中,从对话框左侧的变量歹U表中选择这9个变量,使之添加到Variables框中。
【3】点击"
Descriptives”按钮,弹出“FactorAnalysis:
Descriptives”对话框,如图所示。
FactorAnalysis;
Descriptive5
StatisNcs
dUnivariatedescriptives
yJmtialsolution
CorrelationMatrix
5Coe1Tident£
□Inverss
Significancelevels..JReproduced
二Determinant'
Widmage
d\KM。
andBartlettstestofsphericity
■■■km■■■■KBimmii■imjii■■whiiimjiiiiubii■■■■•«
■■■■■■*
8ntinLieJCancelHelp
Statistics框用丁选择哪些相关的统计量,其中:
Univariatedescriptives(变量描述):
输出变量均值、标准差;
Initialsolution(初始结果)
CorrelationMatrix框中提供了几种检验变量是否适合做引子分析的检验方法,其
中:
Coefficients(相关系数矩阵)
Significanceleves(显著性水平)
Determinant(相关系数矩阵的行歹U式)
Inverse(相关系数矩阵的逆矩阵)
Reproduced(再生相关矩阵,原始相关与再生相关的差值)
Anti-image(反影像相关矩阵检验)
KMOandBartlett'
stestofsphericity(KMO检验和巴特利特球形检验)本例中,选中该对话框中所有选项,击Continue按钮返回FactorAnalysis
因子提取方法在MethodT拉框中选取,SPSS共提供了7种方法:
PrincipleComponentsAnalysis(主成分分析)
Unweightedleastsquares(未加权最小平方法)
Generalizedleastsquares(珠合最小平方法)
Maximumlikelihood(最大似然估价法)
Principalaxisfactoring(主轴因子法)
Alphafactoring(也因子)
Imagefactoring(影像因子)
Analyze框中用丁选择提取变量依据,其中:
Correlationmatrix(相关系数矩阵)
Covariancematrix(协方差矩阵)
Extract框用丁指定因子个数的标准,其中:
Eigenvaluseover(大于特征值)
Numberoffactors(因子个数)
Display框用丁选择输出哪些与因子提取有关的信息,其中:
Unrotatedfactorsolution(未经旋转的因子载荷矩阵)
Screenplot(特征值排歹U图)
MaximuninterationsforConvergence框用丁指定因子分析收敛的最大迭代次数,系统默认的最大迭代次数为25。
本例选用Principalcomponents方法,选择相关系数矩阵作为提取因子变量的依
据,选中Unrotatedfactorsolution和Screeplot项,输出未经过旋转的因子载荷矩阵与其特征值的碎石图;
选择Eigenvaluseover项,在该选项后面可以输入1,指定提取特征值大丁1的因子。
单击Continue按钮返回FactorAnalysis对话框。
【5】单击FactorAnalysis对话框中的Rotation按钮,弹出FactorAnalysis:
Rotation对话框,如下图所示:
S3
该对话框用丁选择因子载荷矩阵的旋转方法。
旋转目的是为了简化结构,以
帮助我们解释因子。
SPSS默认不进行旋转(None)。
Method框用丁选择因子旋转方法,其中:
None(不旋转)
Varimax(正交旋转)
DirectOblimin(直接斜交旋转)
Quanlimax(四分最大正交旋转)
Equamax(平■均正交旋转)
Promax(斜交旋转)
Display框用丁选择输出哪些与因子旋转有关的信息,其中:
Rotatedsolution(输出旋转后的因子载荷矩阵)
Loadingplots(输出载荷散点图)
本例选择方差极大法旋转Varimax,并选中Rotatedsolution和Loadingplot项,表示输出旋转后的因子载荷矩阵和载荷散点图,单击Continue按钮返回FactorAnalysis对话框。
【6】单击FactorAnalysis对话框中的Scores按钮,弹出FactorAnalysis:
Scores对话框,如下图所示:
该对话框用以选择对因子得分进行设置,其中:
Regression(回归法):
因子得分均值为0,采用多元相关平■方;
Bartlett(巴特利法):
因子得分均值为0,采用超出变量范围各因子平■方和被最小化;
Anderson-Rubin(安德森-洛宾法):
因子得分均值为0,标准差1,彼此不相关;
Displayfactorscorecoefficientmatrix:
选择此项将在输出窗口中显示因子得分系数矩阵。
【7】单击FactorAnalysis对话框中的Options按钮,弹出FactorAnalysis:
Options对话框,如下图所示:
该对话框可以指定其他因子分析的结果,并选择对缺失数据的处理方法,其中:
MissingValues框用丁选择缺失值处理方法:
Excludecaseslistwise去除所有缺失值的个案
Excludecasespairwise含有缺失值的变量,去掉该案例
Replacewithmean用平■均值代替缺失值
CofficientDisplayFormat框用丁选择载荷系数的显示格式:
Sortedbysize载荷系数按照数值大小排歹U
Suppressabsolutevalueslessthan不显示绝对值小丁指定值的载荷量
本例选中Excludecaseslistwise项,单击Continue按钮返回FactorAnalysis对话框,完成设置。
单击OK,完成计算。
3结果与讨论
(1)SPSS输出的第一部分如下:
第一个表格中列出了18个原始变量的统计结果,包括平均值、标准差和分
析的个案数。
这个是步骤3中选中Univariatedescriptives项的输出结果。
播她就计鼠
均信
仁/差-
分析N
鹿导风格
16.95
2.012
2D
职信升迁
16.60
1.698
20
16.90
1651
社金地位
17.45
1.7&
1
发展忙£
16.75
1.517
工映\
16.35
T71JR
出发占
15.50
Double-clickto.口
adr.ate
分配
15,50
1iwww
合作性
16.45
2.328
(2)SPSS输出结果文件中的第二部分如下:
该表格给出的是9个原始变量的相关矩阵
崩r
翎林
1偕%A
相关
1.000
.425
.521
.461
-.131
一倾
J56
511
109
.817
v075
.420
.321
.2CI
权尢距离
5:
.511
1000
0"
.599
J0B7
.664
.264
.136
叶会地r
036
.1睥
.C:
1OQC
J79
.067
.022
-.301
-001
发屐机会
461
.&
.559
376
035
.545
170
.070
工作抵■<
-131.067
IDciuble-^lickta
•颂activate•粉
022
.035
.646
1.ooc
•J2D
1.0OD
*355
.514
411
.1哭
264
-201
-E
-J66
-511
1.00D
721
10S
.261
078
”1
721
1ooo
(3)SPSS输出结果的第四部分如下:
KMO和Bartlett的检魅
IjKalser-Meyer-Olkin:
.585
Bartl^tt的咪形度检髓,似卡方
74.733
df
36
Sig.
.000
该部分给出了KMO检验和Bartlett球度检验结果。
其中KMO值为0.585,根据统计学家Kaiser给出的标准,KMO取值小丁0.5,不太适合因子分析。
Bartlett球度检验给出的相伴概率为0.00,小丁显著性水平0.05,因此拒绝Bartlett球度检验的零假设,认为适合丁因子分析。
(4)SPSS输出结果文件中的第六部分如下:
公因亍方差
初始
提取
•:
.匚
.466
职位升迁
1.□□□
.661
1.00Q
.799
.871
发履服
.963
工牌\