主成分因子分析步骤.docx
《主成分因子分析步骤.docx》由会员分享,可在线阅读,更多相关《主成分因子分析步骤.docx(24页珍藏版)》请在冰豆网上搜索。
主成分因子分析步骤
主成分分析、因子分析步骤
不同点
主成分分析
因子分析
概念
具有相关关系的p个变量,经过线性组合后成为k个不相关的新变量
将原数据中多个可能相关的变量综合成少数几个不相关的可反映原始变量的绝大多数信息的综合变量
主要
目标
减少变量个数,以较少的主成分来解释原有变量间的大部分变异,适合于数据简化
找寻变量间的内部相关性及潜在的共同因素,
适合做数据结构检测
强调
重点
强调的是解释数据变异的能力,以方差为导向,使方差达到最大
强调的是变量之间的相关性,以协方差为导向,关心每个变量与其他变量共同享有部分的大小
最终结果应用
形成一个或数个总指标变量
反映变量间潜在或观祭不到的因素
变异解
释程度
它将所有的变量的变异都考虑在内,因而没有误差项
只考虑每一题与其他题目共同享有的变异,因而有误差项,叫独特因素
是否需
要旋转
主成分分析作综合指标用,不需要旋转
因子分析需要经过旋转才能对因子作命名与解释
是否有假设
只是对数据作变换,故不需要假设
因子分析对资料要求需符合许多假设,如果假设条件不符,则因子分析的结果将受到质疑
因子分析
1【分析】T【降维】T【因子分析】
(1)描述性统计量(Descriptives)对话框设置
KMO^Bartlett的球形度检验(检验多变量正态性和原始变量是否适合作因子分析)
酚因刊折:
撞述统计L*gb-1
-Statistics
■IEMIIIlailliumiIIMIIIII■!
!
■“■“■■([■■Il弹夷星描述性d
I?
偉始劳斬结杲
(1)
□系数©B竝棋型凹
1B显著性水平(S):
再生迟)l一行列式匚)二j厦炭象牲)□创10和阴rfl*的球总度检验
[继壤][取消]呃]
(2)因子抽取(Extraction)对话框设置
方法:
默认主成分法。
主成分分析一定要选主成分法分析:
主成分分析:
相关性矩阵。
输出:
为旋转的因子图
抽取:
默认选1.
最大收敛性迭代次数:
默认25.
(3)因子旋转(Rotation)对话框设置
因子旋转的方法,常选择“最大方差法”。
“输出”框中的“旋转解”
因孑分析:
旋转
—方迭
OjEO矗大辺吹才值做①
⑥廉丈斤勢割Q(鹿大平斷值直g
OXttOblniin万祜£0)oPromaxi:
町
Delta(DX0IKflppfltK)厂
爲出1
iBriiiliMililmlliliwJ
最太牧殲tt送戕耿毅凶:
込
(4)因子得分(Scores)对话框设置
“保存为变量”,则可将新建立的因子得分储存至数据文件中,并产生新的变量名称。
®因子另析:
因刊盼>
7T法
■®0H3(K)
BartletttB)
OAnderson-Rubin(A)
Eiimii■■»ail■mmirrmim■■■rn
显朮因孑用井葢独鉅阵(D
Ssisd—-is—&:
■:
>•—jb■>_-jii■—:
na—■■
(5)选项(Options)对话框设置
冏因子分析;选项x
娥失僮
■-?
■■■■rpBiairn'iBianrtiiina-riiairrBinn-ri■■■»»■■arn
色辛按列衰桃釀■!
■现(9罚宙S恳不臺五亠"'”"_
©細均恒曹糕迟)
I
乘独员赵式1
一按丈小怖啟①
□取潸小畫散〔9
迤对船炯下〔闿』T
2结果分析
(1)KMO及Bartlett's检验
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
Bartlett的球形度检验近似卡方
df
Sig.
.515
3.784
6
.706
当KMO直愈大时,表示变量间的共同因子愈多,愈适合作因子分析。
根据Kaiser的观点,当KMO0.9(很棒)、KMO0.8(很好)、KMO0.7(中等)、KMO0.6(普通)、KMO0.5(粗劣)、KM&0.5(不能接受)。
(2)公因子方差
公因子方差
起始
撷取
卫生
1.000
.855
饭量
1.000
.846
等待时间
1.000
.819
味道
1.000
.919
亲切
1.000
.608
撷取方法:
主体元件分析。
Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子
方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。
共同度低说明在因子中的重要度低。
一般的基准是<0.4就可以认为是比较低,
这时变量在分析中去掉比较好。
(3)解释的总方差
说明的变异数总计
元件
各因子的特征值
因子贡献率
因子累积贡献率
总计
变异的%
累加%
总计
变异的%
累加%
总计
变异的%
累加%
1
2.451
49.024
49.024
2.451
49.024
49.024
2.042
40.843
40.843
2
1.595
31.899
80.923
1.595
31.899
80.923
2.004
40.079
80.923
3
.662
13.246
94.168
4
.191
3.823
97.992
5
.100
2.008
100.000
撷取方法:
主体元件分析。
第二列:
各因子的统计值
第三列:
各因子特征值与全体特征值总和之比的百分比。
也称因子贡献率。
第四列:
累积百分比也称因子累积贡献率
第二列统计的值是各因子的特征值,即各因子能解释的方差,一般的,特征值在1以上就是重要的因子;第三列%是各因子的特征值与所有因子的特征值总和的比,也称因子贡献率;
第四列是因子累计贡献率。
如因子1的特征值为2.451,因子2的特征值为1.595,因子3,4,5的特征值在1以下。
因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。
祁H
AJij4
寸应盘童的也則
FAC1
J
FAC?
」I..
4
1
th泗
1
$
1
1.25423
.1.60622
3
1
1.61135
4
1
1?
8622
翻閒2
3
1
1115C7
■1082«
2
1
-KSM
03122
2.
1
14673
1?
咖
D
1
144917
4E033
11
1
-133730
-1D3265
1
1
■79531
D8K5
2
1
■t40031
115G1
1
1
1.2&791
2
1
.2694T
1.2DW0
3
1
76124
1•如剖
至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量,fac1_1、
fac2_1,即为因子得分。
(4)成分矩阵与旋转成分矩阵
帀牛
1
2
饭里
.915
.427
萼待时闾
-.787
.447
卫生
-.775
味追
.750
-B7
亲切
.069
-.776
攧职方法:
主体元件甘析◎a-掖取2个元件。
元件
1
2
-.036
1曲4
.255
卩牛
.212
.90C
等侍时1目
-.260
.&67
亲切
-.487
-.609
廠取方送乂工体珂件好析。
转抽方迭;具有I^isei正规化的最
大麥异法。
酣在3鲁代中收魏徧幵。
成分矩阵是未旋转前的因子矩阵,从该表中并无法清楚地看出每个变量到底应归属于哪个因子。
旋转后的因子矩阵,从该表中可清楚地看出每个变量到底应归属于哪个因子。
此表显示
旋转后原始的所有变量与新生的2个公因子之间的相关程度。
一般的,因子负荷量的绝对值0.4以上,认为是显著的变量,超过0.5时可以说是非常重要的变量。
如味道与饭量关于因子1的负荷量高,所以聚成因子1,称为饮食因子;等待时间、卫生、亲切关于因子2的负荷量高,所以聚成因子2,又可以称为服务因子。
(5)因子得分系数矩阵
元件评分系数矩阵
元件
1
2
卫生
-.010
.447
饭量
.425
-.036
等待时间
-.038
.424
味道
亲切
.480
-.316
.059
-.371
撷取方法:
主体元件分析。
转轴方法:
具有Kaiser正规化的最
大变异法。
元件评分。
因子得分系数矩阵给出了因子与各变量的线性组合系数。
因子1的分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5
因子2的分数=0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5
(6)因子转换矩阵
元件转换矩阵
元件
1
2
1
.723
-.691
2
.691
.723
撷取方法:
主体元件分析。
转轴方法:
具有Kaiser正规化
的最大变异法。
因子转换矩阵是主成分形式的系数。
(7)因子得分协方差矩阵
元件评分共变异数矩阵
元件
1
2
1
2
1.000
.000
1.000
「.000
撷取方法:
主体元件分析。
转轴方法:
具有Kaiser正规化
的最大变异法。
元件评分。
看各因子间的相关系数,若很小,则因子间基本是两两独立的,说明这样的分类是较合理的。
1【分析】
【降维】
主成分分析
【因子分析】
(1)设计分析的统计量
【相关性矩阵】中的“系数”:
会显示相关系数矩阵;
【KMO^Bartlett的球形度检验】:
检验原始变量是否适合作主成分分析。
【方法】里选取“主成分”
&因子分聊
方进也】;主用谢”I
I分鞋|5h出
o柜关容世聲迟.』極转的因子増世;
<■世方羞矩薛过□碁石屈醪)
严—
害星丁那E值⑥
静征诅K于凶:
H
<-医干的砾勒早理要噸的區子二:
品穴M觀性坯齿彌也:
[26_
阿阿両
【旋转】:
选取第一个选项“无”。
「轴宙子分析:
齢■MW
I右选I
◎.刼亚C1虽大四玄方俏法(型
O龍:
松差;fe(v)C'畐大爭SS值法(§)
蟲犬收敛H迭代次数疋)|25
【得分】:
“保存为变量”
【方法】:
“回归”;再选中“显示因子得分系数矩阵”
「轉国子分祈:
因予琴分
3保存为娈垦色)
「方法1J
@目忖®
OBartlett
OAnderson-Rubin
凰亘奈旨至翟菇画更產迪
ImiBirBniiarMimrmiiiiisai■■■iiBBiirBniBirMi■■■'^^niP
[磐]取帚I裁助
LJ
命囲盼析卫
蛀失值—|
u.■■■it—uia-—4iia&—:
■■■la—siiiiSi■■■i—aiaiiis—^B■■■>—«■
处境烈昶?
蠻Y赛⑥I
©按对制畸累®
[便用平闵值替换旦
磔数显示格式
匚按犬<1蜩匸序
"职消小碱3
绝对值如下述:
[雄续]取誚[帮跡
E5-
2结果分析
(1)相关系数矩阵
相关性矩阵
食品
衣着
燃料
住房
交通和通讯
娱乐教育文化
相关食品
1.000
.692
.319
.760
.738
.556
衣着
.692
1.000
-.081
.663
.902
.389
燃料
.319
-.081
1.000
-.089
-.061
.267
住房
.760
.663
-.089
1.000
.831
.387
交通和通讯
.738
.902
-.061
.831
1.000
.326
娱乐教育文化
.556
.389
.267
.387
.326
1.000
两两之间的相关系数大小的方阵。
通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。
由表中可知许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。
(2)KMO及Bartlett's检验
KMO与Bartlett检定
Kaiser-Meyer-Olkin测量取样适当性。
Bartlett的球形检大约卡方
定df
显著性
.602
62.216
15
.000
根据Kaiser的观点,当KMO0.9(很棒)、KMO>0.8(很好)、KMO0.7(中等)、KMO0.6(普通)、KMO0.5(粗劣)、KMO:
0.5(不能接受)。
(3)公因子方差
Communalities
起始
擷取
食品
1.000
.878
衣着
1.000
.825
燃料
1.000
.841
住房
1.000
.810
交通和通讯
1.000
.919
娱乐教育文化
1.000
.584
擷取方法:
主體元件分析。
Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子
方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。
共同度低说明在因子中的重要度低。
一般的基准是<0.4就可以认为是比较低,
这时变量在分析中去掉比较好。
(4)解释的总方差:
说明的变异数总计
元件
起始特征值
撷取平方和载入
总计
变异的%
累加%
总计
变异的%
累加%
1
3.568
59.474
59.474
3.568
59.474
59.474
2
1.288
21.466
80.939
1.288
21.466
80.939
3
.600
10.001
90.941
4
.358
5.975
96.916
5
.142
2.372
99.288
6
.043
.712
100.000
撷取方法:
主体元件分析。
因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,
即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。
(5)成分矩阵(因子载荷矩阵)
元件矩阵
元件
1
2
食品
.902
.255
衣着
.880
-.224
燃料
.093
.912
住房
.878
-.195
交通和通讯
.925
-.252
娱乐教育文化
.588
.488
撷取方法:
主体元件分析。
a.撷取2个元件。
该矩阵并不是主成分1和主成分2的系数。
主成分系数的求法:
各自主成分载荷向量除以主成分方差的算数平方根。
则第1主成分的各
个系数是向量(0.925,0.902,0.880,0.878,0.588,0.093)除以3-568后才得到的,
即(0.490,0.478,0.466,0.465,0.311,0.049)才是主成分1的特征向量。
第1主成分的函数表达式:
Y1=0.490*Z交+0.478*Z食+0.466*Z衣+0.465*Z住+0.311*Z娱+0.049*Z燃
(6)因子得分
1.FAC1.1
耳恥P
W^t:
B1I>DM戦IAffir*:
>M1jilit回酥VDftfi■»曰
5H
2
肃・i*h
u*
f*C2_i
1
WJ1
437T171
O-M
JIDI
»w[
135an
3E4D1Q4T
44-IE
X4t
394
4-inv
jQ36BQ
22J1
轉」,
1H3?
M21iMihUM1u-s翻
齐吕nr««:
■-t-j
ms
17T
33JE
13
11
23.»
11臥1
-1MK4-i
raw
7733
11
H.t
1G9-S2
32^
12.72
4712
34.3S.
-049M
11
nn
IS11
IS61
8l»
tJI
4JT«
1Ain
1J
MS
31Jf
16K
aa
nre
皿
irwr
IfrMM
14
.M
讪&
2tSD
1?
«4
ibit
Ifi.B?
4*94
115W
JD2t
12.K
3344
MJ7
985
-11M3
-54側]
■
一加
101帕
23M
曲
料能
曲旳
丄曲
iu^3
42It
29V
W
2912
dW■AW3S-1M54
114
21.再■給27»
1JET4
»103«&]
-i
-iitzra
45CD1
因子得分显示在SPSS勺数据窗口里。
通过因子得分计算主成分得分。
(7)主成分得分
主成分的得分是相应的因子得分乘以相应方差的算数平方根。
即:
主成分1得分=因子1得分乘以3.568的算数平方根
主成分2得分=因子2得分乘以1.288的算数平方根
FA211^RT(2"06-|
REGRFaztarsccre
RE<31?
fErlnl-scnre喪1
AiAjci
EHZJQ32匚创创W勺』r3i
匕B丄DJ—IFFIHI~~J
SCfJTfriUrti^pfi,姜弧jg||3的疏干方
•
1ryenw
Mnii
Rndil)
Rndi;2)
Rndl:
3)
sin
Sqrt
『runqllj
TiTLfK(2j
rnrct3)
T
曲硼旧JtBIB)■演,ffjh
1*圭壬抿耒二]-IBh/S3SS'■■■.dtstcs争-三淀疑異
;文什疋)痛娟底}视閱应)圾10也}
转換T)劳折凶直静囲
醉G:
.
实
|:
Z2H1勻园
■
jLad昌^
L事
11:
时
王欣分1
主成分2
1
北京
204910
22972
337058
2网5了
2
.41770
1.03&33
JB9W
117667
3
沏1
-1.03S56
-1.01953
-1.&6175
-1.15604
4
4c娈伫■口.
£
C仇盃斗了〉
IHrM
■ta-w-!
■■~ryy
6
rat
-.72783
d.1Q272
-1.37481
-1.2S14B
辽宁
2f3S2
.4b&Ul
.51722
.6Vh3
7
.09&GB
136274
JB0G9
154G&7
B
时
.软阿
-74193
5MD5
9
235583
-43335
444站刍
-49131
1Q
脯、
-05?
%
-.16554
-1094B
-vr&s
11
讯工
G3S62
M&90
120044
0SC63
吃
-.43732
12517G
-82T19
14GGD2
i
-.37767
1.50&5B
-.71335
102331
江西
・6T75B
1490B6
-127985
169197
-11&93
r56950
-.22^7
-64633
i|Os
-.91423
■7G44B
-1.72G9D
-.06761
vI
4
魏ftf机團(3
1
(8)综合得分及排序
综合得分是按照下列公式计算:
化简得:
3r5681.285
Y=电主成分1得分+*主成好2得分,
3,56B+1.2883.56R+I.288
综合得分丫为:
创JfrftCP芦析®1M0)肆©TrPSTiL誓
堆区
酣2
¥I
1
2.(M9tC
223?
2
3.6705&
25&67
277509I
2
¥
41770
-1.03S80
.78900
^1.17667
26763
3
河北
-103856
101363
1M176
■11560(
■174605
4
-1.D8619
-1.31/86
-Z051?
2
-1J9b64
-1X23
S
向軒
-T27B3
-1102F2
-1.37dfi1
-12SU3
6
.27382
.45601
.61722
51763
7
QS5SE
136274
1BQ69
154657
54796
8
38CTB
47C=7
74193
5JW6
40紳
电
上春
2.35683
-43336
4.44996
-49181
J13921
10
05796
I騎討
1094B
-17766
•1?
756
tl
B3652
-.04990
仁临4
05663
.86702
~~
-43752
129Vt
-.02719
14S5D2
-21BM
13
-.3T7G?
1.606t8
-.71339
1823J1
■ZE
-.67766
1.49CI&5
-1J7966
1-69197
-.49161
苗
-11633
-56950
-220B7
64633
■3337?
-.91423
•ZW
^1.72690
•067^1
-i.dWW
【数据】
【排序个案】