因子分析理论与案例.docx
《因子分析理论与案例.docx》由会员分享,可在线阅读,更多相关《因子分析理论与案例.docx(15页珍藏版)》请在冰豆网上搜索。
![因子分析理论与案例.docx](https://file1.bdocx.com/fileroot1/2022-12/30/a0477f36-945f-41bb-a1d2-be51e8e21ea6/a0477f36-945f-41bb-a1d2-be51e8e21ea61.gif)
因子分析理论与案例
盛年不重来,一日难再晨。
及时宜自勉,岁月不待人。
因子分析理论与案例
一、因子分析原理
因子分析是一种将多变量化简的多元统计方法,它可以看作是主成份分析的推广。
因子分析的目的是分解原始变量,从中归纳出潜在的“类别”,相关性较
强的变量归为一类,不同类间的变量的相关性则较低。
每类变量代表了一个“共同因子”,即一种内在结构(联系)。
因子分析就是寻找这种内在结构(联系)的方法。
从全部计算过程来看作R型因子分析与作Q型因子分析都是一样的,只不过出发点不同,R型从相关系数矩阵出发,Q型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析。
(一)模型
主要模型形式:
X!
a11F1
a12F2
a1mFm
1
/d\弃qzp才
X2
a21F1
a22F2
a2mFm
2
(1)展开式
XP
ap1F1
a22F2
aF
pmm
p
(2)矩阵型式
Xi
a11
a12
a1m
F1
1
X
a21
a22
a2m
F2
2
Xp
api
ap2
apm
Fm
p
简记为:
X
AF
+
(p
1)(
pm)(m
1)(p
1)
且满足:
1)mp
2)Cov(F,
)=0
1
0
3)D(F)=
O
Im
即RLFm不相关且方差
=1.
01
(二)相关概念解释
1、因子载荷
aj称为因子载荷(实际上是权数)。
因子载荷的统计意义:
就是第i个变量与第j个公共因子的相关系数,即表示变量xi依赖于Fj的份量(比重),心理学家将它称为载荷。
2、变量共同度
变量人的共同度一一因子载荷阵A中第行元素的平方和,
m
即:
h2a2i1,L,p
ji
为了说明他的统计意义,将下式两边求方差,即
XiQiF+a2F2+L+aimFm+i
Var(X)二a:
Var(F)+L+aimVar(FJ+Var()
_22.22
-ai1ai2Laimi
h2i2
ii
由于Xi已经标准化了,所以有:
ih22
3、方差贡献率
方差贡献率指的是公因子对于自变量的每一分量所提供的方差总和,它是衡
量公因子相对重要程度的指标。
通常情况下,我们将因子载荷矩阵的所有方差贡献率计算出来并按照大小排序,从而提炼出最具影响力的因子。
二、主要计算方法及步骤
(一)方法说明
1、因子载荷矩阵估计方法
因子载荷的求解方法主要有主成分法,主轴因子旋转法和极大似然法。
主成分法指在进行因子分析之前先对数据进行主成分分析,把前几个主成分作为未旋转的公因子,但是此种方法得到的特殊因子间并不相互独立,当变量的共同度较
大时,特殊因子所起的作用较小,它们之间的相关性可以忽略。
卑微如吨坚卿以大象
主轴因子法与主成分分析方法类似,都是都分析矩阵的结构入手,主轴因子法的不同之处在于,其假定m个公因子只能解释原始变量的部分方差,利用变量共同度来代替相关矩阵中对角元素1,并以新矩阵为出发点求解特征值和特征向量。
极大似然估计法假定公因子与特殊因子服从正态分布,通过构造似然函数求因子载荷和特殊因子方差的极大似然估计。
2、因子旋转
因子分析的目的不仅是找出主因子,更重要的是知道每个主因子的意义。
主因子的意义是根据主因子与可观测变量Xi的关系来确定的。
因此希望主因子Fj对Xi(i=1,2,…,p)的载荷平方,有的值很大,有的值很小,(向0,1两极分化),因子载荷矩阵的这种特征称“因子简单结构”。
但是用上述方法所求出的主因子解,初始因子载荷矩阵并不满足“简单结构准则”,各因子的典型代表变量不很突出,因而容易使因子的意义含糊不清,不便于对因子进行解释。
为此须对因子载荷矩阵施行旋转,因子轴方差最大正交旋转的目的即使因子载荷矩阵成为“简单结构”的因子载荷矩阵。
使得因子载荷的平方按列向0和1两极转化,较大的载荷值只集中在少数X变量上,达到其结构简化的目的。
易于因子命名。
经过旋转后,主因子对Xi的方差贡献(变量共同度)并不改变,但各主因子的方差贡献可能有较大的改变,即不再与原来相同,因此,可以通过适当的旋转求得令人满意的主因子。
为了对公因子F能够更好的解释,可通过因子旋转的方法得到一个好解释的公因子。
所谓对公因子更好解释,就是使每个变量仅在一个公因子上有较大的载荷,而在其余的公因子上的载荷比较小。
这种变换因子载荷的方法称为因子轴的旋转。
因子旋转的方法很多,常用的为方差最大正交旋转。
3、因子得分
在分析中,人们往往更愿意用公共因子反映原始变量,这样更有利于描述研究对象的特征。
因而往往将公共因子表示为变量(或样品)的线性组合,即:
1、数据标准化
2、建立相关系数矩阵
3、求解特征根及相应特征向量
4、因子旋转
5、计算因子得分
三、实证分析
(一)、背景介绍
随着市场竞争的日益激烈,公司在人才选择方面更加注重人才的综合素质,并结合职位特定选择专门人才。
在本文中选取一家集生产与销售于一体的大公司在人才招聘中数据,从综合素质以及招聘职位来选择优秀的员工。
“华威”公司是一家集生产、销售为一体的大型国际著名公司。
现公司计划录用6名的员工。
经过初选,公司对48位应聘者进行面试,面试共有15项指标,这15项指标分别是:
求职信的形式(FL)、外貌(APP)、专业能力(AA)、讨人喜欢(LA)、自信心(SC)、洞察力(LC)、诚实(HON)、推销能力(SMS)经验(EXP)、驾驶水平(DRV)、事业心(AMB)理解能力(GSP)、潜在能力(POT)、交际能力(KJ)和适应性(SUIT)。
每项指标的分数是从0分到10分,0分最低,10分最高。
每位求职者的15项指标的得分在文件(应聘者得分记录.xls)中。
试从综合素质选出6名优秀员工,若将这6名员工分别分配到管理、销售和生产部门各2名,指出合理的分配方案。
(二八分析过程详解
1、数据标准化
由于数据均为在面试中的打分成绩,量纲相同,并且观察数据的分布,并无异常值的出现,因此数据没有必要进行标准化,可以直接进行分析。
2、建立相关系数矩阵
利用SPSS软件,correlate功能计算相关系数矩阵,计算皮尔森相关系数并进行卡方双尾检验,可以看出变量间存在这很大的相关性。
外
E
E
信
自4>
s
H
cl
62
鯛m
器
r
-■
外
0.
14d
2
.1
0.
-引
0.
8
3
0.
-III
-0.
心信自
09□.
43
Q
00o
30
□.
1A
力察同
•.JU.
3
2
d
37
Ci
!
;=;
48
0.
8]
0.
-IX
5
3
0.
5
6
0.
41
0
6
3
0.
1
27
0,
49a
05
o
6
3
o
80a
2
0
o
24a
-■
5
5
d
4
1
a
27
4・Ji0.
02
0.
15n-
0.
„1
5
3□.
34
0.
19
0.
9
3
0.
To
0.
p
0.
8
2
3.
8
0.
34
0.
iA
业爭
8
2
o
5
5o
041
o
3
o
8o
■■
2
9e
(3.
o
2cS
TO
Q
34
0.
51a
20
0
o
5
0.
72
a
8s
0.
&
3
11
78
0.
30
0.
1
7
o
7e
o
Jlx
力在3T
IX
51a
9
2
0.
61
61a
n-
42:
1
75
0.
5
3
0.
79o
o
S8
0.
47□.
8
2
a
2
3
-0
9
6
0.
48
a
3
5
o
45
0.
56
0.
-■
2
0,
61
Q
5
5
o
55Q.
54
0.
-■
性
应
适
g
5
0.
8
3
G
4
1o
33
0.
5
2
Q
42
o
00
0.
56
0.
9
6
0.
o
43o
53
0.
57
0.
40
-M
进行相关系数矩阵检验一一KMOffl度和巴特利特球体检验:
KMOS:
0.9以上非常好;0.8以上好;0.7—般;0.6差;0.5很差;0.5以
F不能接受。
巴特利特球体检验原假设H0:
相关矩阵为单位阵
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.784
Bartlett'sTestof
Approx.Chi-Square
645.317
Sphericity
df
105
Sig.
.000
通过观察上面的计算结果,可以知道,KMOfi为0.784,在较好的范围内;而巴特利球体检验的sig值为0.00,拒绝原假设,说明相关矩阵并非单位矩阵,变量的相关系数较为显著。
3、求解特征根及相应特征向量
Spss选项:
Analyze—DataReduction—Factor
用Extraction,选择提取共因子的方法(如果是主成分分析,则选
PrincipalComponents),
用Rotation,选择因子旋转方法(如果是主成分分析就选Non®,
用Scores计算因子得分,再选择Saveasvariables(因子得分就会作
为变量存在数据中的附加列上)和计算因子得分的方法(比如
Regression);要想输出ComponentScoreCoefficientMatrix表,就要选择Displayfactorscorecoefficientmatrix;
输出结果如下:
碎石图:
ScreePlot
8
6_
4一
2
123456789101112131415
ComponentNumber
通过此图可以明显看出前五个因子可以解释大部分的方差,至邓六个因子以
后,线逐渐平缓,解释能力不强。
因此我们提取5个公因子。
方差贡献率
InitialEigenvalues
ExtractioriSumsofSquaredLoadings
Component
Total
%ofVarianco
Cumulative%
Total
%ofVariance
Cumulative%
1
7.514
50092
5D.092
7,614
50092
50092
2
2.056
13708
63.601
2.056
13.700
63.301
3
1456
9.705
73.506
1.456
9.705
73.506
d
1.198
7.986
81.492
1.198
7.98E
81.4^2
5
.73S
4.92S
0E,42O
.73G
4926
3S.420
6
.495
3.297
B9.711
?
.351
2.342
92.O5S
8
.310
2.066
94.125
g
.257
1713
95.838
10
.185
1.233
97X71
11
.153
1.01S
98X88
12
096
.650
98739
13
.099
99.331
14
.055
.431
99.7&2
15
.036
23S
100.000
选择5个公因子,从方差贡献率可以看出,
其中第一个公因子解释了总体方差的
ExtractionMethod:
PrincipalComponentAnalysis.
因子载荷矩阵
ComponentMatrixa
Component
1
2
3
4
5
求职信形式
.445
.615
.381
-.103
.098
外貌
.584
-.051
-.028
.287
.748
专业能力
.110
.340
-.519
.696
-.183
讨人喜欢能力
.617
-.186
.562
.378
-.111
自信心
.796
-.357
-.291
-.189
.004
洞察力
.863
-.188
-.181
-.078
-.178
诚实
.433
-.581
.343
.456
-.055
推销能力
.889
-.042
-.224
-.217
.032
经验
.367
.793
.100
.074
-.089
驾驶水平
.864
.066
-.096
-.171
-.173
事业心
.872
-.098
-.252
-.218
.140
理解能力
.909
-.033
-.141
.082
-.071
潜在能力
.914
.032
-.088
.206
-.109
交际能力
.711
-.118
.564
-.220
-.096
适应性
.647
.603
.108
-.022
.070
a.5componentsextracted.
通过因子载荷矩阵可以看出因子的意义并不是十分明确,为了对因子进行解释与
说明,进行因子旋转,选取方差最大因子旋转方法,并保留因子得分。
4、因子旋转
旋转后的因子载荷矩阵:
RotatedComponentMatrix3
Component
1
2
3
4
5
求职信形式
.107
.830
.097
-.147
.101
外貌
.325
.149
.216
.057
.899
专业能力
.065
.120
-.013
.946
.038
讨人喜欢能力
.230
.240
.875
-.042
.092
自信心
.907
-.110
.142
-.068
.150
洞察力
.877
.092
.267
.041
.005
诚实
.217
-.247
.848
.022
.161
推销能力
.897
.220
.078
-.050
.168
经验
.097
.849
-.046
.231
-.039
驾驶水平
.817
.346
.175
-.012
-.032
事业心
.891
.157
.053
-.074
.270
理解能力
.808
.249
.313
.157
.145
潜在能力
.747
.320
.398
.247
.135
交际能力
.460
.362
.565
-.481
-.031
适应性
.370
.795
.051
.071
.152
a.Rotationconvergedin5iterations.
通过上表中旋转的结果,我们可以看出第一个公因子在自信心,洞察力,推销能力,驾驶水平,事业心,理解能力,潜在能力上有较大的载荷,可以将其命名为基本素质;第二个因子在求职信形式,经验,适应性上有较大的载荷,可以理解为工作经验素质;第三个因子在讨人喜欢能力,诚实,交际能力上有较大的载荷,可以命名为外在能力;第四个因子在专业能力上载荷较大,但在交际能力上的载荷为负相关,也从侧面反映了专业能力较强的人在交际上有一定的欠缺,这和目前一部分高校毕业生书本专业知识较强,但日常待人接物能力较差的现象相吻合,将其命名为专业素质;第五个因子仅在外貌上有较大的载荷,可以将其命名为外表。
最后,通过上面的因子选注我们的评价指标可以通过五个主要的因子来表示,分别为基本素质,工作经验素质,外在能力,专业素质和外表。
接下来计算各因子得分,并按照要求筛选优秀的应试者。
5、计算因子得分
ComponentScoreCoefficientMatrix
Component
1
2
3
4
5
求职信形式
-.112
.375
.002
-.162
.085
外貌
-.128
-.006
-.052
-.041
1.033
专业能力
-.005
-.004
.073
.737
-.071
讨人喜欢能力
-.140
.070
.506
.037
-.062
自信心
.249
-.173
-.107
-.055
.007
洞察力
.216
-.078
.012
.051
-.209
诚实
-.089
-.160
.494
.102
.039
推销能力
.211
-.019
-.151
-.066
.029
经验
-.066
.371
-.028
.137
-.112
驾驶水平
.188
.052
-.040
-.009
-.232
事业心
.202
-.049
-.184
-.096
.168
理解能力
.138
-.007
.044
.124
-.043
潜在能力
.095
.028
.121
.202
-.069
交际能力
.001
.127
.231
-.339
-.169
适应性
-.025
.311
-.061
.001
.082
各因子得分的计算公式为:
fl0.112*求职信形式0.128*外貌0.005*专业能力0.14*讨人喜欢能力
0.249*自信心0.216洞察力0.025*适应性
f50.085*求职信形式1.033*外貌0.071*专业能力0.062*讨人喜欢能力
0.007*自信心0.209洞察力0.082*适应性
分别计算各应试者的五个因子得分,按照相对方差贡献率进行加权,得到最
终各应试者的综合评价
综合得分:
编号
综合得分
编号
综合得分
编号
综合得分
1
0.9925
17
0.2369
33
-0.0634
2
0.9315
18
0.1480
34
-0.5107
3
0.7912
19
0.2378
35
-0.4718
4
0.6150
20
0.2073
36
-0.3979
5
0.6968
21
-0.0711
37
-0.1255
6
0.7259
22
0.8704
38
-0.2785
7
0.6070
23
0.0993
39
-0.5476
8
0.6007
24
0.0325
40
-0.6171
9
0.4299
25
-0.2851
41
-0.9400
10
1.0461
26
0.2296
42
-0.7864
11
0.4309
27
-0.3275
43
-1.1902
12
0.3623
28
-0.0763
44
-1.0797
13
0.5168
29
0.2112
45
-0.9281
14
0.8424
30
-0.3032
46
-0.9682
15
0.3403
31
-0.0685
47
-0.9455
16
0.2117
32
-0.3789
48
-1.0527
将综合得分进行排序,前六名为我们重点考虑的对象,编号分别为:
10,1,
2,22,14,3。
我们重点分析这六个人的各方面得分,从而指定较为合理的部门分配。
编号
基本素质
工作经验素质
外在能力
专业素质
外表
综合得分
10
2.04521
-0.50527
-1.61184
1.493955
-0.28452
1.046139
1
1.147623
1.552198
1.040729
0.4904
-1.42199
0.992542
2
1.009694
1.585842
1.165884
0.556039
-1.536651
0.9315131
22
1.960285
-0.54789
-2.70356
1.486739
-0.22207
0.870439
14
1.629787
-0.83238
-0.90829
1.651657
-0.36539
0.84243
3
0.833452
1.442163
0.168301
0.429408
0.3637251
0.7911891
6
1.121359
0.401301
0.698105
-0.61087
-0.17064
0.725859
通过对排在前六名的应试者各因子得分分析可知:
10号和22号在基本素质包括自信心,洞察力,推销能力,驾驶水平,事业心,理解能力,潜在能力上的得分最高,这也是他最大的优势所在,在专业素质上的得分也很高,说明此人专业水平和好,但是在外在能力也就是交际能力,讨人喜欢能力以及第五因子外表上得分均为负值,说明此人的外在条件并不是很好;另外此人的工作经验素质的得分也为负值,其中包括求职信形式,经验,适应性等,说明欠缺工作经验,此人很有可能为刚毕业的应届生,基本素质以及专业知识过硬,但是社会生活能力较差。
在本次所招收的职位中,生产部门的研发职位要求专业能力强,对于经验及外在条件的要求较低,10号和22号比较适合安排在生产部门。
1号和2号除了外表为负值以外,其他因子得分均为正值,此人外在能力和
工作经验素质