SPSS探索性因子研究分析的过程.docx
《SPSS探索性因子研究分析的过程.docx》由会员分享,可在线阅读,更多相关《SPSS探索性因子研究分析的过程.docx(12页珍藏版)》请在冰豆网上搜索。
SPSS探索性因子研究分析的过程
SPSS探索性因子分析的过程
————————————————————————————————作者:
————————————————————————————————日期:
现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示:
问题
题项
从未使用
很少使用
有时使用
经常使用
总是使用
1
2
3
4
5
a1
电脑
a2
录音磁带
a3
录像带
a4
网上资料
a5
校园网或因特网
a6
电子邮件
a7
电子讨论网
a8
CAI课件
a9
视频会议
a10
视听会议
一.因子分析的定义
在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。
因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。
多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。
更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。
因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。
用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。
因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。
2.数学模型
为第i个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。
)
为共同因子;
为所有变量共同因子的数目;
为变量的唯一因素;
为因子负荷。
(也叫因子载荷,统计意义就是第i个变量与第m个公共因子的相关系数,它反映了第i个变量在第m个公共因子上的相对重要性也就是第m个共同因子对第i个变量的解释程度。
)
因子分析的理想情况,在于个别因子负荷不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则彼此间不能有关联存在。
所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷就是第i个原有变量和第m个因子变量间的相关系数,也就是在第m个共同因子变量上的相对重要性,因此,绝对值越大则公共因子和原有变量关系越强。
在因子分析中有两个重要指针:
一为“共同性”,二为“特征值”。
所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。
从共同性的大小可以判断这个原始变量与共同因子间的关系程度。
如果大部分变量的共同度都高于0.8,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。
而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。
所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子负荷的平方和),在因子分析的的共同因子抽取中,特征值最大的共同因子会最先被抽取,其次是次大者,最后抽取的共同因子的特征值会最小,通常会接近于0。
将每个共同因子的特征值除以总题数,为此共同因子可以解释的变异量,因子分析的目的之一,即在因素结构的简单化,希望以最少的共同因子能对总变异量做最大的解释,因而抽取的因素越少越好,但抽取的因子的累积变异量越大越好。
三.SPSS中实现过程
(一)录入数据
(二)因子分析
1.在菜单栏中依次单击“分析”|“降维”|“因子分析”选项卡,打开如图所示“因子分析”对话框。
从原变量量表中选择需要进行因子分析的变量,然后单击箭头按钮将选中的变量选入“变量”列表中。
“变量列表”的变量为要进行因子分析的的目标变量,变量在区间或比率级别应该是定量变量。
分类数据(如:
性别等)不适合因子分析。
2.“描述按钮”:
主要设定对原始变量的基本描述并对原始变量进行相关性分析。
选中“原始分析结果”复选框,表示因子分析未转轴前之共同性、特征值、变异数百分比及累积百分比,这是一个中间结果,对主成分分析来说,这些值是要进行分析变量的相关或协方差矩阵的对角元素。
KMO与Bartlett球形度检验用来检验适不适合用来做因子分析。
KMO检验,检验变量间的偏相关是否很小;巴特利特球形检验,检验相关阵是否是单位阵。
KMO值越接近1越适合做因子分析,巴特利特检验的原假设设为相关矩阵为单位阵,如果Sig值拒绝原假设表示变量间存在相关关系,因此适合做因子分析。
3.单击“抽取”按钮:
主要设定提取公共因子的方法和公共因子的个数。
方法:
主成分分析法。
SPSS默认方法。
该方法假定原变量是因子变量的线性组合,第一主成分有最大的方差,后续成分可解释的方差越来越少。
这是使用最多的因子提取方法。
分析:
相关性矩阵。
表示以相关性矩阵作为提取公共因子的依据,当分析中使用不同的尺度测量变量时比较适合。
输出:
未旋转的因子解。
显示未旋转时因子负荷量、特征值及共同性。
碎石图。
表示输出与每个因子相关联的特征值的图,该图用于确定应保持的因子个数,通常该图显示大因子的陡峭斜率和剩余因子平缓的尾部之间明显的中断。
按特征值大小排列,有助于确定保留多少个因子。
抽取:
基于特征值。
表示抽取特征值超过指定值的所有因子,在“特征值大于”输入框中指定值,一般为1。
4.旋转:
用于设定因子旋转的方法。
旋转的目的是为了简化结构,以帮助解释因子SPSS默认不旋转。
方法:
最大方差法:
是一种正交旋转方法,他使得对每个因子有高负载的变量的数目达到最小,并简化了因子的解释。
输出:
旋转解。
该复选框只有在选择里旋转方法之后才能选择,对于正交旋转会显示已旋转的模式矩阵和因子变换矩阵。
5.得分:
用于对因子得分进行设置,即计算因子得分。
取默认值,单击继续按钮。
6.选项:
用于设定对变量缺失值的处理和系数显示的格式。
缺失值:
按列表排除个案。
去除所有含缺失值的个案后再进行分析。
系数显示格式:
按大小排列。
载荷系数按照数值的大小排列,并构成矩阵,使得在同一因子上具有较高载荷的变量的排列在一起,便于得到结论。
(三)结果分析
1.KMO及Bartlett’检验
当KMO值愈大时,表示变量间的共同因子愈多,愈适合进行因子分析,根据专家观点,如果KMO的值小于0.5时,较不宜进行因子分析,此处的KMO值为0.695,表示适合因子分析。
此外Bartkett’s球形检验的原假设为相关系数矩阵为单位阵,Sig值为0.000小于显著水平0.05,因此拒绝虚无假设,说明变量之间存在相关关系,适合做因子分析。
(Bartkett’s球形检验的为234.438,自由度为45,达到显著,代表母群体的相关矩阵间有共同因子存在,适合进行因子分析。
)
2.共同性,显示因子间的共同性结果。
在主成分分析中,有多少个原始变量便有多少个成分,所以共同性会等于1,没有唯一因素。
所以本结果中间一栏显示初试共同性都为1,则表示抽取方法为主成分分析法,最右一栏为题项的共同性。
从该表可以得到,因子分析的变量共同度都非常高,表明变量中的大部分信息均能够被因子所提取,说明因子分析的结果是有效的。
3.整体解释的变异数--------旋转之前的数据。
该表给出了因子贡献率的结果,表中左侧部分为初始特征值,中间为提取主因子结果,右侧为旋转后的主因子结果。
“合计”指因子的特征值,“方差的%”表示该因子的特征值占总特征值百分比,“累积%”表示累积的百分比。
左边10个成分因子的特征值总和等于10。
解释变异量为特征值除以题项数,如第一个特征值的解释变异量为6.385÷10=63.579%。
其中自有前三个因子的特征值大于1,并且前三个因子的特征值之和占总特征值的89.366%,因此提取前三个因子作为主因子列于右边,这也是因子分析时所抽出的公共因子数。
由于特征值是由大到小排列,所以第一个公同因子的解释变异量通常是最大者,其次是第二个1.547,再是第三个1.032。
旋转后的特征值为4.389,3.137,1,411,解释变异量为43.885%,31.372%,14.108%,累积的解释变异量为43.885%,75.257%,89.366%。
旋转后的特征值不同于转轴前的特征值。
4.碎石图。
特征值的碎石图。
通常该图显示大因子的陡峭斜率和剩余因子平缓的尾部,之间有明显的中断。
一般取主因子在非常陡峭的斜率上,而处在平缓斜率上的因子对变异的解释非常小。
可以从此碎石图中看出,从第三个因素以后,坡线甚为平坦,因而可以保留3个因素较为适宜。
5.成分矩阵:
给出了未旋转的因子载荷。
从该表中可以得到利用主成分分析方法提取的三个因子的载荷量,其中因子负荷量小于0.1的未被显示,因子为了方便解释因子含义,需要进行因子旋转。
6.旋转成份矩阵:
给出了旋转后的因子载荷值,其中旋转方法采用的是Kaiser标准化的正交旋转法。
通过因子旋转,各个因子有了比较明确的含义。
从图中可以看出:
a1,a8,a6,a5,a4位因子1,a10,a9,a7为因子2,a3,a2为因子3。
题项在其所属的因子层面顺序是按照因子负荷量的高低排列的。
7.成份转换矩阵:
六.结果说明
根据因子的特征值和旋转后的因子矩阵,采用了主成分分析法抽取出3个因子作为共同因子,并使用因子旋转方法中的最大方差法,按照从大到小的顺序进行排列,使得变量与因子的关系豁然明了,对其做如下表所示的因子分析摘要表。
题项
解释变异量
累积解释变异量
抽取的因子
因子1负荷量
因子2负荷量
因子3负荷量
共同性
A1电脑
A8CAI课件
A6电子邮件
A5校园网或因特网
A4网上资料
43.885%
43.885%
0.915
0.912
0.884
0.824
0.789
0.928
0.907
0.867
0.901
0.872
A10视听会议
A9视频会议
A7电子讨论网
31.372%
75.257%
0.939
0.924
0.858
0.939
0.965
0.919
A录像带
A录像磁带
14.108%
89.366%
0.948
0.652
0.900
0.738
特征值
4.389
3.137
1.411