SPSS学习系列31 因子分析Word文档格式.docx

上传人:b****6 文档编号:19737823 上传时间:2023-01-09 格式:DOCX 页数:16 大小:404.21KB
下载 相关 举报
SPSS学习系列31 因子分析Word文档格式.docx_第1页
第1页 / 共16页
SPSS学习系列31 因子分析Word文档格式.docx_第2页
第2页 / 共16页
SPSS学习系列31 因子分析Word文档格式.docx_第3页
第3页 / 共16页
SPSS学习系列31 因子分析Word文档格式.docx_第4页
第4页 / 共16页
SPSS学习系列31 因子分析Word文档格式.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

SPSS学习系列31 因子分析Word文档格式.docx

《SPSS学习系列31 因子分析Word文档格式.docx》由会员分享,可在线阅读,更多相关《SPSS学习系列31 因子分析Word文档格式.docx(16页珍藏版)》请在冰豆网上搜索。

SPSS学习系列31 因子分析Word文档格式.docx

提取公因子方法有

(1)主成份法(默认),假设变量是各因子的线性组合,从解释变量的变异除非,尽量是变量的方差能被主成分所解释,适合大多数情况;

(2)未加权的最小平方法:

使相关矩阵和再生相关矩阵之差的平方和达到最小;

(3)综合最小平方法:

(2),并用单值的倒数对相关系数加权;

(4)最大似然法:

要求数据服从多变量正态分布,此时生成的参数估计最接近观察到相关矩阵,适宜样本量较大情况;

(5)主轴因子分解法:

从原始变量的相关性出发,使变量间的相关程度尽可能地被公因子解释,但对变量方差的解释不太重视;

(6)α因子分解法:

将变量看出从潜在的变量空间中抽取出的样本,计算时尽量使得变量的α信度达到最大,适合不好的数据;

(7)映像因子分解法:

把一个变量看作是其它变量的多元回归,提取公因子。

注2:

计算特征值和特征向量时,可选择相关矩阵(不受量纲影响)或协方差矩阵(受量纲影响较大,需先进行变量标准化)计算主成分。

但SPSS做因子分析时,已经包含了变量标准化过程。

二者结果有差异,但在对因子解释和方差贡献率的解释上是一致的。

4.点【旋转】,打开“旋转”子窗口,【方法】选“最大方差法”,【输出】勾选“旋转解”、“载荷图”;

注:

(1)最大方差法:

最常用,使各因子保持正交前提下的方差差异(相对载荷平方和)达到最大,方便对公因子解释;

(2)最大四次方值法:

各因子方差差异化更强,并减少和每个变量有关联的因子数,简化对原变量的解释;

(3)最大平衡值法:

介于方差最大正交旋转与4次方最大正交旋转之间;

(4)直接Oblimin法:

斜交旋转方法,需先指定一个因子映像的自相关范围;

(5)Promax:

最常用的斜交旋转法,在方差最大正交旋转的基础上再进行斜交旋转,旋转后允许因子间存在相关,适合有具体的结果倾向时选用。

5.用主成分法提取公因子,用回归法对因子进行估计。

点【得分】,打开“因子得分”子窗口,勾选“保存为变量”方法选“回归”、“显示因子得分系数矩阵”;

另外,若在【选项】子窗口,将【系数显示格式】勾选“按大小排序”,将按载荷从大到小排列变量。

点【确定】得到(部分与主成份分析结果相同,略)

KMO和Bartlett的检验

取样足够度的Kaiser-Meyer-Olkin度量。

.620

Bartlett的球形度检验

近似卡方

231.285

df

28

Sig.

.000

KMO检验变量间的偏相关是否较大,该值越大越适合做因子分析,0.7以上因子分析效果较好,0.5以下不适合做因子分析。

KMO值=0.620<

0.7说明变量间的重叠可能不是特别高。

Bartlett球形度检验判断相关系数矩阵是否是单位阵,原假设H0:

各变量相互独立。

P值<

0.001<

0.05,故拒绝原假设,即变量间有较强的相关性。

公因子方差

初始

提取

GDP

1.000

.945

居民消费水平

.799

固定资产投资

.902

职工平均工资

.873

货物周转量

.857

居民消费价格指数

.957

商品价格指数

.928

工业总产值

.904

提取方法:

主成份分析。

公因子方差,表示各变量中所含原始信息能被提取的公因子所表示的程度。

基本都在0.80以上,表示提取的公因子对各变量有较强的解释能力。

解释的总方差

成份

初始特征值

提取平方和载入

旋转平方和载入

合计

方差的%

累积%

1

3.754

46.924

3.207

40.092

2

2.203

27.532

74.456

2.217

27.708

67.800

3

1.208

15.096

89.551

1.740

21.752

4

.403

5.042

94.593

5

.214

2.673

97.266

6

.138

1.722

98.988

7

.066

.829

99.817

8

.015

.183

100.000

【初始特征值】表示初步提取共同因素的结果:

“合计”列为每一个主成分的特征值,其值越大表示该主成分在解释8个变量的变异时越重要;

“方差的%”列为每个提取因素可以解释的变异百分比;

“累积%”列为解释的变异的累积百分比;

8个变量(初始特征值=1)总特征值为8,第一个特征值=3.754,3.754/8=46.924%即第一个“方差的%”值,累积百分比最终是100%.

【提取平方和载入】给出了旋转前的特征值、解释变异量、累积解释变异量;

主成分法默认只提取≥1的特征值,共3个即3个公因子(3个是否合适借助碎石图判断),它们共可解释89.551%的变异。

【旋转平方和载入】给出了旋转后的特征值、解释变异量、累积解释变异量;

旋转后,共同因素的特征值会改变,但总的特征值之和不变(解释的变异的累积百分比相同);

共同性也不会改变,但每个变量在其共同因素中的负荷系数会改变。

碎石图,可以帮助决定公因子的数目。

碎石图将每个公因子的特征值(重要程度)从高到低排序绘制成一条坡度线,横轴为公因子数目。

其判断标准是:

取坡度线急剧下降的部分,去掉坡度线平坦的部分,从图中看选取4个共同因素是合适的。

另外,也要参考选取的合理性:

选择的公因子包含的变量数不能太少。

正常情况下需要将【抽取】的公因子数设为4重新做因子分析:

在原窗口点【抽取】,打开“抽取”子窗口,选择【抽取】下的“因子的固定数量”,在【要提取的因子】框输入“4”;

但由于本例中变量数较少,故保持原来的3个公因子。

成份矩阵a

.884

.385

.120

.606

-.596

.277

.911

.163

.213

.465

-.725

.362

.486

.737

-.279

-.510

.257

.794

-.621

.596

.433

.822

.429

.210

提取方法:

主成份。

a.已提取了3个成份。

旋转前(实际上是主成分分析的结果),8个变量在3个公因子上的载荷矩阵,载荷值越大表示该变量与其共同因素的关联越大。

由该矩阵可以计算每个变量的共同性、每个公因子的特征值、再生相关矩阵。

公因子结构表达式(因子模型,前3项为共同因素,εi为特殊因子):

Zx1=0.884*F1+0.385*F2+0.120*F3+ε1

……

Zx8=0.822*F1+0.429*F2+0.210*F3+ε8

其中,Zxi为xi的标准化变量,Fi的表达式同【第30篇:

主成份分析】中的表示。

共同性为每个变量在各公因子上载荷的平方和,如变量“固定资产投资”的共同性为:

0.9112+0.1632+0.2132=0.902

公因子的特征值是该公因子上所有载荷的平方和,如公因子1的特征值为(注意这些特征值是从大到小排列):

0.9112+0.8842+0.8222+…+(-0.510)2=3.754

再生相关性

再生的相关性

.945a

.341

.894

.176

.680

-.257

-.268

.917

.799a

.515

.814

-.222

-.243

-.611

.301

.902a

.383

.503

-.254

-.376

.864

.873a

-.409

-.136

-.563

.148

.857a

-.280

.017

.657

.957a

-.142

.928a

-.163

.904a

残差b

-.074

.056

.011

-.062

-.015

.004

-.044

-.089

-.098

.071

.008

.019

.062

.013

-.073

-.026

-.072

.053

-.009

.020

-.049

.027

.005

.002

-.051

-.029

a.重新生成的公因子方差

b.将计算观察到的相关性和重新生成的相关性之间的残差。

有11(39.0%)个绝对值大于0.05的非冗余残差。

旋转成份矩阵a

.955

.124

-.131

.219

.841

-.209

.872

.351

-.137

.048

.925

-.121

.751

-.507

-.192

-.135

-.013

.969

-.104

-.496

.819

.944

.109

-.014

旋转法:

具有Kaiser标准化的正交旋转法。

a.旋转在5次迭代后收敛。

采用方差最大正交旋转法旋转后的公因子载荷矩阵,旋转的目的是为了让载荷大的越大、小的越小(载荷平方和不变),从而更容易区分各变量的归属。

由于是正交转轴,故表中系数可视为变量与共同因素的相关系数矩阵(因素结构或加权矩阵),等于旋转前的公因子载荷矩阵乘以成份转换矩阵。

标准定为选择载荷大于0.75的变量,可看出

公因子1包含变量:

GDP、工业总产值、固定资产投资、货物周转量;

从而,可命名为总量因子;

公因子2包含变量:

职工平均工资、居民消费水平;

从而,可命名为消费因子;

公因子3包含变量:

居民消费价格指数、商品价格指数;

从而,可命名为价格因子。

成份转换矩阵

.817

.407

-.408

.548

-.769

.331

.179

.494

.851

成份得分系数矩阵

.306

.047

.025

.387

.040

.270

.129

.075

-.025

.451

.096

.248

-.319

-.139

.070

.180

.653

.077

.462

.317

.026

.123

成分得分矩阵给出了各主成分在每个变量上的载荷,从而得到计算公式:

F1=0.306Zx1+0.025Zx2+0.270Zx3-0.025Zx4+0.248Zx5

+0.070Zx6+0.077Zx7+0.317Zx8

F2=0.011Zx1+0.387Zx2+0.129Zx3+0.451Zx4-0.319Zx5

+0.180Zx6-0.098Zx7+0.026Zx8

F3=0.047Zx1+0.040Zx2+0.075Zx3+0.096Zx4-0.139Zx5

+0.653Zx6+0.462Zx7+0.123Zx8

该计算公式本质上与利用“旋转成分矩阵”得到的主成分计算公式是等价的,区别是前者的标准差是1.

成份得分协方差矩阵

各公因子的得分保存为新变量(默认为):

FAC1_1~FAC3_1

这3个公因子分别从三个不同方面反映了各地经济发展状况,若要用1个综合得分来综合评价各省市经济发展,可以按各公因子对应的方差贡献率的比例为权重计算综合得分:

Score=40.092/89.551*FAC1_1+27.708/89.551*FAC2_1+21.752/89.551*FAC3_1

上述数值来自前文“解释的总方差”表。

【计算变量】,【排序个案】,

得到

注意:

若有反向变量,需要先转化为正向。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1