主成分因子分析步骤.docx

上传人:b****5 文档编号:6722941 上传时间:2023-01-09 格式:DOCX 页数:9 大小:23.05KB
下载 相关 举报
主成分因子分析步骤.docx_第1页
第1页 / 共9页
主成分因子分析步骤.docx_第2页
第2页 / 共9页
主成分因子分析步骤.docx_第3页
第3页 / 共9页
主成分因子分析步骤.docx_第4页
第4页 / 共9页
主成分因子分析步骤.docx_第5页
第5页 / 共9页
点击查看更多>>
下载资源
资源描述

主成分因子分析步骤.docx

《主成分因子分析步骤.docx》由会员分享,可在线阅读,更多相关《主成分因子分析步骤.docx(9页珍藏版)》请在冰豆网上搜索。

主成分因子分析步骤.docx

主成分因子分析步骤

公司内部档案编码:

[OPPTR-OPPT28-OPPTL98-OPPNN08]

 

主成分因子分析步骤

主成分分析、因子分析步骤

不同点

主成分分析

因子分析

概念

具有相关关系的p个变量,经过线性组合后成为k个不相关的新变量

将原数据中多个可能相关的变量综合成少数几个不相关的可反映原始变量的绝大多数信息的综合变量

主要

目标

减少变量个数,以较少的主成分来解释原有变量间的大部分变异,适合于数据简化

找寻变量间的内部相关性及潜在的共同因素,适合做数据结构检测

强调

重点

强调的是解释数据变异的能力,以方差为导向,使方差达到最大

强调的是变量之间的相关性,以协方差为导向,关心每个变量与其他变量共同享有部分的大小

最终结果应用

形成一个或数个总指标变量

反映变量间潜在或观察不到的因素

变异解释程度

它将所有的变量的变异都考虑在内,因而没有误差项

只考虑每一题与其他题目共同享有的变异,因而有误差项,叫独特因素

是否需要旋转

主成分分析作综合指标用,

不需要旋转

因子分析需要经过旋转才能对因子作命名与解释

是否有假设

只是对数据作变换,故不需要假设

因子分析对资料要求需符合许多假设,如果假设条件不符,则因子分析的结果将受到质疑

因子分析

1【分析】→【降维】→【因子分析】

(1)描述性统计量(Descriptives)对话框设置

KMO和Bartlett的球形度检验(检验多变量正态性和原始变量是否适合作因子分析)。

(2)因子抽取(Extraction)对话框设置

方法:

默认主成分法。

主成分分析一定要选主成分法

分析:

主成分分析:

相关性矩阵。

输出:

为旋转的因子图

抽取:

默认选1.

最大收敛性迭代次数:

默认25.

(3)因子旋转(Rotation)对话框设置

因子旋转的方法,常选择“最大方差法”。

“输出”框中的“旋转解”。

(4)因子得分(Scores)对话框设置

“保存为变量”,则可将新建立的因子得分储存至数据文件中,并产生新的变量名称。

(5)选项(Options)对话框设置

2结果分析

(1)KMO及Bartlett’s检验

KMO和Bartlett的检验

取样足够度的Kaiser-Meyer-Olkin度量。

.515

Bartlett的球形度检验

近似卡方

3.784

df

6

Sig.

.706

当KMO值愈大时,表示变量间的共同因子愈多,愈适合作因子分析。

根据Kaiser的观点,当KMO>0.9(很棒)、KMO>0.8(很好)、KMO>0.7(中等)、KMO>0.6(普通)、KMO>0.5(粗劣)、KMO<0.5(不能接受)。

(2)公因子方差

公因子方差

起始

撷取

卫生

1.000

.855

饭量

1.000

.846

等待时间

1.000

.819

味道

1.000

.919

亲切

1.000

.608

撷取方法:

主体元件分析。

Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。

共同度低说明在因子中的重要度低。

一般的基准是<0.4就可以认为是比较低,这时变量在分析中去掉比较好。

(3)解释的总方差

说明的变异数总计

元件

各因子的特征值

因子贡献率

因子累积贡献率

总计

变异的%

累加%

总计

变异的%

累加%

总计

变异的%

累加%

1

2.451

49.024

49.024

2.451

49.024

49.024

2.042

40.843

40.843

2

1.595

31.899

80.923

1.595

31.899

80.923

2.004

40.079

80.923

3

.662

13.246

94.168

4

.191

3.823

97.992

5

.100

2.008

100.000

撷取方法:

主体元件分析。

第二列:

各因子的统计值

第三列:

各因子特征值与全体特征值总和之比的百分比。

也称因子贡献率。

第四列:

累积百分比也称因子累积贡献率

第二列统计的值是各因子的特征值,即各因子能解释的方差,一般的,特征值在1以上就是重要的因子;第三列%是各因子的特征值与所有因子的特征值总和的比,也称因子贡献率;第四列是因子累计贡献率。

如因子1的特征值为2.451,因子2的特征值为1.595,因子3,4,5的特征值在1以下。

因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显着。

至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量,fac1_1、fac2_1,即为因子得分。

(4)成分矩阵与旋转成分矩阵

成分矩阵是未旋转前的因子矩阵,从该表中并无法清楚地看出每个变量到底应归属于哪个因子。

旋转后的因子矩阵,从该表中可清楚地看出每个变量到底应归属于哪个因子。

此表显示旋转后原始的所有变量与新生的2个公因子之间的相关程度。

一般的,因子负荷量的绝对值0.4以上,认为是显着的变量,超过0.5时可以说是非常重要的变量。

如味道与饭量关于因子1的负荷量高,所以聚成因子1,称为饮食因子;等待时间、卫生、亲切关于因子2的负荷量高,所以聚成因子2,又可以称为服务因子。

(5)因子得分系数矩阵

元件评分系数矩阵

元件

1

2

卫生

-.010

.447

饭量

.425

-.036

等待时间

-.038

.424

味道

.480

.059

亲切

-.316

-.371

撷取方法:

主体元件分析。

转轴方法:

具有Kaiser正规化的最大变异法。

元件评分。

因子得分系数矩阵给出了因子与各变量的线性组合系数。

因子1的分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5

因子2的分数=0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5

(6)因子转换矩阵

元件转换矩阵

元件

1

2

1

.723

-.691

2

.691

.723

撷取方法:

主体元件分析。

转轴方法:

具有Kaiser正规化的最大变异法。

因子转换矩阵是主成分形式的系数。

(7)因子得分协方差矩阵

元件评分共变异数矩阵

元件

1

2

1

1.000

.000

2

.000

1.000

撷取方法:

主体元件分析。

转轴方法:

具有Kaiser正规化的最大变异法。

元件评分。

看各因子间的相关系数,若很小,则因子间基本是两两独立的,说明这样的分类是较合理的。

主成分分析

1【分析】——【降维】——【因子分析】

(1)设计分析的统计量

【相关性矩阵】中的“系数”:

会显示相关系数矩阵;

【KMO和Bartlett的球形度检验】:

检验原始变量是否适合作主成分分析。

【方法】里选取“主成分”。

【旋转】:

选取第一个选项“无”。

【得分】:

“保存为变量”

【方法】:

“回归”;再选中“显示因子得分系数矩阵”。

2结果分析

(1)相关系数矩阵

相关性矩阵

食品

衣着

燃料

住房

交通和通讯

娱乐教育文化

相关

食品

1.000

.692

.319

.760

.738

.556

衣着

.692

1.000

-.081

.663

.902

.389

燃料

.319

-.081

1.000

-.089

-.061

.267

住房

.760

.663

-.089

1.000

.831

.387

交通和通讯

.738

.902

-.061

.831

1.000

.326

娱乐教育文化

.556

.389

.267

.387

.326

1.000

两两之间的相关系数大小的方阵。

通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。

由表中可知许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。

(2)KMO及Bartlett’s检验

KMO与Bartlett检定

Kaiser-Meyer-Olkin测量取样适当性。

.602

Bartlett的球形检定

大约卡方

62.216

df

15

显着性

.000

根据Kaiser的观点,当KMO>0.9(很棒)、KMO>0.8(很好)、KMO>0.7(中等)、KMO>0.6(普通)、KMO>0.5(粗劣)、KMO<0.5(不能接受)。

(3)公因子方差

Communalities

起始

撷取

食品

1.000

.878

衣着

1.000

.825

燃料

1.000

.841

住房

1.000

.810

交通和通讯

1.000

.919

娱乐教育文化

1.000

.584

撷取方法:

主体元件分析。

Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。

共同度低说明在因子中的重要度低。

一般的基准是<0.4就可以认为是比较低,这时变量在分析中去掉比较好。

(4)解释的总方差:

说明的变异数总计

元件

起始特征值

撷取平方和载入

总计

变异的%

累加%

总计

变异的%

累加%

1

3.568

59.474

59.474

3.568

59.474

59.474

2

1.288

21.466

80.939

1.288

21.466

80.939

3

.600

10.001

90.941

4

.358

5.975

96.916

5

.142

2.372

99.288

6

.043

.712

100.000

撷取方法:

主体元件分析。

因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显着。

(5)成分矩阵(因子载荷矩阵)

元件矩阵a

元件

1

2

食品

.902

.255

衣着

.880

-.224

燃料

.093

.912

住房

.878

-.195

交通和通讯

.925

-.252

娱乐教育文化

.588

.488

撷取方法:

主体元件分析。

a.撷取2个元件。

该矩阵并不是主成分1和主成分2的系数。

主成分系数的求法:

各自主成分载荷向量除以主成分方差的算数平方根。

则第1主成分的各个系数是向量(0.925,0.902,0.880,0.878,0.588,0.093)除以

后才得到的,即(0.490,0.478,0.466,0.465,0.311,0.049)才是主成分1的特征向量。

第1主成分的函数表达式:

Y1=0.490*Z交+0.478*Z食+0.466*Z衣+0.465*Z住+0.311*Z娱+0.049*Z燃

(6)因子得分

因子得分显示在SPSS的数据窗口里。

通过因子得分计算主成分得分。

(7)主成分得分

主成分的得分是相应的因子得分乘以相应方差的算数平方根。

即:

主成分1得分=因子1得分乘以3.568的算数平方根

主成分2得分=因子2得分乘以1.288的算数平方根

【转换】—【计算变量】

(8)综合得分及排序

综合得分是按照下列公式计算:

综合得分Y为:

【数据】——【排序个案】

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1