主成分因子分析步骤.docx

上传人:b****7 文档编号:9833482 上传时间:2023-02-06 格式:DOCX 页数:24 大小:174.35KB
下载 相关 举报
主成分因子分析步骤.docx_第1页
第1页 / 共24页
主成分因子分析步骤.docx_第2页
第2页 / 共24页
主成分因子分析步骤.docx_第3页
第3页 / 共24页
主成分因子分析步骤.docx_第4页
第4页 / 共24页
主成分因子分析步骤.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

主成分因子分析步骤.docx

《主成分因子分析步骤.docx》由会员分享,可在线阅读,更多相关《主成分因子分析步骤.docx(24页珍藏版)》请在冰豆网上搜索。

主成分因子分析步骤.docx

主成分因子分析步骤

主成分分析、因子分析步骤

不同点

主成分分析

因子分析

概念

具有相关关系的p个变量,经过线性组合后成为k个不相关的新变量

将原数据中多个可能相关的变量综合成少数几个不相关的可反映原始变量的绝大多数信息的综合变量

主要

目标

减少变量个数,以较少的主成分来解释原有变量间的大部分变异,适合于数据简化

找寻变量间的内部相关性及潜在的共同因素,

适合做数据结构检测

强调

重点

强调的是解释数据变异的能力,以方差为导向,使方差达到最大

强调的是变量之间的相关性,以协方差为导向,关心每个变量与其他变量共同享有部分的大小

最终结果应用

形成一个或数个总指标变量

反映变量间潜在或观祭不到的因素

变异解

释程度

它将所有的变量的变异都考虑在内,因而没有误差项

只考虑每一题与其他题目共同享有的变异,因而有误差项,叫独特因素

是否需

要旋转

主成分分析作综合指标用,不需要旋转

因子分析需要经过旋转才能对因子作命名与解释

是否有假设

只是对数据作变换,故不需要假设

因子分析对资料要求需符合许多假设,如果假设条件不符,则因子分析的结果将受到质疑

因子分析

1【分析】T【降维】T【因子分析】

(1)描述性统计量(Descriptives)对话框设置

KMO^Bartlett的球形度检验(检验多变量正态性和原始变量是否适合作因子分析)

酚因刊折:

撞述统计L*gb-1

-Statistics

■IEMIIIlailliumiIIMIIIII■!

!

■“■“■■([■■Il弹夷星描述性d

I?

偉始劳斬结杲

(1)

□系数©B竝棋型凹

1B显著性水平(S):

再生迟)l一行列式匚)二j厦炭象牲)□创10和阴rfl*的球总度检验

[继壤][取消]呃]

(2)因子抽取(Extraction)对话框设置

方法:

默认主成分法。

主成分分析一定要选主成分法分析:

主成分分析:

相关性矩阵。

输出:

为旋转的因子图

抽取:

默认选1.

最大收敛性迭代次数:

默认25.

(3)因子旋转(Rotation)对话框设置

因子旋转的方法,常选择“最大方差法”。

“输出”框中的“旋转解”

因孑分析:

旋转

—方迭

OjEO矗大辺吹才值做①

⑥廉丈斤勢割Q(鹿大平斷值直g

OXttOblniin万祜£0)oPromaxi:

Delta(DX0IKflppfltK)厂

爲出1

iBriiiliMililmlliliwJ

最太牧殲tt送戕耿毅凶:

(4)因子得分(Scores)对话框设置

“保存为变量”,则可将新建立的因子得分储存至数据文件中,并产生新的变量名称。

®因子另析:

因刊盼>

7T法

■®0H3(K)

BartletttB)

OAnderson-Rubin(A)

Eiimii■■»ail■mmirrmim■■■rn

显朮因孑用井葢独鉅阵(D

Ssisd—-is—&:

■:

>•—jb■>_-jii■—:

na—■■

(5)选项(Options)对话框设置

冏因子分析;选项x

娥失僮

■-?

■■■■rpBiairn'iBianrtiiina-riiairrBinn-ri■■■»»■■arn

色辛按列衰桃釀■!

■现(9罚宙S恳不臺五亠"'”"_

©細均恒曹糕迟)

I

乘独员赵式1

一按丈小怖啟①

□取潸小畫散〔9

迤对船炯下〔闿』T

2结果分析

(1)KMO及Bartlett's检验

KMO和Bartlett的检验

取样足够度的Kaiser-Meyer-Olkin度量。

Bartlett的球形度检验近似卡方

df

Sig.

.515

3.784

6

.706

当KMO直愈大时,表示变量间的共同因子愈多,愈适合作因子分析。

根据Kaiser的观点,当KMO0.9(很棒)、KMO0.8(很好)、KMO0.7(中等)、KMO0.6(普通)、KMO0.5(粗劣)、KM&0.5(不能接受)。

(2)公因子方差

公因子方差

起始

撷取

卫生

1.000

.855

饭量

1.000

.846

等待时间

1.000

.819

味道

1.000

.919

亲切

1.000

.608

撷取方法:

主体元件分析。

Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子

方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。

共同度低说明在因子中的重要度低。

一般的基准是<0.4就可以认为是比较低,

这时变量在分析中去掉比较好。

(3)解释的总方差

说明的变异数总计

元件

各因子的特征值

因子贡献率

因子累积贡献率

总计

变异的%

累加%

总计

变异的%

累加%

总计

变异的%

累加%

1

2.451

49.024

49.024

2.451

49.024

49.024

2.042

40.843

40.843

2

1.595

31.899

80.923

1.595

31.899

80.923

2.004

40.079

80.923

3

.662

13.246

94.168

4

.191

3.823

97.992

5

.100

2.008

100.000

撷取方法:

主体元件分析。

第二列:

各因子的统计值

第三列:

各因子特征值与全体特征值总和之比的百分比。

也称因子贡献率。

第四列:

累积百分比也称因子累积贡献率

第二列统计的值是各因子的特征值,即各因子能解释的方差,一般的,特征值在1以上就是重要的因子;第三列%是各因子的特征值与所有因子的特征值总和的比,也称因子贡献率;

第四列是因子累计贡献率。

如因子1的特征值为2.451,因子2的特征值为1.595,因子3,4,5的特征值在1以下。

因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。

祁H

AJij4

寸应盘童的也則

FAC1

J

FAC?

」I..

4

1

th泗

1

$

1

1.25423

.1.60622

3

1

1.61135

4

1

1?

8622

翻閒2

3

1

1115C7

■1082«

2

1

-KSM

03122

2.

1

14673

1?

D

1

144917

4E033

11

1

-133730

-1D3265

1

1

■79531

D8K5

2

1

■t40031

115G1

1

1

1.2&791

2

1

.2694T

1.2DW0

3

1

76124

1•如剖

至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量,fac1_1、

fac2_1,即为因子得分。

(4)成分矩阵与旋转成分矩阵

 

帀牛

1

2

饭里

.915

.427

萼待时闾

-.787

.447

卫生

-.775

味追

.750

-B7

亲切

.069

-.776

攧职方法:

主体元件甘析◎a-掖取2个元件。

元件

1

2

-.036

1曲4

.255

卩牛

.212

.90C

等侍时1目

-.260

.&67

亲切

-.487

-.609

廠取方送乂工体珂件好析。

转抽方迭;具有I^isei正规化的最

大麥异法。

酣在3鲁代中收魏徧幵。

成分矩阵是未旋转前的因子矩阵,从该表中并无法清楚地看出每个变量到底应归属于哪个因子。

旋转后的因子矩阵,从该表中可清楚地看出每个变量到底应归属于哪个因子。

此表显示

旋转后原始的所有变量与新生的2个公因子之间的相关程度。

一般的,因子负荷量的绝对值0.4以上,认为是显著的变量,超过0.5时可以说是非常重要的变量。

如味道与饭量关于因子1的负荷量高,所以聚成因子1,称为饮食因子;等待时间、卫生、亲切关于因子2的负荷量高,所以聚成因子2,又可以称为服务因子。

(5)因子得分系数矩阵

元件评分系数矩阵

元件

1

2

卫生

-.010

.447

饭量

.425

-.036

等待时间

-.038

.424

味道

亲切

.480

-.316

.059

-.371

撷取方法:

主体元件分析。

转轴方法:

具有Kaiser正规化的最

大变异法。

元件评分。

因子得分系数矩阵给出了因子与各变量的线性组合系数。

因子1的分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5

因子2的分数=0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5

(6)因子转换矩阵

元件转换矩阵

元件

1

2

1

.723

-.691

2

.691

.723

撷取方法:

主体元件分析。

转轴方法:

具有Kaiser正规化

的最大变异法。

因子转换矩阵是主成分形式的系数。

(7)因子得分协方差矩阵

元件评分共变异数矩阵

元件

1

2

1

2

1.000

.000

1.000

「.000

撷取方法:

主体元件分析。

转轴方法:

具有Kaiser正规化

的最大变异法。

元件评分。

看各因子间的相关系数,若很小,则因子间基本是两两独立的,说明这样的分类是较合理的。

1【分析】

【降维】

主成分分析

【因子分析】

 

(1)设计分析的统计量

【相关性矩阵】中的“系数”:

会显示相关系数矩阵;

【KMO^Bartlett的球形度检验】:

检验原始变量是否适合作主成分分析。

【方法】里选取“主成分”

&因子分聊

方进也】;主用谢”I

I分鞋|5h出

o柜关容世聲迟.』極转的因子増世;

<■世方羞矩薛过□碁石屈醪)

严—

害星丁那E值⑥

静征诅K于凶:

H

<-医干的砾勒早理要噸的區子二:

品穴M觀性坯齿彌也:

[26_

阿阿両

【旋转】:

选取第一个选项“无”。

「轴宙子分析:

齢■MW

I右选I

◎.刼亚C1虽大四玄方俏法(型

O龍:

松差;fe(v)C'畐大爭SS值法(§)

蟲犬收敛H迭代次数疋)|25

【得分】:

“保存为变量”

【方法】:

“回归”;再选中“显示因子得分系数矩阵”

「轉国子分祈:

因予琴分

3保存为娈垦色)

「方法1J

@目忖®

OBartlett

OAnderson-Rubin

凰亘奈旨至翟菇画更產迪

ImiBirBniiarMimrmiiiiisai■■■iiBBiirBniBirMi■■■'^^niP

[磐]取帚I裁助

LJ

命囲盼析卫

蛀失值—|

u.■■■it—uia-—4iia&—:

■■■la—siiiiSi■■■i—aiaiiis—^B■■■>—«■

处境烈昶?

蠻Y赛⑥I

©按对制畸累®

[便用平闵值替换旦

磔数显示格式

匚按犬<1蜩匸序

"职消小碱3

绝对值如下述:

[雄续]取誚[帮跡

E5-

2结果分析

(1)相关系数矩阵

相关性矩阵

食品

衣着

燃料

住房

交通和通讯

娱乐教育文化

相关食品

1.000

.692

.319

.760

.738

.556

衣着

.692

1.000

-.081

.663

.902

.389

燃料

.319

-.081

1.000

-.089

-.061

.267

住房

.760

.663

-.089

1.000

.831

.387

交通和通讯

.738

.902

-.061

.831

1.000

.326

娱乐教育文化

.556

.389

.267

.387

.326

1.000

两两之间的相关系数大小的方阵。

通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。

由表中可知许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。

(2)KMO及Bartlett's检验

KMO与Bartlett检定

Kaiser-Meyer-Olkin测量取样适当性。

Bartlett的球形检大约卡方

定df

显著性

.602

62.216

15

.000

根据Kaiser的观点,当KMO0.9(很棒)、KMO>0.8(很好)、KMO0.7(中等)、KMO0.6(普通)、KMO0.5(粗劣)、KMO:

0.5(不能接受)。

(3)公因子方差

Communalities

起始

擷取

食品

1.000

.878

衣着

1.000

.825

燃料

1.000

.841

住房

1.000

.810

交通和通讯

1.000

.919

娱乐教育文化

1.000

.584

擷取方法:

主體元件分析。

Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子

方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。

共同度低说明在因子中的重要度低。

一般的基准是<0.4就可以认为是比较低,

这时变量在分析中去掉比较好。

(4)解释的总方差:

说明的变异数总计

元件

起始特征值

撷取平方和载入

总计

变异的%

累加%

总计

变异的%

累加%

1

3.568

59.474

59.474

3.568

59.474

59.474

2

1.288

21.466

80.939

1.288

21.466

80.939

3

.600

10.001

90.941

4

.358

5.975

96.916

5

.142

2.372

99.288

6

.043

.712

100.000

撷取方法:

主体元件分析。

因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,

即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。

(5)成分矩阵(因子载荷矩阵)

元件矩阵

元件

1

2

食品

.902

.255

衣着

.880

-.224

燃料

.093

.912

住房

.878

-.195

交通和通讯

.925

-.252

娱乐教育文化

.588

.488

撷取方法:

主体元件分析。

a.撷取2个元件。

该矩阵并不是主成分1和主成分2的系数。

主成分系数的求法:

各自主成分载荷向量除以主成分方差的算数平方根。

则第1主成分的各

个系数是向量(0.925,0.902,0.880,0.878,0.588,0.093)除以3-568后才得到的,

即(0.490,0.478,0.466,0.465,0.311,0.049)才是主成分1的特征向量。

第1主成分的函数表达式:

Y1=0.490*Z交+0.478*Z食+0.466*Z衣+0.465*Z住+0.311*Z娱+0.049*Z燃

(6)因子得分

1.FAC1.1

耳恥P

W^t:

B1I>DM戦IAffir*:

>M1jilit回酥VDftfi■»曰

5H

2

肃・i*h

u*

f*C2_i

1

WJ1

437T171

O-M

JIDI

»w[

135an

3E4D1Q4T

44-IE

X4t

394

4-inv

jQ36BQ

22J1

轉」,

1H3?

M21iMihUM1u-s翻

齐吕nr««:

■-t-j

ms

17T

33JE

13

11

23.»

11臥1

-1MK4-i

raw

7733

11

H.t

1G9-S2

32^

12.72

4712

34.3S.

-049M

11

nn

IS11

IS61

8l»

tJI

4JT«

1Ain

1J

MS

31Jf

16K

aa

nre

irwr

IfrMM

14

.M

讪&

2tSD

1?

«4

ibit

Ifi.B?

4*94

115W

JD2t

12.K

3344

MJ7

985

-11M3

-54側]

一加

101帕

23M

料能

曲旳

丄曲

iu^3

42It

29V

W

2912

dW■AW3S-1M54

114

21.再■給27»

1JET4

»103«&]

-i

-iitzra

45CD1

因子得分显示在SPSS勺数据窗口里。

通过因子得分计算主成分得分。

(7)主成分得分

主成分的得分是相应的因子得分乘以相应方差的算数平方根。

即:

主成分1得分=因子1得分乘以3.568的算数平方根

主成分2得分=因子2得分乘以1.288的算数平方根

FA211^RT(2"06-|

REGRFaztarsccre

RE<31?

fErlnl-scnre喪1

AiAjci

EHZJQ32匚创创W勺』r3i

匕B丄DJ—IFFIHI~~J

SCfJTfriUrti^pfi,姜弧jg||3的疏干方

1ryenw

Mnii

Rndil)

Rndi;2)

Rndl:

3)

sin

Sqrt

『runqllj

TiTLfK(2j

rnrct3)

T

曲硼旧JtBIB)■演,ffjh

 

1*圭壬抿耒二]-IBh/S3SS'■■■.dtstcs争-三淀疑異

;文什疋)痛娟底}视閱应)圾10也}

转換T)劳折凶直静囲

醉G:

.

|:

Z2H1勻园

jLad昌^

L事

11:

王欣分1

主成分2

1

北京

204910

22972

337058

2网5了

2

.41770

1.03&33

JB9W

117667

3

沏1

-1.03S56

-1.01953

-1.&6175

-1.15604

4

4c娈伫■口.

£

C仇盃斗了〉

IHrM

■ta-w-!

■■~ryy

6

rat

-.72783

d.1Q272

-1.37481

-1.2S14B

辽宁

2f3S2

.4b&Ul

.51722

.6Vh3

7

.09&GB

136274

JB0G9

154G&7

B

.软阿

-74193

5MD5

9

235583

-43335

444站刍

-49131

1Q

脯、

-05?

%

-.16554

-1094B

-vr&s

11

讯工

G3S62

M&90

120044

0SC63

-.43732

12517G

-82T19

14GGD2

i

-.37767

1.50&5B

-.71335

102331

江西

・6T75B

1490B6

-127985

169197

-11&93

r56950

-.22^7

-64633

i|Os

-.91423

■7G44B

-1.72G9D

-.06761

vI

4

魏ftf机團(3

1

(8)综合得分及排序

综合得分是按照下列公式计算:

化简得:

3r5681.285

Y=电主成分1得分+*主成好2得分,

3,56B+1.2883.56R+I.288

综合得分丫为:

创JfrftCP芦析®1M0)肆©TrPSTiL誓

堆区

酣2

¥I

1

2.(M9tC

223?

2

3.6705&

25&67

277509I

2

¥

41770

-1.03S80

.78900

^1.17667

26763

3

河北

-103856

101363

1M176

■11560(

■174605

4

-1.D8619

-1.31/86

-Z051?

2

-1J9b64

-1X23

S

向軒

-T27B3

-1102F2

-1.37dfi1

-12SU3

6

.27382

.45601

.61722

51763

7

QS5SE

136274

1BQ69

154657

54796

8

38CTB

47C=7

74193

5JW6

40紳

上春

2.35683

-43336

4.44996

-49181

J13921

10

05796

I騎討

1094B

-17766

•1?

756

tl

B3652

-.04990

仁临4

05663

.86702

~~

-43752

129Vt

-.02719

14S5D2

-21BM

13

-.3T7G?

1.606t8

-.71339

1823J1

■ZE

-.67766

1.49CI&5

-1J7966

1-69197

-.49161

-11633

-56950

-220B7

64633

■3337?

-.91423

•ZW

^1.72690

•067^1

-i.dWW

【数据】

【排序个案】

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1