应用多元统计分析习题解答因子分析.docx

上传人:b****6 文档编号:8154583 上传时间:2023-01-29 格式:DOCX 页数:15 大小:198.44KB
下载 相关 举报
应用多元统计分析习题解答因子分析.docx_第1页
第1页 / 共15页
应用多元统计分析习题解答因子分析.docx_第2页
第2页 / 共15页
应用多元统计分析习题解答因子分析.docx_第3页
第3页 / 共15页
应用多元统计分析习题解答因子分析.docx_第4页
第4页 / 共15页
应用多元统计分析习题解答因子分析.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

应用多元统计分析习题解答因子分析.docx

《应用多元统计分析习题解答因子分析.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析习题解答因子分析.docx(15页珍藏版)》请在冰豆网上搜索。

应用多元统计分析习题解答因子分析.docx

应用多元统计分析习题解答因子分析

第七章因子分析

7.1试述因子分析与主成分分析的联系与区别。

答:

因子分析与主成分分析的联系是:

①两种分析方法都是一种降维、简化数据的技术。

②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。

因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。

因子分析也可以说成是主成分分析的逆问题。

如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。

因子分析与主成分分析的主要区别是:

主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为I上,突出数据变异的方向,归纳重要信息。

而因子分析是从显在变量去提炼潜在因子的过程。

此外,主成分分析不需要构造分析模型而因子分析要构适因子模型。

7.2因子分析主要可应用于哪些方而?

答:

因子分析是一种通过显在变屋测评潜在变量,通过具体指标测评抽象因子的统计分析方法。

目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。

具体来说,①因子分析可以用于分类。

如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。

即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。

对我们进一步研究与探讨指示方向。

在社会调查分析中十分常用。

③因子分析的列一个作用是用于时空分解。

如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。

7.3简述因子模型X=AY+£中载荷矩阵A的统计意义。

答:

对于因子模型

xt=①百+ai2F2+•••+©◎+•••+aimFm+号f=1,2,…,p

Cl\\Cl\2…a\m

因子载荷阵为A=〜%…%=(列,码...,九)

••••••••••••

“I—2・•・伟j

Xj与巧的协方差为:

Cov(X门巧)=Cov(工纵迟+8i、Fj)

=Cov(工aik以,巧)+Cov(殆FJ

A-l

若对x,作标准化处理,二5,因此知一方而表示X,对巧的依赖程度;另一方而也反映了变量Xi对公共因子Fj的相对重要性。

m

变量共同度h;=工可i=12…,p

>1'

D(X,)=^0(^)+a[2D(F2)+••.+a;mD(F,n)+D(Si)=斥+士说明变量X,的方差由

两部分组成:

第一部分为共同度h;,它描述了全部公共因子对变疑X,的总方差所作的贡献,反映了公共因子对变量的影响程度。

第二部分为特殊因子®对变量X,的方差的贡献,通常称为个性方差。

而公共因子竹对X的员献g;=£好丿・=1,2,…,加

/-I

表示同一公共因子巧对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。

7.4在进行因子分析时,为什么要进行因子旋转?

最大方差因子旋转的基本思路是什么?

答:

因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。

但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。

这种因子模型反而是不利于突出主要矛盾和矛盾的主要方而的,也很难对因子的实际背景进行合理的解释。

这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。

最大方差旋转法是一种正交旋转的方法,英基本思路为:

A

其中令—花,心"巧说d;

"的第j列元素平方的相对方差可泄义为匕=丄£(盗-町)2

P1-1

刖=«+%+・・・+匕

最大方差旋转法就是选择正交矩阵厂,使得矩阵/T所有m个列元素平方的相对方差之和达到最大。

7.5试分析因子分析模型与线性回归模型的区别与联系。

答:

因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。

而线性回归模型回归分析的目的是设法找岀变量间的依存(数虽:

)关系,用函数关系式表达出来。

因子分析模型中每一个变量都可以表示成公共因子的线性函数与特姝因子之和。

Xf="h片+®2瑪+•••+"/例你+耳,(i=12…,p)该模型可用矩阵表7K为:

X=AF+£

而回归分析模型中多元线性回归方程模型为:

而回归分析模型满足

(1)正态性:

随机误差(即残差)e服从均值为0,方差为E的正态分布;

(2)等方差:

对于所有的自变量x,残差亡的条件方差为亍,且d为常数:

(3)独立性:

在给立自变量x的条件下,残差e的条件期望值为0(本假设又称零均值假设):

(4)无自相关性:

各随机谋差项e互不相关。

两种模型的联系在于都是线性的。

因子分析的过程就是一种线性变换。

7.6设某客观现象可用X=()'来描述,在因子分析时,从约相

关阵岀发计算出特征值为丑=1-75412:

=11张=0.255.由于,所以找前两个特

征值所对应的公共因子即可,又知对应的正则化特征向量分别为(0.707,-0.316,0.632)'及(0,0.899,0.4470)',要求:

(1)计算因子载荷矩阵A,并建立因子模型。

町店112,3

(2)计算共同度-

⑶计算第一公因子对X的“贡献”。

解:

(1)根据题意,A:

0.9360\

10.4180.899I

0.8370.4470/

I建立因子模型为

(2)

<3)因为是从约相关阵计算的特征值,所以公共因子对X的“贡献”为

7.7利用伙I子分析方法分析下列30个学生成绩的因子构成,并分析各个学生较适合学文科

还是理釆O

序号

数学

物理

化学

语文

历史

英语

1

65

61

72

84

81

79

解:

令数学成绩为X],物理为X2,化学为怡,语文为《,历史为X5,英语为X】,用SPSS分析学生成绩的因子构成的步骤如下:

1.在SPSS窗「】中选择Analyze—DataReduction-*Factor,调出因子分析主界而,并将六个变量移入Variables框中。

2•点击Descriptives按钮,展开相应对话框,见图72」选择Initialsolution复选项。

这个选项给岀各因子的特征值、存因子特征值占总方差的百分比以及累计百分比。

单击Continue按钮,返回主界而。

Statistics

」LJnii/ariatedescrptives

"IInitialsolution

CorrelationMatrix

□Coefficients匚Inverse口Significancefevels匚ReprcducedDeterminait匚Anti-itnage

KMDendBartlettstestofsphericity

Help

图7.2Descriptives子对话框

3.点击Extraction按钮,设程因子提取的选项,见图7.3。

在Method下拉列表中选择因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项,即“主成分法”。

在Analyze栏中指泄用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵。

在Display栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。

在Extract栏中指左因子提取的数目,有两种设程方法:

一种是在Eigenvaluesover后的框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子:

第二种设宜方法是直接在Numberoffactors后的矩形框中输入要求提取的公因子的数目。

这里我们均选择系统默认选项,单击Continue按钮,返回主界面。

4.点击Rotation按钮,设置因子旋转的方法。

这里选择Varimax(方差最大旋转),并选择Display栏中的Rotatedsolution复选框,在输出窗口中显示旋转后的因子载荷阵。

单击Continue按钮,返回主界而。

園FactorAralysis:

Rotation

Method

Q)NoneC)亠訊汁磁

(;分血胡:

'Equomox

「■GreetOblmn•Premsx

Delta|o|Kappap

Display

Reeledeoluten|_Losdrgplot(e)

图7.4Rotation子对话框

5•点击Scores按钮,设置因子得分的选项。

选中Saveasvariables复选框,将因子得分作为新变量保存在数据文件中。

选中Displayfactorscorecoefficientmatrix复选框,这样在结果输出窗口中会给出因子得分系数矩阵。

单击Continue按钮返回主界而。

图7.5Scores子对话框

6.单击OK按钮,运行因子分析过程•结果分析:

表7.1旋转前因子载荷阵

表7.2旋转后因子载荷阵

成份矩阵・

成份

1

2

X1

-.662

.503

x2

•・53O

.478

x3

•・555

.605

x4

.900

•233

x5

.857

•357

旋转成份矩阵'

提取方法:

主成分分析法。

成份

1

2

X1

-.245

.795

x2

-.152

.698

x3

-.099

.815

x4

.867

「335

x5

.904

-.209

x6

.953

-.072

从表7」中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,为了便于对因子进行命名,需要对因子载荷阵进行旋转,得表7.2。

经过族转后的载荷系数已经明显地两极分化了。

第一个公共因子在后三个指标上有较大载荷,说明这三个指标有较强的相关性,可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。

根据表7.3易得:

Fl=0.064X1+0.085X2+0.137X3+0.332X4+0.378X5+0.432X6

F2=0.439X1+0.400X2+0.484X3+0.014X4+0.073X5+0.169X6

表7・3因子得分系数矩阵

咸常得分茶数捶阵

1

2

.064

.439

X2

.400

x3

.137

.484

X4

.332

-.014

x5

.378

.073

x6

.432

.169

将每个学生的六门成绩分别代入Fl、F2,比较两者的大小,F1大的适合学文,

F2大的适合学理。

计算结果为学号是1、16、24的学生适合学文,其余均适合学理。

7.8某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。

下表是抽查欧洲某汽车市场7个品牌不同型号的汽宇的各种指标数据,试用因子分析法找出英简化的指标系统。

品牌价格发动机功率轴距宽长轴距

.2.2O4.5:

3.7.066.&3.nnnnU

391750

6.5$

Z3.3.

812

960

.9.5.9

2My

d.960.O.2

226.&2&

799799

3342JQ

7.O.L066.4.

677677

216670O1.O8.14.O2.O8.13.

402510500010

122123

825882••••••133124

A21500

A28400

A42000

B23990

B33950

B62000

 

64553452225755752357446733

22222222221222222342222222

.6.6.5.5.5.5.5.5O.O.O3O.60.8J.23O.9O0O0Q6.6.&7.7.&7.&9&04.5.6.7.6.93.O7.5.6.7.6.77•111nnnnnnn11nnnnIBnntlnnnnIBnn

97283818302610000859722147

79764797477753401998635166

JJ4.3.5.7.59.8.7.56.03.3.5卫3.83.934.9.5B

.O00.6.2.8e.2.6£.2.94.9.9.2.7.3d0.90J0.7.876.76.88.94.96.o6.0007.0094.o1809000.97.937974.490090930986.o7.97.

45977755530945716760724044&&0224.M4.5.0Z7.9.224.M6.23.9.9.4.L4.4.66777777777667777667667777

33400823045105515115700000••••••••••••••••••••••••77199325877477o14LLo36383300100111001000100979310010nnnJnnn•!

nnnJnnnnu((nnnnnnu

03350555505505005050380233799740077051778042H866O355

r$.8J.8.8.8.6.6.0.7F.4$.7.80.4Br.7.orr2223八MMM*丄M5-2MMM3-5-LLM2222二工

269903340038900219752530031965278853989539665310104622513260

165351889019390243404570513960923518890198402449522245164802834029185

cccDDDDEEEEFFFFFFFFFGGGGGG

 

解:

令价格为Xh发动机为X2,功率为X3,轴距为X4,宽为X5,长为X6,轴距为X7,燃料容量为X8,燃料效率为X9,用SPSS找简化的指标系统的具体步骤同7.7。

此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差贡献来看,前三个成分贡献了90.9%,因此重复因子分析过程,并在第三步Extraction子对话框中的Numberoffactors后的矩形框中输入3,即为要提取的公因子的数目。

因子分析结果如下:

表7・4旋转后的因子得分系数矩阵

成盼得分系数轨阵

成份

1

2

3

X1

-.399

.289

.342

x2

-.015

.525

-.278

x3

-.060

-.409

x4

.305

-.344

.241

x5

.354

.195

-.338

x6

•別g

-.100

-.332

.036

-.291

.494

x8

-.186

-.221

.651

x9

-.071

.082

-.239

其简化了指标体系为Fl、F2、F3,从旋转后的因子得分系数矩阵得:

Fl=-0・399Xl-0・015X2-0・060X3+0・305X4+0・354X5+0・599X6+0・036X7-0・I86X8-0・071X9F2=0.289X1+0.525X2+0.700X3-0.344X4+0.195X5-0.100X6-0.291X7-0.221X8+0.082X9F3=0・342Xl-0・278X2-0・409X3+0・241X4-0・338X5-0・332X6+0・494X7-0・651X8-0・239X97.9根据人均GDP、第三产业从业人员占全部从业人员的比重、第三产业增加值占GDP的比重.人均铺装道路面积、万人拥有公共汽电车.万人拥有医生、百人拥有电话机数、万人拥有高等学校在校学生人数.人均居住而积、百人拥有公共图书馆藏书.人均绿地而积等十一项指标对目前我国省会城市和计划单列市的城市化进行因子分析,并利用因子得分对其进行

排序和评价。

(数据可从《中国统讣年鉴》查获)

(略)

7.10根据习题5・10中2003年我国省会城市和讣划单列市的主要经济指标数据,利用因子分析法对其进行排序和分类,并与聚类分析的结果进行比较。

解:

对其进行因子分析的步骤与7.7相同,结果如下:

表7.5特征根与方差解释分析表

解釋的总右差

成聊

初始特征佰

梶取平方和戟入

龍袋平右和载入

台计

右差的號

麋祺%

台计

方差的%

累和%

合计

右差的%

累後%

1

5.058

56.199

56.199

5.058

56.199

56.199

3.972

44.138

44.138

2

2.390

26.551

82.750

2.390

26.551

82.750

3.475

38.612

82.750

3

.814

9.041

91.790

4

.341

3.784

95.575

5

.248

2.759

9S.333

6

.100

1.108

99.441

7

・Q2了

•3Q4

99.744

8

.020

.219

99.964

9

.003

.036

100.000

由表7.5可知,提取的两个因子方差贡献达到了82.75%。

 

表7・6旋转后的因子得分系数矩阵成粉得分系数捶阵

1

2

X1

x2

x3

x5

乂6

x7

x8

x9

-.093

-.100

.167

・2刊

.219

.248

-.057

.233

.315

.Ml6-.103-.097

.017-.022

.282

.169-.008

由上而的因子得分矩阵可知:

F1=-O・O93X1—O・1OOX2+O・167X3+O・258X4+O・219X5+O・248X6-O・O57X7+O・O86X8+O・233X9

F2=O・315X1+O・316X2-O.1O3X3-O・O97X4+O・O17X5-O・O22X6+O・282X7+O・169X8-0.008X9

Fl

F2

F

深圳

382417.42

392989.93

385811.19

上海

157848.03

52892.05

124157.16

厦门

114461.78

107589.61

112255.81

广州125604.8649740.69101252.46

杭州

94835.17

45211.64

78906.02

宁波

91203.35

43854.84

76004.48

北京

102885.84

17864.73

75594.07

南宁

102885.84

17864.73

75594.07

天津

89055.66

32589.70

70930.09

海口

89055.66

32589.70

70930.09

南京

82495.01

39893.01

68819.77

青岛

79248.60

22497.55

61031.51

大连

71586.92

27254.60

57356.24

济南

56561.73

25507.43

46593.30

成都

76035.96

-27268.81

42875.13

福州

51129.12

25240.89

42818.99

乌鲁木齐

50117.93

23629.54

41615.16

沈阳

52143.03

19031.14

41514.12

武汉

53771.95

15104.91

41359.83

长春

48409.60

21920.52

39906.60

太原

43732.74

15165.88

34562.78

郑州

41745.50

15185.84

33219.85

海口

39732.42

17509.21

32598.77

昆明

41593.76

13263.93

32499.88

兰州

37263.61

21287.59

32135.31

长沙

42382.92

9666.19

31880.85

石家庄

40997.75

11439.53

31509.56

重庆

62656.07

-34641.39

31423.58

呼和浩特

36273.21

20652.68

31259.02

西安

37702.57

7531.88

28017.78

哈尔滨

35493.87

9735.24

27225.35

南昌

32831.80

14359.21

26902.10

合肥

32205.35

13387.12

26164.70

贵阳

34499.43

6397.94

25478.85

银川

28935.56

16943.87

25086.23

西宁

23503.44

9499.18

19008.08

南宁

25923.91

4138.99

18930.95

根据F的最终数值进行分类,由于没有给出具体的分类标准,分类具有一左的主观性,只要合理即可。

聚类分析的结果见5.11,可将两者进行比较。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 交通运输

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1