应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx

上传人:b****3 文档编号:16718473 上传时间:2022-11-25 格式:DOCX 页数:12 大小:58.48KB
下载 相关 举报
应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx_第1页
第1页 / 共12页
应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx_第2页
第2页 / 共12页
应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx_第3页
第3页 / 共12页
应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx_第4页
第4页 / 共12页
应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx

《应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx》由会员分享,可在线阅读,更多相关《应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx(12页珍藏版)》请在冰豆网上搜索。

应用统计学因子分析与主成分分析案例解析+SPSS操作分析Word格式.docx

货物周转量

居民消费价格指数

商品价格指数

工业总产值

相关

1.000

.267

.951

.187

.617

-.273

-.264

.874

居民消费水平

.426

.716

-.151

-.235

-.593

.363

.396

.431

-.280

-.359

.792

-.357

-.145

-.543

.099

-.253

.022

.659

.763

-.125

-.192

 

图3-2

KMO和Bartlett的检验

取样足够度的Kaiser-Meyer-Olkin度量。

.620

Bartlett的球形度检验

近似卡方

231.285

df

28

Sig.

.000

图3-3

公因子方差

初始

提取

.945

.799

.902

.873

.857

.957

.928

.904

提取方法:

主成份分析。

图3-4

解释的总方差

成份

初始特征值

提取平方和载入

旋转平方和载入

合计

方差的%

累积%

1

3.754

46.924

3.207

40.092

2

2.203

27.532

74.456

2.217

27.708

67.800

3

1.208

15.096

89.551

1.740

21.752

4

.403

5.042

94.593

5

.214

2.673

97.266

6

.138

1.722

98.988

7

.066

.829

99.817

8

.015

.183

100.000

图3-5

图3-6

成份矩阵a

.911

.163

.213

.884

.385

.120

.822

.429

.210

-.621

.596

.433

.606

-.596

.277

.486

.737

-.279

.465

-.725

.362

-.510

.257

.794

提取方法:

主成份。

a.已提取了3个成份。

图3-7

旋转成份矩阵a

.955

.124

-.131

.944

.109

-.014

.872

.351

-.137

.751

-.507

.048

.925

-.121

.219

.841

-.209

-.135

-.013

.969

-.104

-.496

.819

旋转法:

具有Kaiser标准化的正交旋转法。

a.旋转在5次迭代后收敛。

图3-8

成份转换矩阵

.817

.407

-.408

.548

-.769

.331

.179

.494

.851

图3-9

图3-10

成份得分系数矩阵

.306

.011

.047

.025

.387

.040

.270

.129

.075

-.025

.451

.096

.248

-.319

-.139

.070

.180

.653

.077

-.098

.462

.317

.026

.123

构成得分。

图3-11

成份得分协方差矩阵

(2)因子模型中各统计量的意义

A)因子载荷

因子载荷

为第i个变量在第j个因子上的载荷,实际上就是

的相关系数,表示变量

依赖因子

的程度,反应了第i个变量

对于第j个因子

的重要性。

B)变量

的变量共同度:

k个公因子对第i个变量方差的贡献,也称为公因子方差比,记为

,公式为:

=

(j=1,2,….,k)

表示全部公因子对变量

的总方差所做出的贡献,也即是变量

的信息能够被k个公因子所描述的程度。

C)公因子

的方差贡献率:

在因子载荷矩阵A中,各列元素

的平方和记为

,表示第j个公因子

对于X所提供方差的总和,它是衡量公因子相对重要性的指标。

方差贡献率越大,表明公因子对X的贡献越大。

(3)基本分析结果

A)KMO和球形Bartlett检验用于因子分析的适用性检验。

KMO检验变量间的偏相关是否较小,Bartlett球形检验是判断相关矩阵是否是单位阵,参见图3-2。

由Bartlett检验可以看出,应拒绝个变量独立的假设,即变量间具有较强的相关性,但是KMO的统计量为0.620,小于0.7,说明个变量间信息的重叠程度可能不是特别的高,有可能做出的因子分析模型不是很完善,但还是值得尝试的。

B)变量共同度Communalities是表示各变量中所含原始信息能被提取的公因子所表示的程度,由图3-3所示的变量共同度可知:

几乎所有变量的共同度都在80%以上,因此提取出的这几个公因子对各变量的解释能力是较强的。

C)碎石图用于显示各因子的重要程度,横轴为因子序号,纵轴表示特征根大小,从中可以非常直观的了解到哪些是最主要的因子,参见图3-5。

本例中可见前三个因子的散点位于陡坡之上,而后五个因子散点成了平台,且特征根均小于1,因此至多考虑前三个公因子即可。

D)图3-4给出的是各成分的方差贡献率和累计贡献率,以及进行因子旋转后的方差贡献率和累计贡献率,前者将在主成分分析中进行说明。

E)图3-6为因子载荷矩阵,在前面已经直接按列的方向将其解释为个成分的系数,实际上严格讲因子载荷矩阵应该是各因子在各变量上的载荷,即是各因子对各变量的影响度。

表示如下:

ZX1=0.884F1+0.385F2+0.120F3+

ZX2=0.606F1-0.596F2-0.277F3+

.

ZX8=0.822F1+0.429F2-0.210F3+

在表达式中各变量已经不是原始变量,而是标准化变量。

表示特殊因子,是除了这3个公因子之外影响该变量的其他因素。

原来设计了8个指标来表示经济发展水平,但是经过因子分析后,只需要三个因子即可描述影响地区经济发展状况。

F)为了使因子载荷矩阵中系数更加显著,可以对初始因子载荷矩阵进行转换,使因子和原始变量间的关系进行重新分配,相关系数向0-1分化,从而更加容易解释。

图3-9是进行因子旋转的空间示意图,值得注意的是旋转前后各变量散点的相对位置保持不变,即旋转并不改变因子分析的整体结果,只是影响各因子在各变量上的载荷分布,并影响各因子的贡献率。

本例中采用的是方差最大正交旋转法进行因子旋转,输出的结果参见图3-4.,由图可知,只有前三个特征根大于1,因此SPSS只提取了前三个公因子。

在旋转后三个公因子的方差累计贡献率均发生了变化,但仍然会保持从大到小的顺序,而且前三个因子的方差贡献率仍为89.55%,和旋转前完全相同,因此选前三个因子已足够描述经济发展的水平。

G)进行方差最大旋转后,旋转后的因子载荷矩阵如图3-7所示,由图可以看出,第一公因子在

有较大的载荷,主要从GDP、固定资产投资、货物周转量和工业总产值反映经济发展状况,可以命名为总量因子。

第二公因子在

上有较大载荷,从居民消费水平和职工平均工资方面反映经济发展水平,因此命名为消费因子。

第三公因子在

上有较大载荷,表现为居民消费价格指数和水平价格指数方面,因此命名为价格因子。

与未旋转前相比较,旋转后各公因子的意义显然更加明确合理。

H)因子得分:

前面得到了因子结构表达式,可以将各变量表示为公因子的线性形式,但是更多的时候需要将公因子表达为各变量的线性形式。

公因子的得分系数函数不能通过矩阵变换的方法由因子载荷阵得到,只能采用估计的方法求得,本例采用的是回归法。

因子得分系数矩阵如图3-10所示,据此可以直接写出各公因子的得分表达式:

F1=0.306ZX1+0.025ZX2+0.270ZX3-0.025ZX4+0.248ZX5+0.070ZX6+0.077ZX7+0.317ZX8

F2=0.011ZX1+0.387ZX2+0.129ZX3+0.451ZX4-0.319ZX5+0.180ZX6-0.098ZX7+0.026ZX8

F3=0.047ZX1+0.040ZX2+0.075ZX3+0.096ZX4-0.139ZX5+0.653ZX6+0.462ZX7+0.123ZX8

SPSS已经给出三个公因子的得分,保存在fac_1~fac_3中,按各因子对应的方差贡献率为权数计算如下综合统计量:

F=

F1+

F2+

F3

=0.730F1+0.141F2+0.129F3

在SPSS中用程序计算综合因子得分:

Compscore=0.73*fac1_1+0.141*fac2_1+0.129*fac3_1

1.主成分分析

A)由图3-1(各变量相关系数矩阵)可以看出,许多变量之间直接的相关性比较强,的确存在信息上的重叠。

B)由图3-4(具体不再阐述)可知,只有前三个特征根大于1,因此SPSS只提取了前三个主成分,前三个主成分的方差贡献率达到89.55%,因此选前三个主成分已足够描述经济发展的水平。

C)图3-6输出为主成分系数矩阵,从而得到各主成分的表达式,在表达式中各变量已经不是原始变量,而是标准化变量。

F1=0.884ZX1+0.606ZX2+0.911ZX3+0.465ZX4+0.486ZX5-0.51ZX6-0.621ZX7+0.822ZX8

F2=0.385ZX1-0.596ZX2+0.163ZX3-0.725ZX4+0.737ZX5+0.257ZX6-0.596ZX7+0.429ZX8

F3=0.120ZX1+0.277ZX2+0.213ZX3+0.362ZX4-0.279ZX5+0.794X6-0.433ZX7+0.210ZX8

因为各自变量已经过标准化,因此以上三个主成分的均数均为0。

可以证明,各主成分的方差应当为前述特征根

,但这里计算的数值方差均为特征根的平方,即各主成分的原始数值还应该除以一个特征根的平方根才行,但是因为不会对分析结果产生影响,因此在这里不再给出详细计算过程及结果。

在第一主成分中,X1,X2,X3,X8的系数较大,可以看成是反映GDP、固定资产投资、居民消费水平和工业总产值的综合指标。

在第二主成分中,X4H和X5的系数较大,可以看成是反映职工平均工资和货物周转量方面的综合指标。

在第三主成分中,X6系数最大,可以看成是反映居民消费价格指数方面的综合指标。

主成分分析本质上是一种矩阵变换过程。

四、附录

广州陶粒,广州陶粒厂5wrVFkK3gXQ2

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 中考

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1