因子分析实验报告.docx

上传人:b****5 文档编号:27781643 上传时间:2023-07-05 格式:DOCX 页数:19 大小:316.37KB
下载 相关 举报
因子分析实验报告.docx_第1页
第1页 / 共19页
因子分析实验报告.docx_第2页
第2页 / 共19页
因子分析实验报告.docx_第3页
第3页 / 共19页
因子分析实验报告.docx_第4页
第4页 / 共19页
因子分析实验报告.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

因子分析实验报告.docx

《因子分析实验报告.docx》由会员分享,可在线阅读,更多相关《因子分析实验报告.docx(19页珍藏版)》请在冰豆网上搜索。

因子分析实验报告.docx

因子分析实验报告

电子科技大学政治与公共管理学院

本科教学实验报告

(实验)课程名称:

数据分析技术系列实验

电子科技大学教务处制表

电子科技大学

验报

学生姓名:

刘晨飞学号:

2013120101027

指导教师:

咼天鹏

一、实验室名称:

电子政务可视化实验室

二、实验项目名称:

因子分析

三、实验原理

使用SPSS软件的因子分析对数据样本进行分析

相关分析的原理:

步骤一:

将原始数据标准化。

因子分析的第一步是主成分分析,将总量较多的因素通过线性组合的方式组合成几个因素,且这些因素之间相互独立。

步骤二:

建立变量的相关系数矩阵R

Analyse->DimentionRuduction->Fetor->Extraction->勾选Correlationmatrix可以输出相关系数矩阵,相关系数矩阵计算了变量之间两两的pearson相关系数。

步骤三:

适用性检验

使用Bartlett球形检验或者KMO球形检验来检验样本是否适合进行因子分析。

评价标准:

KMO检验用于检验变量间的偏相关系数是否过小,一般情况下,当KMO大于0.9

时效果最佳,小于0.5时不适宜做因子分析。

Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果结论是不拒绝该假设,

则表示各个变量都是各自独立的。

步骤四:

根据因子贡献率选取因子,特征值和特征向量构建因子载荷矩阵A。

处于简化和抽取核心的思想,一般会按照某种标准选取前几个对观测结果影响较大的因素构建因子载荷矩阵,一般的标准是选取特征根大于1的因子。

并要求累积贡献率达到90%以上。

步骤五:

对A进行因子旋转

因子旋转的目的是使因子载荷矩阵的结构发生变化,使每个变量仅在一个因子上有较大载荷。

是将因子矩阵在一个空间里投影,使单个向量的投影在仅在一个变量的方向有较大的值,这样做可以简化分析。

步骤六:

计算因子得分:

计算因子得分是计算在不同样本水平下观测指标的水平的方式。

计算因子得分需要用到因子得分计算函数,这个计算的结果是无量纲的,仅表示各因子在这个水平下观测指标的值,这也是因子分析的目标,将不可观测的目标观测量用一个函数与可以观测的变量联系起来。

四、实验目的

理解因子分析的含义,以及数学原理,掌握使用SPSS进行因子分析的方法,并能对

spss因子分析产生的输出结果进行分析。

五、实验内容及步骤

本次实验包含两个例子:

实验步骤:

(0)问题描述

实验一题目要求:

对我国主要城市的市政基础设施情况进行因子分析。

实验二题目要求:

主要城市日照数sav为例,其中的变量包括城市的名称“city”、各个月份的日照数

(1)实验二步骤:

执行analyze->dimentionreduction->factor->rotation女口下勾选

⑵执行Analyse->DimentionRuduction,打开分析窗口

AnalyzeDiirectMarKetingGraphsUtilitiesAdd-onsWindow旦创

R.@£DltS

DescriptiveStatistics

Tables►

CompareMeans►

GeneralLinearModel►

GeneralizedlLinearModeDs卜Mix^dhladsls卜

Ccnrelale►

Regression►

Loglinear►

NeuralNetworks►

Classify卜

DimensionReduction►

Sc^Jla►

NonparametricTests►

Forecastina►

Survival►

MultipleResponse卜

刃MissingValueAr*al^sls...

MultilpleInnputabon►

ComplexSamples卜

QualityControl►

阳ROCOu咚自…

XI

X5

X6

S790

272

256032

9332

93

181072

9575

279

321439

3114

11S

259914

4032

1101

376329

9308

422

664359

4317

136

213B81

5739

249

428561

住出左c

F.Factor...

;丄ICorrespondenceAnalysis...

OptimalScaling...

5427

196

290098

3224

113

324801

20083

510

662650-

8623

250

397351

9791

426

303367

4946

328

265498

2516B

543

1108886

37?

4

23?

332056

打开参数设置窗口

加入变量

(3)点击Descripitives,选择initialsolution(输出原始分析结果)、coefficients(输出相关系数矩阵)、勾选进行KMO和bartlett球形检验,完成之后点击continue回到参数设置窗口

9575

X

R城市名称[d

Statistics

IUnivariatedescripti'jes

UInitialsolution

Descriptives...

Extraction.

Rotation.

 

Scores.

Options..

rCorrelationMatrix

前Coetncients□inversei_Significan匚电levelsIReproducedDeterminantIAnt-image

CancelHelp

4y4b

25168

543

1108886

 

 

输出选项

(4)点击Extraction输出碎石图,完成之后点击continue回到参数设置窗口

勾选输出碎石图

(5)勾选输出因子得分,完成之后点击continue回到参数设置窗口

FactorAnalysis:

Factor

-Method-

⑥Regress

ion

@Bartlett

/MiiCjGrsoi

ri_pj||

bin

VDisplayfactorscorecoefTicientmatrix

[cantinumj\CancelHeip

输出因子得分

(6)选择缺失的值用均值代替,完成之后点击continue回到参数设置窗口

均值代替缺失数据

(7)点击0K,输出分析结果

六、实验器材(设备、兀器件):

计算机、打印机、硒鼓、碳粉、纸张

七、实验数据及结果分析

(1)实验一主要结果及分析:

KMOandBartlett'sTest

Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.

.856

Bartlett'sTestofSphericityApprox.Chi-Square

281.248

df

15

Sig.

.000

KMOandBartlett's球形检验的结果

从表里的结果可以看出,KMO的检验值为0.856,—般KMO值大于0.9认为适合做因子分析,这个值为0.856接近0.9,适合做因子分析。

CorrelationMatrix

年末实有道

路长度(公

里)

年末实有道路面积(万平方米)

城市桥梁

(座)

城市排水管

道长度(公

里)

城市污水日处理能力

(万立方米)

城市路灯

(盏)

Correlatio年末实有道路长度(公

1.000

.983

.783

.939

.896

.883

n里)

年末实有道路面积(万

.983

1.000

.738

.940

.853

.867

平方米)

城市桥梁(座)

.783

.738

1.000

.759

.873

.719

城市排水管道长度(公

.939

.940

.759

1.000

.845

.916

里)

城市污水日处理能力

.896

.853

.873

.845

1.000

.822

(万立方米)

城市路灯(盏)

.883

.867

.719

.916

.822

1.000

相关系数矩阵

从这个表格中可以看出这六个变量之间有很高的相关度,需要标准化

Communalities

Initial

Extraction

年末实有道路长度(公里)

1.000

.954

年末实有道路面积(万平方米)

1.000

.919

城市桥梁(座)

1.000

.742

城市排水管道长度(公里)

1.000

.924

城市污水日处理能力(万立方

1.000

.882

米)

城市路灯(盏)

1.000

.859

ExtractionMethod:

PrincipalComponentAnalysis.

变量共同度表

这个表,表示提取公共因子之后各个变量的共同度,就是原始信息的保留度,例如第一个变量有95.4%的信息被保留下来了。

TotalVarianceExplained

Component

InitialEigenvalues

ExtractionSumsofSquaredLoadings

Total

%ofVariance

Cumulative%

Total

%ofVariance

Cumulative%

1

5.280

88.001

88.001

5.280

88.001

88.001

2

.390

6.503

94.504

3

.162

2.707

97.211

4

.104

1.738

98.950

5

.051

.849

99.799

6

.012

.201

100.000

ExtractionMethod:

PrincipalComponentAnalysis.

主成分表

按照之前的设置,保留了一个特征值大于1的因子,这个因子的贡献率为88%

ScreePlot

6-

特征值和变量的散点图可以看出,除了第一个因子之外其他的因子特征值都很小。

ComponentMatrix

a

Component

1

年末实有道路长度

(公里)

.977

年末实有道路面积

(万平方米)

.959

城市桥梁(座)

.862

城市排水管道长度

(公里)

.961

城市污水日处理能力(万立方

.939

米)

城市路灯(盏)

.927

因子负荷矩阵

这个可以用来表示因子的线性组合。

ComponentScoreCoefficientMatrix

Component

1

年末实有道路长度(公里)

.185

年末实有道路面积(万平方米)

.182

城市桥梁(座)

.163

城市排水管道长度(公里)

.182

城市污水日处理能力(万立方米)

.178

城市路灯(盏)

.176

因子得分系数矩阵

用主成分分析方法得出的因子得分系数矩阵,可以计算因子得分函数

ComponentScore

CovarianceMatrix

Component

1

1

1.000

因子之间关系的矩阵

这个只选择出一个因子,这个实际上没有意义

(2)实验二结果及分析

Communalities

Initial

Extraction

一月曰照时数

1.000

.915

二月日照时数

1.000

.918

三月日照时数

1.000

.896

四月曰照时数

1.000

.933

五月日照时数

1.000

.882

六月日照时数

1.000

.778

七月日照时数

1.000

.617

八月日照时数

1.000

.874

九月日照时数

1.000

.754

十月日照时数

1.000

.863

十一月日照时数

1.000

.847

十二月日照时数

1.000

.854

变量共同度表

TotalVarianceExplained

Compon

ent

InitialEigenvalues

ExtractionSumsofSquared

Loadings

RotationSumsofSquared

Loadings

Total

%of

Variance

Cumulativ

e%

Total

%of

Variance

Cumulativ

e%

Total

%of

Variance

Cumulativ

e%

1

6.845

57.041

57.041

6.845

57.041

57.041

4.581

38.173

38.173

2

1.962

16.347

73.388

1.962

16.347

73.388

2.886

24.047

62.220

3

1.324

11.034

84.421

1.324

11.034

84.421

2.664

22.201

84.421

4

.725

6.045

90.466

5

.394

3.283

93.749

6

.250

2.085

95.833

7

.171

1.423

97.256

8

.104

.870

98.126

9

.080

.670

98.796

10

.065

.539

99.335

11

.047

.395

99.731

12

.032

.269

100.000

ExtractionMethod:

PrincipalComponentAnalysis.

主成分表

选取了前三个特征解大于1的值

Component

1

2

3

一月曰照时数

.852

-.435

-.015

二月日照时数

.854

-.419

-.115

三月日照时数

.869

-.275

-.257

四月曰照时数

.805

-.079

-.528

五月日照时数

.888

-.033

-.303

六月日照时数

.764

.439

-.038

七月日照时数

.364

.644

-.265

八月日照时数

.465

.809

.066

九月日照时数

.794

.295

.192

十月日照时数

.800

.251

.400

十一月日照时数

.825

-.275

.300

十二月日照时数

.562

-.164

.715

a

ComponentMatrix

因子载荷矩阵

显示提取出来的三个因子的线性组合

Component

1

2

3

一月曰照时数

.837

-.014

.463

二月日照时数

.882

.013

.375

三月日照时数

.901

.163

.241

四月曰照时数

.903

.340

-.049

五月日照时数

.834

.392

.179

六月日照时数

.405

.730

.285

七月日照时数

.128

.763

-.134

八月日照时数

-.031

.917

.178

九月日照时数

.376

.588

.516

十月日照时数

.297

.528

.704

十一月日照时数

.592

.081

.700

十二月日照时数

.140

.018

.913

a

RotatedComponentMatrix

旋转之后的因子载荷矩阵

使各因子的载荷不再集中,可以看出,第一个因子主要由前5个变量决定,中间的因子主要由中间三个因子决定,后面的一个因子主要由后四个因子决定

ComponentTransformationMatrix

Component

1

2

3

1

.754

.437

.491

2

-.432

.892

-.131

3

-.495

-.113

.861

因子转换矩阵

ComponentPlotinRotatedSpace

4U

八、实验结论

因子分析可以有效降低维度,抽取对观测指标影响最大的几个变量的线性组合,简化研究的过程。

九、总结及心得体会

有了数据分析软件可以节省大量的数据分析的时间,但是根据数据分析的结果对样本数据进行评估还是需要人员操作,看不懂分析的结果,不懂得分析结果的意思就无法进行接下来的工作,所以我们不仅要熟练掌握数据分析的方法,还要了解其中的原理,这样才能充分发挥软件给我们带来的好处,有意识地利用软件帮助我们进行计算,而不只是模仿教程上面的操作步骤,得出自己也看不懂的分析结果。

十、对本实验过程及方法、手段的改进建议

可以选取不能进行因子分析的例子,体会因子分析使用的限制。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 视频讲堂

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1