SPSS对主成分回归实验报告要点.docx

上传人:b****8 文档编号:23883506 上传时间:2023-05-21 格式:DOCX 页数:17 大小:853.18KB
下载 相关 举报
SPSS对主成分回归实验报告要点.docx_第1页
第1页 / 共17页
SPSS对主成分回归实验报告要点.docx_第2页
第2页 / 共17页
SPSS对主成分回归实验报告要点.docx_第3页
第3页 / 共17页
SPSS对主成分回归实验报告要点.docx_第4页
第4页 / 共17页
SPSS对主成分回归实验报告要点.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

SPSS对主成分回归实验报告要点.docx

《SPSS对主成分回归实验报告要点.docx》由会员分享,可在线阅读,更多相关《SPSS对主成分回归实验报告要点.docx(17页珍藏版)》请在冰豆网上搜索。

SPSS对主成分回归实验报告要点.docx

SPSS对主成分回归实验报告要点

《多元统计分析分析》实验报告

2012年月日

学院

经贸学院

姓名

学号

实验

名称

实验成绩

一、实验目的

(一)利用SPSS对主成分回归进行计算机实现.

(二)要求熟练软件操作步骤,重点掌握对软件处理结果的解释.

二、实验内容

以教材例题7.2为实验对象,应用软件对例题进行操作练习,以掌握多元统计分析方法的应用

三、实验步骤(以文字列出软件操作过程并附上操作截图)

1、数据文件的输入或建立:

(文件名以学号或姓名命名)

将表7.2数据输入spss:

点击“文件”下“新建”——“数据”见图1:

图1

点击左下角“变量视图”首先定义变量名称及类型:

见图2:

图2:

然后点击“数据视图”进行数据输入(图3):

图3

完成数据输入

2、具体操作分析过程:

(1)首先做因变量Y与自变量X1-X3的普通线性回归:

在变量视图下点击“分析”菜单,选择“回归”-“线性”(图4):

图4

将因变量Y调入“因变量”栏,将x1-x3调入“自变量”栏(图5):

然后选择相关要输出的结果:

①点击右上角“统计量(s)”:

“回归系数”下选择“估计”;“残差”下选择“D.W”;在右上角选择输出“模型拟合度”、“部分相关和偏相关”“共线性诊断”(后两项是做多重共线性检验)。

选完后点击“继续”(见图6)②如果需要对因变量与残差进行图形分析则需要在“绘制”下选择相关项目(图7),一般不需要则继续③如果需要将相关结果如因变量预测值、残差等保存则点击“保存”(图8),选择要保存的项目④如果是逐步回归法或者设置不带常数项的回归模型则点击“选项”(图9)

其他选项按软件默认。

最后点击“确定”,运行线性回归,输出相关结果(见表1-3)

图5

图6

图7

图8

图9

回归分析输出结果:

表1

模型汇总b

模型

R

R方

调整R方

标准估计的误差

Durbin-Watson

1

.996a

.992

.988

.48887

2.740

a.预测变量:

(常量),x3,x2,x1。

b.因变量:

y

表2

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

204.776

3

68.259

285.610

.000a

残差

1.673

7

.239

总计

206.449

10

a.预测变量:

(常量),x3,x2,x1。

b.因变量:

y

表3

系数a

模型

非标准化系数

标准系数

t

Sig.

相关性

共线性统计量

B

标准误差

试用版

零阶

部分

容差

VIF

1

(常量)

-10.128

1.212

-8.355

.000

x1

-.051

.070

-.339

-.731

.488

.965

-.266

-.025

.005

185.997

x2

.587

.095

.213

6.203

.000

.251

.920

.211

.981

1.019

x3

.287

.102

1.303

2.807

.026

.972

.728

.095

.005

186.110

a.因变量:

y

由表可知,回归模型拟合优度达到99.2%,方差分析也显示线性回归方程整体显著(F=285.61,Sig.=0.000)但是回归系数估计结果中,x1的系数为-0.051与一般经济理论矛盾且不显著(t检验值-0.731,检验的p值0.488),经多重共线性诊断(x1与x3的VIF值高达180以上)表明自变量存在共线性。

运用主成分分析做多重共线性处理:

(2)自变量x1-x3的主成分分析:

由于spss没有独立的主成分分析模块,需要在因子分析里完成,因此需要特别注意:

在数据窗口下选择“分析”—“降维”—“因子分析”(见图10);

在弹出的窗口中将x1-x3调入“变量”(见图11);

然后①点击“描述”,选择要输出的统计量(见图12):

选中“统计量”下的两个项目(输出变量描述统计和初始分析结果);在“相关矩阵”一般要选择输出“系数”、“显著性水平”、“KMO”(做主成分分析和因子分析的适用性检验,也就是检验变量之间的相关系数是否足够大可以做因子分析)选完后点击“继续”进行下一步;②点击“抽取”(见图13):

在“方法”下默认“主成分”;“分析”下,默认“相关性矩阵”(含义是要对变量做标准化处理,然后基于标准化后的协差阵也就是相关阵进行分解做因子分析或主成分分析),如果不需要对变量做标准化处理就选“协方差矩阵”;“输出”中的两项都选,要求输出没有旋转的因子解(主成分分析必选项)和碎石图(用图形决定提取的主成分或因子的个数);“抽取“下,默认的是基于特征值(大于1表示提取的因子或主成分至少代表1个单位标准差的变量信息,因为标准化后的变量方差为1,因子或者主成分作为提取的综合变量应该至少代表1个变量的信息),也可以自选提取的因子个数(即第二项),本例中做主成分回归,选择提取全部可能的3个主成分,所以自选个数填3。

选完后点击“继续”进行下一步;③点击“旋转”(图14),按默认的“方法”下不旋转(注意,主成分分析不能旋转!

)其他不用选,点击“继续”进行下一步;④点击“得分”,计算不旋转的初始因子得分(图15),选中“保存为变量”,“方法”下按默认,其他不修改,点击“继续”进行下一步。

⑤“选项”下可以不选按默认(选项里主要针对缺失值和系数显示格式,不影响分析结果)

最后点击“确定”,运行因子分析。

图10

图11

图12

图13

图14

图15

由运行结果计算主成分:

表4、描述统计量

均值

标准差

分析N

x1

194.5909

29.99952

11

x2

3.3000

1.64924

11

x3

139.7364

20.63440

11

表5、相关矩阵

x1

x2

x3

相关

x1

1.000

.026

.997

x2

.026

1.000

.036

x3

.997

.036

1.000

Sig.(单侧)

x1

.470

.000

x2

.470

.459

x3

.000

.459

表6、KMO和Bartlett的检验

取样足够度的Kaiser-Meyer-Olkin度量。

.492

Bartlett的球形度检验

近似卡方

42.687

df

3

Sig.

.000

表7、解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

1.999

66.638

66.638

1.999

66.638

66.638

2

.998

33.272

99.910

.998

33.272

99.910

3

.003

.090

100.000

.003

.090

100.000

提取方法:

主成份分析。

表8、成份矩阵a

成份

1

2

3

x1

.999

-.036

.037

x2

.062

.998

.000

x3

.999

-.026

-.037

提取方法:

主成份。

a.已提取了3个成份。

由表5、6可知适合做主成分或因子分析(KMO检验通过),表7知前两个主成分(初始因子)贡献率已达99.91%,提取前两个主成分用于分析。

由表8(初始因子载荷阵)和表7可计算前两个特征向量,用表8前两列分别除以前两个特征值的平方根得前两个主成分表达式:

F1=0.7066X1*+0.0439X2*+0.7066X3*(式1)

F2=-0.0360X1*+0.9990X2*-0.0260X3*(式2)

其中X1*-X3*表示为标准化变量(这是因为在进行主成分分析时是以标准化变量进行分析的,是从相关阵出发分析的,见图13的选项)。

由于主成分互不相关,可以用提取的主成分代替自变量进行回归分析,因此需要计算主成分得分来代替自变量X1-X3。

主成分的计算:

依据式1和2中两个主成分的表达式,对各自变量标准化后带入就可以计算出每个样品的主成分得分。

但是在spss中,由因子分析提取时是用主成分法提取的,根据初始因子与主成分的关系,未旋转的初始因子等于主成分除以特征根的平方根,因此主成分得分等于因子得分乘以特征根的平方根,因此可以由因子得分计算主成分得分。

前面在因子分析选项中保存了因子得分(见图15),因此计算两个主成分得分:

点击“转换”—“计算变量”(图16):

在弹出的窗口分别定义主成分F1=第一因子得分*第一特征根的平方根(图17)和F2=第二因子得分*第二特征根的平方根。

(3)主成分回归过程:

要做主成分回归,需要用标准化的因变量(因为自变量经过标准化处理做主成分分析,因变量需要对应做标准化)与主成分做回归,对因变量Y做标准化处理,点击“分析”—“描述统计”—“描述”(见图18),在弹出窗口中将Y调入变量,并选中“将标准化得分另存为变量”(图19)后确定完成Y的标准化。

点击“分析”---“回归”---“线性”(图20)在弹出窗口(图21)中将Zscore(y)调入因变量,F1和F2调入自变量,其他选项同前面图6-9,然后点击“确定”运行主成分回归,相关输出结果见表9

图16

图17

图18

图19

图20

图21

主成分回归结果:

表9、模型汇总

模型

R

R方

调整R方

标准估计的误差

1

.994a

.988

.985

.12104901

a.预测变量:

(常量),F1,F2。

表10、Anovab

模型

平方和

df

均方

F

Sig.

1

回归

9.883

2

4.941

337.230

.000a

残差

.117

8

.015

总计

10.000

10

a.预测变量:

(常量),F1,F2。

b.因变量:

Zscore(y)

表11、系数a

模型

非标准化系数

标准系数

t

Sig.

共线性统计量

B

标准误差

试用版

容差

VIF

1

(常量)

-3.043E-16

.036

.000

1.000

F2

.191

.038

.191

4.993

.001

1.000

1.000

F1

.690

.027

.976

25.486

.000

1.000

1.000

a.因变量:

Zscore(y)

由表9-11可知,标准化Y对两个主成分的线性回归通过显著性检验,也没有多重共线性,回归系数合理,即Y*=0.690F1+0.191F2,将前面F1、F2的表达式(式1和二)带入可得标准化Y关于标准化自变量的回归方程:

Y*=0.4806X1*+0.2211X2*+0.4826X3*,还原为原始变量:

整理得最终回归结果:

Y=-9.13+0.072X1+0.60X2+0.1062X3

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 冶金矿山地质

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1