SPSS对主成分回归实验报告要点.docx
《SPSS对主成分回归实验报告要点.docx》由会员分享,可在线阅读,更多相关《SPSS对主成分回归实验报告要点.docx(17页珍藏版)》请在冰豆网上搜索。
SPSS对主成分回归实验报告要点
《多元统计分析分析》实验报告
2012年月日
学院
经贸学院
姓名
学号
实验
名称
实验成绩
一、实验目的
(一)利用SPSS对主成分回归进行计算机实现.
(二)要求熟练软件操作步骤,重点掌握对软件处理结果的解释.
二、实验内容
以教材例题7.2为实验对象,应用软件对例题进行操作练习,以掌握多元统计分析方法的应用
三、实验步骤(以文字列出软件操作过程并附上操作截图)
1、数据文件的输入或建立:
(文件名以学号或姓名命名)
将表7.2数据输入spss:
点击“文件”下“新建”——“数据”见图1:
图1
点击左下角“变量视图”首先定义变量名称及类型:
见图2:
图2:
然后点击“数据视图”进行数据输入(图3):
图3
完成数据输入
2、具体操作分析过程:
(1)首先做因变量Y与自变量X1-X3的普通线性回归:
在变量视图下点击“分析”菜单,选择“回归”-“线性”(图4):
图4
将因变量Y调入“因变量”栏,将x1-x3调入“自变量”栏(图5):
然后选择相关要输出的结果:
①点击右上角“统计量(s)”:
“回归系数”下选择“估计”;“残差”下选择“D.W”;在右上角选择输出“模型拟合度”、“部分相关和偏相关”“共线性诊断”(后两项是做多重共线性检验)。
选完后点击“继续”(见图6)②如果需要对因变量与残差进行图形分析则需要在“绘制”下选择相关项目(图7),一般不需要则继续③如果需要将相关结果如因变量预测值、残差等保存则点击“保存”(图8),选择要保存的项目④如果是逐步回归法或者设置不带常数项的回归模型则点击“选项”(图9)
其他选项按软件默认。
最后点击“确定”,运行线性回归,输出相关结果(见表1-3)
图5
图6
图7
图8
图9
回归分析输出结果:
表1
模型汇总b
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.996a
.992
.988
.48887
2.740
a.预测变量:
(常量),x3,x2,x1。
b.因变量:
y
表2
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
204.776
3
68.259
285.610
.000a
残差
1.673
7
.239
总计
206.449
10
a.预测变量:
(常量),x3,x2,x1。
b.因变量:
y
表3
系数a
模型
非标准化系数
标准系数
t
Sig.
相关性
共线性统计量
B
标准误差
试用版
零阶
偏
部分
容差
VIF
1
(常量)
-10.128
1.212
-8.355
.000
x1
-.051
.070
-.339
-.731
.488
.965
-.266
-.025
.005
185.997
x2
.587
.095
.213
6.203
.000
.251
.920
.211
.981
1.019
x3
.287
.102
1.303
2.807
.026
.972
.728
.095
.005
186.110
a.因变量:
y
由表可知,回归模型拟合优度达到99.2%,方差分析也显示线性回归方程整体显著(F=285.61,Sig.=0.000)但是回归系数估计结果中,x1的系数为-0.051与一般经济理论矛盾且不显著(t检验值-0.731,检验的p值0.488),经多重共线性诊断(x1与x3的VIF值高达180以上)表明自变量存在共线性。
运用主成分分析做多重共线性处理:
(2)自变量x1-x3的主成分分析:
由于spss没有独立的主成分分析模块,需要在因子分析里完成,因此需要特别注意:
在数据窗口下选择“分析”—“降维”—“因子分析”(见图10);
在弹出的窗口中将x1-x3调入“变量”(见图11);
然后①点击“描述”,选择要输出的统计量(见图12):
选中“统计量”下的两个项目(输出变量描述统计和初始分析结果);在“相关矩阵”一般要选择输出“系数”、“显著性水平”、“KMO”(做主成分分析和因子分析的适用性检验,也就是检验变量之间的相关系数是否足够大可以做因子分析)选完后点击“继续”进行下一步;②点击“抽取”(见图13):
在“方法”下默认“主成分”;“分析”下,默认“相关性矩阵”(含义是要对变量做标准化处理,然后基于标准化后的协差阵也就是相关阵进行分解做因子分析或主成分分析),如果不需要对变量做标准化处理就选“协方差矩阵”;“输出”中的两项都选,要求输出没有旋转的因子解(主成分分析必选项)和碎石图(用图形决定提取的主成分或因子的个数);“抽取“下,默认的是基于特征值(大于1表示提取的因子或主成分至少代表1个单位标准差的变量信息,因为标准化后的变量方差为1,因子或者主成分作为提取的综合变量应该至少代表1个变量的信息),也可以自选提取的因子个数(即第二项),本例中做主成分回归,选择提取全部可能的3个主成分,所以自选个数填3。
选完后点击“继续”进行下一步;③点击“旋转”(图14),按默认的“方法”下不旋转(注意,主成分分析不能旋转!
)其他不用选,点击“继续”进行下一步;④点击“得分”,计算不旋转的初始因子得分(图15),选中“保存为变量”,“方法”下按默认,其他不修改,点击“继续”进行下一步。
⑤“选项”下可以不选按默认(选项里主要针对缺失值和系数显示格式,不影响分析结果)
最后点击“确定”,运行因子分析。
图10
图11
图12
图13
图14
图15
由运行结果计算主成分:
表4、描述统计量
均值
标准差
分析N
x1
194.5909
29.99952
11
x2
3.3000
1.64924
11
x3
139.7364
20.63440
11
表5、相关矩阵
x1
x2
x3
相关
x1
1.000
.026
.997
x2
.026
1.000
.036
x3
.997
.036
1.000
Sig.(单侧)
x1
.470
.000
x2
.470
.459
x3
.000
.459
表6、KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.492
Bartlett的球形度检验
近似卡方
42.687
df
3
Sig.
.000
表7、解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
1.999
66.638
66.638
1.999
66.638
66.638
2
.998
33.272
99.910
.998
33.272
99.910
3
.003
.090
100.000
.003
.090
100.000
提取方法:
主成份分析。
表8、成份矩阵a
成份
1
2
3
x1
.999
-.036
.037
x2
.062
.998
.000
x3
.999
-.026
-.037
提取方法:
主成份。
a.已提取了3个成份。
由表5、6可知适合做主成分或因子分析(KMO检验通过),表7知前两个主成分(初始因子)贡献率已达99.91%,提取前两个主成分用于分析。
由表8(初始因子载荷阵)和表7可计算前两个特征向量,用表8前两列分别除以前两个特征值的平方根得前两个主成分表达式:
F1=0.7066X1*+0.0439X2*+0.7066X3*(式1)
F2=-0.0360X1*+0.9990X2*-0.0260X3*(式2)
其中X1*-X3*表示为标准化变量(这是因为在进行主成分分析时是以标准化变量进行分析的,是从相关阵出发分析的,见图13的选项)。
由于主成分互不相关,可以用提取的主成分代替自变量进行回归分析,因此需要计算主成分得分来代替自变量X1-X3。
主成分的计算:
依据式1和2中两个主成分的表达式,对各自变量标准化后带入就可以计算出每个样品的主成分得分。
但是在spss中,由因子分析提取时是用主成分法提取的,根据初始因子与主成分的关系,未旋转的初始因子等于主成分除以特征根的平方根,因此主成分得分等于因子得分乘以特征根的平方根,因此可以由因子得分计算主成分得分。
前面在因子分析选项中保存了因子得分(见图15),因此计算两个主成分得分:
点击“转换”—“计算变量”(图16):
在弹出的窗口分别定义主成分F1=第一因子得分*第一特征根的平方根(图17)和F2=第二因子得分*第二特征根的平方根。
(3)主成分回归过程:
要做主成分回归,需要用标准化的因变量(因为自变量经过标准化处理做主成分分析,因变量需要对应做标准化)与主成分做回归,对因变量Y做标准化处理,点击“分析”—“描述统计”—“描述”(见图18),在弹出窗口中将Y调入变量,并选中“将标准化得分另存为变量”(图19)后确定完成Y的标准化。
点击“分析”---“回归”---“线性”(图20)在弹出窗口(图21)中将Zscore(y)调入因变量,F1和F2调入自变量,其他选项同前面图6-9,然后点击“确定”运行主成分回归,相关输出结果见表9
图16
图17
图18
图19
图20
图21
主成分回归结果:
表9、模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.994a
.988
.985
.12104901
a.预测变量:
(常量),F1,F2。
表10、Anovab
模型
平方和
df
均方
F
Sig.
1
回归
9.883
2
4.941
337.230
.000a
残差
.117
8
.015
总计
10.000
10
a.预测变量:
(常量),F1,F2。
b.因变量:
Zscore(y)
表11、系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
-3.043E-16
.036
.000
1.000
F2
.191
.038
.191
4.993
.001
1.000
1.000
F1
.690
.027
.976
25.486
.000
1.000
1.000
a.因变量:
Zscore(y)
由表9-11可知,标准化Y对两个主成分的线性回归通过显著性检验,也没有多重共线性,回归系数合理,即Y*=0.690F1+0.191F2,将前面F1、F2的表达式(式1和二)带入可得标准化Y关于标准化自变量的回归方程:
Y*=0.4806X1*+0.2211X2*+0.4826X3*,还原为原始变量:
整理得最终回归结果:
Y=-9.13+0.072X1+0.60X2+0.1062X3