SPSS处理多重回归分析.docx
《SPSS处理多重回归分析.docx》由会员分享,可在线阅读,更多相关《SPSS处理多重回归分析.docx(30页珍藏版)》请在冰豆网上搜索。
SPSS处理多重回归分析
实验二多重回归分析
一、实验目的
研究样本数据离差阵、样本协方差阵,以及变量之间的相关系数(包括偏相关)并作
相关性分析。
二、实验要求
为研究高等院校人文社会科学研究中立项课题数受那些因素的影响,收集到某年 31 个
地区部分高校有关社科研究方面的数据(见 SPSS 数据),利用此的数据,设定立项课题数
X5 为因变量(被解释变量),X2,X3,X4,X6,X7,X8 为解释变量,作多重回归分析。
三、实验内容
1.依次点击“分析→回归→线性回归”,得到如下图一所示:
【图一】
2.点击“统计量”,得到如下图二所示:
【图二】
3.点击“继续”,得到如下图三所示:
【图三】
4.点击“继续→确定”,得到如下表一所示:
【表一】
回归
2
Ri2 是解释变量 X i 与其他解释变量间的复相关
系数的平方。
容忍度取值范围为 0-1,越接近 0 表示多重共线性越强,容忍度越接近于 1
表示多重共线性越弱。
方差膨胀因子(VIF):
VIF =
1
Toli
即为容忍度的倒数。
VIF 的值大于等于 1,
VIF 越小,说明多重共线性越弱。
可见,投入高级职称的人年数的容差最小,为 0.007,多重共线性是最弱的,其次是
投入人年数;获奖数的容差最大,为 0.358,多重共线性最强。
其中,解释变量相关阵的特征根和方差比:
如果解释变量有较强的相关性,则它们
之间必然存在信息重叠。
可通过解释变量相关阵的特征值来反映。
解释变量相关阵的最大
特征根能够解释说明解释变量信息的比例是最高的,其他特征根随其特征值的减小对解释
变量方差的的解释能力依次减弱。
如果这些特征根中,最大特征根远远大于其他特征根,
说明这些解释变量间具有相当多的重叠信息。
条件指数:
是在特征值基础上的定义的能反映解释变量间多重共线性的指标
ki =
λm
λi
ki 为第 i 个条件指数, λm 是最大特征根。
通常当 0 ≤ ki < 10 时,认为多重共线性弱;当10 ≤ ki < 100 时,认为多重共线性较强;
当是 ki ≥ 100 ,认为多重共线性很严重。
可见,专著数、论文数及获奖数的多重共线性较强;投入人年数、投入高级职称的
人年数及投入科研事业费的多重共线性较弱。
通过观察数据窗口的库克距离和杠杆值变量的值,发现没有明显的异常点。
综上分析,因此此模型需要改进。
将方法中的 “进入”改为“逐步”,其余操作不变,如下图四所示:
【图四】
点击“确定”,得到如表二所示:
【表二】
回归
可见,投入高级职称的人年数的容差最小,为 0.024,多重共线性是最弱的,其次是
论文数;投入科研经费的容差最大,为 0.267,多重共线性最强。
通过观察数据窗口的库克距离和杠杆值变量的值,发现没有明显的异常点。
也可将方法改为“向后”,如下图五所示:
模型
输入的变量
移去的变量
方法
1
2
3
4
5
6
获奖数, 投
入科研事业
费(百元),
论文数, 专
著数, 投入
人年数, 投
入高级职称
的人年数(a)
.
.
.
.
.
.
专著数
投入高级职
称的人年数
投入科研事
业费(百元)
获奖数
论文数
输入
向后(准
则:
F-to-
remove 的
概率 <=
.100)。
向后(准
则:
F-to-
remove 的
概率 <=
.100)。
向后(准
则:
F-to-
remove 的
概率 <=
.100)。
向后(准
则:
F-to-
remove 的
概率 <=
.100)。
向后(准
则:
F-to-
remove 的
概率 <=
.100)。
【图五】
点击“确定”,得出分析结果如下表三所示:
【表三】
回归
输入/移去的变量(b)
b 因变量:
课题总数
模型
R
R 方
调整的 R
方
估计的标
准差
更改统计量
Durbin-
Watson
R 方更
改
F 更改
df1
df2
显著性F
更改
1
2
3
4
5
6
.969(a)
.969(b)
.968(c)
.965(d)
.963(e)
.959(f)
.939
.939
.937
.931
.927
.919
.924
.927
.927
.923
.921
.917
231.5255
226.8644
226.5820
232.0833
234.8694
241.9582
.939
.000
-.002
-.006
-.004
-.007
61.532
.004
.935
2.327
1.676
2.777
6
1
1
1
1
1
24
24
25
26
27
28
.000
.953
.343
.139
.206
.107
1.747
模型摘要(g)
的人年数。
b 预测变量:
(常量), 获奖数, 投入科研事业费(百元), 论文数, 投入人年数, 投入高级职称的人年数。
c 预测变量:
(常量), 获奖数, 投入科研事业费(百元), 论文数, 投入人年数。
d 预测变量:
(常量), 获奖数, 论文数, 投入人年数。
e 预测变量:
(常量), 论文数, 投入人年数。
f 预测变量:
(常量), 投入人年数。
g 因变量:
课题总数
ANOVA(g)
模型平方和df均方F显著性
1
回归 19790312.
879 6
残差 1286497.1
21 24
3298385.4
80 61.532
53604.047
.000(a)
合计21076810.
00030
2
回归 19790123.
766 5
残差 1286686.2
34 25
3958024.7
53 76.903
51467.449
.000(b)
合计21076810.
00030
3
回归 19741985.
311 4
残差 1334824.6
89 26
4935496.3
28 96.135
51339.411
.000(c)
合计21076810.
00030
4回归19622518.36540839.5121.436.000(d)
60836
5
残差 1454291.3
92 27
合计 21076810.
000 30
回归 19532228.
232 2
残差 1544581.7
68 28
53862.644
9766114.1
16 177.039
55163.635
.000(e)
合计21076810.
00030
6
回归 19379040.
047 1
残差 1697769.9
53 29
19379040.
047 331.018
58543.791
.000(f)
合计21076810.
00030
a 预测变量:
(常量), 获奖数, 投入科研事业费(百元), 论文数, 专著数, 投入人年数, 投入高级职称
的人年数。
b 预测变量:
(常量), 获奖数, 投入科研事业费(百元), 论文数, 投入人年数, 投入高级职称的人年数。
c 预测变量:
(常量), 获奖数, 投入科研事业费(百元), 论文数, 投入人年数。
d 预测变量:
(常量), 获奖数, 论文数, 投入人年数。
e 预测变量:
(常量), 论文数, 投入人年数。
f 预测变量:
(常量), 投入人年数。
g 因变量:
课题总数
系数(a)
标准化系
非标准化系数
数 B 的 95% 置信区
模型B标准误Betat显著性下限上限
1
(常量) -35.313 76.580 -.461 .649 -193.367 122
投入人年数.698.2081.3613.352.003.2681
投入高级职称的
人年数-.467
投入科研事业费
(百元).003
.626 -.464 -.747 .463 -1.759
.002 .237 1.601 .122 -.001
专著数.022.377.014.059.953-.755
论文数-.064.053-.252-1.198.243-.173
获奖数.712.503.1191.416.170-.3261
2
(常量) -36.246 73.442 -.494 .626 -187.504 115
投入人年数.692.1761.3493.932.001.3291
投入高级职称的-.443.458-.439-.967.343-1.385
人年数
投入科研事业费
(百元).003
.002 .240 1.778 .088 .000
论文数-.064.052-.253-1.230.230-.170
获奖数.701.453.1171.548.134-.2321
3(常量)-29.79173.047-.408.687-179.942120
投入人年数.553.1021.0795.411.000.343
投入科研事业费
(百元).002
.001 .152 1.525 .139 -.001
论文数-.088.045-.348-1.934.064-.181
获奖数.716.452.1201.586.125-.2121
4(常量)-63.38571.340-.889.382-209.76282
投入人年数.644.0851.2557.527.000.468
论文数-.096.046-.381-2.081.047-.191-
获奖数.589.455.0991.295.206-.3441
5(常量)-67.92572.109-.942.354-215.63379
投入人年数.628.0861.2247.330.000.452
论文数-.070.042-.278-1.666.107-.156
6(常量)-94.52472.442-1.305.202-242.68553
投入人年数.492.027.95918.194.000.436
a 因变量: