回归分析SPSS习题答案.docx
《回归分析SPSS习题答案.docx》由会员分享,可在线阅读,更多相关《回归分析SPSS习题答案.docx(55页珍藏版)》请在冰豆网上搜索。
回归分析SPSS习题答案
回归分析习题
(
1 通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内
(通常为一年)的营业额与经营面积的比值。
对单位面积营业额的影响因素的指标有单位小时
车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的
满意度评分。
这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得
到的。
而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分
是通过随机采访顾客而得到的平均值数据。
数据集 wyzl4_2 中存放了从某市随机抽取的 20
个商业中心有关指标的数据,利用该数据完成下列工作
(1)研究变量间的相关程度。
(其余 6 个变量与“单位面积年营业额”间的相关程度,其
余 6 个变量之间的相关程度);
(2)由
(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线
性回归方程;
(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。
表20 个商业中心有关指标的数据
商 业 中 单位面积年 每 小 时 机 日 人 流 居民年消 对商场环 对 商 场 对 商 场 商
心编号 营 业 额 ( 万 动 车 流 量 量( 万 费 额 ( 万 境满意度 设 施 满 品 丰 富 程
元 / 平 方 (万辆)x1人)x2元)x3x4意度 x5 度 满 意 度
米)Yx6
1
2
3
4
5
6
…
15
16
17
18
19
20
2.5
3.2
2.5
3.4
1.8
0.9
…
2.6
2.7
1.4
3.2
2.9
2.5
0.51
0.26
0.72
1.23
0.69
0.36
…
1.04
1.18
0.61
1.05
1.06
0.58
3.90
4.24
4.54
6.98
4.21
2.91
…
5.53
5.98
1.27
5.77
5.71
4.11
1.94
2.86
1.63
1.92
0.71
0.62
…
1.30
1.28
1.48
2.16
1.74
1.85
7
7
8
6
8
5
…
10
8
6
7
6
7
9
4
8
10
4
6
…
7
7
7
10
9
9
6
6
7
10
7
5
…
9
9
1
9
9
6
2.我国从 1982~2001 年间的 20 年的财政收入(Y)和国内生产总值(X)的数据存放在数据
集 wyz4_4_7.中。
试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,
并选择最佳回归方程。
1. 解:
(1)变量间的相关性分析
利用 SPSS 软件构造所有变量的散点图矩阵和相关矩阵,结果见图 1 和表 1
从散点图矩阵直观可以看出 Y “单位面积年营业额”与 x2“日人流量(万人) ”和
x3“居民年消费额(万元) ”线性关系较密切。
1 / 15
x2“日人流量(万人) ”与 x6 “对商场商品丰富程度满意度” 线性关系较密切
从表 1 得 ρ ( y, x3) =0.795**, ρ ( y, x2) =0.790**, ρ ( y, x6) =.0 .697**,
说明 Y “单位面积年营业额”与 x3“居民年消费额(万元) ”,x2“日人流量(万人) ”,
x6 “对商场商品丰富程度满意度”及 x5 “对商场设施满意度”在 0 .01 水平(双侧)上
显著相关线性关。
可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公
式。
图 1 散点图矩阵
表 1 相关矩阵
对商场商
单位面积每小时机居民年对商场 对商场 品丰富程
年营业额动车流量日人流量 消费额环境设施度满意
(万元/m2)(万辆)(万人) (万元) 满意度 满意度 度
单位面积
Pearson 相 关 1
.413
.790**
.795**
.341
.450* .697**
年营业额
性
(万元/m2)
显著性(双侧)
N 20
.071
20
.000
20
.000
20
.141
20
.046
20
.001
20
每小时机动车
Pearson 相 关 .413
1
.751**
-.129
.664** .424
.774**
流量(万辆)
性
显著性(双侧).071
N20
20
.000
20
.588
20
.001
20
.062
20
.000
20
日人流量
Pearson 相 关 .790**
.751**
1
.273
.594** .279
.983**
(万人)
性
2 / 15
显著性(双侧).000
.000
.245
.006
.233
.000
N
20
20
20
20
20
20
20
居民年消费额
Pearson 相 关 .795**
-.129
.273
1
-.112
.426
.144
(万元)
性
对商场环境
显著性(双侧).000
N 20
Pearson 相 关 .341
.588
20
.664**
.245
20
.594**
20
-.112
.639
20
1
.061
20
.042
.545
20
.643**
满意度
性
对商场设施
显著性(双侧).141
N 20
Pearson 相 关 .450*
.001
20
.424
.006
20
.279
.639
20
.426
20
.042
.862
20
1
.002
20
.243
满意度
性
显著性(双侧).046
N20
.062
20
.233
20
.061
20
.862
20
20
.302
20
对商场商品
Pearson 相 关 .697**
.774**
.983**
.144
.643** .243
1
丰富程度
性
满意度
显著性(双侧).001
.000
.000
.545
.002
.302
N20
20
20
20
20
20
20
**. 在 .01 水平(双侧)上显著相关。
(2)建立Y“单位面积年营业额”与“居民年消费额”的一元线性回归方程
⎧
设 ⎨ y = β 0 + β1 x3 + ε
⎩ ε ~ N (0,σ 2)
利用 SPSS 软件的线性回归分析的模块进行分析,结果见表 2~表 6 和图 2~图 3
由最小二乘估计得到一元线性回归方程(见表 4)
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)
由回归方程的显著性检验的 p 值 Sig.= .000,知回归方程在α=0.01 的水平上通过检验,
即 Y 与 x3 的线性关系是显著的(见表 3 方差分析表)
由常量 β 的 t 检验的 p 值 Sig.=0.005<0.01 知回归方程的常数项不为零。
拟合有常数
0
项的回归方程是合适的(见表 4 系数表)
由方程的拟合优度(可决系数) R 2 =0.631,知方程的拟合优度(可决系数)还不够高,
即方程有改进的余地,还可以引入有关的变量 。
(见表 1)
对残差作Shapiro-Wilk正态性检验,p值Sig.=0.538>0.05(见表5)知随机误差项
ε
i
服
从正态分布的假定满足。
作回归标准化残差的标准P-P图(见图2),进一步验证了随机误差项
ε
i
服从正态分布的
3 / 15
以标准化的残差 e 为纵坐标,而以标准化的预测值 y∧ 为横坐标做残差的散点图(见图
假定满足
对残差序列作 D-W 检验,检验统计量 Durbin-Watson=2.125 知 ε1 , ε 2 ,Λ , ε n 之间存在
一定的负自相关:
ε1 , ε 2 ,Λ , ε n 相互独立的假定不一定满足(见表 2)
ti
2
3)。
图中显示散点随机地分布在– 到+2 的带子里,可以认为线性回归模型的等方差假定成
立 。
结论:
(1)一元线性回归方程
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)
在α=0.01 的水平上通过检验,拟合优度为 0.631,方程有改进的余地,还可以引入有关的
变量 。
(2)误差项正态分布的假设和和误差项的等方差假设均成立,但误差项的独立性假设不满
足。
表2
模型汇总b
模型
R
R 方
调整 R 方 标准 估计的误差 Durbin-Watson
1
.795a
.631
.611 .51341 2.125
a. 预测变量:
(常量), 居民年消费额(万元)。
b. 因变量:
单位面积年营业额(万元/m2)
表3 方差分析表
Anovab
模型
平方和
df
均方
F
Sig.
1回归
残差
8.125
4.745
1
18
8.125
.264
30.824
.000a
总计
12.870
19
a. 预测变量:
(常量), 居民年消费额(万元)。
b. 因变量:
单位面积年营业额(万元/m2)
表4
系数a
非标准化系数
标准系数
模型
B
标准 误差
试用版 t
Sig.
1(常量)
.928
.288
3.220
.005
4 / 15
居民年消费额(万元)
.887 .160 .795 5.552 .000
a. 因变量:
单位面积年营业额(万元/m2)
表5 残差的正态性检验
Tests of Normality
Kolmogorov-SmirnovaShapiro-Wilk
Statistic
df
Sig.
Statistic
df Sig.
Standardized Residual
.090
20
.200*
.960
20 .538
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
图2 回归标准化残差的标准P-P图
5 / 15
图3 标准化残差图
表6
残差统计量a
极小值
极大值
均值
标准 偏差
N
预测值
残差
标准 预测值
标准 残差
1.4244
-.89496
-1.484
-1.743
4.0049
.76957
2.462
1.499
2.3950
.00000
.000
.000
.65393
.49972
1.000
.973
20
20
20
20
a. 因变量:
单位面积年营业额(万元/m2)
(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。
解 设 y 与 x1,x2,…,x8 满足
⎨
⎩
规定:
进入方程的变量的显著性水平为 0.05,从方程中剔出变量的显著性水平为 0.10,(见
表 7)
逐步回归的步骤:
(见表 10)
第一步引入变量 x3 居民年消费额(万元)得到一元线性回归方程
6 / 15
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额),
第二步引入变量 x2 日人流量(万人)得到线性回归方程
Y
(单位面积年营业额)=-0.117+0.698x3(居民年消费额) +0.317x2(日人流量(万人)),
第三步引入变量 x4 对商场环境满意度,所得线性回归方程为:
Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291 x2 (日人流量(万人))
+0.037 x4(对商场环境满意度)
以上 3 方程在显著性水平为 0.05 上均通过检验(见表 9)。
t
第 3 个方程的回归系数(包括常数项) 检验的 p 值 0.010,0.000,0.000,0.034,在显著
性水平为 0.05 上均通过检验(见表 10)。
三个方程的修正 R 方值逐步增大 0.611<0.985<.988,故第 3 个方程为最优的(见表
8)
对第 3 个方程的自变量作共线性诊断(见表 10):
回归方程第 i 个回归系数的方差膨
胀因子 VIF 分别 1.235、1.885、1.767,说明方程中的 3 个回归变量不存在共线性,
对残差序列作 D-W 检验,检验统计量 Durbin-Watson=2.574> 2 知 ε1 , ε 2 ,Λ , ε n 之间
存在一定的负自相关:
ε1 , ε 2 ,Λ , ε n 相互独立的假定不一定满足(见表 8)
对残差作Shapiro-Wilk正态性检验,p值Sig.= =0 <0.01(见表15)知随机误差项
不服从正态分布。
ε
i
作回归标准化残差的标准P-P图(见图3),进一步验证了随机误差项
ε
i
不服从正态
分布。
ti
图5)。
图中显示散点随机地分布在–到+2的带子里(除一个点) 可以认为线性回归模型的
等方差假定成立 。
结论:
(1)“单位面积年营业额”的预测公式为:
Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291 x2 (日人流量(万人))
+0.037 x4(对商场环境满意度)
方程在显著性水平为 0.05 上通过检验,调整的 R 方值=0.988,
(2)模型的假定误差项的正态性和不相关性存在问题,估计方法有待改进。
7 / 15
表 7
输入/移去的变量 a
模型
1
输入的变量
居民年消费额
(万元)
移去的变量 方法
. 步 进 ( 准 则 :
F-to-enter 的概率
<=.050,
F-to-remove 的 概
率 >= .100)。
2日人流量(万人). 步 进 ( 准 则 :
F-to-enter 的概率
<=.050,
F-to-remove 的 概
率 >= .100)。
3对商场环境满意
度
. 步 进 ( 准 则 :
F-to-enter 的概率
<= .050 ,
F-to-remove 的 概
率 >= .100)。
a. 因变量:
单位面积年营业额(万元/m2)
表 8
模型汇总 d
模型
R
R 方
调整 R 方 标准 估计的误差
Durbin-Watson
1
2
3
.795a
.993b
.995c
.631
.987
.990
.611
.985
.988
.51341
.09930
.08861
2.574
a. 预测变量:
(常量), 居民年消费额(万元)。
b. 预测变量:
(常量), 居民年消费额(万元), 日人流量(万人)。
c. 预测变量:
(常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意度。
d. 因变量:
单位面积年营业额(万元/m2)
表 9
Anovad
模型
平方和
df
均方
F
Sig.
1回归
残差
8.125
4.745
1
18
8.125
.264
30.824
.000a
总计
12.870
19
8 / 15
2回归
残差
总计
12.702
.168
12.870
2
17
19
6.351
.010
644.024 .000b
3回归
残差
12.744
.126
3
16
4.248
.008
540.982
.000c
总计
12.870
19
a. 预测变量:
(常量), 居民年消费额(万元)。
b. 预测变量:
(常量), 居民年消费额(万元), 日人流量(万人)。
c. 预测变量:
(常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意
度。
d. 因变量:
单位面积年营业额(万元/m2)
表 10
系数 a
非标准化系数
标准系数
模型
B
标准 误差
试用版 t
Sig.
1(常量)
居民年消费额(万元)
2(常量)
.928
.887
-.117
.288
.160
.074
3.220
.795 5.552
-1.585
.005
.000
.131
居民年消费额(万元)
日人流量(万人)
3(常量)
居民年消费额(万元)
日人流量(万人)
对商场环境满意度
.698
.317
-.297
.723
.291
.037
.032
.015
.102
.031
.017
.016
.625
.620
.648
.569
.076
21.739
21.544
-2.913
23.603
16.766
2.313
.000
.000
.010
.000
.000
.034
a. 因变量:
单位面积年营业额(万元/m2)
系数 a
共线性统计量
模型
1
2
居民年消费额(万元)
居民年消费额(万元)
容差
1.000
.926
VIF
1.000
1.080
日人流量(万人)
3居民年消费额(万元)
日人流量(万人)
.926
.810
.530
1.080
1.235
1.885
9 / 15
对商场环境满意度
.566 1.767
a. 因变量:
单位面积年营业额(万元/m2)
表 11
已排除的变量 d
模型
Beta In
t
Sig.
偏相关
1每小时机动车流量(万辆)
日人流量(万人)
对商场环境满意度
对商场设施满意度
对商场商品丰富程度满意度
2每小时机动车流量(万辆)
对商场环境满意度
对商场设施满意度
对商场商品丰富程度满意度
3每小时机动车流量(万辆)
对商场设施满意度
对商场商品丰富程度满意度
.524a
.620a
.436a
.137a
.595a
.088b
.076b
.013b
-.113b
.065c
.016c
-.223c
6.813
21.544
4.192
.858
16.600
1.927
2.313
.423
-.520
1.459
.546
-1.156
.000
.000
.001
.403
.000
.072
.034
.678
.610
.165
.593
.266
.856
.982
.713
.204
.971
.434
.501
.105
-.129
.353
.140
-.286
a. 模型中的预测变量:
(常量), 居民年消费额(万元)。
b. 模型中的预测变量:
(常量), 居民年消费额(万元), 日人流量(万人)。
c. 模型中的预测变量:
(常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意
度。
d. 因变量:
单位面积年营业额(万元/m2)
表 12
已排除的变量 d
共线性统计量
模型
1每小时机动车流量(万辆)
日人流量(万人)
对商场环境满意度
对商场设施满意度
对商场商品丰富程度满意度
2每小时机动车流量(万辆)
容差
.983
.926
.987
.819
.979
.316
VIF
1.017
1.080
1.013
1.221
1.021
3.168
最小容差
.983
.926
.987
.819
.979
.297
10 / 15
对商场环境满意度
对商场设施满意度
对商场商品丰富程度满意度
3每小时机动车流量(万辆)
对商场设施满意度
对商场商品丰富程度满意度
.566
.790
.017
.291
.789
.016
1.767
1.266
59.374
3.442
1.267
62.518
.530
.790
.016
.277
.516
.016
d. 因变量:
单位面积年营业额(万元/m2)
表 13
共线性诊断 a
方差比例
居民年消费额(万
对商场环境满意
模型
维数
特征值
条件索引
(常量)
元)
日人流量(万人)
度
1
1
2
21
2
3
31
2
3
4
1.917
.083
2.837
.105
.058
3.785
.136
.062
.017
1.000
4.812
1.000
5.197
6.971
1.000
5.270
7.823
14.838
.04
.96
.01
.04
.95
.00
.00
.23
.76
.04
.96
.02
.89
.10
.01
.68
.01
.31
.01
.33
.66
.00
.03
.59
.38
.00
.05
.02
.93
a. 因变量:
单位面积年营业额(万元/m2)
表 14
残差统计量 a
极小值
极大值
均值
标准 偏差
N
预测值
残差
标准 预测值
标准 残差
1.0291
-.28298
-1.668
-3.193
3.9475
.08128
1.896
.917
2.3950
.00000
.000
.000
.81898
.08132
1.000
.918
20
20
20
20
a. 因变量:
单位面积年营业额(万元/m2)
11 / 15
表15
Tests of Normality
Kolmogorov-SmirnovaShapiro-Wilk
Statistic
df
Sig.
Statistic
df
Sig.
Standardized Residual
.172
20
.121
.775
20
.000
a. Lilliefors Significance Correction
图 4 回归标准化残差的标准 P-P 图
12 / 15
图 5 标准化残差图
2. 我国从 1982~2001 年间的 20 年的财政收入(Y)和国内生产总值(X)的数据存放在数据集 wyz4_4_7.中。
试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。
解:
(1)利用 SP