回归分析SPSS习题答案.docx
《回归分析SPSS习题答案.docx》由会员分享,可在线阅读,更多相关《回归分析SPSS习题答案.docx(20页珍藏版)》请在冰豆网上搜索。
![回归分析SPSS习题答案.docx](https://file1.bdocx.com/fileroot1/2023-1/3/f5275ff3-0257-4e05-a36c-1f3c566faa37/f5275ff3-0257-4e05-a36c-1f3c566faa371.gif)
回归分析SPSS习题答案
商业中
心编号
单位面积年
营业额(万
元/平方米)
Y
每小时机
动车流量
(万辆)x1
日人流
量 (万
人)x2
居民年消
费额(万
元)x3
对商场环
境满意度
x4
对商场设
施满意度
x5
对商场商
品丰富程
度满意度
x6
1
2.5
0.51
3.90
1.94
7
9
6
2
3.2
0.26
4.24
2.86
7
4
6
3
2.5
0.72
4.54
1.63
8
8
7
4
3.4
1.23
6.98
1.92
6
10
10
5
1.8
0.69
4.21
0.71
8
4
7
6
0.9
0.36
2.91
0.62
5
6
5
…
…
…
…
…
…
…
…
15
2.6
1.04
5.53
1.30
10
7
9
16
2.7
1.18
5.98
1.28
8
7
9
17
1.4
0.61
1.27
1.48
6
7
1
18
3.2
1.05
5.77
2.16
7
10
9
19
2.9
1.06
5.71
1.74
6
9
9
20
2.5
0.58
4.11
1.85
7
9
6
回归分析习题
1 通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内
(通常为一年)的营业额与经营面积的比值。
对单位面积营业额的影响因素的指标有单位小
时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度
的满意度评分。
这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而
得到的。
而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评
分是通过随机采访顾客而得到的平均值数据。
(数据集 wyzl4_2 中存放了从某市随机抽取
的 20 个商业中心有关指标的数据,利用该数据完成下列工作
(1)研究变量间的相关程度。
(其余 6 个变量与“单位面积年营业额”间的相关程度,其
余 6 个变量之间的相关程度);
(2)由
(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线
性回归方程;
(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。
表 20 个商业中心有关指标的数据
2.我国从 1982~2001 年间的 20 年的财政收入(Y)和国内生产总值(X)的数据存放在数据
集 wyz4_4_7.中。
试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方
程,并选择最佳回归方程。
1. 解:
(1)变量间的相关性分析
利用 SPSS 软件构造所有变量的散点图矩阵和相关矩阵,结果见图 1 和表 1
从散点图矩阵直观可以看出 Y “单位面积年营业额”与 x2“日人流量(万人) ”和
x3“居民年消费额(万元) ”线性关系较密切。
x2“日人流量 (万人) ”与 x6 “对商场商品丰富程度满意度” 线性关系较密切
单位面积
年营业额
(万元/m2)
每小时机
动车流量
(万辆)
日人流量
(万人)
居民年
消费额
(万元)
对商场
环境
满意度
对商场
设施
满意度
对商场商
品丰富程
度满意
度
单位面积 Pearson 相关
年营业额 性
(万元/m2) 显著性(双侧)
N
1
20
.413
.071
20
.790**
.000
20
.795**
.000
20
.341
.141
20
.450*
.046
20
.697**
.001
20
每小时机动车 Pearson 相关
流量(万辆) 性
显著性(双侧)
N
.413
.071
20
1
20
.751**
.000
20
-.129
.588
20
.664**
.001
20
.424
.062
20
.774**
.000
20
表 1 相关矩阵
从表 1 得 ρ ( y, x3) =0.795**, ρ ( y, x2) =0.790**, ρ ( y, x6) =.0 .697**,
说明 Y “单位面积年营业额”与 x3“居民年消费额(万元) ”,x2“日人流量(万人) ”,
x6 “对商场商品丰富程度满意度”及 x5 “对商场设施满意度”在 0 .01 水平(双侧)上
显著相关线性关。
可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公
式。
图 1 散点图矩阵
日人流量 Pearson 相关
(万人) 性
显著性(双侧)
N
.790**
.000
20
.751**
.000
20
1
20
.273
.245
20
.594**
.006
20
.279
.233
20
.983**
.000
20
居民年消费额 Pearson 相关
(万元) 性
显著性(双侧)
N
.795**
.000
20
-.129
.588
20
.273
.245
20
1
20
-.112
.639
20
.426
.061
20
.144
.545
20
对商场环境 Pearson 相关
满意度 性
显著性(双侧)
N
.341
.141
20
.664**
.001
20
.594**
.006
20
-.112
.639
20
1
20
.042
.862
20
.643**
.002
20
对商场设施 Pearson 相关
满意度 性
显著性(双侧)
N
.450*
.046
20
.424
.062
20
.279
.233
20
.426
.061
20
.042
.862
20
1
20
.243
.302
20
对商场商品 Pearson 相关
丰富程度 性
满意度 显著性(双侧)
N
.697**
.001
20
.774**
.000
20
.983**
.000
20
.144
.545
20
.643**
.002
20
.243
.302
20
1
20
(2)建立Y“单位面积年营业额”与“居民年消费额”的一元线性回归方程
2
利用 SPSS 软件的线性回归分析的模块进行分析,结果见表 2~表 6 和图 2~图 3
由最小二乘估计得到一元线性回归方程(见表 4)
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)
由回归方程的显著性检验的 p 值 Sig.= .000,知回归方程在 α=0.01 的水平上通过检验,
即 Y 与 x3 的线性关系是显著的(见表 3 方差分析表)
由常量 β 0 的 t 检验的 p 值 Sig.=0.005<0.01 知回归方程的常数项不为零。
拟合有常数
项的回归方程是合适的 (见表 4 系数表)
由方程的拟合优度(可决系数) R2 =0.631,知方程的拟合优度(可决系数)还不够高,
模型
平方和
df
均方
F
Sig.
1 回归
残差
总计
8.125
4.745
12.870
1
18
19
8.125
.264
30.824
.000a
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.795a
.631
.611
.51341
2.125
即方程有改进的余地,还可以引入有关的变量 。
(见表 1)
对残差作Shapiro-Wilk正态性检验,p值Sig.=0.538>0.05(见表5)知随机误差项
ε
i
服从
正态分布的假定满足。
作回归标准化残差的标准P-P图(见图2),进一步验证了随机误差项
ε
i
服从正态分布的
假定满足
对残差序列作 D-W 检验,检验统计量 Durbin-Watson=2.125 知 ε1, ε 2 ,L , ε n 之间存在
一定的负自相关:
ε1, ε 2 ,L , ε n 相互独立的假定不一定满足(见表 2)
∧
以标准化的残差 et 为纵坐标,而以标准化的预测值 yi 为横坐标做残差的散点图(见
图 3)。
图中显示散点随机地分布在–2 到+2 的带子里,可以认为线性回归模型的等方差假
定成立 。
结论:
(1)一元线性回归方程
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)
在 α=0.01 的水平上通过检验,拟合优度为 0.631,方程有改进的余地,还可以引入有关的
变量 。
(2)误差项正态分布的假设和和误差项的等方差假设均成立,但误差项的独立性假设不
满足。
表2
b. 因变量:
单位面积年营业额(万元/m2)
表3 方差分析表
b. 因变量:
单位面积年营业额(万元/m2)
表4
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1 (常量)
居民年消费额(万元)
.928
.887
.288
.160
.795
3.220
5.552
.005
.000
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic
df
Sig.
Statistic
df
Sig.
Standardized Residual
.090
20
.200*
.960
20
.538
表5 残差的正态性检验
*. This is a lower bound of the true significance.
图2 回归标准化残差的标准P-P图
极小值
极大值
均值
标准 偏差
N
预测值
残差
标准 预测值
标准 残差
1.4244
-.89496
-1.484
-1.743
4.0049
.76957
2.462
1.499
2.3950
.00000
.000
.000
.65393
.49972
1.000
.973
20
20
20
20
图3 标准化残差图
表6
(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。
解 设 y 与 x1,x2,…,x8 满足
⎨
⎩
规定:
进入方程的变量的显著性水平为 0.05,从方程中剔出变量的显著性水平为
0.10,(见表 7)
逐步回归的步骤:
(见表 10)
第一步引入变量 x3 居民年消费额(万元)得到一元线性回归方程
Y(单位面积年营业额)=0.928+0.877x3(居民年消费额),
第二步引入变量 x2 日人流量(万人)得到线性回归方程
Y(单位面积年营业额)=-0.117+0.698x3(居民年消费额) +0.317x2(日人流量(万人)
),
第三步引入变量 x4 对商场环境满意度,所得线性回归方程为:
Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291 x2 (日人流量(万人))
+0.037 x4(对商场环境满意度)
以上 3 方程在显著性水平为 0.05 上均通过检验(见表 9)。
第 3 个方程的回归系数(包括常数项)t 检验的 p 值 0.010,0.000,0.000,0.034,在显
著性水平为 0.05 上均通过检验(见表 10)。
三个方程的修正 R 方值逐步增大 0.611<0.985<.988,故第 3 个方程为最优的(见
表 8)
对第 3 个方程的自变量作共线性诊断(见表 10):
回归方程第 i 个回归系数的方差
膨胀因子 VIF 分别 1.235、1.885、1.767,说明方程中的 3 个回归变量不存在共线性,
对残差序列作 D-W 检验,检验统计量 Durbin-Watson=2.574> 2 知 ε1, ε 2 ,L , ε n 之间存
在一定的负自相关:
ε1, ε 2 ,L , ε n 相互独立的假定不一定满足(见表 8)
对残差作Shapiro-Wilk正态性检验,p值Sig.= =0 <0.01(见表15)知随机误差项
ε
i
不
服从正态分布。
作回归标准化残差的标准P-P图(见图3),进一步验证了随机误差项
ε
i
不服从正态
分布。
∧
以标准化的残差 et 为纵坐标,而以标准化的预测值 yi 为横坐标做残差的散点图(见
图5)。
图中显示散点随机地分布在–2到+2的带子里(除一个点),可以认为线性回归模型
的等方差假定成立 。
结论:
(1)“单位面积年营业额”的预测公式为:
Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291 x2 (日人流量(万人)
)+0.037 x4(对商场环境满意度)
方程在显著性水平为 0.05 上通过检验,调整的 R 方值=0.988,
(2)模型的假定误差项的正态性和不相关性存在问题,估计方法有待改进。
模型
输入的变量
移去的变量
方法
1
2
3
居民年消费额
(万元)
日人流量(万人)
对商场环境满意
度
.
.
.
步进(准则:
F-to-
enter 的概率 <=
.050,F-to-remove
的概率 >= .100)。
步进(准则:
F-to-
enter 的概率 <=
.050,F-to-remove
的概率 >= .100)。
步进(准则:
F-to-
enter 的概率 <=
.050,F-to-remove
的概率 >= .100)。
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
2
3
.795a
.993b
.995c
.631
.987
.990
.611
.985
.988
.51341
.09930
.08861
2.574
表 7
表 8
b. 预测变量:
(常量), 居民年消费额(万元), 日人流量(万人)。
c. 预测变量:
(常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意度。
d. 因变量:
单位面积年营业额(万元/m2)
表 9
Anovad
模型平方和df均方FSig.
1回归8.12518.12530.824.000a
模型
非标准化系数
标准系数
B
标准 误差
试用版
t
Sig.
1 (常量)
居民年消费额(万元)
.928
.887
.288
.160
.795
3.220
5.552
.005
.000
2 (常量)
居民年消费额(万元)
日人流量(万人)
-.117
.698
.317
.074
.032
.015
.625
.620
-1.585
21.739
21.544
.131
.000
.000
3 (常量)
居民年消费额(万元)
日人流量(万人)
对商场环境满意度
-.297
.723
.291
.037
.102
.031
.017
.016
.648
.569
.076
-2.913
23.603
16.766
2.313
.010
.000
.000
.034
残差
总计
4.745
12.870
18
19
.264
2 回归
残差
总计
12.702
.168
12.870
2
17
19
6.351
.010
644.024
.000b
3 回归
残差
总计
12.744
.126
12.870
3
16
19
4.248
.008
540.982
.000c
b. 预测变量:
(常量), 居民年消费额(万元), 日人流量(万人)。
c. 预测变量:
(常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意
度。
d. 因变量:
单位面积年营业额(万元/m2)
表 10
系数 a
共线性统计量
模型容差VIF
1居民年消费额(万元)1.0001.000
2
居民年消费额(万元) .926 1.080
日人流量(万人).9261.080
3居民年消费额(万元).8101.235
模型
Beta In
t
Sig.
偏相关
1 每小时机动车流量(万辆)
日人流量(万人)
对商场环境满意度
对商场设施满意度
对商场商品丰富程度满意度
.524a
.620a
.436a
.137a
.595a
6.813
21.544
4.192
.858
16.600
.000
.000
.001
.403
.000
.856
.982
.713
.204
.971
2 每小时机动车流量(万辆)
对商场环境满意度
对商场设施满意度
对商场商品丰富程度满意度
.088b
.076b
.013b
-.113b
1.927
2.313
.423
-.520
.072
.034
.678
.610
.434
.501
.105
-.129
3 每小时机动车流量(万辆)
对商场设施满意度
对商场商品丰富程度满意度
.065c
.016c
-.223c
1.459
.546
-1.156
.165
.593
.266
.353
.140
-.286
日人流量(万人).5301.885
对商场环境满意度.5661.767
a. 因变量:
单位面积年营业额(万元/m2)
表 11
b. 模型中的预测变量:
(常量), 居民年消费额(万元), 日人流量(万人)。
c. 模型中的预测变量:
(常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满
意度。
d. 因变量:
单位面积年营业额(万元/m2)
表 12
已排除的变量 d
共线性统计量
模型容差VIF最小容差
1
2
每小时机动车流量(万辆) .983 1.017 .983
日人流量(万人) .926 1.080 .926
对商场环境满意度 .987 1.013 .987
对商场设施满意度 .819 1.221 .819
对商场商品丰富程度满意度 .979 1.021 .979
每小时机动车流量(万辆) .316 3.168 .297
对商场环境满意度 .566 1.767 .530
模型 维数
方差比例
特征值
条件索引
(常量)
居民年消费额
(万元)
日人流量(万人)
对商场环境满意
度
1 1
2
1.917
.083
1.000
4.812
.04
.96
.04
.96
2 1
2
3
2.837
.105
.058
1.000
5.197
6.971
.01
.04
.95
.02
.89
.10
.01
.33
.66
3 1
2
3
4
3.785
.136
.062
.017
1.000
5.270
7.823
14.838
.00
.00
.23
.76
.01
.68
.01
.31
.00
.03
.59
.38
.00
.05
.02
.93
极小值
极大值
均值
标准 偏差
N
预测值
残差
标准 预测值
标准 残差
1.0291
-.28298
-1.668
-3.193
3.9475
.08128
1.896
.917
2.3950
.00000
.000
.000
.81898
.08132
1.000
.918
20
20
20
20
对商场设施满意度
对商场商品丰富程度满意度
.790
.017
1.266
59.374
.790
.016
3 每小时机动车流量(万辆)
对商场设施满意度
对商场商品丰富程度满意度
.291
.789
.016
3.442
1.267
62.518
.277
.516
.016
d. 因变量:
单位面积年营业额(万元/m2)
表 13
表 14
表15
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic
df
Sig.
Statistic
df
Sig.
Standardized Residual
.172
20
.121
.775
20
.000
图 4 回归标准化残差的标准 P-P 图
图 5 标准化残差图
2. 我国从 1982~2001 年间的 20 年的财政收入(Y)和国内生产总值(X)的数据存放在数据集 wyz4_4_7.中。
试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。
解: