回归分析SPSS习题答案.docx

上传人:b****7 文档编号:25705466 上传时间:2023-06-11 格式:DOCX 页数:55 大小:644.89KB
下载 相关 举报
回归分析SPSS习题答案.docx_第1页
第1页 / 共55页
回归分析SPSS习题答案.docx_第2页
第2页 / 共55页
回归分析SPSS习题答案.docx_第3页
第3页 / 共55页
回归分析SPSS习题答案.docx_第4页
第4页 / 共55页
回归分析SPSS习题答案.docx_第5页
第5页 / 共55页
点击查看更多>>
下载资源
资源描述

回归分析SPSS习题答案.docx

《回归分析SPSS习题答案.docx》由会员分享,可在线阅读,更多相关《回归分析SPSS习题答案.docx(55页珍藏版)》请在冰豆网上搜索。

回归分析SPSS习题答案.docx

回归分析SPSS习题答案

 

回归分析习题

1 通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内

(通常为一年)的营业额与经营面积的比值。

对单位面积营业额的影响因素的指标有单位小时

车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的

满意度评分。

这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得

到的。

而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分

是通过随机采访顾客而得到的平均值数据。

 数据集 wyzl4_2 中存放了从某市随机抽取的 20

个商业中心有关指标的数据,利用该数据完成下列工作

(1)研究变量间的相关程度。

(其余 6 个变量与“单位面积年营业额”间的相关程度,其

余 6 个变量之间的相关程度);

(2)由

(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线

性回归方程;

(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。

 

表20 个商业中心有关指标的数据

商 业 中 单位面积年 每 小 时 机 日 人 流 居民年消 对商场环 对 商 场 对 商 场 商

心编号 营 业 额 ( 万 动 车 流 量 量( 万 费 额 ( 万 境满意度 设 施 满 品 丰 富 程

元 / 平 方 (万辆)x1人)x2元)x3x4意度 x5 度 满 意 度

米)Yx6

1

2

3

4

5

6

15

16

17

18

19

20

2.5

3.2

2.5

3.4

1.8

0.9

2.6

2.7

1.4

3.2

2.9

2.5

0.51

0.26

0.72

1.23

0.69

0.36

1.04

1.18

0.61

1.05

1.06

0.58

3.90

4.24

4.54

6.98

4.21

2.91

5.53

5.98

1.27

5.77

5.71

4.11

1.94

2.86

1.63

1.92

0.71

0.62

1.30

1.28

1.48

2.16

1.74

1.85

7

7

8

6

8

5

10

8

6

7

6

7

9

4

8

10

4

6

7

7

7

10

9

9

6

6

7

10

7

5

9

9

1

9

9

6

 

2.我国从 1982~2001 年间的 20 年的财政收入(Y)和国内生产总值(X)的数据存放在数据

集 wyz4_4_7.中。

试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,

并选择最佳回归方程。

 

1. 解:

(1)变量间的相关性分析

利用 SPSS 软件构造所有变量的散点图矩阵和相关矩阵,结果见图 1 和表 1

从散点图矩阵直观可以看出 Y “单位面积年营业额”与 x2“日人流量(万人) ”和

x3“居民年消费额(万元) ”线性关系较密切。

 

1 / 15

 

x2“日人流量(万人) ”与 x6 “对商场商品丰富程度满意度” 线性关系较密切

从表 1 得 ρ ( y, x3) =0.795**, ρ ( y, x2) =0.790**, ρ ( y, x6) =.0 .697**,

说明 Y “单位面积年营业额”与 x3“居民年消费额(万元) ”,x2“日人流量(万人) ”,

x6 “对商场商品丰富程度满意度”及 x5 “对商场设施满意度”在 0 .01 水平(双侧)上

显著相关线性关。

可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公

式。

 

图 1 散点图矩阵

表 1 相关矩阵

对商场商

单位面积每小时机居民年对商场 对商场 品丰富程

年营业额动车流量日人流量 消费额环境设施度满意

(万元/m2)(万辆)(万人) (万元) 满意度 满意度 度

单位面积

Pearson 相 关 1

.413

.790**

.795**

.341

.450*  .697**

年营业额

(万元/m2)

显著性(双侧)

N            20

.071

20

.000

20

.000

20

.141

20

.046

20

.001

20

每小时机动车

Pearson 相 关 .413

1

.751**

-.129

.664** .424

.774**

流量(万辆)

显著性(双侧).071

N20

20

.000

20

.588

20

.001

20

.062

20

.000

20

日人流量

Pearson 相 关 .790**

.751**

1

.273

.594** .279

.983**

(万人)

 

2 / 15

 

显著性(双侧).000

.000

.245

.006

.233

.000

N

20

20

20

20

20

20

20

居民年消费额

Pearson 相 关 .795**

-.129

.273

1

-.112

.426

.144

(万元)

 

对商场环境

显著性(双侧).000

N            20

Pearson 相 关 .341

.588

20

.664**

.245

20

.594**

20

-.112

.639

20

1

.061

20

.042

.545

20

.643**

满意度

 

对商场设施

显著性(双侧).141

N            20

Pearson 相 关 .450*

.001

20

.424

.006

20

.279

.639

20

.426

20

.042

.862

20

1

.002

20

.243

满意度

显著性(双侧).046

N20

.062

20

.233

20

.061

20

.862

20

20

.302

20

对商场商品

Pearson 相 关 .697**

.774**

.983**

.144

.643** .243

1

丰富程度

满意度

显著性(双侧).001

.000

.000

.545

.002

.302

N20

20

20

20

20

20

20

**. 在 .01 水平(双侧)上显著相关。

 

(2)建立Y“单位面积年营业额”与“居民年消费额”的一元线性回归方程

设 ⎨ y = β 0 + β1 x3 + ε

⎩ ε ~ N (0,σ 2)

利用 SPSS 软件的线性回归分析的模块进行分析,结果见表 2~表 6 和图 2~图 3

由最小二乘估计得到一元线性回归方程(见表 4)

Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)

由回归方程的显著性检验的 p 值 Sig.= .000,知回归方程在α=0.01 的水平上通过检验,

即 Y 与 x3 的线性关系是显著的(见表 3 方差分析表)

由常量 β 的 t 检验的 p 值 Sig.=0.005<0.01 知回归方程的常数项不为零。

拟合有常数

0

项的回归方程是合适的(见表 4 系数表)

由方程的拟合优度(可决系数) R 2 =0.631,知方程的拟合优度(可决系数)还不够高,

即方程有改进的余地,还可以引入有关的变量 。

(见表 1)

对残差作Shapiro-Wilk正态性检验,p值Sig.=0.538>0.05(见表5)知随机误差项

ε

i

从正态分布的假定满足。

作回归标准化残差的标准P-P图(见图2),进一步验证了随机误差项

ε

i

服从正态分布的

 

3 / 15

 

以标准化的残差 e  为纵坐标,而以标准化的预测值 y∧  为横坐标做残差的散点图(见图

假定满足

对残差序列作 D-W 检验,检验统计量 Durbin-Watson=2.125 知 ε1 , ε 2 ,Λ , ε n 之间存在

一定的负自相关:

 ε1 , ε 2 ,Λ , ε n 相互独立的假定不一定满足(见表 2)

 

ti

2

3)。

图中显示散点随机地分布在– 到+2 的带子里,可以认为线性回归模型的等方差假定成

立 。

 

结论:

(1)一元线性回归方程

Y(单位面积年营业额)=0.928+0.877x3(居民年消费额)

在α=0.01 的水平上通过检验,拟合优度为 0.631,方程有改进的余地,还可以引入有关的

变量 。

(2)误差项正态分布的假设和和误差项的等方差假设均成立,但误差项的独立性假设不满

足。

 

表2

模型汇总b

模型

R

R 方

调整 R 方 标准 估计的误差  Durbin-Watson

1

.795a

.631

.611          .51341           2.125

a. 预测变量:

 (常量), 居民年消费额(万元)。

b. 因变量:

 单位面积年营业额(万元/m2)

 

表3 方差分析表

Anovab

模型

平方和

df

均方

F

Sig.

1回归

残差

8.125

4.745

1

18

8.125

.264

30.824

.000a

总计

12.870

19

a. 预测变量:

 (常量), 居民年消费额(万元)。

b. 因变量:

 单位面积年营业额(万元/m2)

 

表4

系数a

非标准化系数

 

标准系数

模型

B

标准 误差

试用版       t

Sig.

1(常量)

.928

.288

3.220

.005

 

4 / 15

 

居民年消费额(万元)

.887       .160       .795      5.552       .000

a. 因变量:

 单位面积年营业额(万元/m2)

 

表5 残差的正态性检验

Tests of Normality

Kolmogorov-SmirnovaShapiro-Wilk

Statistic

df

Sig.

Statistic

df     Sig.

Standardized Residual

.090

20

.200*

.960

20  .538

a. Lilliefors Significance Correction

*. This is a lower bound of the true significance.

 

图2 回归标准化残差的标准P-P图

 

5 / 15

 

图3 标准化残差图

 

表6

残差统计量a

极小值

极大值

均值

标准 偏差

N

预测值

残差

标准 预测值

标准 残差

1.4244

-.89496

-1.484

-1.743

4.0049

.76957

2.462

1.499

2.3950

.00000

.000

.000

.65393

.49972

1.000

.973

20

20

20

20

a. 因变量:

 单位面积年营业额(万元/m2)

 

(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。

解 设 y 与 x1,x2,…,x8 满足

规定:

进入方程的变量的显著性水平为 0.05,从方程中剔出变量的显著性水平为 0.10,(见

表 7)

逐步回归的步骤:

(见表 10)

第一步引入变量 x3 居民年消费额(万元)得到一元线性回归方程

 

6 / 15

 

Y(单位面积年营业额)=0.928+0.877x3(居民年消费额),

第二步引入变量 x2 日人流量(万人)得到线性回归方程

Y

(单位面积年营业额)=-0.117+0.698x3(居民年消费额) +0.317x2(日人流量(万人)),

第三步引入变量 x4 对商场环境满意度,所得线性回归方程为:

Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291 x2 (日人流量(万人))

+0.037 x4(对商场环境满意度)

以上 3 方程在显著性水平为 0.05 上均通过检验(见表 9)。

t

第 3 个方程的回归系数(包括常数项) 检验的 p 值 0.010,0.000,0.000,0.034,在显著

性水平为 0.05 上均通过检验(见表 10)。

三个方程的修正 R 方值逐步增大 0.611<0.985<.988,故第 3 个方程为最优的(见表

8)

对第 3 个方程的自变量作共线性诊断(见表 10):

回归方程第 i 个回归系数的方差膨

胀因子 VIF 分别 1.235、1.885、1.767,说明方程中的 3 个回归变量不存在共线性,

对残差序列作 D-W 检验,检验统计量 Durbin-Watson=2.574> 2 知 ε1 , ε 2 ,Λ , ε n 之间

存在一定的负自相关:

 ε1 , ε 2 ,Λ , ε n 相互独立的假定不一定满足(见表 8)

对残差作Shapiro-Wilk正态性检验,p值Sig.= =0 <0.01(见表15)知随机误差项

不服从正态分布。

ε

i

作回归标准化残差的标准P-P图(见图3),进一步验证了随机误差项

ε

i

不服从正态

分布。

ti

图5)。

图中显示散点随机地分布在–到+2的带子里(除一个点) 可以认为线性回归模型的

等方差假定成立 。

 

结论:

(1)“单位面积年营业额”的预测公式为:

Y(单位面积年营业额)=-.297+0.723x3(居民年消费额)+0.291 x2 (日人流量(万人))

+0.037 x4(对商场环境满意度)

方程在显著性水平为 0.05 上通过检验,调整的 R 方值=0.988,

(2)模型的假定误差项的正态性和不相关性存在问题,估计方法有待改进。

 

7 / 15

 

表 7

输入/移去的变量 a

模型

1

输入的变量

居民年消费额

(万元)

移去的变量       方法

. 步 进 ( 准 则 :

F-to-enter 的概率

<=.050,

F-to-remove 的 概

率 >= .100)。

2日人流量(万人). 步 进 ( 准 则 :

F-to-enter 的概率

<=.050,

F-to-remove 的 概

率 >= .100)。

3对商场环境满意

. 步 进 ( 准 则 :

F-to-enter 的概率

<=    .050   ,

F-to-remove 的 概

率 >= .100)。

a. 因变量:

 单位面积年营业额(万元/m2)

 

表 8

模型汇总 d

模型

R

R 方

调整 R 方 标准 估计的误差

Durbin-Watson

1

2

3

.795a

.993b

.995c

.631

.987

.990

.611

.985

.988

.51341

.09930

.08861

 

2.574

a. 预测变量:

 (常量), 居民年消费额(万元)。

b. 预测变量:

 (常量), 居民年消费额(万元), 日人流量(万人)。

c. 预测变量:

 (常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意度。

d. 因变量:

 单位面积年营业额(万元/m2)

 

表 9

Anovad

模型

平方和

df

均方

F

Sig.

1回归

残差

8.125

4.745

1

18

8.125

.264

30.824

.000a

总计

12.870

19

 

8 / 15

 

2回归

残差

总计

12.702

.168

12.870

2

17

19

6.351

.010

644.024       .000b

3回归

残差

12.744

.126

3

16

4.248

.008

540.982

.000c

总计

12.870

19

a. 预测变量:

 (常量), 居民年消费额(万元)。

b. 预测变量:

 (常量), 居民年消费额(万元), 日人流量(万人)。

c. 预测变量:

 (常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意

度。

d. 因变量:

 单位面积年营业额(万元/m2)

 

表 10

系数 a

非标准化系数

标准系数

模型

B

标准 误差

试用版       t

Sig.

1(常量)

居民年消费额(万元)

2(常量)

.928

.887

-.117

.288

.160

.074

3.220

.795      5.552

-1.585

.005

.000

.131

居民年消费额(万元)

日人流量(万人)

3(常量)

居民年消费额(万元)

日人流量(万人)

对商场环境满意度

.698

.317

-.297

.723

.291

.037

.032

.015

.102

.031

.017

.016

.625

.620

 

.648

.569

.076

21.739

21.544

-2.913

23.603

16.766

2.313

.000

.000

.010

.000

.000

.034

a. 因变量:

 单位面积年营业额(万元/m2)

 

系数 a

共线性统计量

模型

1

2

居民年消费额(万元)

居民年消费额(万元)

容差

1.000

.926

VIF

1.000

1.080

日人流量(万人)

3居民年消费额(万元)

日人流量(万人)

.926

.810

.530

1.080

1.235

1.885

 

9 / 15

 

对商场环境满意度

.566      1.767

a. 因变量:

 单位面积年营业额(万元/m2)

 

表 11

已排除的变量 d

 

模型

Beta In

t

Sig.

偏相关

1每小时机动车流量(万辆)

日人流量(万人)

对商场环境满意度

对商场设施满意度

对商场商品丰富程度满意度

2每小时机动车流量(万辆)

对商场环境满意度

对商场设施满意度

对商场商品丰富程度满意度

3每小时机动车流量(万辆)

对商场设施满意度

对商场商品丰富程度满意度

.524a

.620a

.436a

.137a

.595a

.088b

.076b

.013b

-.113b

.065c

.016c

-.223c

6.813

21.544

4.192

.858

16.600

1.927

2.313

.423

-.520

1.459

.546

-1.156

.000

.000

.001

.403

.000

.072

.034

.678

.610

.165

.593

.266

.856

.982

.713

.204

.971

.434

.501

.105

-.129

.353

.140

-.286

a. 模型中的预测变量:

 (常量), 居民年消费额(万元)。

b. 模型中的预测变量:

 (常量), 居民年消费额(万元), 日人流量(万人)。

c. 模型中的预测变量:

 (常量), 居民年消费额(万元), 日人流量(万人), 对商场环境满意

度。

d. 因变量:

 单位面积年营业额(万元/m2)

表 12

已排除的变量 d

共线性统计量

模型

1每小时机动车流量(万辆)

日人流量(万人)

对商场环境满意度

对商场设施满意度

对商场商品丰富程度满意度

2每小时机动车流量(万辆)

容差

.983

.926

.987

.819

.979

.316

VIF

1.017

1.080

1.013

1.221

1.021

3.168

最小容差

.983

.926

.987

.819

.979

.297

 

10 / 15

 

对商场环境满意度

对商场设施满意度

对商场商品丰富程度满意度

3每小时机动车流量(万辆)

对商场设施满意度

对商场商品丰富程度满意度

.566

.790

.017

.291

.789

.016

1.767

1.266

59.374

3.442

1.267

62.518

.530

.790

.016

.277

.516

.016

 

d. 因变量:

 单位面积年营业额(万元/m2)

 

表 13

共线性诊断 a

方差比例

居民年消费额(万

 

对商场环境满意

模型

维数

特征值

条件索引

(常量)

元)

日人流量(万人)

1

1

2

21

2

3

31

2

3

4

1.917

.083

2.837

.105

.058

3.785

.136

.062

.017

1.000

4.812

1.000

5.197

6.971

1.000

5.270

7.823

14.838

.04

.96

.01

.04

.95

.00

.00

.23

.76

.04

.96

.02

.89

.10

.01

.68

.01

.31

 

.01

.33

.66

.00

.03

.59

.38

 

.00

.05

.02

.93

a. 因变量:

 单位面积年营业额(万元/m2)

 

表 14

残差统计量 a

极小值

极大值

均值

标准 偏差

N

预测值

残差

标准 预测值

标准 残差

1.0291

-.28298

-1.668

-3.193

3.9475

.08128

1.896

.917

2.3950

.00000

.000

.000

.81898

.08132

1.000

.918

20

20

20

20

a. 因变量:

 单位面积年营业额(万元/m2)

 

11 / 15

 

表15

Tests of Normality

Kolmogorov-SmirnovaShapiro-Wilk

Statistic

df

Sig.

Statistic

df

Sig.

Standardized Residual

.172

20

.121

.775

20

.000

a. Lilliefors Significance Correction

 

图 4 回归标准化残差的标准 P-P 图

 

12 / 15

 

图 5 标准化残差图

 

2. 我国从 1982~2001 年间的 20 年的财政收入(Y)和国内生产总值(X)的数据存放在数据集 wyz4_4_7.中。

试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。

解:

(1)利用 SP

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 信息与通信

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1