实验五多重共线性检验参考案例共16页word资料.docx

上传人:b****5 文档编号:8099881 上传时间:2023-01-28 格式:DOCX 页数:18 大小:366.55KB
下载 相关 举报
实验五多重共线性检验参考案例共16页word资料.docx_第1页
第1页 / 共18页
实验五多重共线性检验参考案例共16页word资料.docx_第2页
第2页 / 共18页
实验五多重共线性检验参考案例共16页word资料.docx_第3页
第3页 / 共18页
实验五多重共线性检验参考案例共16页word资料.docx_第4页
第4页 / 共18页
实验五多重共线性检验参考案例共16页word资料.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

实验五多重共线性检验参考案例共16页word资料.docx

《实验五多重共线性检验参考案例共16页word资料.docx》由会员分享,可在线阅读,更多相关《实验五多重共线性检验参考案例共16页word资料.docx(18页珍藏版)》请在冰豆网上搜索。

实验五多重共线性检验参考案例共16页word资料.docx

实验五多重共线性检验参考案例共16页word资料

实验五多重共线性检验

实验时间:

姓名:

学号:

成绩:

【实验目的】

1、掌握多元线性回归模型的估计、检验和预测;

2、掌握多重共线性问题的检验方法

3、掌握多重共线性问题的修正方法

【实验内容】

1、数据的读取和编辑;

2、多元回归模型的估计、检验、预测;

3、多重共线性问题的检验

4、多重共线性问题的修正

【实验背景】

为了评价报账最低工资(负收入税)政策的可行性,兰德公司进行了一项研究,以评价劳动供给(平均工作小时数)对小时工资提高的反应,词研究中的数据取自6000户男户主收入低于15000美元的一个国民样本,这些数据分成39个人口组,并放在表1中,由于4个人口组中的某些变量确实,所以只给出了35个组的数据,用于分析的各个变量的定义如下:

Y表示该年度平均工作小时数;X1表示平均小时工资(美元);X2表示配偶平均收入(美元);X3表示其他家庭成员的平均收入(美元);X4表示年均非劳动收入(美元);X5表示平均家庭资产拥有量;X6表示被调查者的平均年龄;X7表示平均赡养人数;X8表示平均受教育年限。

为随机干扰项,考虑一下回归模型:

(1)将该年度平均工作小时数Y对X进行回归,并对模型进行简单分析;

(2)计算各变量之间的相关系数矩阵,利用相关系数法分析变量间是否具有多重共线性;

(3)利用逐步回归方法检验并修正回归模型,最后再对模型进行经济意义检验、统计检验。

表5

观测组

Y

X1

X2

X3

X4

X5

X6

X7

X8

1

2157

2.905

1121

291

380

7250

38.5

2.34

10.5

2

2174

2.97

1128

301

398

7744

39.3

2.335

10.5

3

2062

2.35

1214

326

185

3068

40.1

2.851

8.9

4

2111

2.511

1203

49

117

1632

22.4

1.159

11.5

5

2134

2.791

1013

594

730

12710

57.7

1.229

8.8

6

2185

3.04

1135

287

382

776

38.6

2.602

10.7

7

2210

3.222

1100

295

474

9338

39

2.187

112

8

2105

2.495

1180

310

255

4730

39.9

2.616

9.3

9

2267

2.838

1298

252

431

8317

38.9

2.024

11.1

10

2205

2.356

885

264

373

6489

38.8

2.662

9.5

11

2121

2.922

1251

328

312

5907

39.8

2.287

10.3

12

2109

2.499

1207

347

271

5069

39.7

3.193

8.9

13

2108

2.796

1036

300

259

4614

38.2

2.4

9.2

14

2047

2.453

1213

397

139

1987

40.3

2.545

9.1

15

2174

3.582

1141

414

498

10239

40

2.064

11.7

16

2067

2.909

1805

290

239

4439

39.1

2.301

10.5

17

2159

2.511

1075

289

308

5621

39.3

2.486

9.5

18

2257

2.516

1093

176

392

7293

37.9

2.042

10.1

19

1985

1.423

553

381

146

1866

40.6

3.833

6.6

20

2184

3.636

1091

291

560

11240

39.1

2.328

11.6

21

2084

2.983

1327

331

296

5653

39.8

2.208

10.2

22

2051

2.573

1197

279

172

2806

40

2.362

9.1

23

2127

3.263

1226

314

408

8042

39.5

2.259

10.8

24

2102

3.234

1188

414

352

7557

39.8

2.019

10.7

25

2098

2.28

973

364

272

4400

40.6

2.661

8.4

26

2042

2.304

1085

328

140

1739

41.8

2.444

8.2

27

2181

2.912

1072

304

383

9340

39

2.337

10.2

28

2186

3.015

1122

30

352

7292

37.2

2.046

10.9

29

2188

3.01

990

366

374

7325

38.4

2.847

10.6

30

2077

1.901

350

209

95

1370

37.4

4.158

8.2

31

2196

3.009

947

294

342

6888

37.5

3.047

10.6

32

2093

1.899

342

311

120

1425

37.5

4.512

8.1

33

2173

2.959

1116

296

387

7625

39.2

2.342

10.5

34

2179

2.959

1116

296

387

7625

39.2

2.342

10.5

35

2200

2.98

1126

204

393

7885

39.2

2.341

10.6

【实验过程】

一、利用Eviews软件建立年度平均工作小时数y的回归模型。

(一)首先创建Workfile(命令窗口输入CreateU,再输入35个样本观测值),其次输入数据Y,X1,X2,X3,X4,X5,X6,X7,X8(命令窗口DataYX1X2X3X4X5X6X7X8)将上述表格中的数据复制粘贴到数据窗口中。

(二)进行OLS回归

命令窗口输入命令LSYCX1X2X3X4X5X6X7X8

从表中可以看到,模型可能存在多重共线性。

因为拟合优度较高,F统计量对应的P值小于1%,说明回归方程是显著地,回归系数X3,X4,X6,X7在10%的水平下显著,其他回归系数的t统计量对应的P值大于0.1,是不显著变量,说明解释变量可能存在多重共线性。

二、多重共线性的检验

1、简单相关系数法

这种方法只适用于只有两个解释变量的情况。

当这两个解释变量相关系数的绝对值很大时,认为这两个解释变量存在共线性。

操作:

Quick→Groupstatistics→Correlations→对话框→x1x2x3x4x5x6x7x8→ok,得到关于上述8个变量之间的相关系数矩阵。

从上表结果可以看出,有几个解释变量,如x1和x4之间,x1和x5之间,x3和x6之间简单县官系数都在0.7以上,x4和x5的相关系数在0.9以上,说明这些变量之间都具有很强的相关性,存在多重共线性。

二、多重共线性的修正方法

(一)逐步回归法

逐步回归法的“逐步”指的是使用回归分析方法建立模型时,一次只能引入一个解释变量,进行一次引入称为“一步”,这样逐步进行下去,直到最后得到的模型达到“最优”(模型中没有不显著的变量)。

1、找出最简单的回归形式(对每个自变量与因变量y进行回归)

从而决定解释变量的重要程度,为解释变量排序,即分别作作y对x1,x2,x3,x4,x5,x6,x7,x8的一元回归,结果如下:

一元回归结果(被解释变量为y)

解释变量

X1

X2

X3

X4

X5

X6

X7

X8

参数估计值

77.369

0.031

-0.191

0.319

0.014

-1.137

-33.953

0.893

T统计量

3.836

0.710

-1.724

5.311

4.780

-0.450

-2.113

1.426

修正R2

0.287

-0.015

0.055

0.445

0.391

-0.024

0.094

0.029

根据R2的大小排序,课间解释变量的重要性程度依次为:

x4,x5,x1,x7,x3,x8,x6,x2;

2、以x4为基础,进行逐步回归,依次引入变量x5,x1,x7,x3,x8,x6,x2

加入新变量的回归结果

(一)

解释变量

X1

X2

X3

X4

X5

X6

X7

X8

R2

x4,x5

0.276

0.002

0.429

t值

1.795

0.303

x4,x1

21.726

0.268

0.440

t值

0.867

3.164

x4,x7

0.324

1.999

0.428

t值

1.537

0.136

x4,x3

-0.367

0.399

0.719

t值

-5.763

8.887

x4,x8

0.309

0.343

0.436

t值

4.977

0.700

x4,x6

0.451

-8.168

0.677

t值

8.516

-4.969

x4,x2

-0.009

0.6323

0.429

t值

-0.283

5.158

经过比较,新加入x3的方程其R2=0.719改进最大,从0.445增加到0.719,而且各参数经济合理,t检验显著,选择保留x3,以此x4,x3两变量为基础,再进行逐步回归,加入x5,x1,x7,,x8,x6,x2

3、以x4,x3为基础,加入x5,x1,x7,x8,x6,x2

加入新变量的回归结果

(一)

解释变量

X1

X2

X3

X4

X5

X6

X7

X8

R2

x4,x3,x5

-0.368

423

-0.001

0.710

t值

-5.666

3.756

-0.228

x4,x3,x1

-6.077

-0.372

0.415

0.711

t值

-0.325

-2.262

6.258

x4,x3,x7

-0.398

0.454

19.082

0.439

t值

-6.254

8.644

1.849

x4,x3,x8

-0.364

0.395

0.127

0.711

t值

-5.611

8.403

0.359

x4,x3,x6

-0.257

0.433

-3.540

0.731

t值

-2.735

8.864

-1.566

x4,x3,x2

-0.024

-0.374

0.411

0.719

t值

-1.023

-5.844

8.861

-经比较,新加入x7的方程,其拟合优度R2=0.739有所改进,从0.719增至0.789,而且各参数经济意义合理,t检验显著,所以选择保留x7.

(4)在x4,x3,x7的基础上,逐步加入x5,x1,x8,x6,x2

加入新变量的回归结果

(一)

解释变量

X1

X2

X3

X4

X5

X6

X7

X8

R2

x4,x3,x7,x5

-0.398

0.469

-0.007

19.006

0.730

t值

-6.139

4.201

-0.146

1.811

x4,x3,x7,x1

5.826

-0.394

0.443

20.236

0.731

t值

0.304

-5.999

6.730

1.816

x4,x3,x7,x8

-0.395

0.450

18.985

0.109

0.731

t值

-6.087

8.236

1.812

0.319

x4,x3,x7,x6

-0.271

0.502

-4.213

21.864

0.761

t值

-3.056

8.980

-1.955

2.191

x4,x3,x7,x2

0.009

-0.340

0.458

21.951

0.731

t值

0.289

-6.156

8.350

1.520

经比较,新加入x6的方程,其R2=0.761有所改进,从0.739增至0.761,而其各参数经济意义合理,t检验显著,所以选择保留x6.再依次加入变量x5,x1,x8,x2进行回归,发现回归结果R2都没有改进,而且各变量的t检验不显著,从而说明加入任何一个变量都无法对模型有任何改善,所以应予以剔除。

最后修正严重多重共线性后的回归结果如下图

回归方程为

t值33.7428.956-3.0722.211-1.958

p值(0.000)(0.000)(0.005)(0.035)(0.060)

R2=0.789F=28.082D.W.=1.638

从回归估计结果可以看出,x4,x3都通过了1%的显著性检验,x7通过5%的显著性检验,x6通过10%的显著性检验,说明模型参数显著,而且拟合优度为0.789,F统计量也很大,说明整体回归线性关系显著。

经济意义说明:

在其他条件不变的情况下,其他家庭成员的平均收入x3每上涨1美元,则年度工作时数平均减少0.27小时;年均非劳动收入x4每上涨1美元,则年均工作时数平均增加0.50小时;被调查者的平均年龄x6每增加1年,则年度工作时数平均减少4.21小时;平均赡养人数增加1人,则年度工作时数平均增加21.86小时。

三、利用软件直接实现逐步回归,主要有有进有出法、单项逐步回归法。

方法:

菜单Quick——EstimateEquation——在方法中选择逐步最小二乘方法STEPLS

注意Method中的选项。

在第一个设定框内输入:

yc;在第二个设定框输入解释变量:

X1x2x3x4x5x6x7x8如图:

然后,可以利用Option来控制逐步回归具体采用的方法。

在SelectionMethod中选择具体的逐步回归方法,如有进有出法(Stepwise),单项逐步回归法(Uni-directiona),程序终止准则区StoppingCriteria中选择p-value,并将其p值定为0.05,其余采用默认设置,如图

后向有进有出逐步回归设定(选择Backwards)

单项逐步回归设定

具体回归结果如下:

1、后向有进有出逐步回归设定

2、单项逐步回归结果

具体回归结果和上述最终回归结果的数据一样。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 其它

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1