实验五多重共线性检验参考案例.docx

上传人:b****5 文档编号:12185283 上传时间:2023-04-17 格式:DOCX 页数:17 大小:324.79KB
下载 相关 举报
实验五多重共线性检验参考案例.docx_第1页
第1页 / 共17页
实验五多重共线性检验参考案例.docx_第2页
第2页 / 共17页
实验五多重共线性检验参考案例.docx_第3页
第3页 / 共17页
实验五多重共线性检验参考案例.docx_第4页
第4页 / 共17页
实验五多重共线性检验参考案例.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

实验五多重共线性检验参考案例.docx

《实验五多重共线性检验参考案例.docx》由会员分享,可在线阅读,更多相关《实验五多重共线性检验参考案例.docx(17页珍藏版)》请在冰豆网上搜索。

实验五多重共线性检验参考案例.docx

实验五多重共线性检验参考案例

实验五多重共线性检验

实验时间:

姓名:

学号:

成绩:

【实验目的】

1、掌握多元线性回归模型的估计、检验和预测;

2、掌握多重共线性问题的检验方法

3、掌握多重共线性问题的修正方法

【实验内容】

1、数据的读取和编辑;

2、多元回归模型的估计、检验、预测;

3、多重共线性问题的检验

4、多重共线性问题的修正

【实验背景】

为了评价报账最低工资(负收入税)政策的可行性,兰德公司进行了一项研究,以评价劳动供给(平均工作小时数)对小时工资提高的反应,词研究中的数据取自6000户男户主收入低于15000美元的一个国民样本,这些数据分成39个人口组,并放在表1中,由于4个人口组中的某些变量确实,所以只给出了35个组的数据,用于分析的各个变量的定义如下:

Y表示该年度平均工作小时数;X1表示平均小时工资(美元);X2表示配偶平均收入(美元);X3表示其他家庭成员的平均收入(美元);X4表示年均非劳动收入(美元);X5表示平均家庭资产拥有量;X6表示被调查者的平均年龄;X7表示平均赡养人数;X8表示平均受教育年限。

为随机干扰项,考虑一下回归模型:

(1)将该年度平均工作小时数Y对X进行回归,并对模型进行简单分析;

(2)计算各变量之间的相关系数矩阵,利用相关系数法分析变量间是否具有多重共线性;

(3)利用逐步回归方法检验并修正回归模型,最后再对模型进行经济意义检验、统计检验。

表5

观测组

Y

X1

X2

X3

X4

X5

X6

X7

X8

1

2157

1121

291

380

7250

2

2174

1128

301

398

7744

3

2062

1214

326

185

3068

4

2111

1203

49

117

1632

5

2134

1013

594

730

12710

6

2185

1135

287

382

776

7

2210

1100

295

474

9338

39

112

8

2105

1180

310

255

4730

9

2267

1298

252

431

8317

10

2205

885

264

373

6489

11

2121

1251

328

312

5907

12

2109

1207

347

271

5069

13

2108

1036

300

259

4614

14

2047

1213

397

139

1987

15

2174

1141

414

498

10239

40

16

2067

1805

290

239

4439

17

2159

1075

289

308

5621

18

2257

1093

176

392

7293

19

1985

553

381

146

1866

20

2184

1091

291

560

11240

21

2084

1327

331

296

5653

22

2051

1197

279

172

2806

40

23

2127

1226

314

408

8042

24

2102

1188

414

352

7557

25

2098

973

364

272

4400

26

2042

1085

328

140

1739

27

2181

1072

304

383

9340

39

28

2186

1122

30

352

7292

29

2188

990

366

374

7325

30

2077

350

209

95

1370

31

2196

947

294

342

6888

32

2093

342

311

120

1425

33

2173

1116

296

387

7625

34

2179

1116

296

387

7625

35

2200

1126

204

393

7885

【实验过程】

一、利用Eviews软件建立年度平均工作小时数y的回归模型。

(一)首先创建Workfile(命令窗口输入CreateU,再输入35个样本观测值),其次输入数据Y,X1,X2,X3,X4,X5,X6,X7,X8(命令窗口DataYX1X2X3X4X5X6X7X8)将上述表格中的数据复制粘贴到数据窗口中。

(二)进行OLS回归

命令窗口输入命令LSYCX1X2X3X4X5X6X7X8

从表中可以看到,模型可能存在多重共线性。

因为拟合优度较高,F统计量对应的P值小于1%,说明回归方程是显著地,回归系数X3,X4,X6,X7在10%的水平下显著,其他回归系数的t统计量对应的P值大于0.1,是不显著变量,说明解释变量可能存在多重共线性。

二、多重共线性的检验

1、简单相关系数法

这种方法只适用于只有两个解释变量的情况。

当这两个解释变量相关系数的绝对值很大时,认为这两个解释变量存在共线性。

操作:

Quick→Groupstatistics→Correlations→对话框→x1x2x3x4x5x6x7x8→ok,得到关于上述8个变量之间的相关系数矩阵。

从上表结果可以看出,有几个解释变量,如x1和x4之间,x1和x5之间,x3和x6之间简单县官系数都在0.7以上,x4和x5的相关系数在0.9以上,说明这些变量之间都具有很强的相关性,存在多重共线性。

二、多重共线性的修正方法

(一)逐步回归法

逐步回归法的“逐步”指的是使用回归分析方法建立模型时,一次只能引入一个解释变量,进行一次引入称为“一步”,这样逐步进行下去,直到最后得到的模型达到“最优”(模型中没有不显著的变量)。

1、找出最简单的回归形式(对每个自变量与因变量y进行回归)

从而决定解释变量的重要程度,为解释变量排序,即分别作作y对x1,x2,x3,x4,x5,x6,x7,x8的一元回归,结果如下:

一元回归结果(被解释变量为y)

解释变量

X1

X2

X3

X4

X5

X6

X7

X8

参数估计值

T统计量

修正R2

根据R2的大小排序,课间解释变量的重要性程度依次为:

x4,x5,x1,x7,x3,x8,x6,x2;

2、以x4为基础,进行逐步回归,依次引入变量x5,x1,x7,x3,x8,x6,x2

加入新变量的回归结果

(一)

解释变量

X1

X2

X3

X4

X5

X6

X7

X8

R2

x4,x5

 

t值

x4,x1

t值

x4,x7

t值

x4,x3

t值

x4,x8

t值

x4,x6

t值

-

x4,x2

t值

经过比较,新加入x3的方程其R2=改进最大,从0.445增加到0.719,而且各参数经济合理,t检验显著,选择保留x3,以此x4,x3两变量为基础,再进行逐步回归,加入x5,x1,x7,,x8,x6,x2

3、以x4,x3为基础,加入x5,x1,x7,x8,x6,x2

加入新变量的回归结果

(一)

解释变量

X1

X2

X3

X4

X5

X6

X7

X8

R2

x4,x3,x5

423

t值

x4,x3,x1

t值

x4,x3,x7

t值

x4,x3,x8

4

t值

x4,x3,x6

 

t值

x4,x3,x2

t值

-经比较,新加入x7的方程,其拟合优度R2=0.739有所改进,从0.719增至0.789,而且各参数经济意义合理,t检验显著,所以选择保留x7.

(4)在x4,x3,x7的基础上,逐步加入x5,x1,x8,x6,x2

加入新变量的回归结果

(一)

解释变量

X1

X2

X3

X4

X5

X6

X7

X8

R2

x4,x3,x7,x5

 

t值

x4,x3,x7,x1

t值

x4,x3,x7,x8

t值

x4,x3,x7,x6

t值

x4,x3,x7,x2

t值

经比较,新加入x6的方程,其R2x5,x1,x8,x2进行回归,发现回归结果R2都没有改进,而且各变量的t检验不显著,从而说明加入任何一个变量都无法对模型有任何改善,所以应予以剔除。

最后修正严重多重共线性后的回归结果如下图

回归方程为

p值(0.000)(0.000)(0.005)(0.035)(0.060)

R2

从回归估计结果可以看出,x4,x3都通过了1%的显著性检验,x7通过5%的显著性检验,x6通过10%的显著性检验,说明模型参数显著,而且拟合优度为0.789,F统计量也很大,说明整体回归线性关系显著。

经济意义说明:

在其他条件不变的情况下,其他家庭成员的平均收入x3每上涨1美元,则年度工作时数平均减少0.27小时;年均非劳动收入x4每上涨1美元,则年均工作时数平均增加0.50小时;被调查者的平均年龄x6每增加1年,则年度工作时数平均减少4.21小时;平均赡养人数增加1人,则年度工作时数平均增加21.86小时。

三、利用软件直接实现逐步回归,主要有有进有出法、单项逐步回归法。

方法:

菜单Quick——EstimateEquation——在方法中选择逐步最小二乘方法STEPLS

注意Method中的选项。

在第一个设定框内输入:

yc;在第二个设定框输入解释变量:

X1x2x3x4x5x6x7x8如图:

然后,可以利用Option来控制逐步回归具体采用的方法。

在SelectionMethod中选择具体的逐步回归方法,如有进有出法(Stepwise),单项逐步回归法(Uni-directiona),程序终止准则区StoppingCriteria中选择p-value,并将其p值定为0.05,其余采用默认设置,如图

后向有进有出逐步回归设定(选择Backwards)

单项逐步回归设定

具体回归结果如下:

1、后向有进有出逐步回归设定

2、单项逐步回归结果

具体回归结果和上述最终回归结果的数据一样。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 生产经营管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1