最新多重共线性的解决之法.docx

上传人:b****2 文档编号:2192972 上传时间:2022-10-27 格式:DOCX 页数:14 大小:301.11KB
下载 相关 举报
最新多重共线性的解决之法.docx_第1页
第1页 / 共14页
最新多重共线性的解决之法.docx_第2页
第2页 / 共14页
最新多重共线性的解决之法.docx_第3页
第3页 / 共14页
最新多重共线性的解决之法.docx_第4页
第4页 / 共14页
最新多重共线性的解决之法.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

最新多重共线性的解决之法.docx

《最新多重共线性的解决之法.docx》由会员分享,可在线阅读,更多相关《最新多重共线性的解决之法.docx(14页珍藏版)》请在冰豆网上搜索。

最新多重共线性的解决之法.docx

最新多重共线性的解决之法

 

多重共线性的解决之法

第七章多重共线性

教学目的及要求:

1、重点理解多重共线性在经济现象中的表现及产生的原因和后果

2、掌握检验和处理多重共线性问题的方法

3、学会灵活运用Eviews软件解决多重共线性的实际问题。

第一节多重共线性的产生及后果

一、多重共线性的含义

1、含义

在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。

如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。

多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。

2、类型

多重共线性包含完全多重共线性和不完全多重共线性两种类型。

(1)完全多重共线性

完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。

如对于多元线性回归模型

           (7-1)

存在不全为零的数,使得下式成立:

   (7-2)

则可以说解释变量之间存在完全的线性相关关系,即存在完全多重共线性。

从矩阵形式来看,就是,即,观测值矩阵是降秩的,表明在向量X中至少有一个列向量可以由其他列向量线性表示。

(2)不完全多重共线性

不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。

如对于多元线性回归模型(7-1)存在不全为零的数,使得下式成立:

(7-3)

其中为随机误差项,则可以说解释变量之间存在不完全多重共线性。

随机误差项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。

完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。

二、多重共线性产生的原因

多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。

(一)经济变量间具有相同方向的变化趋势

在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起多重共线性。

如在经济上升时期,投资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。

(二)经济变量间存在较密切关系

由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系。

如耕地面积与施肥量都会对粮食总产量有一定影响,同时,二者本身存在密切关系。

(三)采用滞后变量作为解释变量较易产生多重共线性

一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。

如在研究消费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间存在多重共线性的可能很大。

(四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。

三、多重共线性产生的后果

由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模型进行最小二乘估计都会产生严重后果。

(一)完全多重共线性产生的后果

以二元线性回归模型为例,

  (7-4)

以离差形式表示,假设其中,,,,常数,则,,的最小二乘估计量为

  

(7-5)

同理得到:

   (7-6)

可见参数估计值和无法确定。

再考察参数估计量的方差,由前面章节可知:

(7-7)

将代入上式,则

(7-8)

    =

说明此种情况下方差为无穷大。

同理可以证明的方差在完全共线性下也为无穷大。

以上分析表明,在完全多重共线性条件下,普通最小二乘法估计的参数值不能确定,并且估计值的方差为无穷大。

(二)不完全多重共线性产生的后果

假设上述二元线性回归模型中解释变量与的关系为

       (7-9)

其中为随机项,满足,,代入估计表达得:

    =(7-10)

由于,因而是可确定估计的,但是其数值依赖的数值,而的数值随样本的变化有较大变化,所以估计值是很不稳定的。

同理可以证明也是可估计的,且数值具有不稳定性。

考察估计量的方差:

由(7-1)式可知是、的相关系数,因此

(7-11)

参数估计量的方差可表达为:

                (7-12)

其中为和之间的相关系数,从(7-12)式可见,的值越大,则共线程度越高,估计量方差越大,直至无穷。

综上所述,线性回归模型解释变量间存在多重共线性可能产生如下后果:

增大最小二乘估计量的方差;参数估计值不稳定,对样本变化敏感;检验可靠性降低,产生弃真错误。

由于参数估计量方差增大,在进行显著性检验时,t检验值将会变小,可能使某些本该参数显著的检验结果变得不显著,从而将重要变量舍弃。

第二节多重共线性的检验

多重共线性是较为普通存在的现象,从上节分析可知,较高程度的多重共线性会对最小二乘估计产生严重后果,因此,在运用最小二乘法进行多元线性回归时,不但要检验解释变量间是否存在多重共线性,还要检验多重共线性的严重程度。

一、不显著系数法

情况1、很大,t小

不显著系数法是利用多元线性回归模型的拟合结果进行检验。

如果拟合优度的值很大(一般来说在0.8以上),然而模型中的全部或部分参数值估计值经检验却不显著,那么解释变量间有可能存在较严重的多重共线性。

情况2、理论性强,检验值弱

如果从经济理论或常识来看某个解释变量对被解释变量有重要影响,但是从线性回归模型的拟合结果来看,该解释变量的参数估计值经检验却不显著,那么可能是解释变量间存在多重共线性所导致的。

情况3、新引入变量后,方差增大

在多元线性回归模型中新引入一个变量后,发现模型中原有参数估计值的方差明显增大,则说明解释变量间可能存在多重共线性。

二、拟合优度检验

对多元线性回归模型中各个解释变量相互建立回归方程,分别求出各回归方程的拟和优度,如果其中最大的一个接近1,显著大于临界值,该变量可以被其他变量线性解释,则其所对应的解释变量与其余解释变量间存在多重共线性。

如设某多元线性回归模型中原有个解释变量,将每个解释变量对其他解释变量进行回归,得到个回归方程:

分别求出上述各个方程的拟合优度,如果其中最大的一个接近于1,则它所对应的解释变量与其余解释变量间存在多重共线性。

三、相关矩阵法

考察多元线性回归模型

(7-13)

其解释变量之间的相关系数矩阵为:

 (7-14)

因为,,所以上面相关阵为对称阵,,只需考察主对角线元素上方(或下方)某个元素绝对值是否很大(一般在0.8以上),就可以判断两个解释变量间是否存在多重共线性。

结论:

另外需要特别注意的是,如果相关系数很大,则一定存在多重共线性,如果相关系数很小,不一定没有多重共线性。

四、Frisch综合分析法

1、方法及分析标准

Frisch综合分析法也叫逐步分析估计法,其基本思想是先将被解释变量对每个解释变量作简单回归方程,称为基本回归方程。

再对每一个基本回归方程进行统计检验,并根据经济理论分析选出最优基本方程,然后再将其他解释变量逐一引入,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别:

1.如果新引进的解释变量使得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。

2.如果新引进的解释变量对改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。

3.如果新引进的解释变量不仅改变了,而且对其他回归系数的数值或符号具有明显影响,则可认为引进新变量后,回归模型解释变量间存在严重多重共线性。

这个新引进的变量如果从理论上分析是十分重要的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计。

如果通过检验证明存在明显线性相关的两个解释变量中的一个可以被另一个解释,则可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。

2、具体实例

例7-1设某地10年间有关服装消费、可支配收入、流动资产、服装类物价指数、总物价指数的调查数据如表7-1,请建立需求函数模型。

表7-1服装消费及相关变量调查数据

年份

服装开支

(百万元)

可支配收入

Y

(百万元)

流动资产

(百万元)

服装类物价指数Pc

1992年=100

总物价指数

P0

1992年=100

1988

8.4

82.9

17.1

92

94

1989

9.6

88.0

21.3

93

96

1990

10.4

99.9

25.1

96

97

1991

11.4

105.3

29.0

94

97

1992

12.2

117.7

34.0

100

100

1993

14.2

131.0

40.0

101

101

1994

15.8

148.2

44.0

105

104

1995

17.9

161.8

49.0

112

109

1996

19.3

174.2

51.0

112

111

1997

20.8

184.7

53.0

112

111

(1)设对服装的需求函数为

用最小二乘法估计得

    

由得出拒绝零假设,认为服装支出与解释变量间存在显著关系。

(2)求各解释变量的基本相关系数

上述基本相关系数表明解释变量间高度相关,也就是存在较严重的多重共线性。

(3)为检验多重共线性的影响,作如下简单回归:

(-3.3102)(41.9370)

(-9.1682)(12.5363)

(2.5858)(15.3096)

(-14.7710)(18.6585)

以上四个方程根据经济理论和统计检验,收入Y是最重要的解释变量(t检验值=41.937也最大),从而得出最优简单回归方程。

(4)将其余变量逐个引入,计算结果如下表7-2:

表7-2 服装消费模型的估计

(常数)

-1.2455

(-3.3102)

0.117(41.9370)

____

____

____

0.9955

2.6271

1.4047

(0.2852)

0.1257

(8.4259)

-0.0361

(-0.5398)

____

____

0.9957

2.5335

0.9400

(0.1815)

0.1387

(5.5845)

-0.0345

(-0.4941)

-0.0379

(-0.6682)

____

0.9959

3.1568

-12.7593

(-1.9581)

0.1036

(7.4640)

-0.1882

(-2.4693)

____

0.3186

(2.6189)

0.9980

3.5241

-13.5335

(-1.8013)

0.0970

(3.6603)

-0.1991

(-2.2087)

0.0151

(0.3053)

0.3401

(2.2714)

0.9980

3.3826

结果分析:

①在最优简单回归方程中引入变量,使由0.9955提高到0.9957,正号,负号是合理的,进行t检验不显著。

从经济理论分析,应该是重要因素

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1