计量经济学课件第四章多重共线性.docx

资源描述

计量经济学课件第四章多重共线性.docx

《计量经济学课件第四章多重共线性.docx》由会员分享，可在线阅读，更多相关《计量经济学课件第四章多重共线性.docx（38页珍藏版）》请在冰豆网上搜索。

计量经济学课件第四章多重共线性.docx

计量经济学课件第四章多重共线性

第四章多重共线性

引子：

发展农业会减少财政收入吗？

为了分析各主要因素对财政收入的影响，建立财政收

入模型:

CSi=β0+β1NZi+β2GZi+β3JZZi

+β4TPOPi+β5CUMi+β6SZMi+ui

其中:

CS财政收入（亿元）;

NZ农业增加值（亿元）;GZ工业增加值（亿元）;

JZZ建筑业增加值（亿元）;TPOP总人口（万人）;

CUM最终消费（亿元）;SZM受灾面积（万公顷）

数据样本时期1978年-2007年（资料来源：

《中国统计年鉴

2008》，中国统计出版社2008年版）

采用普通最小二乘法得到以下估计结果

财政收入模型的EViews估计结果

Variable

农业增加值

工业增加值建

筑业增加值

总人口

最终消费

受灾面积

截距

Coefficient

-1.907548

Std.Error

0.342045

0.042746

0.765767

0.091660

0.042807

0.048904

8607.753

t-Statistic

-5.576888

1.074892

8.433867

1.047591

0.072609

-0.564916

-0.631118

Prob.

0.0000

0.2936

0.0000

0.3057

0.9427

0.5776

0.5342

0.045947

6.458374

0.096022

0.003108

-0.027627

-5432.507

R-squared

AdjustedR-squared

S.E.ofregression

Sumsquaredresid

Loglikelihood

Durbin-Watsonstat

0.989654

0.986955

1437.448

47523916

-256.7013

1.654140

Meandependentvar10049.04

S.D.dependentvar12585.51

Akaikeinfocriterion17.58009

Schwarzcriterion17.90704

F-statistic366.6801

Prob（F-statistic）0.000000

模型估计与检验结果分析

●可决系数为0.9897，校正的可决系数为0.9870，模

型拟合很好。

模型对财政收入的解释程度高达98.9%。

●F统计量为366.68，说明0.05水平下回归方程整体

上显著。

●t检验结果表明，除了农业增加值、建筑业增加

值以外，其他因素对财政收入的影响均不显著。

●农业增加值的回归系数是负数。

农业的发展反而会使财政收入减少吗？

这样的异常结果显然与理论分析和实践经验不相符。

若模型设定和数据真实性没问题，问题出在哪里呢？

第四章多重共线性

本章讨论四个问题：

●什么是多重共线性

●多重共线性产生的后果

●多重共线性的检验

●多重共线性的补救措施

第一节什么是多重共线性

本节基本内容:

●多重共线性的含义

●产生多重共线性的背景

一、多重共线性的含义

在计量经济学中所谓的多重共线性（Multi-Collinearity），

不仅包括完全的多重共线性，还包括不完全的多重共线性。

在有截距项的模型中，截距项可以视为其对应的解释变量总

是为1。

对于解释变量1,X2,X3,,Xk，如果存在不全为0的

λ数λ1,2,...λk，使得

12X2i3X3ikXki0（i1,2,,n）

则称解释变量1,X2,X3,

线性。

或者说,当Rank（X）k

重共线性。

Xk之间存在着完全的多重共

时，表明在数据矩阵

X中，至少有

一个列向量可以用其余的列向量线性表示，则说明存在完全的多

不完全的多重共线性

实际中，常见的情形是解释变量之间存在不完

全的多重共线性。

对于解释变量1,X2,X3,

λ1,λ2,λk，使得

Xk，存在不全为0的数

λ1+λ2X2i+λ3X3i+...+λkXki+ui=0

i=1,2,...,n

其中，ui为随机变量。

这表明解释变量

1,X2,X3,Xk只是一种近似的线性关系。

回归模型中解释变量的关系

可能表现为三种情形：

（1）rxixj=0，解释变量间毫无线性关系，变量间相

互正交。

这时已不需要作多元回归，每个参数j都可

以通过Y对Xj的一元回归来估计。

（2）rxixj=1，解释变量间完全共线性。

此时模型参

数将无法确定。

（3）0＜rxixj＜，解释变量间存在一定程度的线性关

系。

实际中常遇到的情形。

二、产生多重共线性的背景

多重共线性产生的经济背景主要有几种情形：

1.经济变量之间具有共同变化趋势。

2.模型中包含滞后变量。

3.利用截面数据建立模型也可能出现多重共线性。

4.样本数据自身的原因。

第二节多重共线性产生的后果

本节基本内容:

●完全多重共线性产生的后果

●不完全多重共线性产生的后果

一、完全多重共线性产生的后果

1.参数的估计值不确定

当解释变量完全线性相关时——OLS估计式不确定

▲从偏回归系数意义看：

在X2和X3完全共线性时，无法保

持X3不变，去单独考虑X2对Y的影响（X2和X3的影响

不可区分）

ˆ=0

▲从OLS估计式看：

可以证明此时β2

2.参数估计值的方差无限大

OLS估计式的方差成为无穷大：

Var

（2）

二、不完全多重共线性产生的后果

如果模型中存在不完全的多重共线性，可以得到

参数的估计值，但是对计量经济分析可能会产生

一系列的影响。

1.参数估计值的方差增大

ˆ）=σ2

Var（β2

1σ1

2222

∑x2i（1-r23）∑x2i（1-r23）

当

r23

增大时Var（β2）也增大

2.对参数区间估计时，置信区间趋于变大

3.假设检验容易作出错误的判断

4.可能造成可决系数较高，但对各个参数单独的

t检验却可能不显著，甚至可能使估计的回归系

数符号相反，得出完全错误的结论。

第三节多重共线性的检验

本节基本内容：

●简单相关系数检验法

●方差扩大（膨胀）因子法

●直观判断法

●逐步回归法

一、简单相关系数检验法

含义：

简单相关系数检验法是利用解释变量之间

的线性相关程度去判断是否存在严重多重共线性

的一种简便方法。

判断规则：

一般而言，如果每两个解释变量的简

单相关系数（零阶相关系数）比较高，例如大于0.8，

则可认为存在着较严重的多重共线性。

注意：

较高的简单相关系数只是多重共线性存在的充分

条件，而不是必要条件。

特别是在多于两个解释

变量的回归模型中，有时较低的简单相关系数也

可能存在多重共线性。

因此并不能简单地依据相

关系数进行多重共线性的准确判断。

二、辅助回归模型检验

当模型的解释变量个数多于两个，并且呈现出较

为复杂的相关关系时，可以通过每个解释变量对其它

解释变量的辅助回归模型来检验多重共线性，即依次

建立k个辅助回归模型：

xi=a0+a1x1++ai-1xi-1+ai+1xi+1++akxk+ε

（i=1,2,…,k）

若其中某些方程显著，则表明存在多重共线性。

三、方差扩大（膨胀）因子法

统计上可以证明，解释变量Xj的参数估计式βj

的方差可表示为

1σ

Var（βj）=

⋅=

⋅VIFj

222

∑xj1-Rj∑xj

其中的VIFj是变量Xj的方差扩大因子

（VarianceInflationFactor），即VIFj=2

（1-Rj）

其中R

是多个解释变量辅助回归的可决系数

经验规则

●方差膨胀因子越大，表明解释变量之间的多重共

性越严重。

反过来，方差膨胀因子越接近于1，

多重共线性越弱。

●经验表明，方差膨胀因子≥10时，说明解释变量

与其余解释变量之间有严重的多重共线性，且这

种多重共线性可能会过度地影响最小二乘估计。

另一个与VIF等价的指标是“容许度”（Tolerance）

，其定义为：

TOLi=（1-R）=1VIFi

显然，0≤TOL≤1；当xi与其它解释变量高度相关时，

TOL→0。

因此，一般当TOL<0.1时，认为模型存在较

严重的多重共线性

四、直观判断法

1.当增加或剔除一个解释变量，或者改变一个观

测值时，回归参数的估计值发生较大变化，回归

方程可能存在严重的多重共线性。

2.从定性分析认为，一些重要的解释变量的回归

系数的标准误差较大，在回归方程中没有通过显

著性检验时，可初步判断可能存在严重的多重共

线性。

3.有些解释变量的回归系数所带正负号与定性分

析结果违背时，很可能存在多重共线性。

4.解释变量的相关矩阵中，自变量之间的相关系

数较大时，可能会存在多重共线性问题。

五、逐步回归检测法

逐步回归的基本思想

将变量逐个的引入模型，每引入一个解释变量后，

都要进行Ｆ检验，并对已经选入的解释变量逐个进行

t检验，当原来引入的解释变量由于后面解释变量的

引入而变得不再显著时，则将其剔除。

以确保每次引

入新的变量之前回归方程中只包含显著的变量。

在逐步回归中，高度相关的解释变量，在引入时会

被剔除。

因而也是一种检测多重共线性的有效方法。

第四节多重共线性的补救措施

本节基本内容:

●修正多重共线性的经验方法

●逐步回归法

岭回归法在本科教学中只是供选择使用

的内容。

一、修正多重共线性的经验方法

1.剔除变量法

把方差扩大因子最大者所对应的自变量首先

剔除再重新建立回归方程，直至回归方程中

不再存在严重的多重共线性。

注意:

需注意产生新的问题:

①模型的经济意义不合理；

②是否使模型产生异方差性或自相关性；

③若剔除不当,可能会产生模型设定误差，造成

参数估计严重有偏

2.增大样本容量

如果样本容量增加，会减小回归参数的方差，

标准误差也同样会减小。

因此尽可能地收集足

够多的样本数据可以改进模型参数的估计。

问题：

增加样本数据在实际计量分析中常面临

许多困难。

3.变换模型形式

一般而言，差分后变量之间的相关性要比差分前

弱得多，所以差分后的模型可能降低出现共线性

的可能性，此时可直接估计差分方程。

问题：

差分会丢失一些信息，差分模型的误差项

可能存在序列相关，可能会违背经典线性回归模

型的相关假设，在具体运用时要慎重。

4.利用非样本先验信息

通过经济理论分析能够得到某些参数之间的关

系，可以将这种关系作为约束条件，将此约束

条件和样本信息结合起来进行约束最小二乘估

计。

【例】

生产函数

Y=AL

展开阅读全文