计量经济学课件第四章多重共线性.docx

上传人:b****3 文档编号:2899165 上传时间:2022-11-16 格式:DOCX 页数:38 大小:106.97KB
下载 相关 举报
计量经济学课件第四章多重共线性.docx_第1页
第1页 / 共38页
计量经济学课件第四章多重共线性.docx_第2页
第2页 / 共38页
计量经济学课件第四章多重共线性.docx_第3页
第3页 / 共38页
计量经济学课件第四章多重共线性.docx_第4页
第4页 / 共38页
计量经济学课件第四章多重共线性.docx_第5页
第5页 / 共38页
点击查看更多>>
下载资源
资源描述

计量经济学课件第四章多重共线性.docx

《计量经济学课件第四章多重共线性.docx》由会员分享,可在线阅读,更多相关《计量经济学课件第四章多重共线性.docx(38页珍藏版)》请在冰豆网上搜索。

计量经济学课件第四章多重共线性.docx

计量经济学课件第四章多重共线性

第四章多重共线性

引子:

发展农业会减少财政收入吗?

为了分析各主要因素对财政收入的影响,建立财政收

入模型:

CSi=β0+β1NZi+β2GZi+β3JZZi

+β4TPOPi+β5CUMi+β6SZMi+ui

其中:

CS财政收入(亿元);

NZ农业增加值(亿元);GZ工业增加值(亿元);

JZZ建筑业增加值(亿元);TPOP总人口(万人);

CUM最终消费(亿元);SZM受灾面积(万公顷)

数据样本时期1978年-2007年(资料来源:

《中国统计年鉴

2008》,中国统计出版社2008年版)

采用普通最小二乘法得到以下估计结果

财政收入模型的EViews估计结果

Variable

农业增加值

工业增加值建

筑业增加值

总人口

最终消费

受灾面积

截距

Coefficient

-1.907548

Std.Error

0.342045

0.042746

0.765767

0.091660

0.042807

0.048904

8607.753

t-Statistic

-5.576888

1.074892

8.433867

1.047591

0.072609

-0.564916

-0.631118

Prob.

0.0000

0.2936

0.0000

0.3057

0.9427

0.5776

0.5342

0.045947

6.458374

0.096022

0.003108

-0.027627

-5432.507

R-squared

AdjustedR-squared

S.E.ofregression

Sumsquaredresid

Loglikelihood

Durbin-Watsonstat

0.989654

0.986955

1437.448

47523916

-256.7013

1.654140

Meandependentvar10049.04

S.D.dependentvar12585.51

Akaikeinfocriterion17.58009

Schwarzcriterion17.90704

F-statistic366.6801

Prob(F-statistic)0.000000

模型估计与检验结果分析

●可决系数为0.9897,校正的可决系数为0.9870,模

型拟合很好。

模型对财政收入的解释程度高达98.9%。

●F统计量为366.68,说明0.05水平下回归方程整体

上显著。

●t检验结果表明,除了农业增加值、建筑业增加

值以外,其他因素对财政收入的影响均不显著。

●农业增加值的回归系数是负数。

农业的发展反而会使财政收入减少吗?

!

这样的异常结果显然与理论分析和实践经验不相符。

若模型设定和数据真实性没问题,问题出在哪里呢?

第四章多重共线性

本章讨论四个问题:

●什么是多重共线性

●多重共线性产生的后果

●多重共线性的检验

●多重共线性的补救措施

第一节什么是多重共线性

本节基本内容:

●多重共线性的含义

●产生多重共线性的背景

一、多重共线性的含义

在计量经济学中所谓的多重共线性(Multi-Collinearity),

不仅包括完全的多重共线性,还包括不完全的多重共线性。

在有截距项的模型中,截距项可以视为其对应的解释变量总

是为1。

对于解释变量1,X2,X3,,Xk,如果存在不全为0的

λ数λ1,2,...λk,使得

12X2i3X3ikXki0(i1,2,,n)

则称解释变量1,X2,X3,

线性。

或者说,当Rank(X)k

重共线性。

Xk之间存在着完全的多重共

时,表明在数据矩阵

X中,至少有

一个列向量可以用其余的列向量线性表示,则说明存在完全的多

不完全的多重共线性

实际中,常见的情形是解释变量之间存在不完

全的多重共线性。

对于解释变量1,X2,X3,

λ1,λ2,λk,使得

Xk,存在不全为0的数

λ1+λ2X2i+λ3X3i+...+λkXki+ui=0

i=1,2,...,n

其中,ui为随机变量。

这表明解释变量

1,X2,X3,Xk只是一种近似的线性关系。

回归模型中解释变量的关系

可能表现为三种情形:

(1)rxixj=0,解释变量间毫无线性关系,变量间相

互正交。

这时已不需要作多元回归,每个参数j都可

以通过Y对Xj的一元回归来估计。

(2)rxixj=1,解释变量间完全共线性。

此时模型参

数将无法确定。

1

(3)0<rxixj<,解释变量间存在一定程度的线性关

系。

实际中常遇到的情形。

二、产生多重共线性的背景

多重共线性产生的经济背景主要有几种情形:

1.经济变量之间具有共同变化趋势。

2.模型中包含滞后变量。

3.利用截面数据建立模型也可能出现多重共线性。

4.样本数据自身的原因。

第二节多重共线性产生的后果

本节基本内容:

●完全多重共线性产生的后果

●不完全多重共线性产生的后果

一、完全多重共线性产生的后果

1.参数的估计值不确定

当解释变量完全线性相关时——OLS估计式不确定

▲从偏回归系数意义看:

在X2和X3完全共线性时,无法保

持X3不变,去单独考虑X2对Y的影响(X2和X3的影响

不可区分)

ˆ=0

▲从OLS估计式看:

可以证明此时β2

0

2.参数估计值的方差无限大

ˆ

OLS估计式的方差成为无穷大:

Var

(2)

二、不完全多重共线性产生的后果

如果模型中存在不完全的多重共线性,可以得到

参数的估计值,但是对计量经济分析可能会产生

一系列的影响。

1.参数估计值的方差增大

ˆ)=σ2

Var(β2

1σ1

=

2222

∑x2i(1-r23)∑x2i(1-r23)

2

r23

增大时Var(β2)也增大

^

2.对参数区间估计时,置信区间趋于变大

3.假设检验容易作出错误的判断

4.可能造成可决系数较高,但对各个参数单独的

t检验却可能不显著,甚至可能使估计的回归系

数符号相反,得出完全错误的结论。

第三节多重共线性的检验

本节基本内容:

●简单相关系数检验法

●方差扩大(膨胀)因子法

●直观判断法

●逐步回归法

一、简单相关系数检验法

含义:

简单相关系数检验法是利用解释变量之间

的线性相关程度去判断是否存在严重多重共线性

的一种简便方法。

判断规则:

一般而言,如果每两个解释变量的简

单相关系数(零阶相关系数)比较高,例如大于0.8,

则可认为存在着较严重的多重共线性。

注意:

较高的简单相关系数只是多重共线性存在的充分

条件,而不是必要条件。

特别是在多于两个解释

变量的回归模型中,有时较低的简单相关系数也

可能存在多重共线性。

因此并不能简单地依据相

关系数进行多重共线性的准确判断。

二、辅助回归模型检验

当模型的解释变量个数多于两个,并且呈现出较

为复杂的相关关系时,可以通过每个解释变量对其它

解释变量的辅助回归模型来检验多重共线性,即依次

建立k个辅助回归模型:

xi=a0+a1x1++ai-1xi-1+ai+1xi+1++akxk+ε

(i=1,2,…,k)

若其中某些方程显著,则表明存在多重共线性。

三、方差扩大(膨胀)因子法

ˆ

统计上可以证明,解释变量Xj的参数估计式βj

的方差可表示为

ˆ

Var(βj)=

⋅=

⋅VIFj

222

∑xj1-Rj∑xj

2

2

σ

其中的VIFj是变量Xj的方差扩大因子

1

(VarianceInflationFactor),即VIFj=2

(1-Rj)

其中R

2

j

是多个解释变量辅助回归的可决系数

经验规则

●方差膨胀因子越大,表明解释变量之间的多重共

性越严重。

反过来,方差膨胀因子越接近于1,

多重共线性越弱。

●经验表明,方差膨胀因子≥10时,说明解释变量

与其余解释变量之间有严重的多重共线性,且这

种多重共线性可能会过度地影响最小二乘估计。

另一个与VIF等价的指标是“容许度”(Tolerance)

,其定义为:

TOLi=(1-R)=1VIFi

2

i

显然,0≤TOL≤1;当xi与其它解释变量高度相关时,

TOL→0。

因此,一般当TOL<0.1时,认为模型存在较

严重的多重共线性

四、直观判断法

1.当增加或剔除一个解释变量,或者改变一个观

测值时,回归参数的估计值发生较大变化,回归

方程可能存在严重的多重共线性。

2.从定性分析认为,一些重要的解释变量的回归

系数的标准误差较大,在回归方程中没有通过显

著性检验时,可初步判断可能存在严重的多重共

线性。

3.有些解释变量的回归系数所带正负号与定性分

析结果违背时,很可能存在多重共线性。

4.解释变量的相关矩阵中,自变量之间的相关系

数较大时,可能会存在多重共线性问题。

五、逐步回归检测法

逐步回归的基本思想

将变量逐个的引入模型,每引入一个解释变量后,

都要进行F检验,并对已经选入的解释变量逐个进行

t检验,当原来引入的解释变量由于后面解释变量的

引入而变得不再显著时,则将其剔除。

以确保每次引

入新的变量之前回归方程中只包含显著的变量。

在逐步回归中,高度相关的解释变量,在引入时会

被剔除。

因而也是一种检测多重共线性的有效方法。

第四节多重共线性的补救措施

本节基本内容:

●修正多重共线性的经验方法

●逐步回归法

岭回归法在本科教学中只是供选择使用

的内容。

一、修正多重共线性的经验方法

1.剔除变量法

把方差扩大因子最大者所对应的自变量首先

剔除再重新建立回归方程,直至回归方程中

不再存在严重的多重共线性。

注意:

需注意产生新的问题:

①模型的经济意义不合理;

②是否使模型产生异方差性或自相关性;

③若剔除不当,可能会产生模型设定误差,造成

参数估计严重有偏

2.增大样本容量

如果样本容量增加,会减小回归参数的方差,

标准误差也同样会减小。

因此尽可能地收集足

够多的样本数据可以改进模型参数的估计。

问题:

增加样本数据在实际计量分析中常面临

许多困难。

3.变换模型形式

一般而言,差分后变量之间的相关性要比差分前

弱得多,所以差分后的模型可能降低出现共线性

的可能性,此时可直接估计差分方程。

问题:

差分会丢失一些信息,差分模型的误差项

可能存在序列相关,可能会违背经典线性回归模

型的相关假设,在具体运用时要慎重。

4.利用非样本先验信息

通过经济理论分析能够得到某些参数之间的关

系,可以将这种关系作为约束条件,将此约束

条件和样本信息结合起来进行约束最小二乘估

计。

【例】

生产函数

Y=AL

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1