计量经济学放宽基本假定的模型总结.docx
《计量经济学放宽基本假定的模型总结.docx》由会员分享,可在线阅读,更多相关《计量经济学放宽基本假定的模型总结.docx(30页珍藏版)》请在冰豆网上搜索。
计量经济学放宽基本假定的模型总结
异方差性
1 定 义 :
对于不同的样本点,随机干扰项的方差不再是常数,而是互不一样。
则认为出现
了异方差性。
2 影响:
① OLS 参数估计量非有效:
具有:
线性性、无偏性 不具有:
有效性
(大样本下)
具有:
一致性不具有:
渐进有效性
②变量的显著性检验失去意义
关于变量的显著性检验中,构造了 t 统计量,他是建立在随机干扰项共同的方差σ2不变,而
真确地估计了参数方差 S ∧ 的基础之上的。
如果出现了异方差性其估计值会偏大或偏小。
t
B j
检验失去意义。
③ 模型的预测失效
预测值的置信区间中也包含有参数的方差的估计量 S ∧ 。
所以当模型出现异方差性是,任然
B j
使用 ols 估计量,将导致预测区间篇大或小,预测功能失效。
3 判断:
假设 4:
Var(μi | xi) = σ
2
由于异方差性是相对于不同的解释变量观测值,随机误差项具有不同的方差。
那么检验异方
差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性与其相关的“形式”。
随机误差项方差的表示!
一般的处理方法:
首先采用 OLS 估计,得到残差估计值。
用它的平方近似随机误差项的方差。
~^
残差估计值 ei = Y - Y (OLS )
近似随机误差项的方差 Var(μ i) = E(μ i) ≈ ei
~
2
图示检验法
帕克检验与戈里瑟检验 由于 f(x)的形式未知,所以要进行各种形式的检验。
~i 2 = f ( X ji ) + ε i | ~ |= f (X ji ) +εi
选择关于变量 X 的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种
函数形式,使得方程显著成立,则说明原模型存在异方差性。
GQ 检验:
适合样本容量大,异方差为单调增或单调减的函数形式。
Step1 将样本观测值按照有可能引起异方差的解释变量观测值排序
Step2 除去 c=0.25n 观测值,讲剩下的观测值分为两组,每个子样样本容量为 0.5(n-c)
Step3 对每个子样做 OLS,计算出两个残差平方和, 自由度为 0.5(n-c)-k-1
Step4 构建 F 分布
F>F a (v1,v2) 拒绝同方差性假设,表明存在异方差。
White 检验:
对任何形式的异方差均试用。
Step1 做 OLS 回归,得到
Var (μi ) = E (μi2 ) ≈ ~ 2
Step2 辅助回归
~2 = α0 +α1X1i +α2 X2i +α3 X1i +α4 X2i +α5 X1i X2i + εi
由度为辅助回归中解释变量个数的χ分布,即 nR ~ χ2 。
nR 2 >χa (辅助回归中解释变量个数) 拒绝同方差性假设,表明存在异方差。
~ 2~ 2
辅助回归是检验 ei 与解释变量可能组合的显著性。
如果存在异方差性,则表明 ei 与某种解
释变量的组合存在显著的相关性,往往显示出比较大的可决系数,并且某一参数的 t 检验值
比较大。
Step3 在同方差性假设下,辅助回归的可决系数 R2 ,与样本容量 n 的乘积,渐进地服从自
22
2
4 解决:
加权最小二乘法 WLS(也称为广义最小二乘法 GLS):
关键是寻找随机干扰项与解释变量间
适当的函数形式。
加权最小二乘估计量,是无偏、有效的估计量。
广义最小二乘法估计量具有 BLUE 特征。
思路:
加权最小二乘法就是对原模型进行加权处理,使新模型不存在异方差性,然后采用
普通最小二乘法进行回归。
对较大的残差平方和赋予较小的权,对较小的残差平方和赋予较大的权。
Var (μ i ) = E (μ i ) 2 = σ i2 = f ( X ji )σ
2
1
f (X ji )
Yi = β0
1
f (X ji )
+ β1
1
f (X ji )
X1i + β2
1
f (X ji )
X 2i +
+ βk
1
f (X ji )
X ki +
1
f (X ji )
μi
Var(
1
f ( X ji )
μi ) = E(
1
f ( X ji )
μi )2 =
1
f ( X ji )
E(μi )2 = σ 2
加权后的模型满足同方差性,可用 OLS 法估计。
w 权=
1
f (xij)
普通最小二乘法就是权等于 1 时的加权最小二乘法。
异方差稳健标准误法:
适合样本容量足够大的情况。
不具有有效性。
仍用普通最小二乘法估计量,对方差进行修正。
用 wls 时,寻找合适的函数形式比较困难,所以可以应用异方差稳标准误法来消除异方差带
来的后果。
思路:
存在异方差性的时候,用普通最小二乘回归的估计量是具有无偏性,一致性,但不
具有有效性。
只影响了参数估计量的方差和标准差的正确估计。
优点:
找不到 wls 的权时候使用异方差稳健标准误法。
修正方差后,使得以估计量方差为基
础的统计检验不再失效,预测区间更加合理。
一般经验:
对于采用截面数据作为样本的计量与经济学问题,由于在不同样本点上解释变量
以外的其他因素差异较大,所以往往存在异方差性。
n 采用截面数据作样本时,不对原模型进行异方差
性检验,而是直接选择加权最小二乘法。
n 如果确实存在异方差,则被有效地消除了;
n 如果不存在异方差性,则加权最小二乘法等价于普
通最小二乘法。
n 采用时序数据作样本时,不考虑异方差性检验。
经济变量固有惯性和滞后期
模型设定偏误:
(遗漏了重要的解释
变量/模型设定有误 虚假序列相关)
随机干扰项中一个重要的系统性影
序列相关性:
经常出现在以时间序列数据为样本的模型中
响因素。
数据的编造:
新数据是通过源数据生
成的。
1 定义:
随机干扰项序列相关假设 4 Cov(μi, μj) = E(μi, μj) ≠ 0
一阶序列相关/自相关:
形式 1 E(μi, μi + 1) ≠ 0
形式 2 μi = ρμi - 1 + εi
一阶自相关系数/自协方差系数 ρ
2 影响
① OLS 参数估计量非有效:
具有线性无偏性,不具有有效性。
因为在证明中用了 同方差性 和 独立性条件。
(大样本)具有一致性,不具有渐进有效性。
②变量的显著性检验失去意义
T 统计量是建立在参数方差正确估计的基础之上的。
只有当随机干扰项具有同方差和相互独
立性时才成立。
如果存在序列相关性,则估计的参数方差 S ^ 出现偏误,t 检验失去意义。
B j
③ 模型的预测失效
区间预测和参数估计量的方差有关,在方差估计有偏误的情况下,预测就不准。
3 判断
eˆi
图示法:
残差~ = Yi - (Yi ) 0ls可以作为 μi 的估计
回归检验法:
~ = ρ~ -1 + ε t
~ = ρ1~ -1 + ρ 2 ~ -2 + ε t
……
进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列
相关性。
有点就是,可以确定序列相关的形式,适用于各种类型的序列相关。
D.W 检验法:
Step1 假定条件:
解释变量非随机
随机干扰项为一阶自回归形式:
μt = ρμt - 1 + εt
回归模型模型中不能还有滞后变量作为解释变量
回归模型中含有截距项
Step2:
原假设:
H0:
p=0 即 μt 不存在一阶自回归
D.W . ≈ 2(1 - ρ )
完全 1 阶正相关 p=1 dw=0
完全 1 阶负相关 p=-1 dw=4
完全不相关 p=0 dw=2
正
相
关
不
能
确
定
无自相关 不
能
确
定
负
相
关
0dLdU2
4-dU4-dL
上限 du 下限 dL 只与 样本容量 n 和解释变量 k 有关 而与解释变量取值无关
缺点:
只能检验一阶自相关,存在一片无法判断的 dw 值区域,不能检验存在滞后的解释变
量的模型。
LM 拉格朗日乘数检验法:
克服了 DW 的缺陷,适用于高阶序列相关和存在滞后解释变量
的模型。
Yi = β 0 + β1 X 1i + β 2 X 2i + + β k X ki + μ i
Step1:
如果怀疑随机干扰项存在 p 阶段序列相关
μt = ρ1μt -1 + ρ2μt -2 + ρ pμt - p + εt
Step2:
拉格朗日乘数检验就可以用来检验如下受约束回归方程
Y = β0 + β1X1t + + βk Xkt + ρ1μ -1 + + ρpμ -p +εt
H0:
ρ1=ρ2=…=ρp
约束条件:
H0:
=0
Step3:
如果约束条件为真,则 LM 统计量服从在大样本下自由度为 p 的渐进 x2 分布
辅助回归:
~ = β0 + β1X1t + + βk X kt + ρ1~ -1
+ + ρ p~ - p
+ ε
t
n 为辅助回归中样本容量,可决系数也来自该辅助回归。
(
LM = nR 2 ~ χ 2P )
一阶序列相关就是(n-1)二阶序列相关就是(n-2)
Step4 如果
2
LM = nR 2 > χα ( P ) 则拒绝约束条件为真的原假设,表明可能存在
直到 p 阶的序列相关性。
在实际检验中,可以逐步向高阶检验,并参考辅助回归中原模型经普通最小二乘法估计的
残差项前参数的显著性来判断序列相关阶数。
4 解决
广义最小二乘法:
GLS 的原理与 WLS 一样,只是将权矩阵 W 换为方差-协方差矩阵 Ω。
(只要知道随机干扰项的方差-协方差矩阵就可以用 GLS 得到参数的最佳线性无偏估计量)
广义最小二乘估计量是无偏的,有效地。
如何得到方差-协方差矩阵?
有 n 个样本,要对 n(n - 1) / 2 + k + 2 参数进行估计非常困难。
所以要经过特殊设定后,才
可得到其估计值。
例如设定随机干扰项为一阶序列相关形式。
广义差分法:
广义差分法是将原模型变换为满足 OLS 法的差分模型,再 d 对差分模型进行 OLS
估计。
得到的原模型参数无偏且有效估计量。
Yi = β 0 + β1 X 1i + β 2 X 2i + + β k X ki + μ i
μt = ρ1μt -1 + ρ2μt -2 + + ρl μt -l + ε t
Y - ρ1Y -1 - - ρlY -l = β0(1- ρ1 - - ρl ) + β1(X1t - ρ1X1t-1 - - ρl X1t-l )
+ + βk ( X kt - ρ1 X kt -1 - - ρl X kt -l ) + ε t
注意:
大样本下面广义差分法和广义最小二乘法的估计结果接近,但在小样本中观测值的
损失可能会对估计结果又影响,为了弥补损失,可以进行普来斯-温斯特变换。
这样广义差
分法和广义最小二乘法的结果一样。
随机干扰项相关系数的估计:
应用广义最小二乘法或广义差分法,必须已知随机干扰项的相关系数ρ1, ρ2, … , ρL。
实际上,
人们并不知道它们的具体数值,所以必须首先对它们进行估计。
Ø
科克伦-奥科特迭代法
Yi = β0 + β1X1i + β2 X 2i + + βk X ki + μi
采用 OLS
法估计
随机误差项的“近似估计值”,作为方程的样本观测值
μt = ρ1μt-1 + ρ2μt-2 + + ρl μt-l + εt
ρ 1 , ρ 2 , , ρ
p
Y - ρ1Y -1 - - ρlY -l = β0(1- ρ1 - - ρl ) + β1(X1t - ρ1X1t-1 - - ρl X1t-l )
+ + β k ( X kt - ρ1 X kt -1 - - ρl X kt -l ) + ε t
66
ˆˆ
ˆ
Yi = β 0 + β1 X 1i + β 2 X 2i + + β k X ki + μi
第二次估计
ρ 1 , ρ 2 ,
ρ
p
n 类似地,可进行第三次、第四次迭代。
n 两次迭代过程也被称为科克伦-奥科特两步法。
给一个精度,当次估计之差小于这个精度就终止迭代。
Ø杜宾(durbin)两步法
该方法仍是先估计ρ1,ρ2,⋯,ρl,再对差分模型进行估计。
Y - ρ1Y -1 - - ρlY -l = β0(1- ρ1 - - ρl ) + β1(X1t - ρ1X1t-1 - - ρl X1t-l )
+ + β k ( X kt - ρ1 X kt -1 - - ρl X kt -l ) + ε t
Yt = ρ1Yt-1 + + ρlYt-p + β0 (1- ρ1 - - ρ p ) + β1(Xt - ρ1Xt-1 - - ρl Xt-p )
+ + β k ( X kt - ρ1 X kt -1 - - ρ l X kt - p ) + ε t
ρ1 , ρ 2 , , ρ p
β0 , β1 , , β * β0 = β0 (1- ρ1 - - ρp )β j = β *
67
68
如果能够找到一种方法,求得 Ω 或各序列相关系数ρj 的估计量,使得 GLS 能够实现,则称
为可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares)。
如果参数是被估计出来的。
FGLS 估计量,也称为可行的广义最小二乘估计量(feasible
general least squares estimators)
可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,
估计量也具有渐近有效性。
前面提出的方法,就是 FGLS。
序列相关稳健标准误法:
(大样本 一致估计)出现序列相关只是影响到了参数方差的正确
估计,从而无法保证最小二乘估计量的有效性,并不影响估计量的无偏性和一致性。
仍采
用 OLS,但修正其方差。
异方差+序列相关同时存在时,这个方法可以把方差都纠正了。
多重共线性
经济变量相关的共同趋势(时间序列和截面数据)
滞后变量的引入
样本资料的限制
1 定义:
如果某两个或者多个解释变量间出现了相关性,则称为存在多重共线性。
c1X1i + c2 X 2i + + ck X ki = 0
Ci 不全为 0 完全共线性
c1X1i + c2 X 2i + + ck X ki + vi = 0
Ci 不全为 0 近似共线性
R(X) < k +1
完全共线性
2 影响:
1.完全共线性下参数估计量不存在。
如果存在完全共线性,则(X’X)-1 不存在,无法得到参数的估计量。
2.近似共线性下 OLS 估计量非有效
22
•当近似共线时, 0< r2⋅>
1 - r 2
<1
多重共线性使参数估计值的方差增大,1/(1-r2)为方
差膨胀因子(Variance Inflation Factor, VIF)
表4.3.1 方差膨胀因子表
相关系数平方00.5 0.8 0.90.950.960.970.980.990.999
方差膨胀因子000
•当完全共线时, r2=1,var( β 1 ) = ∞
91
3.参数估计量经济含义不合理:
不反应解释变量各自对于被解释变量的影响,而反应了共同影响。
所以当出现解
释变量系数不合理的情况应该首先怀疑存在多重共线性。
4.变量的显著性检验失去意义
存在多重共线性时
参数估计值的方差与标准差变大
容易使通过样本计算的 t 值小于临界值,
误导作出参数为 0 的推断
可能将重要的解释变量排除在模型之外
5.模型的预测功能失效
注意:
除非是完全共线性,多重共线性并不意味着任何基本假设的违背;
因此,即使出现较高程度的多重共线性,OLS 估计量仍具有线性性等良好的统计性质。
问题
在于,即使 OLS 法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给
出真正有用的信息。
3 判断:
任务 1、检验模型是否存在多重共线性 2、判断存在多重共线性的X围。
Step1:
检验是否存在多重共线性
Step2:
判断多重共线性存在的X围
如果可决系数接近 1,则 F 统计量就会比较大。
原假设:
xj 与其他解释变量不存在明显的线性关系。
4 解决:
随机解释变量:
多出现在滞后变量作为模型的解释变量的情况。
1 定义:
单方程线性计量经济学模型假设解释变量是确定性变量,并且与随机干扰项不相关。
违背这一假设的问题被称为随机解释变量问题。
Style1:
随机解释变量和随机干扰项独立
Coc(x2, μ) = 0
Style2:
随机解释变量和随机干扰项同期无关但异期相关
Coc(x2t, μt) = 0
Coc(x2t - s, μt - s) ≠ 0
Style3:
随机解释变量和随机干扰项同期相关
Coc(x2t, μt) ≠ 0
如果某解释变量是确定性变量,不是随机变量,则该解释变量一定与随机干扰项独立。
假设 5 Cov( Xij, μi | X1, X 2, X 3⋯⋯ Xk) = 0 该假设要求随机解释变量与随机干扰项同
期无关,这时随机解释变量被称为同期外生的。
如果随机解释变量和随机干扰项既不同期相关,也不异期相关则称为严格外生。
2 影响:
随机解释变量和随机干扰项正相关
随机解释变量和随机干扰项负相关
A X与μ 相互独立,得到的参数估计量仍是无偏一致估计量
B X与μ 同期无关,异期相关。
一致,有偏。
C X与μ 同期相关。
有偏不一致。
随机解释变量和随机干扰项同期相关是,会对 OLS 造成严重不良后果。
这时候我们也称随
机解释变量具有内生性。
如果模型中有滞后的被解释变量作为解释变量,则同期相关时不一致有偏非有效。
即使同
期无关,肯定也会出现异期相关,ols 还是有偏的。
3 判断:
工具变量法(解决 OLS 有偏问题)
B X与μ 同期无关,异期相关。
一致,有偏。
增大样本容量的方法来得到一致估计量。
C X与μ 同期相关。
有偏不一致。
增大样本容量也无法解决。
使用工具变量法。
4 解决
Yi =β0 +β1 X i
三点说明:
1、 工具变量法并没有改变原来的模型。
只是在模型参数的估计过程中用工具变
量替代了随机解释变量。
工具变量法可以分解为以下两阶段的 OLS
Step1:
用普通最小二乘法进行 X 关于工具变量 Z 的回归
X i = a0 + a1Zi
Step2:
以第一步得到的 X i 为解释变量,进行如下普通最小二乘回归:
~~
工具变量法仍是 Y 对 X 的回归。
两阶段最小二乘法(2SLS)
对于没有选择另外的变量作为工具变量的解释变量,可以认为自身作为工具变量。
如果随机解释变量和随机干扰项的相关性主要来源于同期测量误差引起的。
就可以用滞后
一期的随机解释变量作为原解释变量的工具变量。
解释变量的内生性(同期相关)检验:
回归模型的基本假设要求随机解释变量和随机干扰项至少同期无关。
即随机解释变量是同
期外生变量。
Step1 将被怀疑是内生变量的 X,关于 Z1 Z2 做 OLS
iiiiiZXYευδβββ++++=2210
Xi = a0 + a1zi1 + a2 zi2 + vi
得到残差 v
Step2 将得到残差 v 带入到原来的模型中进行 OLS
如果 δ 显著为 0,则表明随机解释变量和随机干扰项同期无关。
第五章 经典单方程计量经济学模型:
专门问题
虚拟解释变量;滞后解释变量和滞后被解释变量;模型设定偏误
第一节 虚拟解释变量
有些影响因素无法量化,为了将这些因素引入模型中,提高模型精度,只能引入一些人工的
变量即虚拟变量。
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of
variance:
ANOVA)模型。
1、定义:
根据这些因素的属性类型,构造只能取 0(比较类型和否定类型)或 1(基础类型
和肯定类型)的人工变量,通常称为虚拟变量。
2、 虚拟变量的引入
加法方式 截距
乘法方式 斜率
3、 虚拟变量设置原则:
如果有 m 个确定性变量,只在模型中引入 m-1 个虚拟变量。
第二节 滞后变量模型
同期各种因素影响
某些经济变量受到影响
过去时期各种因素影响
自身过去值的影响
含有滞后变量的模型被称为滞后变量模型。
因为考虑了时间因素,也被称为动态模型。
滞
后效应即动态性。
被解释变量和解释变量的因果关系并不一定就在一瞬间发生。
可能存在时间滞后,或者说
解释变量的变化要一段时间时候才能完全地对被解释变量产生影响。
同样的,被解释变量
自身也可能受到前期值的影响。
这种被解释变量自身或者其他解释变量前几期值的影响被
称为滞后效应,前几期值被称为滞后变量。
心理原因
产生原因
技术原因
制度原因
(1) 分布滞后模型:
没有滞后被解释变量,仅有解
释变量 X 当期值和若干期滞后值。
一般形式:
s
i=0
βi 被称为乘数
i=0 短期或者即期乘数
i=1、2……动态乘数或
延迟系数
滞后变量模型
s
i=0
i
长期或均衡乘数
(2)自回归模型:
仅包括 X 的当期值和 Y 的一个或者
多个滞后值。
滞后期长度 Q 也别称为自回归模型的阶
数
q
i=0
一阶自回归模型:
自回归分布滞后模型(有限和无限):
Yt-q 为被解释变量 Y 的第 q 期滞后 Xt-s 为第 s 期滞
后
格兰杰因果关系检验:
一个变量的过去的行为在影响另一个变量的当前行为,还是双方的
过去行为在相互影响着对方的当前行为。
格兰杰因果关系检验要求做以下两个回归
mm
i=1i=1
m m
i=1 i=1
检验结果有四种:
1x 对 y 有单向影响:
x 整体参数不为零,y 整体参数为零
2y 对 x 有单向影响:
x 整体参数为零,y 整体参数不为零
3 双向影响:
都不为零
4 没影响:
都为零
格兰杰检验是通过受约束的 F 检验得到的
RSSU:
包含 x 滞后的回归
RSSR:
不包含 x 滞后的回归