完整版高级计量经济学复习精要汇总.docx

资源描述

完整版高级计量经济学复习精要汇总.docx

《完整版高级计量经济学复习精要汇总.docx》由会员分享，可在线阅读，更多相关《完整版高级计量经济学复习精要汇总.docx（20页珍藏版）》请在冰豆网上搜索。

完整版高级计量经济学复习精要汇总.docx

完整版高级计量经济学复习精要汇总

高级计量经济学复习精要

一、简答题（10分X2）:

（一）多重共线性问题：

（主要看修正方法）

1、多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

完全共线性的情况并不多见，一般出现的是在一定

程度上的共线性，即近似共线性。

2、产生原因主要有3各方面：

（1）经济变量相关的共同趋势；

（2）滞后变量的引入；

（3）样本资料的限制。

3、造成的后果：

（1）完全共线性下参数估计量不存在；

（2）近似共线性下OLS估计量非有效；（3）参数估计量经济含义不合理；（4）变量的显著性检验失去意义；（5）模型的预测功能失效。

4、识别方法：

（1）经验识别：

对模型估计后，R2极高，多个变量不显著，出现与理论

预期相悖的情况，有理由怀疑存在多重共线性。

（2）相关系数法：

计算变量间两两相关系数。

只要其中一个大等于0.6或0.7,则表明可能存在严重的共线性。

（3）膨胀因子法：

计算每

个解释变量的VIF,若某一个VIF>10,则表明存在严重的共线性。

5、修正方法：

（※※※）根据潘老师讲课内容进行整理

共线性的修正方法有很多，按照优劣程度排序，主要有五种方法：

方法1:

扩充样本以减弱共线性。

主要通过增加自由度来提高精度，如将时序数据或截

面数据变为面板数据，从而将一维数据变为二维。

评价：

这种方法最理想，但存在的缺点是：

①效果不定；②不可行。

方法2:

工具变量法（IV）。

主要通过工具变量，运用两阶段最小二乘完成。

评价：

这种方法目前最受欢迎，高质量的期刊论文通常都采用该方法。

缺点是：

①由于相关关系具有传导性，工具变量S很难找；②用S替彳弋X,有时经济正当性不足。

方法3:

变量变换法。

可以通过对数变换、绝对转相对和方程变换进行变量变换。

评价：

这种方法最简单易行，但存在的缺点是：

①简单相关系数描述的是线性关系，而

对数是非线性化过程；②功效不足；③不是所有变量都能用来做变换，必须有明确的经济学

指代。

方法4:

逐步回归法。

主要是通过降维减少变量来减弱共线性。

评价：

这种方法要慎用，最大的缺点是：

虽然能很好地解决共线性问题，但是却引发了

更严重的内生性问题。

方法5:

主成份分析法或因子分析法。

具有降维的作用，主要用于多指标评价。

评价：

该方法很好地消除了共线性。

但这种方法要慎用，最大的缺点是：

经济含义伤害

过大。

（二）内生性问题

1、内生性是指：

模型中的解释变量与扰动项相关。

通常我们做古典假设①片为白噪声，

E（6）=0,var（3）=仃:

cov（%和）=0;②X是非随机变量（微观可以通过固定抽样得到解决，宏观则不可），则cov（X,6）=0成立。

但是当cov（X,z）w0时上述假设便不再成立，我们称之为内生性，进而导致OLS失效，是非一致性的。

2、内生性产生的原因：

①X与Y存在双向因果，即X影响Y的同时，Y也影响X;如金融发展与经济增长；外商直接投资FDI与经济增长；犯罪率与警备投入。

②模型遗漏重要解释变量。

无论是缺失重要解释变量导致，还是无法获取数据导致，被遗漏的重要变量进

入了残差项，如果与其他解释变量相关，就会出现cov（Ut,Xt）W0,也就是内生性问题。

③

度量误差：

由于关键变量的度量上存在误差，使其与真实值之间存在偏差，这种偏差可能会

成为回归误差的一部分，从而导致内生性问题。

（潘老师上课没讲③）

3、解决方法：

针对双向因果产生的内生性问题，比较容易解决，通过联立方程组即可。

难处理的是遗漏重要解释变量的情况，通常采用的方法有：

①工具变量法（IV）：

就是找到一个变量和内生化变量相关，但是和残差项不相关。

通常采用2SLS方法进行回归。

这种方法是找到影响内生变量的外生变量，连同其他已有的外生变量一起回归，得到内生变量的估计值，以此作为IV,放到原来的回归方程中进行回归。

（假如我们考察一个工资决定模型salary=P0+P1educ+P2abli+ui

首先，用Probit模型彳古计p（work）=f（educ,abli）,得到?

其次，构建模型salary=P0+P1educ+P2abli+6?

+Vj进行估计）

②得分匹配与DID模型（双差分模型）：

思想是按照一定的标准，找到与样本match的

控制组。

在假设外在冲击同时影响两个组别的情况下，做差来剔除掉外界冲击的影响。

第一步，该方法关键在于得分匹配的确定，配对样本的选择原则是保证两个样本随时间自然变化的部分是相同的，一般根据距离最近作为配对的样本点的方法进行匹配得分。

第二步是估计方法，采用双重差分法（DID）。

在假设外在冲击同时影响两个组别的情

况下，做差来剔除掉外界冲击的影响。

（在样本选择上，控制不可观测变量，然后利用双差分模型进行估计

Eg：

salary=00+匕educ十02abli+u

（1）样本抽取时，将ablity相等或相近的观测值进行配对（匹配标准IQ/双胞胎）

（2）用双差分模型（DID）进行参数估计

ln（salary得分组-salary对照组）=%+%ln（eduq导分组-educ寸照组）+%

估计出璃，等价于原模型中的邛不足：

样本要求非常大，尤其是用多重标准进行匹配时，样本要求更大。

）潘老师举得例子

二、虚拟变量：

（20分）（给出实际经济问题，根据目标设计虚拟变量，写出模

型。

考察一种群体异质。

完整考察如何设计，如何运用到模型中。

）

注意事项：

1、模型设计时一定要有截距项，虚拟变量引入原则一定要满足m-1原则。

m为互斥类型的定性因素。

2、要掌握虚拟变量引入模型的三种方法，即加法模型、乘法模型

和既加又乘模型。

1、举例说明如何引进加法模式和乘法模式建立虚拟变量模型。

答案：

设Y为个人消费支出；X表示可支配收入，定义

2季度13季度_T14季度

其他与二“其他|0其他

如果设定模型为

Yt=A+8工与+Bd+Rd+尾羽+%

此时模型仅影响截距项，差异表现为截距项的和，因此也称为加法模型。

如果设定模型为

，e=4+BQ2t+与。

王+

+区（4/）+艮（鼻国）+舄（2占）+々

此时模型不仅影响截距项，而且还影响斜率项。

差异表现为截距和斜率的双重变化，因此也

称为乘法模型。

=^^i-^r+B^Dt.+BjDi.+BjD4.+u._

2、考虑下面的模型：

£。

44rF其中，Y表不大

学教师的年薪收入，X表示工龄。

为了研究大学教师的年薪是否受到性别（男、女）、学历（本科、硕士、博士）的影响。

按照下面的方式引入虚拟变量：

门；1.男教师nJ1.硕士「口，博士

马飞，女教师其他5=[口，其他

1.基准类是什么？

1解薜各系敬所代表的含义，并懂期答系数的将导「

里若£*＞与，你得出什么结论？

解：

1基准类为本科女教师，

2.凡表示工龄对年期的影响，即工埼捻姆加1单位，平均而言，年薪将培加用个单位.阴期符号为正，因为随着年龄的精加，工资应该指加,

外体现了性利展异"

电和瓦体观了学历差导，莎朗符号为正，

3.玛＞为说明，博士教师的年薪高于颉土教师的年期,

元=Sn+B、X—B、DrP+B-iD^+R*D&t+%J

3、考虑下面的模型:

上"'……"其中，丫表示大学教

师的年薪收入，X表示工龄。

为了研究大学教师的年薪是否受到性别、学历的影响。

按照下面的方式引入虚拟变量：

（10分）

男教师门J1,硕士门J1,博士

[0，女教师3=|0，其他L[0、其他

1.基准类是什么？

2.解释各系数所代表的含义，并预期各系数的符号。

3.若B4＞B3,你得出什么结论？

答案：

1.基准类是本科学历的女教师。

2.B0表示刚参加工作的本科学历女教师的收入，所以B0的符号为正。

B1表示在其他条件不变时，工龄变化一个单位所引起的收入的变化，所以

B1的符号为正。

B2表示男教师与女教师的工资差异，所以B2的符号为正。

B3表示硕士学历与本科学历对工资收入的影响，所以B3的符号为正。

B4表示博士学历与本科学历对工资收入的影响，所以B4的符号为正。

3.若B4>B3,说明博士学历的大学教师比硕士学历的大学教师收入要高。

4、性别因素可能对年薪和工龄之间的关系产生影响。

试问这种影响可能有几种形式，并设定出相应的计量经济模型。

令丫二年薪，变量X二工龄，

nfO，男性D=Y

[1，女性（2分）

性别因素可能对年薪和工龄之间的关系的影响有三种方式。

第一种，性别只影响职工的初始年薪，设定模型为：

X=%+B/+3工。

+%（2分）

第二种，性别因素胤响职工的加薪机会，设定模型为：

X=/+B\Xj+8：

1）区+%（2分）

第三种，性别因素既影响职工的初始年薪也影响加薪机会，模型设定为:

工二扁+瓦正+国2?

.乜+星4+盯（2分）

5、考虑下面的模型:

1r二属+国1:

++BJ）-.+ur

£krJlX4■一j.B二口>!

.11.

其中，Y——MBA毕业生收入，X——工龄。

所有毕业生均来自清华大学，东北财经大学,

八工清华大学3俎4八J沈阳工业大学,1区4

沈阳工业大学。

〔0其他，10其他

（1）基准类是什么？

基准类是东北财经大学MB即业生。

你预期各系数的符号如何？

预期B1的符号为正；B2的符号为正；B3的符号为负。

（2）如何解释截距B2B3?

截距B2反应了清华大学MB肝业生相对于东北财经大学MB即业生收入的差别；截距B3反应了沈阳工业大学MB即业生相对于东北财经大学MB即业生收入的差别。

）

（3）若B2>B3，你得出什么结论？

（4）如果B2>B3,我们可以判断清华大学MB即业生的收入平均高于沈阳工业大学MB即业生的收入。

三、异方差问题（25分）

模型Z=用+A4+凤工卢…+居居+乂（；"工…㈤，如果出现

⑷=£7产G=12…㈤，对于不同的样本点，随机扰动项的方差不再是常数，而且

互不相同，则认为出现了异方差。

1、异方差的三大后果：

一是最小二乘估计不再是有效估计量；二是相关参数的t检验、

模型F检验失效；三是估计量的方差是有偏的，参数或因变量预测的置信区间的估计精度下降（甚至这种区间估计是失效的）。

2、异方差的检验识别：

White检验的具体步骤如下。

以二元回归模型为例，

yt=-0+-1Xt1+-2Xt2+ut

（1）

①首先对上式进行OLS回归，求残差国。

②做如下辅助回归式，（包括截距项、一次项、平方项、交叉项）

C222―

t=：

0+?

1Xt1+：

2Xt2+:

3Xt1+：

4Xt2+:

5Xt1Xt2+Vt

（2）

即用u?

t2对原回D3式

（1）中的各解释变量、解释变量的平方项、交叉积项进行OLS回归。

求辅助回归式

（2）的可决系数R2。

③White检验的零假设和备择假设是

Ho:

（1）式中的ut不存在异方差，

Hi：

（1）式中的ut存在异方差

④在不存在异方差假设条件下构造LM统计量或F统计量

LM=nR2、第）

R2/5

或F=〜F（5,n-6）

2（1-R2）/（n-6）

其中n表示样本容量，R2是辅助回归式

（2）的OLS估计式的可决系数。

自由度5表示辅助回归式

（2）中解释变量项数（注意，不计算常数项）,n-6是样本量减参数个数（因此可以扩展到K个解释变量的情形）。

nR2属于LM统计量。

⑤判别规则是

若nR2W72a⑸，接受Ho（ut具有同方差）

若nR2>/o（（5），拒绝Ho（ut具有异方差）

或F

3、异方差的消除（WLS:

加权最小二乘估计）

关键在于权重的选择，我们考的是采用残差作为权重，即采用（

1）式中估计的l/|Ut|为权

重，将残差的绝对值除

（1）式的左右两边，然后对转换后的

（1）式进行OLS。

1、什么是异方差性？

举例说明经济现象中的异方差性。

1）模型3二凤+舟4+^J+…+居居+从（"LZ…㈤,如果出现

产中（风）=久（i=12…E）,对于不同的样本点，随机扰动项的方差不再是常数，而且

互不相同，则认为出现了异方差。

2）在现实经济中，异方差性经常出现，尤其是采用截面数据作样本的计量经济学问题。

例

如：

工业企业的研究与发展费用支出同企业的销售和利润之间关系的函数模型；服装需求量

与季节、收入之间关系的函数模型；个人储蓄与个人可支配收入之间关系的函数模型等。

检

验异方差的主要思路就是检验随机扰动项的方差与解释变量观察值的某种函数形式之间是

否存在相关性。

2、下面是一个回归模型的检验结果。

WhiteHeteroskedasticityTest:

F-statistic

Obs*R-squared

19.41659Probability

16.01986Probability

0.000022

0.006788

TestEquation:

DependentVariable:

RESIDA2

Method:

LeastSquares

Date:

05/31/06Time:

10:

Sample:

118

Includedobservations:

Variable

Coefficient

Std.Error

t-Statistic

Prob.

693735.7

2652973.

0.261494

0.7981

135.0044

107.7244

1.253239

0.2340

X1A2

-0.002708

0.000790

-3.427009

0.0050

X1*X2

0.050110

0.020745

2.415467

0.0326

-1965.712

1297.758

-1.514698

0.1557

X2A2

-0.116387

0.146629

-0.793752

0.4428

R-squared

0.889992

Meandependentvar

6167356.

AdjustedR-squared

0.844155

S.D.dependentvar

13040908

S.E.ofregression

5148181.

Akaikeinfocriterion

34.00739

Sumsquaredresid

3.18E+14

Schwarzcriterion

34.30418

Loglikelihood

-300.0665

F-statistic

19.41659

Durbin-Watsonstat

2.127414

Prob（F-statistic）

0.000022

1）写出原回归模型？

y-c+axl+/3x2+u（2分）

2）检验结果说明什么问题？

异方差问题。

3）如何修正？

加权最小二乘法，做变量变换。

3、试述异方差的后果及其补救措施。

答案：

后果：

OLS估计量是线性无偏的，不是有效的，估计量方差的估计有偏。

建立在t分布和F分布之上的置信区间和假设检验是不可靠的。

补救措施：

加权最小二乘法（WLS）

1.假设巴已知，则对模型进行如下变换:

25%5

2.如果［未知

（1）误差与i成比例：

平方根变换。

可见，此时模型同方差，从而可以利用OLS估计和假设检验。

⑵误差方差和正成比例。

即'（d）=b/

3.重新设定模型:

四、若在模型,1=£1+BJC,+附中存在下列形式的号方差：

由对）=叮,尤、你如何估计参数用.电门吩）

解；对于模型

】；=B［十B:

Xt十/

（1）

存在下列形式的导方差：

工,（%）=b:

*"我们可以在。

京左右两端国矶除以后〉可得

其中

5,^1=

而

五、若在模型二4=及+占/『+%中有在下列形式的异方差：

EE&JnbAV，你如1可估i+谷数玛:

玛口吩）答案：

使用加权最小二乘法估计樽型中的蛭/，火，

在模型匕=禺+为K+修的两边同时除以,反，我们肾

令‘府，'而则上面的模型可以表示为:

（1）

Fartg_卓

M£,艮年换后的模型门下白爱机误差项勰足丽差假定，可U使用0L5估计出瓦，.

若在模型：

匕=瓦+&X,+%中存在下列形式的异方差：

5，）你如何估

计参数'''

答：

将原模型左右两边同H寸除以Xn原模型变形为：

无一用

+8、T

（1）

y*__LlM_]lj__Ll

叼吟=叼知=

由于工

令'W'一£一则式（D可以写为:

声Var（u^=b

A（；所以式

（2）所表示的模型不再存在异方差问

题，故可利用普通最小二乘法对其进行估计，求得参数国岛的估计值。

四、面板数据问题（20分）

1.模型形式的选择（混合模型、变截距模型及变系数模型的选择问题）：

F检验

混合模型形式：

针对不同截面个体和时点，截距项相等和斜率项也相等

%="+a/+劭，i=jN」=l「TJ）

变截距模型：

不同截面个体的截距项不同，但斜率项相同

九=6+巧/+i=\，…N，t=I,-r

（2）

变系数模型：

所有参数在不同截面个体间不一样

匕=%+巧也十%，，=1，…N，/=1,…7

（3）

所以F检验的目的在于对截距参数和斜率参数进行检验

假设：

H1:

b1=b2=•••=bN

H2:

a1=a2=3=aN；b1=b2=♦•二bN

如果接受H2,则应该选择混合模型，如果拒绝H2,然后检验H1,若接受H1,则选择变截距

模型，否则选择变系数模型。

F检验的基本思想：

记变系数模型（6）的残差平方和S1,变截距模型的残差平方和为S2,混合模型的残差平

方和为S3。

在H2下检验统计量F2服从相应自由度下的F分布，即

〜伏+\）,N（T-k-l）J

电——1必+1）]

-S,/[NT-N{/T+I）]

如果F2的值小于给定显著性水平下的临界值Fg（（N-1（（k+1）,N（T-K-1））,（K为解释变量的

个数）。

则接受H2,即选择混合模型；若大于临界值，则继续检验H1.

在H1下检验统计量F1也服从相应自由度下F分布，即

（邑-4）/[（凶-1）妇

F[（N-X）k7N（T-k-l）]

若F1的值小于给定显著性水平下的临界值F用（（N-1）k,N（T-K-1））,则接受H1,应建立变

截距模型，否则建立变系数模型。

［以下不需要记，仅供大家理解，公式看着复杂，其实理解F检验的思想就好记了（方便大家记忆，给出个人对F检验的理解）：

F检验是在给定约束条件下（即原假设），比较两个模

型的好坏，判断好坏的一个标准就是看哪个模型的残差平方和较小（很显然模型拟合的结果

显示残差平方和最小，表明解释变量量越能解释因变量的变异程度）就选该模型（要小到如

何程度或大到如何程度呢，所以需要在给定一个显著性水平下的临界值比较），但不同模型

的自由度不一样，所以应该比较平均残差平方和（术语叫做均方误），用含约束的模型的残

差平方和原模型（即不含约束或假设的模型）的残差平方差和之差再除以自由度之差即分子，

分母就是原模型的均方误（记不住自由度，可以投机取巧：

如分子的自由度表示为qr-qur

分别注明为约束方程残差平方和的自由度与不存在约束的方程的残差平方和的自由度（注意

指出哪个是约束方程哪个不是约束方程），分母自由度为qur）］。

1、变截距模型中固定效应（FE：

fixedeffect）和随机效应（RE:

randomeffect）的检

验：

Hausman检验（豪斯曼检验）

首先将变截距模型变形为：

匕二（〃+匕）+巧/+%…N，f=

［如下不需要记：

方便大家理解，个人总结理解（理解这些，hausman检验的假设就不需要

记）：

变形的目的在于将截距项分成不随截面个体变化的共同截距成分和随不同截面个体变

化的部分，这就是变截距模型的实质，如果分离出的随截面个体变化的截距成分与样本有关，

即与X有关，则这些因素是由样本或自变量决定的，是可由样本控制或可观测或可确定（为

什么称为“固定效应”呢？

原因就在于此，该效应在给定样本下是确定的）的成分，如果是

不能由样本决定则其是不受控制或不可观测的成分，即由其他样本之外的随机因素决定，则

该成分与样本是无关的],这就构成了如下Hausman检验的假设条件：

H0：

cov（xit,vi）=0（RE）

Hl：

COV（Xit,Vi）=0（FE）

Hausman检验统计量为：

%=[var（Acr）—）][bcv—）

其中bcv为固定效应模型的离差变换OLS参数估计，bGLs为随机效应模型的参数估计。

在原假设成立下，W服从自由度为K（解释变量的个数）的卡方分布，所以在给定显著性

水平下与临界值X2欢K）进行比较，若大于卡方临界值则拒绝H1,应该建立固定效应模型，

反之则建立随机效应模型。

[不需要记忆，仅供大家理解，理解Hausman检验的思想：

如果截距项与解释变量是不相关

的，实际上这种随机成分可以归入误差项，则采用两种估计参数的方法得到的估计量均还是

一致估计量，因为残差项与解释变量不相关，所以两种估计方法的参数估计之差应该是很小

的，若H0不成立，即截距项与解释变量相关，则GLS将不是一致估计，则参数之差应比

较

离差变换OLS估计

可彳fGLS估计

估计量之差

个体随机效应回归模型

估计量具有一致性

小

个体固定效应回归模型

估计量具有一致性

估计量不具有一致性

大

大。

]

2、FE和RE的参数估计方法（离差变换OLS估计和FGLS估计）

（1）FE的参数估计：

离差变换OLS

即分别对因变量和各解释变量取平均值，并对原模型进行离差转换，此时无截距项，如下:

变换的方程为yit-y=（Xit-Xi）/:

（uit-Ui）

然后采用OLS对该方程进行估计。

（2）RE效应模型的FGLS估计大家看伍德里奇书上第468-469页

关于识别面板数据模型类别介绍2个统计量.

4.4判别模型中是否存在个体固定效应的F检验

面板数据建模的一项重要任务就是判别模型中是否存在个体固定效应#以个体随机效应模型处="#居R+%为例，无论是固定效应还粘随机效应模型，区都被看作是随机变量，并都有假定条件小明1%,无。

=勾+黑,0

下血介绍两种检®方法,产检验和Ha抽血血检跄.

先介绍F检验原理,F统计量定义为，F=W户

SSEU/（T-k）

其中SSEr表示约束模型的残差平方和，&表示非约束模型的残差平方和，部表示约束条件个数，『表示样本容眼，A表示未加幽束的模型中被估参数的个数0以椅验建立混合模型还是个体固定效应模型为例，介绍产检脸的.应用.建立假设

珏：

由F.模型中不同个体的截距相同（真实模型为混合模理，

珥：

模型中不同个体的截距项囚不同（真实模型为个体冏定效应模型）q

F统计量定义为；

尾（WS当一£喝｝/[（打一1—的一（AT—N—（S弭—5竭）人M—I）SSE^/iNT-N-k）SSEu/（NT^N^k）

其中用品表示约束模型，即混合估计模型的残差平方和.酩耳表示非约束模型，

即个体固定效应模型的残差平方和.用表示个体个数.（由1）表示约束条件个数口▲*^rIrrin5♦产i#一”穴口j

表示解群变鼠对应参数的个数.

案例1（曲:

5Psm曲02卜199GZ002年中国东北、华北、华东15个省级

地区的居民家庭固定价格的人均消费（CP）和人均收入（TP）数据。

数据是7年的，每一年都有15个数据，共105组观测值&

人均消费和收入两个面板数据都是平衡面板数据，各有15个个体“

以案例1为例，已知SSb=482458乩55^=2270386,个体数150

人（SS..SS4M时-1

展开阅读全文