东北财经的大学博士研究生计量经济学复习备考资料.docx

上传人:b****3 文档编号:26449933 上传时间:2023-06-19 格式:DOCX 页数:24 大小:109.08KB
下载 相关 举报
东北财经的大学博士研究生计量经济学复习备考资料.docx_第1页
第1页 / 共24页
东北财经的大学博士研究生计量经济学复习备考资料.docx_第2页
第2页 / 共24页
东北财经的大学博士研究生计量经济学复习备考资料.docx_第3页
第3页 / 共24页
东北财经的大学博士研究生计量经济学复习备考资料.docx_第4页
第4页 / 共24页
东北财经的大学博士研究生计量经济学复习备考资料.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

东北财经的大学博士研究生计量经济学复习备考资料.docx

《东北财经的大学博士研究生计量经济学复习备考资料.docx》由会员分享,可在线阅读,更多相关《东北财经的大学博士研究生计量经济学复习备考资料.docx(24页珍藏版)》请在冰豆网上搜索。

东北财经的大学博士研究生计量经济学复习备考资料.docx

东北财经的大学博士研究生计量经济学复习备考资料

计量经济学复习资料

一、虚拟变量:

(20分)(给出实际经济问题,根据目标设计虚拟变量,写出模型。

考察一种群体异质。

完整考察如何设计,如何运用到模型中。

注意事项:

(1)注意虚拟变量陷阱是指一般在引入虚拟变量时要求如果有m个定性变量,在模型

中引入m-1个虚拟变量。

否则,如果引入m个虚拟变量,就会导致模型解释变量间出现完全共线性的情况。

我们一般称由于引入虚拟变量个数与定性因素个数相同出现的模型无法估计的问题,称为"虚拟变量陷阱"。

(2)虚拟变量的应用分为两种情况:

虚拟变量做解释变量和虚拟变量做被解释变量(定性相应模型)。

(3)要掌握虚拟变量引入模型的三种方法,即加法模型、乘法模型和既加又乘模型。

1、举例说明如何引进加法模式、乘法模式和既加且乘模型建立虚拟变量模型。

答案:

设Y为个人消费支出;X表示可支配收入,定义

1)如果设定模型为

虚拟变量单独做解释变量,此时模型仅影响截距项,差异表现为截距项的和,因此也称为加法模型。

(2)如果设定模型为

YtB1B2D2tXtB3D3tXtB4D4tXtut虚拟变量与一个数值变量相乘后做解释变量,此时模型仅影响斜率,差异表现为截距项的和,因此也称为乘法模型。

(3)如果设定模型为

此时模型不仅影响截距项,而且还影响斜率项。

差异表现为截距和斜率的双重变化,因此也称为既加且乘模型。

例题1考虑下面的模型:

其中,Y表示

大学教师的年薪收入,X表示工龄。

为了研究大学教师的年薪是否受到性别、学历的影响。

按照下面的方式引入虚拟变量:

(10分)

1.基准类是什么?

2.解释各系数所代表的含义,并预期各系数的符号

3.若B4>B3,你得出什么结论?

答案:

(1)基准类是本科学历的女教师。

2)B0表示刚参加工作的本科学历女教师的收入,所以B0的符号为正。

B1表示在其他条件不变时,工龄变化一个单位所引起的收入的变化,所以B1的符号

为正。

B2表示男教师与女教师的工资差异,所以B2的符号为正。

B3表示硕士学历与本科学历对工资收入的影响,所以B3的符号为正。

B4的符号为正。

B4表示博士学历与本科学历对工资收入的影响,所以

(3)若B4>B3,说明博士学历的大学教师比硕士学历的大学教师收入要高。

例题2性别因素可能对年薪和工龄之间的关系产生影响。

式,并设定出相应的计量经济模型。

性别因素可能对年薪和工龄之间的关系的影响有三种方式。

第一种,性别只影响职工的初始年薪,设定模型为:

第二种八性另咽素影响职工的扣薪机会,设定模型为;

}j=&+;+u.

第三神,性别因素既影响职工的初始年藕也影响加薪机会

试问这种影响可能有几种形

(汾)

模型设定为:

5^=&+号1之^斗产匕+场耳+取(

例题3考虑下面的模型:

其中,Y——MBA毕业生收入,X——工龄。

所有毕业生均来自清华大学,东北财经大学,沈阳工业大学。

(1)基准类是什么?

基准类是东北财经大学MBA毕业生。

你预期各系数的符号如何?

预期B1的符号为正;B2的符号为正;B3的符号为负。

(1)如何解释截距B2、B3?

截距B2反应了清华大学MBA毕业生相对于东北财经大学MBA毕业生收入的差别;截距B3反应了沈阳工业大学MBA毕业生相对于东北财经大学MBA毕业生收入的差别。

(2)若B2>B3,你得出什么结论?

(3)如果B2>B3,我们可以判断清华大学MBA毕业生的收入平均高于沈阳工业大学MBA

毕业生的收入。

二、异方差和自相关问题(25分)

(一)异方差问题

模型,如果出现,对于不同的样本点,随机扰动项的方差不再是常数,而且互不相同,则认为出现了异方差。

在现实经济中,异方差性经常出现,尤其是采用截面数据作样本的计量经济学问题。

例如:

工业企业的研究与发展费用支出同企业的销售和利润之间关系的函数模型;服装需求量与季节、收入之间关系的函数模型;个人储蓄与个人可支配收入之间关系的函数模型等。

检验异方差的主要思路就是检验随机扰动项的方差与解释变量观察值的某种函数形式之间是否存在相关性。

1.异方差的三大后果:

一是最小二乘估计不再是有效估计量,最小二乘法做出的估计量是无偏、线性但不是有效估计量;

二是相关参数的t检验、模型F检验失效;

三是估计量的方差是有偏的,参数或因变量预测的置信区间的估计精度下降(甚至这种区间估计是失效的)。

2、异方差的检验识别:

异方差的产生机制:

截面数据的异方差是由解释变量决定的,因此要找到解释变量与残差方差之间的函数关系,即2ig(xi)

White检验的具体步骤如下。

以二元回归模型为例,

yt=0+1xt1+2xt2+ut

(1)

1首先对上式进行OLS估计参数,求残差u?

t。

2做如下辅助回归式,(包括截距项、一次项、平方项、交叉项)

222u?

t=0+1xt1+2xt2+3xt12+4xt22+5xt1xt2+vt

(2)

即用u?

t2对原回归式

(1)中的各解释变量、解释变量的平方项、交叉积项进行OLS回

归。

求辅助回归式

(2)的拟合系数R2。

3White检验的零假设和备择假设是

H0:

(1)式中的ut不存在异方差,

H1:

(1)式中的ut存在异方差

4在不存在异方差假设条件下构造LM统计量

22

LM=nR22(5)

其中n表示样本容量,R2是辅助回归式

(2)的OLS估计式的拟合系数。

nR2属于LM统计量。

5判别规则是

若nR22(5),接受H0(ut具有同方差)

若nR2>2(5),拒绝H0(ut具有异方差)

说明:

(1)White检验本质上是一个大样本检验,如果实证样本较少(100-300),

由于nR2渐进服从2分布,White检验的可信度不佳,计量经济学暂时没有好办法;

(2)

x>4、n在(100-300)

在多元回归中,为了节省自由度,white检验可以省略交叉项,当

之间时省略交叉项。

 

模型变换控制异方差。

WLS的思想:

如果

2

i未知(通常情况下,

2

i都是未知的,此时用

1

i进行估计,用进行加权)

Ii|

 

 

I1丨

|n|对角阵

21

注:

(1)由于i仅仅是COV(Q的估计,因此用进行加权,可能加权后依然存

Iil

在异方差,此时继续做二次加权;

(2)对于界面数据频发的异方差,且var(i)=2i已知时

同方差:

ols等价于WLS

异方差:

WLS好于OLS故可以直接用WLS(但是不推荐)

最好先用OLS估计,计算如果存在异方差,再用WLS

(二)自相关问题残差相关问题

1.定义:

经典回归假设中i是一个白噪声,即残差时零均值、同方差和无序列相关的。

如果cov(i,j)0,即残差相关。

2.产生原因

线性回归模型中随机误差项存在序列相关的原因很多,但主要是经济变量自身特点、据特点、变量选择及模型函数形式选择引起的。

(1)经济变量惯性的作用引起随机误差项自相关

(2)经济行为的滞后性引起随机误差项自相关

(3)—些随机因素的干扰或影响引起随机误差项自相关

(4)模型设定误差引起随机误差项自相关

(5)观测数据处理引起随机误差项序列相关

3.产生的影响(与异方差相似)

(1)最小二乘估计不再是有效估计量,最小二乘法做出的估计量是无偏、线性但不是

有效估计量;

 

DW值在0-4之间刻画自相关的程度

德斌沃森用穷举法计算了不同的N与解释变量X下DW统计量的两个临界值(Dl和

Du)细节见附录表格

DW检验法的缺陷:

(1)DW只刻画了t和t-1之间的关系,仅适用于一阶自相关,忽

视了t和t-2这种跳跃式的结构;

(2)DW对模型形式本身有要求,要求原始方程必须含

有截距项,模型中不能含有之后被解释变量Yt-1(因变量之后刻画刚性,例如投资;工具

变量经常引入因变量的滞后变量;政策分期效应)

DW的优点:

在小样本情况下,DW检验比较可靠。

①用OLS估计原模型的参数,得到

②用t做一个辅助回归

 

进行显著性检验

问题:

P的确定,制定的阶数P只需要比真实的阶数高就可以了

小样本(500以内)P=4

大样本(大于500)P=6

关于LM检验

有点:

适用于各种自相关(高阶),对模型无限制;LM本质上是一个大样本检验,n

绩效的时候,LM检验的势偏高。

此时用DW。

6.自相关的修正

GLS广义最小二乘法

思想:

原回归模型:

Y

0

1Xtt假设存在一阶自相关t1t1et

(1)Yt0

1Xt

t

(2)Y10

1Xt

1t1

(1)-

(2)得

Yt

Yt1

(1)01(XtXt1)Xt1t

变换为Y;*0*

1X

te满足经典假设

用OLS估计—

*

0

1

1

注:

1.自相关阶数P的确定(推荐试错法)

用试错法,先做一个一阶差分,判断拟差分后的方程是否存在自相关,若存在自相关,做二姐拟差分,再验证是否存在自相关……

2.系相关系数的确定(迭代的思想)

(1)用OLS估计原模型参数,进而得到了;

(2)做一个P阶自回归,t⑴1t12t2pp2et=

(3)用OLS做估计得到⑴

(4)用做GLS估计GLS后的方程,得到—代入原方程,计算t

(2)

(5)重复

(2)—(4),直到前后两次得到高度接近,|(k)(k°|0.005

、定性相应模型(LPM模型Logit模型Probit模型)

定性响应模型是虚拟变量做被解释变量的情形。

(这一块理论性挺强,觉得掌握基本原理、概率的含义、如何将概率方程还原为y关

于x的方程就行)

这类模型处理的问题是因变量是离散数据,即二元选择数据(因变量不是取1就是取0)。

例如家庭买房的决策,是否买房。

1.线性概率模型(LPM

模型的形式如下,

yi=+Xi+ui

其中Ui为随机误差项,Xi为定量解释变量。

yi为二元选择变量。

「1

(若是第一种选择)

yi=«

0

(若是第二种选择)

对yi取期望,

E(yi)=

:

+

Xi

下面研究yi的分布。

因为yi只能取两个值,0和1,所以yi服从两点分布。

把yi的分布记为:

LP(yi=1)=pi

-P(yi=0)=1-pi

EW)=19)+0(1-pi)=pi⑶

(2)和(3)式有

pi=+xi(yi的样本值是0或1,而预测值是概率。

)(4)

则回归系数的含义为x增加一个单位,采用第一种选择的概率增加。

假设用这个模型进行预测,当预测值落在[0,1]区间之内时,则没有什么问题;但当预测值落在[0,1]区间之外时,则会暴露出该模型的严重缺点。

因为概率的取值范围是[0,

1],所以此时必须强令预测值(概率值)相应等于0或1。

线性概率模型常写成如下形式。

{

1,+Xi1

+Xi,0<+Xi<1(5)

0,+Xi0

然而这样做是有问题的。

假设预测某个事件发生的概率等于1,但是实际中该事件可能

根本不会发生。

反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。

虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。

线性概率模型的估计:

使用OLS估计;

检验:

当n极大的时候,残差服从标准正态分布系数也服从标准正态用T检验

当n不好的时候,残差服从两点分布系数服从韦氏分布用Z检验

由于线性概率模型的上述缺点,希望能找到一种变换方法:

(1)使解释变量Xi所对应的所有预测值(概率值)都落在(0,1)之间;

(2)同时对于所有的Xi,当Xi增加时,希望Yi也单调增加或单调减少。

显然累积概率分布函数F(zi)能满足这样的要求。

采用累积正态概率分布函数的模型称作Probit模型。

用正态分布的累积概率作为Probit模型的预测概率。

另外logistic函数也能满足这样的要求。

采用logistic函数的模型称作logit模型。

2.Probit(概率单位)模型

仍假定

对应yi在实轴上的值,相应概率值永远大于更合理。

Probit模型需要假定yi服从正态分布。

0、小于1。

显然Probit模型比Tobit模型

3.logit模型

其形式是

 

对于给定的Xi,pi表示相应个体做出某种选择的概率。

Probit曲线和logit曲线很相似。

两条

曲线都是在pi=0.5处有拐点,但logit曲线在两个尾部要比Probit曲线厚。

logit曲线计算上也比较方便,所以Logit模型比Probit模型更常用。

对上式作如下变换,

pi(1+eyi)=1(8)

对上式除以pi,并减1得

e-yi=丄-1=1匹PiPi

取倒数后,再取对数,

yi=log(B)

1Pi

所以log(0—)=yi=+Xi(9)

1Pi

由上式知回归方程的因变量是对数的某个具体选择的机会比。

logit模型的一个重要优

点是把在[0,1]区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。

logit累积概率分布函数的斜率在pi=0.5时最大,在累积分布两个尾端的斜率逐渐减小。

说明相对于Pi=0.5附近的解释变量Xi的变化对概率的变化影响较大,而相对于pi接近0和

1附近的Xi值的变化对概率的变化影响较小。

对于Logit模型使用极大似然法估计参数是一个很好的选择。

首先分析含有两个参数(

pi=

1=1

1e(为)=1eyi

(10)

yi取值为0或1的信息。

极大和的估计值。

从样本

和)的随机试验。

假设被估计的模型如下

在样本中Pi是观测不到的。

相对于Xi的值,只能得到因变量似然估计的出发点就是寻找样本观测值最有可能发生条件下的

看,如果第一种选择发生了n次,第二种选择发生了N-n次。

设采取第一种选择的概率是

Pi。

采取第二种选择的概率是(1-pi)。

重新将样本数据排列,使前n个观测值为第一种选

择,后N-n个观测值为第二种选择,则似然函数是

L(,)=P(y1,y2,…yN=P(y”P(y2)…P(yN)=P1…pn(1-pn+1)…(1pn)

(11)

(12)

(13)

(14)

i1

in1

分别求上式对和

的偏导数,

并令其为

0,即

「logL=

n/

1Pi

N1

Pi=0

i1Pi

i11Pi

logL=

n“

1Pi

N1

Pi=0

J

i1Pi

i11Pi

一0

nN

logL(,)=logpi+log(1-pi)

=Pi(1Pi)

i1in1

对数似然函数是

便可求到和的极大似然估计值。

和的极大似然估计量具有一致性和渐近有效性,

且都是渐近正态的。

四、标准化回归

1.标准化变量的回归

在多元回归中存在解释变量系数不可比的问题,因为量纲与系数大小有直接的关系,排

除量纲影响后,系数可比。

例如柯布道格拉斯函数YAKL

lnY01lnK2InLi想要比较劳动和资本对产出的影响大小。

对于多元线性回归需要对各个自变量进行标准化,排除单位的影响。

标准化方法:

即将原始数据减去相应变量的均数后再除以该变量的标准差,而标准化得

到的回归方程称为标准化回归方程,相应得回归系数为标准化回归系数。

在Y对X的回归中,把变量重新定义为标准化变量:

Y*口X*XiX

iSyiSx

标准化变量的特征是均值为0,标准差总是1,标准化使所有变量都处于同一标准之下。

对于双变量线性回归来说,我们对标准化变量做回归:

****

Y12XiUi2XiUi

因为对标准化的被解释变量和解释变量做回归,所以截距项为0.

2.Wald检验(此处不甚理解见谅按照潘老师将的内容整理)

例如柯布道格拉斯函数YAKL

Y01Xi2Zii想要比较劳动和资本对产出的影响大小。

原假设:

Ho:

2(约束条件)

 

若约束条件成立:

Y

01(XiZi)iRSS受

 

 

若约束条件不成立:

Y0lXi2ZiiRSS无

k是无约束代入参数的个数

构造统计量(RSSc-RSSe)/约束条件的个数

RSS无/nk

该统计量服从F分布

进行显著性检验

接受原假设时,二者相等

 

拒绝原假设时,二者不等,可以根据

1和2的估计值判断其对丫的贡献大小。

 

给定经济现象,请选择解释变量,设定模型

15分)

五、建模问题

 

主要考点:

(1)被解释变量(注意被解释变量的测量问题);

(2)解释变量有哪些;

(3)为什么引入这些变量;

(4)解释变量如何度量?

(虚拟or数值);

(5)写出具体的模型形式;

(6)判断经济显著性,即预期符号。

举例子:

博学楼6:

00-9:

00自习室上座率。

1.变量选取和数据获得

被解释变量:

y:

博学楼6:

00-9:

00自习室上座率

y=上自习人数/座位数*100%

测度方法:

调查取得;

X1:

在校研究生人数(博士+硕士)

%=在校博士生人数+在校硕士生人数

选取理由:

因为博学楼主要是研究生的学习场所

测度方法:

根据入学注册人数-毕业人数-辍学人数;

X2:

居住地离博学楼距离

则一般情况不会

选取理由:

在校研究生分为住校和不住校,原则上居住地离学校过远,

选择来博学楼上自习

X2=具体里程数

测度方法:

调查取得;

D:

是否假期

选取理由:

与学期相比,假期在校的学生人数明显减少;

1「正常学期

D仁]0寒暑假

根据学校校历

D2:

是否临近考试

选取理由:

临近考试,自习室上座率会增加

1每学期16周-19周

D2=L其他

根据学校校历

2.模型构建

丫二o+1X1

2X2

3D1

4D2(5D1

6D2)X1(5D1

6D2)X2

 

3.判断经济显著性,即预期符号:

X1:

预期符号为正,理论上在校研究生人数越多,上座率越高;

X2:

预期符号为负,理论上居住地离博学楼距离越远,上座率越低;

D1:

预期符号为正,理论上正常学期与假期相比,上座率高;

D2:

预期符号为正,理论上越是临近考试,上座率越高。

根据下面例子练习一下:

试指出在目前建立中国宏观计量经济模型时,下列内生变量应由哪些变量来解释,简单

说明理由,并拟定关于每个解释变量的待估参数的正负号。

(1)轻工业增加值;

(2)衣着类商品价格指数;(3)农业生产资料进口额

答:

(1)轻工业增加值应该由反映需求的变量解释。

包括居民收入(反映居民对轻工业的消费需求,参数符号为正)、国际市场轻工业品交易总额(反映国际市场对轻工业的需求,参数符号为正)等。

(2)衣着类商品价格指数应该由反映需求和反映成本的两类变量解释。

主要包括居民

收入(反映居民对衣着类商品的消费需求,参数符号为正)、国际市场衣着类商品交易总额

(反映国际市场对衣着类商品的需求,参数符号为正)、棉花的收购价格指数(反映成本对

价格的影响,参数符号为正)等。

(3)农业生产资料进口额应该由国内第一产业增加值(反映国内需求,参数符号为正)

国内农业生产资料生产部门增加值(反映国内供给,参数符号为负)、国际市场价格(参数符号为负)、出口额(反映外汇支付能力,参数符号为正)等变量解释。

六、简答题

(一)工具变量

在模型估计过程中被作为工具使用,以替代模型中与误差项相关的随机解释变量的变量,称为工具变量。

作为工具变量,必须满足下述四个条件:

(1)与所替的随机解释变量高度相关;

(2)与随机误差项不相关;

(3)与模型中其他解释变量不相关;

(4)同一模型中需要引入多个工具变量时,这些工具变量之间不相关。

工具变量在解决内生性问题、多重共线性问题方面都有应用。

在时间序列模型中,经常使用滞后一期的因变量作为工具变量,这也会导自相关问题中

使用DW(德斌沃森)检验时因为模型形式不符合而使DW检验存在缺陷。

工具变量的选择只要掌握一个关键点就行:

找一个和内生性变量有数据相关的,但是和

残差没有关系的东西,这就是你的IV了。

例如贸易量如果是内生的,那么你找地理距离作

为IV。

北京到纽约的距离,那是自然形成的,你会发现贸易量和地理距离在数据上具有相关性。

这就很好。

这种数据相关性越强,IV的效果就越好。

(二)共线性问题

1.定义

多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

2.产生原因

(1)经济变量之间的内在联系是多重共线性产生的根本原因,例如许多经济变量变现为同向化的趋势(消费、收入、储蓄、投资、就业都随着经济的增长或衰退产生同向化的变化)、在时间序列模型中回归元之间也经常存在着相同的时间趋势;

(2)模型设定时将滞后变量作为解释变量,易产生多重共线性;

(3)模型中解释变量的个数大于观测次数,例如在医药研究中从少数的病人身上搜集大量的信息,易产生共线性问题。

3.不良后果

(1)完全共线性下参数估计量不存在;

(2)近似共线性下OLS估计量方差变大,非有效(方差膨胀);

(3)变量的显著性检验失去意义(由于估计量的方差膨胀,导致其标准差增大,从而

T检验的T值降低,估计值不显著的概率上升,进而导致关键变量不显著,使假设检验失去意义。

4.识别方法

(1)经验识别:

对模型估计后,R2极高,多个变量不显著,出现与理论预期相悖的情况,有理由怀疑存在多重共线性。

(2)相关系数法:

计算解释变量间两两相关系数。

只要其中一个大等于0.65-0.7,则

表明可能存在严重的共线性。

注意:

不要计算简单相关系数,目前推荐使用佩尔森相关系数。

不足之处是只能证有,不能证无。

(3)膨胀因子法:

计算每个解释变量的VIF,若某一个VIF>10,则表明存在严重的共线性。

(4)Klein法则:

每个解释变量对其余所有解释变量做辅助回归,如Max(R辅)>R原,则共线性严重到要处理。

5、修正

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 可爱清新

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1