计量经济学 马少康老师.docx
《计量经济学 马少康老师.docx》由会员分享,可在线阅读,更多相关《计量经济学 马少康老师.docx(23页珍藏版)》请在冰豆网上搜索。
计量经济学马少康老师
考题:
单选题20题×2’多选题5题×2’
简答题共四题,2题×5’,2题×10’计算题2题×10’
第一章:
单选
一.建立计量经济学模型的步骤和要点
1、理论模型的设计2、样本数据的收集3、模型参数的估计4、模型的检验
5、计量经济学模型成功的三要素
二.理论模型的建立:
、Y为被解释变量(explainedor
dependentvariable)X为解释变量(explanatoryorindependentvariables)
四项任务:
1.确定模型包含的变量(依据经济学理论——理论导向;在时间序列数据样本下可以应用协整检验、Granger因果统计检验等方法——数据导向;分析经济活动中的动力学关系——关系论导向;不遗漏显著的变量;考虑数据的可得性;考虑入选变量之间的关系。
);2.确定模型的数学形式(利用经济学和数理经济学的成果,根据样本数据作出的变量关系图,选择可能的形式模拟);3.确定随机扰动项的概率分布特性;4.拟定模型中待估计参数的理论期望值区间
三.样本数据的收集
⑴几类常用的样本数据:
时间数列数据、截面数据和虚变量数据。
⑵数据质量:
完整性;准确性;可比性;一致性
四.模型的检验
⑴经济意义检验:
根据拟定的符号、大小、关系,对参数估计结果的可靠性进行判断。
⑵统计检验(拟合优度检验;总体显著性检验;变量显著性检验)
(3)计量学检验(异方差性检验;序列相关性检验;共线性检验)
五.计量经济学模型成功的三要素:
理论、数据、方法
六.计量经济学模型的应用:
1.结构分析(前提是模型设定和统计推断都是正确的。
)
2.经济预测(经济预测不应该成为计量经济学模型的主要应用领域。
)
3.政策评价(政策评价应该成为计量经济学模型的主要应用领域。
政策有效性评价;政策效果评价;政策传导路径检验;政策模拟;宏观经济政策的微观效果评价;政策选择;辅助政策制定)
4.理论检验与发展(正确理解“证伪”和“证实”的不对称性。
经验检验是建立在经济意义和统计意义不对称性、证伪和证实不对称性的基础之上的。
)
第二章:
简答及选择,计算
一.相关分析与回归分析(简答及选择)
对变量间统计依赖关系的考察主要是通过相关分析或回归分析来完成的。
相关分析:
主要研究随机变量间的相关形式及相关程度。
适用于所有统计关系;对称地对待任何(两个)变量,两个变量都被看作是随机的。
回归分析:
是研究一个变量关于另一个(些)变量的依赖关系的计算方法和理论。
仅对存在因果关系而言。
其目的在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。
对变量的处理方法存在不对称性,即区分因变量(被解释变量)和自变量(解释变量),前者是随机变量,后者不一定是。
回归分析构成计量经济学的方法论基础,其主要内容包括:
根据样本观察值对经济计量模型参数进行估计,求得回归方程;对回归方程、参数估计值进行显著性检验;利用回归方程进行分析、评价及预测。
二.简述相关分析和回归分析的联系和区别。
(如果这里考简答题…猜想。
)
答:
相关分析与回归分析既有联系又有区别。
首先,两者都是研究非确定性变量间的的统计依赖关系,并能测度线性依赖程度的大小。
其次,两者间又有明显的区别。
相关分析仅仅是从统计数据上测度变量间的相关程度,而无需考察两者间是否有因果关系,因此,变量的地位在相关分析中式对称的,而且都是随机变量;回归分析则更关注具有统计相关关系的变量间的因果关系分析,变量的地位是不对称的,有解释变量和被解释变量之分,而且解释变量也往往被假设为非随机变量。
再次,相关分析只关注变量间的联系程度,不关注具体的依赖关系;而回归分析则更加关注变量间的具体依赖关系,因此可以进一步通过解释变量的变化来估计或预测被解释变量的变化,达到深入分析变量间依存关系,掌握其运动规律的目的。
三.不存在线性相关并不意味着不相关。
存在相关关系并不一定存在因果关系。
(选择)
四.计量经济学模型的四种表达方式(简答及选择)
1.总体回归模型:
被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。
由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型(PRM)。
i=1,2…,n
2.样本回归模型:
从一次抽样中获得的总体回归函数的近似,称为样本回归函数;样本回归函数的随机形式,称为样本回归模型
3.一元线性回归模型
4.多元线性回归模型:
在线性回归模型中的解释变量有多个,至少开始是这样。
这样的模型被称为多元线性回归模型。
五.最小二乘的基本假定:
以下假设主要是针对采用普通最小二乘法估计而提出(选择)
1、关于模型关系的假设
模型设定正确假设。
线性回归假设:
2、关于解释变量的假设
确定性假设。
随机项不相关假设:
由确定性假设可以推断。
E(i)=0i=1,2,…,n;Cov(i,j)=0i≠ji,j=1,2,…,n
观测值变化假设。
无完全共线性假设。
样本方差假设:
随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。
3、关于随机项的假设
0均值假设:
由模型设定正确假设推断
同方差假设。
Var(i)=2i=1,2,…,n;
序列不相关假设。
4、随机项的正态性假设
正态性假设。
i~N(0,2)i=1,2,…,n
5、CLRM和CNLRM
六.参数估计的OLS(普通最小二乘法OrdinaryLeastSquares)原理及推导(简答)(此题推导具体看书本P34和PPT)
1、普通最小二乘原理
根据被解释变量的所有观测值与估计值之差的平方和最小的原则求得参数估计量。
简单求和可能将很大的误差抵消掉,只有平方和才能反应二者在总体上的接近程度。
推导:
当Q对0,1的一阶偏导数为0时,Q到到最小,即可推出用语估计0,1的下列方程组;该关于参数估计量的线性方程组称为正规方程组
求解正规方程组得到结构参数的普通最小二乘估计量及其离差形式:
也可以写成
分布参数的普通最小二乘估计量
七.最小二乘估计量的统计性质(简答)
(1)线性性,即它是否是另一随机变量的线性函数;
(2)无偏性,即它的均值或期望值是否等于总体的真实值;
(3)有效性,即它是否在所有线性无偏估计量中具有最小方差。
这三个准则也称作估计量的小样本性质。
拥有这类性质的估计量称为最佳线性无偏估计量
(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;
(5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;
(6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。
当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质
八.拟合优度检验的含义(选择):
对样本回归直线与样本观测值之间拟合程度的检验。
九.可决系数统计量的公式(选择和计算)
是一个非负的统计量。
取值范围:
[0,1]
越接近1,说明实际观测点离回归线越近,拟合优度越高。
随着抽样的不同而不同。
十.变量的显著性检验(原理、检验结果的判断)(选择和计算)
原理:
在一元线性模型中,变量的显著性检验就是判断X是否对Y具有显著的线性性影响。
变量的显著性检验所应用的方法是数理统计学中的假设检验。
通过检验变量的参数真值是否为零来实现显著性检验。
变量显著性检验的步骤
答:
(1)对总体参数提出假设H0:
1=0,H1:
10
(2)以原假设H0构造t统计量,并由样本计算其值:
(3)给定显著性水平,查t分布表得临界值t/2(n-2)
(4)比较,判断
若|t|>t/2(n-2),则拒绝H0,接受H1;
若|t|t/2(n-2),则接受H0,拒绝H1;
对于一元线性回归方程中的0,也可构造如下t统计量进行显著性检验
注:
老师PPT中有这样一句话:
自学教材p48例题,学会检验的全过程
十一.置信区间的估计(计算公式、缩小置信区间的方法)(选择和计算)(具体看P49和PPT)
计算公式:
如果存在这样一个区间,称之为置信区间;1-称为置信系数(置信度),称为显著性水平;置信区间的端点称为置信限。
PPT例题:
一个假想的社区有99户家庭组成,欲研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。
即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。
由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布是已知的,例如:
P(Y=561|X=800)=1/4。
因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditionalmean)或条件期望(conditionalexpectation):
E(Y|X=Xi)。
该例中:
E(Y|X=800)=605
将居民消费支出看成是其可支配收入的线性函数时:
在上述收入-消费支出例题中,如果给定=0.01,查表得:
由于
于是,1、0的置信区间分别为:
(0.6056,0.7344)
(-6.719,291.52)
显然,在该例题中,我们对结果的正确陈述应该是:
边际消费倾向β1是以99%的置信度处于以0.670为中心的区间(0.6056,0.7344)中。
回答:
边际消费倾向等于0.670的置信度是多少?
边际消费倾向以100%的置信度处于什么区间?
缩小置信区间的方法:
1.增大样本容量n。
因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;
2.提高模型的拟合优度。
因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和越小。
第三章:
选择及简答、计算
一.多元线性回归模型的基本假定(选择)
1.关于模型关系的假设
模型设定正确假设
线性回归假设
2、关于解释变量的假设
确定性假设:
解释变量X是确定性变量,不是随机变量,在重复抽样中取固定值。
随机项不相关假设:
由确定性假设可以推断。
无完全多重共线性假设:
各解释变量之间不存在严格线性相关性;适用于多元线性回归模型。
样本方差假设:
随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。
3、关于随机项的假设
0均值假设:
给定X的条件下,随机误差项的均值为0.
同方差假设:
给定X的条件下,对所有观测,方差都是相同的。
序列不相关假设:
各随机误差项之间无自相关性
注:
多元线性回归模型的基本假设是什么?
提示:
一般表达式式和矩阵符号表达式。
二.最小二乘原理及参数估计(简答)
原理:
根据被解释变量的所有观测值与估计值之差的平方和最小的原则求得参数估计量。
即是残差平方和最小的参数估计量。
最小二乘参数估计:
即利用系统的输入输出得到参数估计的表达方式:
1.正规方程组的矩阵形式,参数的最小二乘估计值为:
正规方程组的另外一种写法:
2.离差形式的普通最小二乘估计法
3.随机误差项的方差的无偏估计=
三.最小二乘估计量的统计性质(简答)(和第二章问题一样,答案无出入)
四.拟合优度检验(选择)
对样本回归直线与样本观测值之间拟合程度的检验。
如何检验:
构造统计量——统计量只能是相对量
五.方程显著性的F检验(原理、统计量、检验结果的判断)(选择及计算)
方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。
在多元模型中,即检验模型中的参数j是否显著不为0。
在原假设H0成立的条件下,统计量
给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,通过
FF(k,n-k-1)或FF(k,n-k-1)
来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立。
六.变量显著性的t检验(原理、统计量、检验结果的判断)(选择及计算)(此题和第二章问题一样。
公式有些许出入)
方程的总体线性关系显著不等于每个解释变量对被解释变量的影响都是显著的。
必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。
这一检验是由对变量的t检验完成的。
t统计量
t检验
设计原假设与备择假设:
H0:
i=0(i=1,2…k);H1:
i0
给定显著性水平,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过
|t|t/2(n-k-1)或|t|t/2(n-k-1)
判断拒绝或不拒绝原假设H0,从而判定对应的解释变量是否应包括在模型中。
七.参数置信区间(计算公式、缩小置信区间的方法)(此题与第二章问题一样。
答案的最后有些许出入。
)(选择和计算)
如果存在这样一个区间,称之为置信区间;1-称为置信系数(置信度),称为显著性水平;置信区间的端点称为置信限。
缩小置信区间的方法:
增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小。
提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。
提高样本观测值的分散度,一般情况下,样本观测值越分散,(X’X)-1的分母的|X’X|的值越大,致使区间缩小。
八.线性化为非线性的方法有几种(选择)
1、倒数模型、多项式模型与变量的直接置换法
2、幂函数模型、指数函数模型与对数变换法
3、复杂函数模型与级数展开法
第四章选择和计算
一.四种违背基本假定的情况(需要掌握其定义、产生的原因(实际经济问题中)、后果、检验的方法、修正的方法。
)
(1)随机误差项序列存在异方差性;
(2)随机误差项序列存在序列相关性;
(3)解释变量之间存在多重共线性;
(4)解释变量是随机变量且与随机干扰项相关
二.异方差性(计算案例见P116)
定义:
即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性
实际经济问题中的异方差性
例4.1.1:
截面资料下研究居民家庭的储蓄行为
Yi=0+1Xi+i
Yi:
第i个家庭的储蓄额Xi:
第i个家庭的可支配收入
高收入家庭:
储蓄的差异较大;
低收入家庭:
储蓄则更有规律性,差异较小。
i的方差呈现单调递增型变化
以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:
Ci=0+1Yi+I
将居民按照收入等距离分成n组,取组平均数为样本观测值。
一般情况下,居民收入服从正态分布:
中等收入组人数多,两端收入组人数少。
而人数多的组平均数的误差小,人数少的组平均数的误差大。
样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起随机项的异方差性,且呈U形
例4.1.3:
以某一行业的企业为样本建立企业生产函数模型
Yi=Ai1Ki2Li3eI
被解释变量:
产出量Y,解释变量:
资本K、劳动L、技术A。
每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
对于不同的企业,它们对产出量的影响程度不同,造成了随机误差项的异方差性。
随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
后果:
1.参数估计量非有效:
OLS估计量仍然具有无偏性,但不具有有效性。
因为在有效性证明中利用了E(’)=2I而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。
2.变量的显著性检验失去意义
变量的显著性检验中,构造了t统计量
3、模型的预测失效:
当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
检验的方法:
1、检验思路
2、图示法
(1)用X-Y的散点图进行判断
看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)。
3.帕克(Park)检验与戈里瑟检验:
选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。
4、戈德菲尔德-匡特。
)检验
G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。
先将样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。
由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)或小于1(递减方差)。
5、怀特(White)检验
修正的方法:
1.加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。
2.如何得到2W?
一种可行的方法:
对原模型进行OLS估计,得到随机误差项的近似估计量ěi,以此构成权矩阵的估计量。
即
3、异方差稳健标准误法
应用软件中推荐的一种选择。
适合样本容量足够大的情况。
仍然采用OLS,但对OLS估计量的标准差进行修正。
与不附加选择的OLS估计比较,参数估计量没有变化,但是参数估计量的方差和标准差变化明显。
即使存在异方差、仍然采用OLS估计时,变量的显著性检验有效,预测有效。
三.序列相关性(计算案例见P132)
定义:
模型随机项之间不存在相关性,称为:
NoAutocorrelation。
以截面数据为样本时,如果模型随机项之间存在相关性,称为:
SpatialAutocorrelation。
以时序数据为样本时,如果模型随机项之间存在相关性,称为:
SerialAutocorrelation。
习惯上统称为序列相关性
实际经济问题中的序列相关性
没有包含在解释变量中的经济变量固有的惯性。
模型设定偏误(Specificationerror)。
主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。
数据的“编造”。
时间序列数据作为样本时,一般都存在序列相关性。
截面数据作为样本时,一般不考虑序列相关性。
后果:
与异方差性引起的后果相同:
参数估计量非有效
变量的显著性检验失去意义
模型的预测失效
检验的方法:
1、检验方法的思路
2、图示法
3、回归检验法
;
。
。
。
如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性
回归检验法的优点是:
能够确定序列相关的形式;适用于任何类型序列相关性问题的检验
4、杜宾-瓦森(Durbin-Watson)检验法
该方法的假定条件是:
解释变量X非随机;随机误差项i为一阶自回归形式:
i=i-1+I;
回归模型中不应含有滞后应变量作为解释变量;回归含有截距项。
对原模型进行OLS估计,用残差的近似值构造统计量。
D.W.统计量:
H0:
=0
该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。
但是,他们成功地导出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。
5、拉格朗日乘数检验
适合于高阶序列相关以及模型中存在滞后被解释变量的情形。
对原模型进行OLS估计,用残差近似值的辅助回归模型的可决系数构造统计量。
修正的方法:
1、广义最小二乘法(GLS)GLS的原理与WLS相同,只是将权矩阵W换为方差协方差矩阵Ω。
2、广义差分法:
是将原模型变换为满足OLS法的差分模型,再进行OLS估计
3、随机误差项相关系数的估计
应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数1,2,…,L。
实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。
常用的估计方法有:
科克伦-奥科特(Cochrane-Orcutt)迭代法;杜宾(durbin)两步法
4、稳健标准误法
应用软件中推荐的一种选择。
适合样本容量足够大的情况。
仍然采用OLS,但对OLS估计量的标准差进行修正。
与不附加选择的OLS估计比较,参数估计量没有变化,但是参数估计量的方差和标准差变化明显。
致使存在异方差和序列相关、仍然采用OLS估计时,变量的显著性检验有效
应用软件中的广义差分法
在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。
在解释变量中引入AR
(1)、AR
(2)、…,即可得到参数和ρ1、ρ2、…的估计值。
其中AR(m)表示随机误差项的m阶自回归。
在估计过程中自动完成了ρ1、ρ2、…的迭代。
5、虚假序列相关问题
由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(falseautocorrelation),应在模型设定中排除。
避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。
四.多重共线性(计算案例P140)
定义:
如果某两个或多个解释变量之间出现了相关性,则称为多重共线性
产生的原因:
(1)经济变量相关的共同趋势
(2)滞后变量的引入(3)样本资料的限制
后果:
1.完全共线性下参数估计量不存在
;
如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。
2、近似共线性下OLS估计量非有效
近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为
由于|X’X|0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。
3、参数估计量经济含义不合理
4、变量的显著性检验失去意义:
可能将重要的解释变量排除在模型之外
5、模型的预测功能失效:
变大的方差容易使区间预测的“区间”变大,使预测失去意义。
检验的方法:
判定系数检验法、逐步回归检验法
1、检验多重共线性是否存在
(1)对两个解释变量的模型,采用简单相关系数法
求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。
(2)对多个解释变量的模型,采用综合统计检验法
如果在OLS法下,R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。
2、判明存在多重共线性的范围
(1)判定系数检验法
使模型中每一个解释变量分别以其余解释变量为解释变量进行辅助回归(AuxiliaryRegression),并计算相应的拟合优度。
如果某一种回归Xji=1X1i+2X2i+LXLi的判定系数较大,说明Xj与其他X间存在共线性。
可以构造F检验:
(2)排除变量法
在模型中排除某一个解释变量Xj,估计模型;
如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。
(3)逐步回归法
以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。
根据拟合优度的变化决定新引入的变量是否独立。
如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;
如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。
修正的方法:
1、第一类方法:
排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除。
所以逐步回归法得到最广泛的应用。
注意:
剩余解释变量参数的经济含义和数值都发生了变化。
2、第二类方法:
差分法
时间序列数据为样本的线性模型;将原模型变换为