计量经济学复习要点.docx
《计量经济学复习要点.docx》由会员分享,可在线阅读,更多相关《计量经济学复习要点.docx(14页珍藏版)》请在冰豆网上搜索。
计量经济学复习要点
计量经济学复习要点
参考教材:
李子奈潘文卿《计量经济学》
数据类型:
截面、时间序列、面板
第二章简单线性回归
回归分析的基本概念,常用术语
现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值。
简单线性回归模型是只有一个解释变量的线性回归模型。
回归中的四个重要概念
1.总体回归模型(PopulationRegressionModel,PRM)
--代表了总体变量间的真实关系。
2.总体回归函数(PopulationRegressionFunction,PRF)
--代表了总体变量间的依存规律。
3.样本回归函数(SampleRegressionFunction,SRF)
--代表了样本显示的变量关系。
4.样本回归模型(SampleRegressionModel,SRM)
---代表了样本显示的变量依存规律。
总体回归模型与样本回归模型的主要区别是:
描述的对象不同。
总体回归模型描述总体中变量y与x的相互关系,而样本回归模型描述所关的样本中变量y与x的相互关系。
建立模型的依据不同。
总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的。
模型性质不同。
总体回归模型不是随机模型,而样本回归模型是一个随机模型,它随样本的改变而改变。
总体回归模型与样本回归模型的联系是:
样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型。
线性回归的含义
线性:
被解释变量是关于参数的线性函数(可以不是解释变量的线性函数)
线性回归模型的基本假设
简单线性回归的基本假定:
对模型和变量的假定、对随机扰动项u的假定(零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定)
普通最小二乘法(原理、推导)
最小二乘法估计参数的原则是以“残差平方和最小”。
Min
✍
:
,
OLS估计量的性质
(1)线性:
是指参数估计值
和
分别为观测值
的线性组合。
(2)无偏性:
是指
和
的期望值分别是总体参数
和
。
(3)最优性(最小方差性):
是指最小二乘估计量
和
在在各种线性无偏估计中,具有最小方差。
高斯-马尔可夫定理
OLS参数估计量的概率分布
OLS随机误差项μ的方差σ2的估计
拟合优度的检验R2
离差平方和的分解:
TSS=ESS+RSS
“拟合优度”是模型对样本数据的拟合程度。
检验方法是构造一个可以表征拟合程度的指标——判定系数又称决定系数。
(1)
,表示回归平方和与总离差平方和之比;反映了样本回归线对样本观测值拟合优劣程度的一种描述;
(2)
;
(3)回归模型中所包含的解释变量越多,
越大!
变量显着性检验,t检验
例子:
回归报告
函数形式(对数、半对数模型系数的解释)
(1)
:
X变化一个单位Y的变化
(2)
:
X变化1%,Y变化
%,表示弹性。
(3)
:
X变化一个单位,Y变化百分之100
(4)
:
X变化1%,Y变化
/100。
第三章多元线性回归
1、变量系数的解释(剔除、控制其他因素的影响)
对斜率系数
的解释:
在控制其他解释变量(X2)不变的条件下,X1变化一个单位对Y的影响;或者,在剔除了其他解释变量的影响之后,X1的变化对Y的单独影响!
2、多元线性回归模型中对随机扰动项u的假定,除了零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定以外,还要求满足无多重共线性假定。
3、多元线性回归模型参数的最小二乘估计式;参数估计式的分布性质及期望、方差和标准误差;在基本假定满足的条件下,多元线性回归模型最小二乘估计式是最佳线性无偏估计式。
最小二乘法(OLS)公式:
估计的回归模型:
的方差协方差矩阵:
残差的方差:
的估计的方差协方差矩阵是:
4、修正可决系数的作用和方法。
5、F检验是对多元线性回归模型中所有解释变量联合显着性的检验,F检验是在方差分析基础上进行的。
6、t检验
7、可化为线性回归的模型
8、约束回归
第四章放宽基本假设
一、异方差
什么是异方差
异方差的后果
异方差的检验(White检验)
异方差的处理
加权最小二乘法
异方差稳健标准误
二、序列相关
什么是序列相关
序列相关的后果
序列相关的检验(DW检验、LM检验)
序列相关的处理
广义最小二乘法
Newey-West稳健标准误
三、多重共线性
多重共线性的概念
多重共线性的后果
多重共线性的检验
多重共线性的处理
四、工具变量
什么时候需要工具变量
作为工具变量的条件
两阶段最小二乘法
第5章专门问题
一、虚拟变量
1.虚拟变量的定义:
定性变量(二值与多值);虚拟变量有时候不一定只是0和1;
2.如何引入虚拟变量:
如果一个变量分成N组,引入该变量的虚拟变量形式是只能放入N-1个虚拟变量;
3.虚拟变量系数的解释:
不同组均值的差(基准组或对照组与处理组)
4.以下几种模型形式表达的不同含义;
1)
:
截距项不同;
2)
:
斜率不同;
3)
:
截距项与斜率都不同;
其中D是二值虚拟变量,X是连续的变量。
第八章时间序列
平稳性的概念
白噪声
随机游走
单位根的概念
单位根的检验(ADF检验,ADF的三种形式)
单整
趋势平稳与差分平稳
协整的概念
协整的检验
误差修正模型
Eviews回归结果界面解释表
英文名称
中文名称
常用计算公式
常用相互关系和判断准则
Variable
变量
Coefficient
系数
Sta.Error
标准差
一般是绝对值越小越好
t-statistic
T检验统计量
绝对值大于2时可粗略判断系数通过t检验
Prob
T统计量的P值
P值小于给定显着水平时系数通过t检验
R-squared
AjustedR-squared
S.E.ofregression
扰动项标准差
Sumsquaredresid
残差平方和
Loglikelihood
似然函数对数值
Durbin-Watsonstat
DW统计量
Meandependentvar
应变量样本均值
S.D.dependentvar
应变量样本标准差
Akaikeinfocriterion
AIC准则
一般是越小越好
Schwarzcriterion
SC准则
一般是越小越好
F-statistic
F统计量
Prob(F-statistic)
F统计量的P值
P值小于给定显着水平时模型通过F检验
计量经济学复习题
第二章习题:
1、2、3、5、6、7、9、10、11、12
第三章习题:
1、2、3、4、5、6、7、8、9、10、11、12、13
第四章习题:
2、5、6、8、9、10
第五章习题:
1、2、3、5、6
第八章习题:
1、2、5、6、7、8
1、判断下列表达式是否正确
2、给定一元线性回归模型:
(1)叙述模型的基本假定;
(2)写出参数
和
的最小二乘估计公式;
(3)说明满足基本假定的最小二乘估计量的统计性质;
(4)写出随机扰动项方差的无偏估计公式。
3、对于多元线性计量经济学模型:
(1)该模型的矩阵形式及各矩阵的含义;
(2)对应的样本线性回归模型的矩阵形式;
(3)模型的最小二乘参数估计量。
4、根据美国1961年第一季度至1977年第二季度的数据,我们得到了如下的咖啡需求函数的回归方程:
(-2.14)(1.23)(0.55)(-3.36)(-3.74)(-6.03)(-0.37)
其中,Q=人均咖啡消费量(单位:
磅);P=咖啡的价格(以1967年价格为不变价格);I=人均可支配收入(单位:
千元,以1967年价格为不变价格);
=茶的价格(1/4磅,以1967年价格为不变价格);T=时间趋势变量(1961年第一季度为1,…,1977年第二季度为66);D1=1:
第一季度;D2=1:
第二季度;D3=1:
第三季度。
请回答以下问题:
1模型中P、I和
的系数的经济含义是什么?
2咖啡的需求是否很有弹性?
3咖啡和茶是互补品还是替代品?
4你如何解释时间变量T的系数?
5你如何解释模型中虚拟变量的作用?
6哪一个虚拟变量在统计上是显着的?
7咖啡的需求是否存在季节效应?
5、为研究体重与身高的关系,我们随机抽样调查了51名学生(其中36名男生,15名女生),并得到如下两种回归模型:
(5.1)
t=(-5.2066)(8.6246)
(5.2)
t=(-2.5884)(4.0149)(5.1613)
其中,W(weight)=体重(单位:
磅);h(height)=身高(单位:
英寸)
请回答以下问题:
1你将选择哪一个模型?
为什么?
2如果模型(5.2)确实更好,而你选择了(5.1),你犯了什么错误?
③D的系数说明了什么?
6、以
表示粮食产量,
表示播种面积,
表示化肥施用量,经检验,它们取对数后都是
变量且互相之间存在
关系。
同时经过检验并剔除不显着的变量(包括滞后变量),得到如下粮食生产模型:
(1)
⑴写出长期均衡方程的理论形式;
⑵写出误差修正项ecm的理论形式;
⑶写出误差修正模型的理论形式;
⑷指出误差修正模型中每个待估参数的经济意义。
7、简述异方差对下列各项有何影响:
(1)OLS估计量及其方差;
(2)置信区间;(3)显着性t检验和F检验的使用。
8、假设某研究使用250名男性和280名女性工人的工资(Wage)数据估计出如下OLS回归:
(标准误)(0.23)(0.36)
其中WAGE的单位是美元/小时,Male为男性=1,女性=0的虚拟变量。
用男性和女性的平均收入之差定义工资的性别差距。
(1)性别差距的估计值是多少?
(2)计算截距项和Male系数的t统计量,估计出的性别差距统计显着不为0吗?
(5%显着水平的t统计量临界值为1.96)
(3)样本中女性的平均工资是多少?
男性的呢?
(4)对本回归的R2你有什么评论,它告诉了你什么,没有告诉你什么?
评价这个回归结果?
(5)另一个研究者利用相同的数据,但建立了WAGE对Female的回归,其中Female为女性=1,男性=0的变量。
由此计算出的回归估计是什么?
9、基于人口调查1998年的数据得到平均小时收入对性别、教育和其他特征的回归结果,见下表。
其中:
AHE=平均小时收入;College=二元变量(大学取1,高中取0);Female女性取1,男性取0;Age=年龄(年);Northeast居于东北取1,否则为0;Midwest居于中西取1,否则为0;South居于南部取1,否则为0;West居于西部取1,否则取0。
表1:
基于2004年CPS数据得到的平均小时收入对年龄、性别、教育、地区的回归结果
因变量:
AHE
(1)
(2)
(3)
回归变量
College(X1)
5.46
5.48
5.44
(0.21)
(0.21)
(0.21)
Female(X2)
-2.64
-2.62
-2.62
(0.20)
(0.20)
(0.20)
Age(X3)
0.29
0.29
(0.04)
(0.04)
Northeast(X4)
0.69
(0.30)
Midwest(X5)
0.60
(0.28)
South(X6)
-0.27
(0.26)
截距
12.69
4.40
3.75
(0.14)
(1.05)
(1.06)
概括统计量和联合检验
地区效应=0的F统计量
6.10
注:
F(3,∞)分布,1%显着水平的临界值为:
3.78
SER
6.27
6.22
6.21
R2
0.176
0.190
0.194
N
4000
4000
4000
注:
括号中是标准误。
(1)计算每个回归的调整R2。
(2)利用表1中列
(1)的回归结果回答:
大学毕业的工人平均比高中毕业的工人挣得多吗?
多多少?
这个差距在5%显着性水平下统计显着吗?
男性平均比女性挣的多吗?
多多少?
这个差距在5%显着性水平下统计显着吗?
(3)年龄是收入的重要决定因素吗?
请解释。
使用适当的统计检验来回答。
(4)Sally是29岁女性大学毕业生,Betsy是34岁女性大学毕业生,预测她们的收入。
(5)用列(3)的回归结果回答:
地区间平均收入存在显着差距吗?
利用适当的假设检验解释你的答案。
(6)为什么在回归中省略了回归变量West?
如果加上会怎样。
解释3个地区回归变量的系数的经济含义。
(7)Juantia是南部28岁女性大学毕业生,Jennifer是中西部28岁女性大学毕业生,计算她们收入的期望差距