计量经济学案例分析报告Word文档格式.docx
《计量经济学案例分析报告Word文档格式.docx》由会员分享,可在线阅读,更多相关《计量经济学案例分析报告Word文档格式.docx(14页珍藏版)》请在冰豆网上搜索。
3用OLS估计15
4自相关其他检验15
5消除自相关16
第七章分布滞后模型与自回归模型案例18
7.2案例119
1问题引入19
2模型设定19
3参数估计19
7.3案例220
1问题引入21
2模型设定21
3、回归分析21
4模型检验23
第八章虚拟变量回归案例23
1问题引入24
2模型设定24
3参数估计26
4模型检验27
第2章简单线性回归模型案例
1、问题引入
居民消费在社会经济的持续发展中有着重要的作用。
适度的居民消费规模和合理的消费模型是人民生活水平的具体体现,有利于经济持续健康的增长。
随着社会信息化程度和居民的收入水平的提高,计算机的运用越来越普及,作为居民耐用消费品重要代表的计算机已经为众多的城镇居民家庭所拥有。
研究中国各地区城镇居民计算机拥有量与居民收入水平的数量关系。
影响居民计算机拥有量的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入水平。
从理论上说居民收入水平越高,居民计算机拥有量越多。
所以我们设定“城镇居民家庭平均每百户计算机拥有量(台)”为被解释变量,“城镇居民平均每人全年家庭总收入(元)”为解释变量。
2、模型设定
(1)对数据X和Y的统计结果的描述
图表2-1:
X和Y的描述统计结果
(2)X和Y的散点图及分析
图表2-2:
各地区城镇居民每百户计算机拥有量与人均总收入的散点图
分析:
从散点图2-2中,可以看出各地区城镇居民计算机拥有量随着人均总收入水平的提高而增加,近似于线性关系,为分析中国各地区城镇居民每百户计算机拥有量随人均总收入变动的数量规律性,可以考虑建立如下简单线性回归模型:
3、估计参数
图表2-3:
回归结果
可用规范的形式将参数估计和检验的结果写为
4、模型检验
(1)经济意义检验
所估计的参数
=11.9580,
=0.002873,说明城镇居民家庭人均总收入每增加1元,平均说来城镇居民每百户计算机拥有量将增加0.002873台,这与预期的经济意义相符。
(2)拟合优度和统计检验
由拟合优度R2=0.831996可知,所建立的模型对样本数据的拟合度较高。
对回归参数的显著性检验——t检验:
对β1建立下列假设条件:
原假设H0:
β1=0备择假设H1:
β1≠0
取α=0.05,β1服从t~(29),P值检验的结果是0.0421<
0.05,所以应该拒绝原假设β1=0,接受备择假设β1≠0,说明β1对被解释变量有显著性影响。
对β2建立下列假设条件:
β2=0备择假设H1:
β2≠0
取α=0.05,β2服从t~(29),P值检验的结果是0.0000<
0.05,所以应该拒绝原假设β2=0,接受备择假设β2≠0,说明解释变量城镇居民平均每人家庭总收入对被解释变量城镇居民平均每百户计算机拥有量有显著影响。
图表2-4:
剩余项、实际值、拟合值图形
第3章多元线性回归模型案例
改革开放以来,中国经济增长迅速,各级政府对教育的投入不断增加,2012年,各级政府的教育的支出达到国内生产总值的4%,其中地方支出占约94%。
为了研究影响中国地方财政教育支出差异的主要原因,分析地方财政教育支出增的数量规律,预测中国地方财政教育支出的增长趋势。
总结了影响中国地方财政教育支出的主要的因素有:
(1)由地区经济规模决定的地方整体财力;
(2)地区人口数量不同决定各地教育规模不同;
(3)人民对教育质量的需求对以政府教育投入为代表的公共财政的需求会有相当的
影响。
(4)物价水平,影响地方财政对教育的支出。
(5)地方政府对教育投入的能力与意愿
研究范围:
2011年31个省市区的数据为样本。
(1)地方财政教育支出及影响因素
图表3-1:
地方财政教育支出及影响因素数据图形
从上图可以看出,各地区地方财政教育经费支出及各影响因素的差异明显,其变动的方向基本相同,相互间可能具有一定的相关性。
探索将模型设定为线性回归模型形式:
图表3-2:
由上图中数据,模型估计的结果写为:
(1)经济意义检验:
在假定其它变量不变的情况下,
地区生产总值(GDP)每增长1亿元,平均说来地方财政教育支出将增长0.0112亿元;
地区年末人口每增长1万人,平均说来地方财政教育支出会增长0.0395亿元;
当居民平均每人教育现金消费增加1元,平均说来地方财政教育支出会增长0.1460亿元;
当居民教育消费价格指数增加1个百分点,平均说来地方财政教育支出会增长22.8162亿元。
当教育支出在地方财政支出中的比重增加1%,平均说来地方财政教育支出会增长866.41亿元。
(2)统计检验
拟合优度:
,修正的可决系数为
,说明模型对样本的拟合很好。
F检验:
给定显著性水平α=0.05,查F分布表自由度为k-1=5和n-k=25的临界值为
,由于F=181.7539>
2.61,应拒绝原假设,说明回归方程整体显著。
t检验:
在显著性水平α=0.05时从
到
的t统计量对应的P值分别是0.0161,0.0000,0.0000,0.0091,0.0189,均小于0.05,所以是显著地。
的t统计量对应的P值为0.0773>
0.05,而0.0773<
0.1,说明在α=0.05,时“教育支出在地方财政支出中的比重”对地方财政教育支出没有显著影响,而在α=0.10时,有显著影响。
第4章多重线性案例
1、问题引入
近年来,中国旅游业一直保持高速发展,旅游业作为国民经济的新增长点,在整个社会经济的发展中的作用日益明显。
中国的旅游业分为国内旅游和入境旅游两袋市场,入境旅游外汇收入年均增长22.6%,与此同时,国内旅游业迅速增长。
为了规划中国未来国内旅游产业的发展,需要定量地分析影响中国国内旅游市场发展的主要因素。
经分析,影响国内旅游市场收入的主要要是,除了国内旅游人数和旅游支出以为,可能与相关基础设施有关。
为此设定变量如下:
被解释变量为:
第t年全国国内旅游收入-Yt
影响因素有:
国内旅游人数X2
城镇居民人均旅游支出X3
农村居民人均旅游支出X4
基础设施-铁路里程X5
所以设定多元线性回归模型:
3、参数估计
图表4-1:
OLS回归结果
该模型
=0.9814,拟合程度较好,F检验值225.8475,明显显著。
但是在显著性水平
=0.05时,x2的系数不显著。
而且x3,x5的符号与预期相反,这表明可能存在严重的多重共线性。
图表4-3:
相关系数矩阵
可以看出,各解释变量相互之间相关系数较高,确定存在一定的共线性,通过辅助回归得出各个回归的可决系数和方差扩大因子:
被解释变量
可决系数R²
的值
方差扩大因子
X2
0.9285
13.9860
X3
0.8315
5.9347
X4
0.7902
4.7664
X5
0.9615
25.9740
方差扩大因子大于10时,相应解释变量与其余解释变量间有共线性,由此可知X3。
X5有严重的共线性
4、对多重共线性的处理
图后补
估计结果为:
ln
=-8.4495+0.9168lnX2+0.4136lnX3+0.2890lnX4+0.9982lnX5
(0.6050)(0.0936)(0.1390)(0.0459)(0.4209)
t=(-13.97)(9.80)(2.98)(6.30)(2.37)
P(t)=(0.0000)(0.0000)(0.0107)(0.0000)(0.0338)
=0.9972F=1550.58P(F)=0.0000
该模型可决系数较高,F检验值为1550.58,明显显著,各系数也显著。
说明消除了多重共线性。
对系数估计值的解释:
在其他变量保持不变的情况下,如果旅游人数每增加1%,则国内旅游收入平均增加0.92%;
如果城镇居民旅游支出每增加1%,则国内旅游收入平均增加0.41%;
如果农村居民旅游支出每增加1%,则国内旅游收入平均增加0.29%;
如果铁路里程每增加1%,则国内旅游收入平均增加1%。
所有的检验变量的符号都与先验预期相一致,及旅游人数、城乡居民旅游支出和铁路里程都与国内旅游收入正相关。
第5章异方差性案例
为了给制定医疗机构的规划提供依据,分析医疗机构与人口数量之间的关系。
建立卫生医疗机构数与人口数之间的回归模型。
以四川省2000年各地区医疗机构数与人口数。
为实验研究范围。
被解释变量:
卫生医疗机构数-Y
解释变量:
人口数-X
理论模型设定为:
=
+
图表5-1:
估计结果为:
=-562.9074+5.3728
(291.5642)(0.6442)
t=(-1.9306)(8.3398)
=0.7854F=69.5525
该模型结果认为人口数量每增加1万人,平均医疗机构将增加5.37个,与实际情况不相符,所以该模型可能存在异方差。
4、异方差检验
(1)图形法
让e2=resid^2,做e2和X的散点图如下:
图表5-2:
散点图
由图5-2可以看出,残差平方e2对解释变量x的散点图主要分布在图形中的下三角部分,大致看出残差平方e2随X的变动呈增大的趋势,因此,模型很可能存在异方差。
但是否确实存在异方差还应通过更进一步的检验。
(2)Goldfeld-Quanadt检验
先将变量按递增性排序,样本容量为21,剔除中间5各样本,剩下的平分为两个子样本:
1-8和14-21.
1-8样本的OLS估计结果如下:
图表5-3:
样本区间1-8的回归结果
在对14-21样本的OLS估计结果如下:
图表5-4:
样本区间14-21的回归结果
求F统计量值:
由图5-3和图5-4可以得到两个子样本的残差平方和,计算F统计量为:
F=
=5.0763
在
=0.05下,F统计量中分子分母的自由度均为6,查表得
因为5.0763>
4.28,所以拒绝原假设,表明模型确实存在异方差。
(3)White检验
图表5-5:
White检验结果
从图5-5可以看出,n
=18.0748,在
=0.05下,查表得临界值
(2)=5.9915,因为n
=18.0748>
(2)=5.9915,所以拒绝原假设、不拒绝备择假设,表明模型存在异方差。
5、异方差性的修正
使用加权最小二乘法(WLS)对异方差进行修正,选
为权数。
经检验发现
的效果最好。
得到如下图:
图表5-6:
用权数
的估计结果
可以看出,运用加权最小二乘法消除了异方差后,参赛的t检验均显著,F检验也显著即估计结果为
=368.6203+2.9528
t=(4.3796)(3.589272)
=0.4041DW=1.7060F=12.8828
人口数量每增加1万人,平均增加2.9528个医疗机构,而不是之前的5.37个。
虽然这个模型可能还存在某些不足,但这一估计比引子更接近真实情况。
第6章自相关案例
2011年中国农村人口占总人口的49.73%,农村居民人均消费为5222元,仅为城镇居民人均消费15161的34.44%,农村居民的收入与消费是一个值得研究的问题。
研究中国农村居民收入-消费模型。
影响因素较多,但由于各种限制因素,只引入居民收入这一影响因素进行考量。
设定模型
-居民消费,
-居民收入
1985—2011年农村居民人均收入和消费的数据为研究范围
3、用OLS估计
图后补6-1回归结果
所得估计结果为:
(10.1079)(0.0121)
t=(4.3680)(59.6060)
R2=0.9930F=3552.876DW=0.5300
该回归方程可决系数较高,回归系数均显著。
对样本量为27、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.316,dU=1.469。
该模型中DW<
dL,显然该模型自相关。
4、自相关其他检验
(1)残差图
在图6-2中,残差的变动有规律性,连续为正和连续为负,表明残差项存在一阶正自相关。
(2)BG检验
从图6-3可以看出
,其p值为0.000756,表明存在自相关。
图表6-2:
残差图
图表6-3:
BG检验结果
5、消除自相关
(1)采用广义差分法。
得回归方程
,则
=0.7283。
对原模型建立广义差分方程:
-0.7283
(1-0.7283)+
(
)+
广义差分回归的结果为:
图表6-4:
广义差分方程输出结果
由差分方程有
,所以最终得到中国农村居民消费模
(2)科克伦-奥克特迭代法
由图6-5可知,DW=1.7813可以判断,dU=1.461,dU<
DW<
4-dU,说明在5%显著性水平下广义差分后模型中已无自相关。
结论:
中国农村居民的边际消费倾向为0.7162,农民人均实际纯收入每增加1元,平均说来人均实际消费支出将增加0.7162元。
图表6-5:
科克伦-奥克特法估计结果
第7章分布滞后模型与自回归模型案例
7.2案例1
1955-1974年间美国制造业库存量和销售的关系,由于检验加权法有一定的随意性,需要操作者的要求较高,采用阿尔蒙法继续估计。
用阿尔蒙法进行估计。
将系数用二次多项式近似:
估计如下回归方程:
回归结果如图7-2-1所示。
表中Z0,Z1,Z2对应的系数分别为
的估计值,将其代入阿尔蒙多项式,可计算得出
的估计值。
得到最终估计式为:
图表7-2-1:
图表7-2-2:
回归分析结果
7.3案例2
货币主义学派认为,产生通货膨胀的必要条件是货币的超量供应。
物价变动与货币供应量的变化有着较为密切的联系,但是二者之间的关系不是瞬时的,货币供应量的变化对物价的影响存在一定时滞。
在中国,大家普遍认同货币供给的变化对物价具有滞后影响,但滞后期究竟有多长,还存在不同的认识。
下面采集1996年1月-2008年11月全国广义货币供应量和物价指数的月度数据对这一问题进行研究。
解释变量:
广义货币M2的月增长量-M2Z
居民消费价格月度同比指数-TBZS
估计如下回归模型:
3、回归分析
图表7-3-1:
从回归结果来看,M2Z的t统计量值显著,表明当期货币供应量的变化对当期物价水平的影响在统计意义上有一定的影响,但没有显现出这种影响的滞后性。
为了分析货币供应量变化影响物价的滞后性,我们做滞后6个月的分布滞后模型的估计。
回归结果如图7-3-2所示。
从回归结果来看,M2Z各滞后期的系数逐步增加,表明当期货币供应量的变化对物价水平的影响要经过一段时间才能逐步显现。
但各滞后期的系数的t统计量值不显著,因此还不能据此判断滞后期究竟有多长。
为此,我们做滞后12个月的分布滞后模型的估计。
回归结果如图7-3-3所示。
从图7-3-2可以看出,从M2Z到M2Z(11),回归系数都不显著异于零,而M2Z(12)的回归系数显著,这表明,当期货币供应量变化对物价水平的影响在经过12个月(即一年)后明显地显现出来。
图表7-3-2:
图表7-3-3:
为了考察货币供应量变化对物价水平影响的持续期,我们做滞后18个月的分布滞后模型的估计。
估计结果如图7-3-4.
图表7-3-4:
从滞后12个月开始t统计量值显著,一直到滞后15个月为止,从滞后第16个月开始t值变得不显著;
再从回归系数来看,从滞后11个月开始,货币供应量变化对物价水平的影响明显增加,再滞后13个月时达到最大,然后逐步下降。
在我国,货币供应量变化对物价水平的影响具有明显的滞后性,滞后期大约为三个季度,而且滞后影响具有持续性,持续的长度大约为半年,其影响力度先递增然后递减,滞后结构为Λ型。
第8章虚拟变量回归案例
为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄(Y),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系,并建立相应的计量经济学模型。
为了研究1978—2011年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城乡居民储蓄存款、国民总收入随时间的变化情况,如图所示:
图表8-1:
城乡居民储蓄存款、国民总收入随时间的变化情况
从上图中,尚无法得到居民的储蓄行为发生明显改变的详尽信息。
若取居民储蓄的增量(YY),并作时序图如下。
从图8.2可以看出,城乡居民的储蓄行为表现出了明显的阶段特征:
在1996年、2000年、2005年、2007年和2009年有五个明显的转折点。
图表8-2:
居民储蓄增量图
再从城乡居民储蓄存款增量与国民总收入之间关系的散布图看(图8.3),也呈现出了相同的阶段性特征。
图表8-3:
城乡居民储蓄存款增量与居民总收入之间关系的散布图
为了分析居民储蓄行为在1996年—2011年不同时期的数量关系,以1996、2000、2005、2007、2009年度的五个转折点作为依据,分别引入虚拟变量D1、D2、D3、D4、D5,这五个年度所对应的GNI分别为70142.5,98000.5,184088.6,251483.2和340320亿元。
据此,我们设定了如下以加法和乘法两种方式同时引入虚拟变量的的模型:
数据出错后重新补上。
图表8-4:
se=(944.8749)(0.0301)(0.1112)(0.1110)
se=(0.0759)(0.0826)(0.0605)
t=(-3.6034)(5.5553)(-7.0692)
F=122.5778DW=2.989804
各个解释变量的系数都显著,最后可得居民人民币储蓄存款年增加额的回归模型为:
表明六个时期居民储蓄增加额的回归方程在统计意义上确实有很大不同。
1996年以前国民总收入每增加1亿元,平均说来居民储蓄存款的增加额为0.1326亿元,居民储蓄增加额随国民总收入增长的变动相对稳定。
1996年以后随着国民总收入的增长居民储蓄存款的增加额在不同年份有增有减,呈现出明显的周期性变化。
上述模型同城乡居民储蓄存款与国民总收入之间的散布图吻合,与这一时段中国的实际经济运行状况也是相符的。