计量经济学三元线性回归模型案例分析Word格式.docx
《计量经济学三元线性回归模型案例分析Word格式.docx》由会员分享,可在线阅读,更多相关《计量经济学三元线性回归模型案例分析Word格式.docx(13页珍藏版)》请在冰豆网上搜索。
X4
1978
519.28
3624.1
1122.09
100.7
1979
537.82
4038.2
1281.79
102
1980
571.7
4517.8
1228.83
106
1981
629.89
4862.4
1138.41
102.4
1982
700.02
5294.7
1229.98
101.9
1983
775.59
5934.5
1409.52
101.5
1984
947.35
7171
1701.02
102.8
1985
2040.79
8964.4
2004.25
108.8
1986
2090.73
10202.2
2204.91
1987
2140.36
11962.5
2262.18
107.3
1988
2390.47
14928.3
2491.21
118.5
1989
2727.4
16909.2
2823.78
117.8
1990
2821.86
18547.9
3083.59
102.1
1991
2990.17
21617.8
3386.62
102.9
1992
3296.91
26638.1
3742.2
105.4
1993
4255.3
34636.4
4642.3
113.2
1994
5126.88
46759.4
5792.62
121.7
1995
6038.04
58478.1
6823.72
114.8
1996
6909.82
67884.6
7937.55
106.1
1997
8234.04
74462.6
9233.56
100.8
1998
9262.8
78345.2
10798.18
97.4
1999
10682.58
82067.5
13187.67
97
2000
12581.51
89468.1
15886.5
98.5
2001
15301.38
97314.8
18902.58
99.2
2002
17636.45
104790.6
22053.15
98.7
六,参数估计
利用eviews软件可以得到Y关于X2的散点图:
可以看出Y和X2成线性相关关系
Y关于X3的散点图:
可以看出Y和X3成线性相关关系
Y关于X1的散点图:
DependentVariable:
Y
Method:
LeastSquares
Date:
01/09/10Time:
13:
16
Sample:
19782002
Includedobservations:
25
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-2582.755
940.6119
-2.745825
0.0121
0.022067
0.005577
3.956633
0.0007
0.702104
0.033236
21.12474
0.0000
23.98506
8.738296
2.744821
R-squared
0.997430
Meandependentvar
4848.366
AdjustedR-squared
0.997063
S.D.dependentvar
4870.971
S.E.ofregression
263.9591
Akaikeinfocriterion
14.13511
Sumsquaredresid
1463163.
Schwarzcriterion
14.33013
Loglikelihood
-172.6889
F-statistic
2717.254
Durbin-Watsonstat
0.948521
Prob(F-statistic)
0.000000
模型估计的结果为:
Yi=-2582.755+0.022067X2+0.702104X3+23.98506X4
(940.6119)(0.0056)(0.0332)(8.7383)
t={-2.7458}{3.9567}{21.1247}{2.7449}
R2=0.997R2=0.997F=2717.254df=21
七,相关检验
1.经济意义检验
模型估计结果说明,在假定其他变量不变的情况下,当年GDP每增长1亿元,税收收入就会增长0.02207亿元;
在假定其他变量不变的情况下,当年财政支出每增长1亿元,税收收入就会增长0.7021亿元;
在假定其他变量不变的情况下,当零售商品物价指数上涨一个百分点,税收收入就会增长23.985亿元。
2.统计检验
(1)拟合优度:
R2=0.997,修正的可决系数为R2=0.997这说明模型对样本拟合的很好。
(2)F检验:
针对H0:
β2=β3=β4=0,给定的显著性水平α=0.05,在F分布表中查出自由度为K-1=3和n-k=21的临界值Fα(3,21)=3.075.由Eviews得到F=2717.238>
3.075,应拒绝原假设H0,说明回归方程显著,即“国内生产总值(GDP)”“财政支出”“商品零售物价指数”联合起来确实对“税收收入”有显著影响。
(3)T检验:
分别针对H:
βj=0(j=0,2,3,4),给定的显著水平α=0.05,查t分布表得自由度为n-k=21临界值tα/2(n-k)=2.080。
由Eviews数据可得,与β0β2β3β4对应的t统计量分别为-2.7458,3.9567,21.1247,2.7449,其绝对值均大于2.080,这说明分别都应当拒绝H0,也就是说,当其他解释变量不变的情况下,解释变量“国内生产总值(亿元)X2”“财政支出(亿元)X3”“商品零售价格指数(%)X4”分别对被解释变量“税收收入Y”都有显著的影响。
八,预测
财政收入占GDP的比重,又称为国民经济的财政负担率,它综合反映出政府与微观经济主体之间占有和支配社会资源的关系,反映政府调控经济运行的能力和影响社会资源配置的程度。
由于在单个核算期内GDP的变化与财政收入可能不“同步”,因此以单个核算期来看,财政收入占GDP的比重会上下波动。
但从较长时期来看,财政收入占GDP的比重有相对的稳定性和一定的变化趋势。
从上面的实证分析中我们可以看到,GDP与财政收入之间的关系在不同地域、不同经济发展时期是不一样的,那么,可以说,除了我们在第一部分时所指出的两者在经济内涵方面所存在的区别之外,在实际经济生活当中还有以下这些因素会影响到GDP与财政收入的关系:
1、财政级别和行政级别
从财政收入角度来看,一方面,由于目前我国实行的是分级财政体制,行政级别越高,所掌握的财政资源就越多,例如中央级财政掌握了增值税的75%、海关关税的全部以及其他一些比较重要税种的大部分,而对于地方财政来说,能够完全掌握的只有地方企业营业税和所得税以及其他一些小税种。
另一方面,财政收入采取的是所属制原则,也就是说,一般情况下,中省直企业的大部分税收和利润是由其所属级别的财政来掌握,而不是由其所在地的财政来掌握。
而GDP所采用的则是所在地原则,也就是说,对于一个地区来说,只要是在本地区的辖区范围之内的单位,不管其税交到哪儿,不管其主管机构是谁,都在GDP的核算口径之内。
这就造成了财政收入与GDP在同一行政级别上数量的不匹配,在客观上形成了地方财政收益率明显低于中央财政收益率的现状。
2、经济发展程度和整体经济效益
由于财政收入的主体是税收收入,而税收收入的高低主要取决于这一地区纳税企业的数量以及企业纳税能力的高低。
如果一个地区的市场经济活跃,辖区内的纳税企业数量多、规模大、效益好,在地区生产总值中无税经济成分所占比重相应就小,财政收入占GDP的比重自然也就高。
从对全国部分中等规模城市的定量分析来看,也印证了这一点。
从表中可以看出,财政收入占GDP的比重比较高的城市,大部分是区域优势明显、经济发达程度比较高的地区,而排在后面的城市大多数都是中西部欠发达地区。
3、产业结构层次的高低
虽然从宏观上讲财政收入是GDP的重要组成部分,但并不等于说地区经济的发展水平就代表着财政收入的水平。
严格地说,在GDP的收入分配构成中只有生产税净额和营业盈余的一部分(主要指所得税)构成了财政收入。
由于地区生产总值中各个产业部门的行业构成不同,各行业盈利水平也不同,因而在同样的生产规模和增长速度的条件下,不同的产业结构和行业结构会形成不同的税源状况和盈利水平。
只有当高附加值、高税率的产业部门(行业)在整个地区经济中的比重上升并占据一定优势时,税源才有保障,财政收入与GDP的发展水平才有可能同步,个别产业规划较好的地区财政收入会超过GDP的增长。
四、对GDP与财政收入关系研究的现实意义
GDP与财政收入之间存在着源与流、根与叶的关系,源远则流长,根深则叶茂,经济的全面、可持续发展是财政收入增长的根本保证,财政收入的健康增长又为国民经济的协调发展提供了源动力。
研究GDP与财政收入关系对实际经济工作具有现实指导意义,笔者认为实际工作中应该从以下两个方面把握GDP与财政收入关系的要点:
1、提高经济运行质量和效益,将财政收入对GDP的弹性系数控制在一定范围内。
通常情况下,财政收入增长速度相对于GDP增长速度的比例被称为财政收入对GDP的弹性系数,它被用来衡量财政收入增长幅度与宏观经济增长的依存关系,表明宏观经济每增长一个百分点能带动财政收入增长多少个百分点。
毫无疑问,这一指标对于政府在现实经济工作中实施宏观调控,调整产业结构,提高经济运行质量具有重要意义。
经过对1990年以来数据的分析与整理,我们发现中央财政对国内地区生产总值的弹性系数控制在0.9-1.1之间时,国民经济的运转形势相对良好;
对于地方来说,由于各地区经济发展差别较大,经过测算,我们认为这一弹性系数大致控制在0.8-1.3之间比较合理。
2、确定科学的财税政策,将财政收入对GDP的比重控制在合理的范围内。
财政收入占GDP的比重是一个衡量政府对国民经济控制能力的非常重要的指标,财政收入占GDP比重越高,国家就越有能力为国民提供富足的公共服务。
但是这一指标必须控制在合理的范围之内,如果比重过高,政府集中的财力过度,则会挤占纳税人的利益,削弱经济发展的基础,最终影响国民经济的发展和财政收入的增长;
如果比重过低,政府集中的财力有限,将严重影响政府各项职能的正常履行,削弱财政对宏观经济运行和资源优化配置的调控能力。
最好有以下几块东西
1、选定研究对象
(确定被解释变量,说明选题的意义和原因等。
)
2、确定解释变量,尽量完备地考虑到可能的相关变量供选择,并初步判定个变量对被解释变量的影响方向。
(作出相应的说明)
3、确定理论模型或函数式
(根据相应的理论和经济关系设立模型形式,并提出假设,系数是正的还是负的等。
(二)数据的收集和整理
(三)数据处理和回归分析
(先观察数据的特点,观看和输出散点图,最后选择相应的变量关系式进行OLS回归,并输出会归结果。
(四)回归结果分析和检验
(写出模型估计的结果)
1、回归结果的经济理论检验,方向正确否?
理论一致否?
2、统计检验,t检验F检验R2—拟合优度检验
3、模型设定形式正确否?
可试试其他形式。
4、模型的稳定性检验。
(五)模型的修正
(对所发现的模型变量选择问题、设定偏误、模型不稳定等,进行修正。
(六)确定模型
(七)预测
实验三多元回归模型
【实验目的】
掌握建立多元回归模型和比较、筛选模型的方法。
【实验内容】
建立我国国有独立核算工业企业生产函数。
根据生产函数理论,生产函数的基本形式为:
。
其中,L、K分别为生产过程中投入的劳动与资金,时间变量反映技术进步的影响。
表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;
其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。
表3-1我国国有独立核算工业企业统计资料
年份时间
工业总产值
Y(亿元)职工人数
L(万人)固定资产
K(亿元)
197813289.1831392225.70
197923581.2632082376.34
198033782.1733342522.81
198143877.8634882700.90
198254151.2535822902.19
198364541.0536323141.76
198474946.1136693350.95
198585586.1438153835.79
198695931.3639554302.25
1987106601.6040864786.05
1988117434.0642295251.90
1989127721.0142735808.71
1990137949.5543646365.79
1991148634.8044727071.35
1992159705.5245217757.25
19931610261.6544988628.77
19941710928.6645459374.34
资料来源:
根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理
【实验步骤】
一、建立多元线性回归模型
一建立包括时间变量的三元线性回归模型;
在命令窗口依次键入以下命令即可:
⒈建立工作文件:
CREATEA7894
⒉输入统计资料:
DATAYLK
⒊生成时间变量:
GENRT=@TREND(77)
⒋建立回归模型:
LSYCTLK
则生产函数的估计结果及有关信息如图3-1所示。
图3-1我国国有独立核算工业企业生产函数的估计结果
因此,我国国有独立工业企业的生产函数为:
(模型1)
=(-0.252)(0.672)(0.781)(7.433)
模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。
回归系数的符号和数值是较为合理的。
,说明模型有很高的拟合优度,F检验也是高度显著的,说明职工人数L、资金K和时间变量对工业总产值的总影响是显著的。
从图3-1看出,解释变量资金K的统计量值为7.433,表明资金对企业产出的影响是显著的。
但是,模型中其他变量(包括常数项)的统计量值都较小,未通过检验。
因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除统计量最小的变量(即时间变量)而重新建立模型。
二建立剔除时间变量的二元线性回归模型;
命令:
LSYCLK
则生产函数的估计结果及有关信息如图3-2所示。
图3-2剔除时间变量后的估计结果
(模型2)
=(-2.922)(4.427)(14.533)
从图3-2的结果看出,回归系数的符号和数值也是合理的。
劳动力边际产出为1.2085,资金的边际产出为0.8345,表明这段时期劳动力投入的增加对我国国有独立核算工业企业的产出的影响最为明显。
模型2的拟合优度较模型1并无多大变化,F检验也是高度显著的。
这里,解释变量、常数项的检验值都比较大,显著性概率都小于0.05,因此模型2较模型1更为合理。
三建立非线性回归模型——C-D生产函数。
C-D生产函数为:
,对于此类非线性函数,可以采用以下两种方式建立模型。
方式1:
转化成线性模型进行估计;
在模型两端同时取对数,得:
在EViews软件的命令窗口中依次键入以下命令:
GENRLNY=log(Y)
GENRLNL=log(L)
GENRLNK=log(K)
LSLNYCLNLLNK
则估计结果如图3-3所示。
图3-3线性变换后的C-D生产函数估计结果
即可得到C-D生产函数的估计式为:
(模型3)
=(-1.172)(2.217)(9.310)
即:
从模型3中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,而且拟合优度较模型2还略有提高,解释变量都通过了显著性检验。
方式2:
迭代估计非线性模型,迭代过程中可以作如下控制:
⑴在工作文件窗口中双击序列C,输入参数的初始值;
⑵在方程描述框中点击Options,输入精度控制值。
控制过程:
①参数初值:
0,0,0;
迭代精度:
10-3;
则生产函数的估计结果如图3-4所示。
图3-4生产函数估计结果
此时,函数表达式为:
(模型4)
=(0.313)(-2.023)(8.647)
可以看出,模型4中劳动力弹性=-1.01161,资金的产出弹性=1.0317,很显然模型的经济意义不合理,因此,该模型不能用来描述经济变量间的关系。
而且模型的拟合优度也有所下降,解释变量L的显著性检验也未通过,所以应舍弃该模型。
②参数初值:
10-5;
图3-5生产函数估计结果
从图3-5看出,将收敛的误差精度改为10-5后,迭代100次后仍报告不收敛,说明在使用迭代估计法时参数的初始值与误差精度或迭代次数设置不当,会直接影响模型的估计结果。
③参数初值:
10-5,迭代次数1000;
图3-6生产函数估计结果
此时,迭代953次后收敛,函数表达式为:
(模型5)
=(0.581)(2.267)(10.486)
从模型5中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,,具有很高的拟合优度,解释变量都通过了显著性检验。
将模型5与通过方式1所估计的模型3比较,可见两者是相当接近的。
④参数初值:
1,1,1;
10-5,迭代次数100;
图3-7生产函数估计结果
此时,迭代14次后收敛,估计结果与模型5相同。
比较方式2的不同控制过程可见,迭代估计过程的收敛性及收敛速度与参数初始值的选取密切相关。
若选取的初始值与参数真值比较接近,则收敛速度快;
反之,则收敛速度慢甚至发散。
因此,估计模型时最好依据参数的经济意义和有关先验信息,设定好参数的初始值。
二、比较、选择最佳模型
估计过程中,对每个模型检验以下内容,以便选择出一个最佳模型:
一回归系数的符号及数值是否合理;
二模型的更改是否提高了拟合优度;
三模型中各个解释变量是否显著;
四残差分布情况
以上比较模型的一、二、三步在步骤一中已有阐述,现分析步骤一中5个不同模型的残差分布情况。
分别在模型1~模型5的各方程窗口中点击View/Actual,Fitted,Residual/Actual,Fitted,ResidualTable(图3-8),可以得到各个模型相应的残差分布表(图3-9至图3-13)。
可以看出,模型4的残差在前段时期内连续取负值且不断增大,在接下来的一段时期又连续取正值,说明模型设定形式不当,估计过程出现了较大的偏差。
而且,模型4的表达式也说明了模型的经济意义不合理,不能用于描述我国国有工业企业的生产情况,应舍弃此模型。
模型1的各期残差中大多数都落在的虚线框内,且残差分别不存在明显的规律性。
但是,由步骤一中的分析可知,模型1中除了解释变量K之外,其余变量均为通过变量显著性检验,因此,该模型也应舍弃。
模型2、模型3、模型5都具有合理的经济意义,都通过了检验和F检验,拟合优度非常接近,理论上讲都可以描述资本、劳动的投入与产出的关系。
但从图3-13看出,模型5的近期误差较大,因此也可以舍弃该模型。
最后将模型2与模型3比较发现,模型3的近期预测误差略小,拟合优度比模型2略有提高,因此可以选择模型2为我国国有工业企业生产函数。