第三章 多元线性回归案例分析.docx
《第三章 多元线性回归案例分析.docx》由会员分享,可在线阅读,更多相关《第三章 多元线性回归案例分析.docx(18页珍藏版)》请在冰豆网上搜索。
第三章多元线性回归案例分析
多元回归现行回归习题分析
【例3.2】中国税收增长的分析
一、研究的目的要求
改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,中央和地方的税收收入1978年为519.28亿元,到2002年已增长到17636.45亿元,25年间增长了33倍,平均每年增长%。
为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。
影响中国税收收入增长的因素很多,但据分析主要的因素可能有:
(1)从宏观经济看,经济整体增长是税收增长的基本源泉。
(2)公共财政的需求,税收收入是财政收入的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算支出所表现的公共财政的需求对当年的税收收入可能会有一定的影响。
(3)物价水平。
我国的税制结构以流转税为主,以现行价格计算的GDP等指标和经营者的收入水平都与物价水平有关。
(4)税收政策因素。
我国自1978年以来经历了两次大的税制改革,一次是1984-1985年的国有企业利改税,另一次是1994年的全国范围内的新税制改革。
税制改革对税收会产生影响,特别是1985年税收陡增215.42%。
但是第二次税制改革对税收增长速度的影响不是非常大。
因此,可以从以上几个方面,分析各种因素对中国税收增长的具体影响。
二、模型设定
为了全面反映中国税收增长的全貌,选择包括中央和地方税收的“国家财政收入”中的“各项税收”(简称“税收收入”)作为被解释变量,以反映国家税收的增长;选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售物价指数”作为物价水平的代表。
由于财税体制的改革难以量化,而且1985年以后财税体制改革对税收增长影响不是很大,可暂不考虑税制改革对税收增长的影响。
所以解释变量设定为可观测的“国内生产总值”、“财政支出”、“商品零售物价指数”等变量。
从《中国统计年鉴》收集到以下数据(见表3.3):
表3.3中国税收收入及相关数据
年份
税收收入(亿元)
(Y)
国内生产总值(亿元)
(X2)
财政支出(亿元)
(X3)
商品零售价格指数(%)
(X4)
1978
519.28
3624.1
1122.09
100.7
1979
537.82
4038.2
1281.79
102.0
1980
571.70
4517.8
1228.83
106.0
1981
629.89
4862.4
1138.41
102.4
1982
700.02
5294.7
1229.98
101.9
1983
775.59
5934.5
1409.52
101.5
1984
947.35
7171.0
1701.02
102.8
1985
2040.79
8964.4
2004.25
108.8
1986
2090.73
10202.2
2204.91
106.0
1987
2140.36
11962.5
2262.18
107.3
1988
2390.47
14928.3
2491.21
118.5
1989
2727.40
16909.2
2823.78
117.8
1990
2821.86
18547.9
3083.59
102.1
1991
2990.17
21617.8
3386.62
102.9
1992
3296.91
26638.1
3742.20
105.4
1993
4255.30
34634.4
4642.30
113.2
1994
5126.88
46759.4
5792.62
121.7
1995
6038.04
58478.1
6823.72
114.8
1996
6909.82
67884.6
7937.55
106.1
1997
8234.04
74462.6
9233.56
100.8
1998
9262.80
78345.2
10798.18
97.4
1999
10682.58
82067.5
13187.67
97.0
2000
12581.51
89468.1
15886.50
98.5
2001
15301.38
97314.8
18902.58
99.2
2002
17636.45
104790.6
22053.15
98.7
设定的线性回归模型为:
三、估计参数
利用EViews估计模型的参数,方法是:
1、建立工作文件:
启动EViews,点击File\New\Workfile,在对话框“WorkfileRange”。
在“Workfilefrequency”中选择“Annual”(年度),并在“Startdate”中输入开始时间“1978”,在“enddate”中输入最后时间“2002”,点击“ok”,出现“WorkfileUNTITLED”工作框。
其中已有变量:
“c”—截距项“resid”—剩余项。
在“Objects”菜单中点击“NewObjects”,在“NewObjects”对话框中选“Group”,并在“NameforObjects”上定义文件名,点击“OK”出现数据编辑窗口。
2、输入数据:
点击“Quik”下拉菜单中的“EmptyGroup”,出现“Group”窗口数据编辑框,点第一列与“obs”对应的格,在命令栏输入“Y”,点下行键“↓”,即将该序列命名为Y,并依此输入Y的数据。
用同样方法在对应的列命名X2、X3、X4,并输入相应的数据。
或者在EViews命令框直接键入“dataY
X3X4…”,回车出现“Group”窗口数据编辑框,在对应的Y、X2、X3、X4下输入响应的数据。
3、估计参数:
3.1最小平方法Ls点击“Procs“下拉菜单中的“MakeEquation”,在出现的对话框的“EquationSpecification”栏中键入“YCX2X3X4”,在“EstimationSettings”栏中选择“LeastSqares”(最小二乘法),点“ok”,即出现回归结果:
表3.4
DependentVariable:
Y
Method:
LeastSquares
Date:
03/15/15Time:
20:
59
Sample:
19782002
Includedobservations:
25
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-2582.791
940.6128
-2.745860
0.0121
X1
0.022067
0.005577
3.956605
0.0007
X2
0.702104
0.033236
21.12466
0.0000
X3
23.98541
8.738302
2.744859
0.0121
R-squared
0.997430
Meandependentvar
4848.366
AdjustedR-squared
0.997063
S.D.dependentvar
4870.971
S.E.ofregression
263.9599
Akaikeinfocriterion
14.13512
Sumsquaredresid
1463172.
Schwarzcriterion
14.33014
Loglikelihood
-172.6890
Hannan-Quinncriter.
14.18921
F-statistic
2717.238
Durbin-Watsonstat
0.948542
Prob(F-statistic)
0.000000
根据表3.4中数据,模型估计的结果为:
Y=-2582.790739+0.02206711301*X2+0.7021043918*X3+23.98541027*X4
(940.6128)(0.0056)(0.0332)(8.7363)
t=(-2.7459)(3.9566)(21.1247)(2.7449)
F=2717.238df=21
3.29极大似然法
点击QUICK/CONSORED
DependentVariable:
Y
Method:
ML-CensoredNormal(TOBIT)(Quadratichillclimbing)
Date:
03/15/15Time:
22:
00
Sample:
19782002
Includedobservations:
25
Leftcensoring(value)atzero
Convergenceachievedafter3iterations
Covariancematrixcomputedusingsecondderivatives
Variable
Coefficient
Std.Error
z-Statistic
Prob.
C
-2582.791
862.0852
-2.995981
0.0027
X1
0.022067
0.005112
4.317014
0.0000
X2
0.702104
0.030461
23.04891
0.0000
X3
23.98541
8.008780
2.994890
0.0027
ErrorDistribution
SCALE:
C(5)
241.9233
34.21305
7.071082
0.0000
Meandependentvar
4848.366
S.D.dependentvar
4870.971
S.E.ofregression
263.9668
Akaikeinfocriterion
14.21512
Sumsquaredresid
1463248.
Schwarzcriterion
14.45889
Loglikelihood
-172.6890
Hannan-Quinncriter.
14.28273
Avg.loglikelihood
-6.907559
Leftcensoredobs
0
Rightcensoredobs
0
Uncensoredobs
25
Totalobs
25
3.3GMM(矩估计)
点击QUICK/GeneralizedMethodofMoments
对话框出现两个窗口,分别填“ycx1x2x3”;“cx1x2x3”
DependentVariable:
Y
Method:
GeneralizedMethodofMoments
Date:
03/15/15Time:
22:
09
Sample:
19782002
Includedobservations:
25
Linearestimationwith1weightupdate
Estimationweightingmatrix:
HAC(Bartlettkernel,Newey-Westfixed
bandwidth=3.0000)
Standarderrors&covariancecomputedusingestimationweightingmatrix
Instrumentspecification:
CX1X2X3
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-2582.791
991.1708
-2.605798
0.0165
X1
0.022067
0.004957
4.451933
0.0002
X2
0.702104
0.023805
29.49394
0.0000
X3
23.98541
8.975450
2.672335
0.0143
R-squared
0.997430
Meandependentvar
4848.366
AdjustedR-squared
0.997063
S.D.dependentvar
4870.971
S.E.ofregression
263.9599
Sumsquaredresid
1463172.
Durbin-Watsonstat
0.948542
J-statistic
4.26E-43
Instrumentrank
4
四、模型检验
1、经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年GDP每增长1亿元,税收收入就会增长0.02207亿元;在假定其它变量不变的情况下,当年财政支出每增长1亿元,税收收入会增长0.7021亿元;在假定其它变量不变的情况下,当年零售商品物价指数上涨一个百分点,税收收入就会增长23.9854亿元。
这与理论分析和经验判断相一致。
2、统计检验
(1)拟合优度:
由表3.4中数据可以得到:
,修正的可决系数为
,这说明模型对样本的拟合很好。
(2)F检验:
针对
,给定显著性水平
,在F分布表中查出自由度为k-1=3和n-k=21的临界值
。
由表3.4中得到F=2717.238,由于F=2717.238>
,应拒绝原假设
,说明回归方程显著,即“国内生产总值”、“财政支出”、“商品零售物价指数”等变量联合起来确实对“税收收入”有显著影响。
(3)t检验:
分别针对
:
,给定显著性水平
,查t分布表得自由度为n-k=21临界值
。
由表3.4中数据可得,与
、
、
、
对应的t统计量分别为-2.7459、3.9566、21.1247、2.7449,其绝对值均大于
,这说明分别都应当拒绝
:
,也就是说,当在其它解释变量不变的情况下,解释变量“国内生产总值”(
)、“财政支出”(
)、“商品零售物价指数”(
)分别对被解释变量“税收收入”Y都有显著的影响。
为了作区间预测,在X和Y的数据表中,点击“View”选“DescriptiveStats\CmmonSample”,则得到X和Y的描述统计结果,见表3.5:
表3.5
Date:
09/20/07Time:
08:
55
Sample:
19782002
X2
X3
X4
Y
Mean
35976.74
5854.728
105.3400
4848.366
Median
18547.90
3083.590
102.8000
2821.860
Maximum
104790.6
22053.15
121.7000
17636.45
Minimum
3624.100
1122.090
97.00000
519.2800
Std.Dev.
34444.88
5967.935
6.883616
4870.971
Skewness
0.730686
1.423573
0.994931
1.255106
Kurtosis
1.980133
3.952894
2.971455
3.574707
Jarque-Bera
3.308057
9.389841
4.125378
6.907763
Probability
0.191278
0.009142
0.127112
0.031623
Observations
25
25
25
25
五、多重共线性检验
计算各解释变量的相关系数,选择X1、X2、X3数据,
点”view/covarianceanalyss”
出现界面
点击correlation得相关系数矩阵
X1
X2
X3
X1
1
0.9569655695314073
-0.2902330698557423
X2
0.9569655695314073
1
-0.3754636919632496
X3
-0.2902330698557423
-0.3754636919632496
1
DependentVariable:
Y
Method:
ML-CensoredNormal(TOBIT)(Quadratichillclimbing)
Date:
04/16/15Time:
17:
36
Sample:
19782002
Includedobservations:
25
Leftcensoring(value)atzero
Convergenceachievedafter3iterations
Covariancematrixcomputedusingsecondderivatives
Variable
Coefficient
Std.Error
z-Statistic
Prob.
C
-2582.791
862.0852
-2.995981
0.0027
X1
0.022067
0.005112
4.317014
0.0000
X2
0.702104
0.030461
23.04891
0.0000
X3
23.98541
8.008780
2.994890
0.0027
ErrorDistribution
SCALE:
C(5)
241.9233
34.21305
7.071082
0.0000
Meandependentvar
4848.366
S.D.dependentvar
4870.971
S.E.ofregression
263.9668
Akaikeinfocriterion
14.21512
Sumsquaredresid
1463248.
Schwarzcriterion
14.45889
Loglikelihood
-172.6890
Hannan-Quinncriter.
14.28273
Avg.loglikelihood
-6.907559
Leftcensoredobs
0
Rightcensoredobs
0
Uncensoredobs
25
Totalobs
25