基于逐步回归法的国家财政收入回归分析Word下载.docx
《基于逐步回归法的国家财政收入回归分析Word下载.docx》由会员分享,可在线阅读,更多相关《基于逐步回归法的国家财政收入回归分析Word下载.docx(17页珍藏版)》请在冰豆网上搜索。
![基于逐步回归法的国家财政收入回归分析Word下载.docx](https://file1.bdocx.com/fileroot1/2022-11/21/21e7927d-624d-4c26-b859-5d2d78b93033/21e7927d-624d-4c26-b859-5d2d78b930331.gif)
检验时,挑选未引入模型中的变量的显著性贡献度最大的计算:
则说明该变量对
作用显著,应引入变量,并对相关矩阵
作变换。
步骤6:
如以上步骤,检验是否接受新变量,引入回归方程后,检验其显著性,判断是否有变量应该剔除,直至无变量可引入和剔除为止,逐步回归结束,将上述所有标准化的量,化成实际回归系数,再求出常数项.
3国家财政收入回归模型
3。
1数据采集
本文从《中国统计年鉴2011》中采集并整理了1991~2010年影响我国财政收入的主要因素的相关数据信息,包括工业总产值(亿元)、农业总产值(亿元)、建筑业总产值(亿元)、第三产业总产值(亿元)、社会商品零售总额(亿元)、人口数量(万人)、受灾面积(千公顷)以及居民消费水平(元).数据如表3.1所示。
其中1991~2009年的数据作为模型建立的依据,2010年的数据用作对模型的检验。
3.2变量标识
为了方便模型的描述,本文对各影响因素做了如表3。
2所示的符号约定.并选择财政收入y为因变量,其余8个影响因素X1、X2、X3、X4、X5、X6、X7、X8为自变量。
表3。
2符号说明
符号
y
X1
X2
X3
X4
X5
X6
X7
X8
变
量
财政
收入
工业总产值
农业总产值
建筑业总产值
第三产业总产值
社会商品零售总额
人
口
受灾
面积
居民消费水平
表3.1样本数据
年份
财政收入
建筑业总
产值
第三产业总
人口
受灾面积
1991
3149。
48
8087.1
5342.2
1015。
1
7337。
9415.6
115823
55472
932
1992
3483。
37
10284.5
5866.6
1415
9357.38
10993。
7
117171
51332
1116
1993
4348。
95
14188
6963.8
2266。
5
11915。
73
14270.4
118517
48827
1393
1994
5218。
19480。
9572。
2964。
16179。
76
18622.9
119850
55046
1833
1995
6242.2
24950.6
12135。
8
3728。
19978.46
23613.8
121121
45824
2355
1996
7407。
99
29447.6
14015。
4
4387.4
23326.24
28360。
2
122389
46991
2789
1997
8651.14
32921.4
14441。
9
4621。
6
26988。
15
31252.9
123626
53427
3002
1998
9875。
34018。
14817.6
4985。
30580。
47
33378.1
124761
50145
3159
1999
11444。
08
35861.5
14770
5172.1
33873.44
35647。
125786
49979。
3346
2000
13395。
23
40033。
14944。
5522。
3
38713。
39105。
126743
54688
3632
2001
16386.04
43580.6
15781。
5931.7
44361。
61
43055。
127627
52214。
3887
2002
18903。
64
47431。
16537
6465.5
49898.9
48135.9
128453
46946.1
4144
2003
21715。
25
54945.5
17381.7
7490.8
56004.73
52516。
129227
54505.8
4475
2004
26396。
65210
21412。
8694.3
64561。
29
59501
129988
37106。
26
5032
2005
31649。
77230.8
22420
10133。
74919。
28
67176.6
130756
38818.23
5573
2006
38760。
91310.9
24040
11851.1
88554.88
76410
131448
41091。
41
6263
2007
51321.78
107367.2
28095
14014。
111351。
89210
132129
48992。
35
7255
2008
61330.35
130260。
24
33702
18743。
131339。
114830。
132802
39990。
03
8349
2009
68518.3
135239。
35226
22398。
83
147642.09
132678。
133474
47213。
69
9098
2010
83101。
51
160867
36941.11
26714。
173087.01
156998.4
134091
37426
9968
(注:
2010年的数据用作预测)
我们可以建立如下的回归模型[2]:
其中,In在本模型中为8阶单位矩阵,
为了使建立的回归模型达到最佳效果,本文选用上文所描述的逐步回归分析法并利用SPSS19软件求解此线性回归模型。
3.3逐步回归分析
3.3.1逐步回归分析操作步骤
基于上文中搜集到的数据,在SPSS软件中建立数据视图,以8个影响因素为X1-X8,以财政收入为Y,各列数据均为数值类型。
在SPSS中进行逐步回归分析的一般步骤如下所示:
1。
创建数据;
2.打开线性回归功能;
3.将X1—X8依次选为因变量,Y选为自变量;
4.设置统计量,确定置信水平,启用个案诊断;
5。
设置绘图选项;
6。
设置使用F的概率;
7。
完成设置,开始分析;
8.得到分析结果图表,分析结果并保存。
以下几个小节中,将对本次分析的分析结果进行阐述和总结。
2输入/剔除表
表3。
3.为分析过程中变量的输入和剔除情况。
3输入/移除的变量a
模型
输入的变量
移去的变量
方法
X4第三产业总产值
。
步进(准则:
F-to-enter的概率〈=。
050,F—to—remove的概率〉=。
100)。
X6人口
F-to-enter的概率<
=.050,F—to-remove的概率>
=。
X3建筑业总产值
.
F-to-enter的概率〈=.050,F-to—remove的概率>
X7受灾面积
F-to-enter的概率〈=.050,F—to-remove的概率>
a.因变量:
财政收入
SPSS系统默认当F概率小于或等于0.05时进入,F概率大于等于0.1剔除。
从表中所示结果,可知系统在逐步分析时产生了4个模型,模型1是按照F检验的标准先将与y(财政收入)关系最密切的变量X4(第三产业总产值)引入模型,建立y(财政收入)与X4之间的线性回归模型,然后引入X6(人口),建立y与X4、X6之间的回归模型,然后依次引入X3(建筑业总产值)、X7(受灾面积)、建立回归模型。
在整个过程中,剔除的变量为X1(工业总产值)、X2(农业总产值)、X5(社会商品零售总额)、X8(居民消费水平)。
3.3模型汇总表
4模型汇总e
R
R2
调整R2
估计的标准差
997a
994
1605.97225
000b
.999
999
498。
21278
000c
000
244.82710
1.000d
1.000
189。
48385
a。
预测变量:
(常量),X4第三产业总产值。
b.预测变量:
(常量),X4第三产业总产值,X6人口.
c.预测变量:
(常量),X4第三产业总产值,X6人口,X3建筑业总产值。
d.预测变量:
(常量),X4第三产业总产值,X6人口,X3建筑业总产值,X7受灾面积.
e。
因变量:
模型汇总表中显示了各模型的拟合情况,从表中可以看出各模型的相关系数R都等于1或非常接近1,随着模型中自变量个数的增加。
标准估计误差逐渐减小,说明模型越来越优.在下文的分析中,主要以模型4进行分析。
3.3.4方差分析
5Anovae(方差分析)
平方和
df
均方
F
Sig。
回归
7.220E9
2799.185
.000a
残差
43845496.519
17
2579146。
854
总计
7.263E9
18
259E9
3.630E9
14623.117
.000b
3971455.642
16
248215.978
263E9
7.262E9
421E9
40387.152
.000c
899104。
627
59940.308
816E9
50571.142
000d
502657.825
14
35904.130
预测变量:
(常量),X4第三产业总产值,X6人口。
c.预测变量:
(常量),X4第三产业总产值,X6人口,X3建筑业总产值。
d。
(常量),X4第三产业总产值,X6人口,X3建筑业总产值,X7受灾面积。
因变量:
财政收入
此表显示个模型的方差分析结果,对于以上模型,F值分别为2799.185、14623。
117、40387.152、50571.142,并且每个模型的显著性概率均Sig<
0。
001,可知回归效果都是显著的。
5回归系数分析及检验预测
表3.6系数a
非标准化系数
标准系数
t
B
标准差
Beta
(常量)
—3500。
289
598.953
—5。
844
.000
481
.009
.997
52.907
66512。
820
5527.066
12.034
.550
.006
139
90.043
—。
585
046
-.160
-12。
674
74841.829
2954.726
25。
330
.640
.013
326
49。
419
-.652
.025
179
—26.558
—.600
.084
-.172
-7。
159
77885。
316
2463.409
31.617
639
.010
325
63。
778
—.664
019
-。
182
—34。
340
-.601
.065
—.172
—9。
273
031
—.009
-3.323
.005
在表3。
6中,B为非标准化得回归系数,t为偏回归系数为0的假设检验的t值,Sig。
为偏回归系数为0的假设检验的显著性水平值。
在逐步回归过程中,利用偏回归系数平方和来判断一个自变量对因变量影响的显著程度。
某因素的偏回归系数平方和愈大,该因素对y的作用也就愈大.
由逐步回归分析原理可知,模型4为最优模型。
故对于财政收入及其各影响因素的回归方程为:
y=77885。
316+0.639X4-0.664X6-0。
601X3—0。
031X7
3.3.6检验预测
为了验证回归方程的有效性,以2010年的数据为例对模型进行检验。
X4=173087.01,X6=134091,X3=26714.4,X7=37426,代入回归方程计算得y=82235。
9306。
检验结果与实际结果的绝对误差为1.0416%.由于财政收入是以亿元为计数单位,故可认为预测结果与实际数据非常吻合,从而验证了模型的有效性。
3.7被剔除的变量信息
7已排除的变量e
BetaIn
偏相关
共线性统计量
容差
X1工业总产值
242a
-.966
.349
235
006
X2农业总产值
—.281a
—3。
749
.002
-.684
036
074a
498
.625
124
017
X5社会商品零售总额
-.404a
—1。
973
066
442
.007
160a
—12.674
954
214
.009a
.384
706
096
.727
X8居民消费水平
-.535a
-10.953
939
.019
.056b
.681
.506
.173
077b
-2.255
039
503
.023
172b
—7.159
880
.014
243b
—6。
750
-.867
007
009b
-1.263
226
310
.699
—.241b
-2.941
605
.003
.078c
188
.505
017c
665
517
.175
—.096c
918
.374
238
001
009c
—3.323
664
006c
089
.931
024
002
.035d
.971
349
260
004
009d
407
.690
—.112
012
-.082d
026
.323
274
036d
666
a.预测变量:
(常量),X4第三产业总产值,X6人口。
c。
(常量),X4第三产业总产值,X6人口,X3建筑业总产值。
d.预测变量:
(常量),X4第三产业总产值,X6人口,X3建筑业总产值,X7受灾面积。
7显示了在逐步回归过程中所建立的模型剔除的变量,以及该变量的Beta值和t统计量值,双尾显著性概率sig。
值、偏相关系数及共线统计量的容差。
3.8残差统计量
表3.8残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
3307.0149
68664.6719
21484。
0953
20087。
10411
19
-296。
10504
449。
33591
.00000
167.10905
标准预测值
—.905
2.349
标准残差
-1.563
2.371
882
财政收入
表3.8显