影响农业总产值相关因素的分析.docx
《影响农业总产值相关因素的分析.docx》由会员分享,可在线阅读,更多相关《影响农业总产值相关因素的分析.docx(14页珍藏版)》请在冰豆网上搜索。
影响农业总产值相关因素的分析
影响农业总产值相关因素的分析
(经济学院2003级博士生刘良灿吴文元)
一、问题的提出
由于农业生产的特点,决定了农业生产过程中各种生产要素的投入量与产出之间、生产要素与生产要素之间、产品与产品之间的数量关系十分复杂。
因此,反映这种复杂关系的生产函数也是多种多样的。
生产函数按数学形式进行区分,主要有线性生产模型和非线性生产模型两大类。
线性函数模型主要用于描述和反映经济变量之间的线性关系;而非线性函数模型主要用于描述和反映经济变量之间的非线性关系。
应用生产函数模型对农业生产过程中投入产出的数量分析,可以为生产决策提供可靠的经济依据。
同时还由于对农业生产的经济问题加强了数量研究,这就为我们把握和控制农业经济的运行变化规律提供了可能,从而使农业经济学科更好地为农业生产服务。
由于非线性函数模型在分析过程中较为复杂,本文采用了线性函数模型进行农业产出的相关因素分析。
而且在实际的农业经济分析中,线性生产函数模型得到了广泛的应用。
二、解释变量的确定
在农业生产过程中生产要素与产量的关系表现在两个方面,一方面是生产要素对产量的影响,另一方面是生产要素之间的配合比例对产量的影响。
制约农业生产发展的因素是多种多样的,但是在众多的因素中总有一些因素对发展农业生产起着主导的决定性的作用。
因此,解决主导因素成为发展农业生产的关键。
根据我们初步的理论分析,选取以下五个因素作为可能的解释变量,分别如下(包括其含义的解释):
(1)农业机械总动力(万千瓦):
指主要用于农、林、牧、渔业的各种动力机械的动力总和。
包括耕作机械、排灌机械、收获机械、农用运输机械、植物保护机械、牧业机械、林业机械、渔业机械和其他农业机械〔内燃机按引擎马力折成瓦(特)计算、电动机按功率折成瓦(特)计算〕。
不包括专门用于乡、镇、村、组办工业、基本建设、非农业运输、科学试验和教学等非农业生产方面用的动力机械与作业机械。
(2)单位面积谷物产量(公斤/公顷):
指单位耕地面积上的谷物产量。
(3)农作物播种面积(千公顷):
指实际播种或移植有农作物的面积。
凡是实际种植有农作物的面积,不论种植在耕地上还是种植在非耕地上,均包括在农作物播种面积中。
在播种季节基本结束后,因遭灾而重新改种和补种的农作物面积,也包括在内。
(4)农用化肥施用量(万吨):
指本年内实际用于农业生产的化肥数量,包括氮肥、磷肥、钾肥和复合肥。
化肥施用量要求按折纯量计算数量。
折纯量是指把氮肥、磷肥、钾肥分别按含氮、含五氧化二磷、含氧化钾的百分之一百成份进行折算后的数量。
复合肥按其所含主要成分折算。
(5)乡村劳动力数量(万人):
指在乡村从事农业生产活动的劳动力数量。
三、模型的设定-
我们采用多元线性回归模型对农业总产量及其相关因素进行数量分析。
回归模型是研究相关变量之间变化规律的一种数学方法,它把大量的不确定的相关关系转化为确定的函数关系。
通过回归模型的计测,不仅可以指出在现有技术水平条件下所能达到的产量水平及其资源消耗量,而且还可以根据生产要素之间的合理配置,确定获得最大收益的生产模式。
本文的模型设定如下:
y=β1+β2x1+β3x2+β4x3+β5x4+β6x5+ui
其中:
y——农业总产值(亿元)
β1——模型的截距项
x1——农机机械总动力(万千瓦)
x2——单位面积谷物产量(公斤/公顷)
x3——农作物播种面积(千公顷)
x4——化肥使用量(万吨)
x5——乡村劳动力数量(万人)
四、数据的收集
由于本文选用了5个可能的解释变量,《中国统计年鉴》有关这5个指标的数据达不到计量经济学关于样本容量大小的最低要求(即要求至少有30个样本数据)。
故本文采用截面数据来进行模型估计。
本文的数据来源于2003年《中国统计年鉴》。
采用我国2002年31个省、市、自治区的农总产值及农机机械总动力、单位面积谷物产量、农作物播种面积、化肥使用量和乡村劳动力数量等几个指标。
表12001年中国各省、区、市农业总产值及相关因素一览表
名称
X1(万千瓦)
X2(公斤/公顷)
X3(千公顷)
X4(万吨)
X5(万人)
Y(亿元)
北京
395
5194
386.4
15.7
67.9
89.7
天津
603.3
4820
544.5
17.3
81
86.7
河北
2744.4
4025
8990.8
273.4
1665
899.4
山西
1767.5
2806
3672.3
84.9
658
191.3
内蒙古
1423.6
3854
5707.3
79.3
518.4
307.6
辽宁
1401.3
4891
3964.8
109.8
649
503.1
吉林
1096.5
5125
4890.1
114.1
514.3
405.9
黑龙江
1648.3
4512
9989.2
123.2
742.5
540.6
上海
133.9
7320
490.9
20.3
83.2
95.5
江苏
2957.9
6302
7777.4
338
1452.3
1142.7
浙江
2017.2
6082
3245.9
90.3
985.1
529.5
安徽
3165
4829
8733.1
280.7
1975.6
688
福建
888.8
5089
2713.1
117.4
760.4
433.2
江西
1002
5233
5534.7
109.7
977.4
405.9
山东
7689.6
5268
11266.1
428.6
2434.3
1401.3
河南
6078.7
4907
13127.7
441.7
3472.3
1331.6
湖北
1469.2
5885
7489
245.3
1143.7
658.3
湖南
2358
6015
7931.7
184.3
2058.7
665.7
广东
1760.2
5360
5193.1
195.1
1566.4
817.9
广西
1552.4
4656
6288.1
168.1
1555.1
439.9
海南
212.2
4169
871.7
27
179.9
141.3
重庆
628.1
4448
3555.9
72.6
884.6
250.4
四川
1735.1
4759
9571.5
212
2582.6
769.9
贵州
647.9
4236
4650.7
70
1368.3
279.9
云南
1397.8
3923
5929.6
120
1689.4
431.3
西藏
123.2
5044
230.9
3
88.8
27.6
陕西
1099.8
3095
4331.9
131.1
985.9
337.4
甘肃
1122
2905
3688.9
66.1
696.8
254
青海
264.7
3361
529
7.2
141.6
28.9
宁夏
407.6
4044
1007.6
24.6
151.7
49.4
新疆
880.9
5771
3404.1
83.3
321
348.8
(数据来源:
中国统计信息网,2002年《中国统计年鉴》电子版)
五、模型估计及检验
(一)、初步回归分析
利用Eviews软件,用OLS方法对模型进行参数估计,其结果如下:
表2初步回归结果
此回归方程的可决系数为0.95346,说明模型拟合较好。
当取显著水平a=0.05,查t分布表得ta/2(n-6)=t0.025(25)=2.060.因为|tβ1|=1.718093<2.06,所以接受H0:
β1=0,同理,β2、β4、β6也接受H0,即常数项β1、x1的系数β2、x3的系数β4、、x5的系数β6都通不过t检验。
只有x2和x4系数β3、β5通过t检验。
查F分布表得临界值F0.05(k-1,n-k)=F0.05(5,25)=2.62,由于此回归方程的F=102.4342>2.62,则拒绝H0,说明从整体上看解释变量与被解释变量之间的线性关系显著。
查D—W表得,dL=1.09,dU=1.825,这时有dU(二)、多重共线性检验
从初步回归结果的t值可看出,x1、x3、x5系数均不显著,即使x2、x4的系数也不是非常显著。
但是从调整可决系数(AdjustedR-squared=0.944152)来看,模型整体上比较显著,所以该模型可能存在多重共线性,需要对其进行检验。
1、解释变量之间的相关系数如下:
表3x1,x2,x3,x4,x5相关系数
变量名称
X1
X2
X3
X4
X5
X1
1
0.128305980
0.799674825
0.902492593
0.786342460
X2
0.128305980
1
0.078237828
0.216457549
0.090625242
X3
0.799674825
0.078237828
1
0.890861357
0.879363314
X4
0.902492593
0.216457549
0.890861357
1
0.868133219
X5
0.786342460
0.090625242
0.879363314
0.868133219
1
从表中各变量之间的相关系数可以看出x1与x3、x1与x4、x1与x5、x3与x4、x3与x5、x4与x5之间都存在较严重的线性相关性。
2.多重共线性调整过程:
调整的基本思路为:
先用y分别对各解释变量进行单独回归,找出其中调整可决系数最大的解释变量作为第一次调整保留的变量;以此变量为基础再分别对剩下的解释变量进行二元回归,找出一个比第一次调整可决系数大的变量作为要保留的解释变量(如有几个变量的调整可决系数比第一次保留解释变量的调整可决系数都大,那么就选择其中系数最大的那一个);以此类推,直到全部新的调整可决系数比上一次最大的要小,从而确定模型的基本解释变量。
第一次回归结果:
名称
X1
X2
X3
X4
X5
调整可决系数
0.787296
0.052643
0.76663
0.937805
0.717077
第一次回归选择x4
第二次回归结果:
名称
X1
X2
X3
X5
调整可决系数
0.937126
0.942842
0.936970
0.936084
故第二次回归选择x4,x2
第三次回归结果:
名称
X1
X3
X5
调整可决系数
0.943698
0.944627
0.942409
故第三次回归选择x2,x3,x4
第四次回归结果:
名称
X1
X5
调整可决系数
0.946087
0.942730
故第四次回归选择x1,x2,x3,x4
第五次回归:
和x5回归得到的调整可决系数为:
0.944152,小于上面的0.946087,所以模型不应该包括x5这个解释变量。
根据多重共线性检验结果,我们应该选择x1,x2,x3,x4作为解释变量。
以x1,x2,x3,x4作为解释变量进行回归,结果如下:
表4y对x1,x2,x3,x4的回归结果
由回归结果看出,x1,x3仍通不过t检验。
如果选取t值较理想的x2、x4作为解释变量进行回归,结果如下:
表5y对x2、x4的回归结果
回归结果中x2又通不过t检验。
从以上分析看来,似乎模型不太合理。
但是我们进行另外的尝试,用y对x1,x2,x3,x4的不同组合进行回归,比较结果。
x1,x2,x3,x4的其它组合都不太理想,只有x1,x2,x3组合最为理想,其回归结果如下:
表6y对x1,x2,x3的回归结果
相对于前面的回归结果来看,尽管调整可决系数和F值有所降低,但它的t值明显提高了(前面模型的t值有通不过检验的)。
总的来看,选取x1,x2,x3作为解释变量较为合理。
(三)、异方差检验
因为本文采用的是截面数据,故在异方差检验中没必要进行ARCH检验。
White(无交叉项)检验结果如下:
表7White检验
在显著水平为0.05的条件下,查χ2分布表得到临界值χ0.052(6)=12.5916。
而从上表中可看出,nR2=9.007823<χ0.052(6)=12.5916,则接受H0:
辅助回归方程的各个系数均为0(不包括它的截距项为0)。
另外,从上表也可以看出,辅助回归方程各自变量系数的t值均不显著,说明模型中随机误差u不存在异方差。
附:
ARCH检验结果如下:
表8ARCH检验
结果也表明不存在异方差。
(四)、自相关检验
1、检验
从表6可以看出,D-W值为2.666422。
在α=0.05的显著水平下(本模型的样本容量n=31,解释变量个数kˊ=3),查表得dL=1.229,dU=1.650。
因为4-dU需要进行进一步修正。
2、修正
应用Cochrane-Orcutt迭代法进行修正,结果如下:
表9Cochrane-Orcutt迭代法修正结果
经过调整,其D-W值变为2.291942,与未修正时的D-W值(2.666422)相比,有了明显好转。
这时dU六、结果的分析说明
模型经过多重共线性、异方差和自相关检验后,得出最终结果如下:
Y=-284.3075+0.110518*X1+0.07194*X2+0.046102*X3+[AR
(1)=-0.3584]
(82.2177)(0.01953)(0.017334)(0.009963)(0.189106)
t=-3.4579845.6588264.1503554.627321-1.895419
R2=0.916404adj-R2=0.903029F=68.51429
D—W=2.291942
1、统计学检验分析
此模型的可决系数为R2=0.916404,可调整可决系数adj-R2=0.903029,说明模型拟合较好。
当显著水平a=0.05时,查t分布表得ta/2(n-5)=t0.025(25)=2.060。
从上面可以看出,截距项和x1、x2、x3系数的t值都大于临界值2.06,所以系数均显著不为零。
查F分布表得临界值F0.05(k-1,n-k)=F0.05(4,25)=2.74,由于此模型的F=68.51429>2.74,则拒绝H0原假设,说明从整体上看解释变量与被解释变量之间的线性关系显著。
2、计量经济学检验分析
当显著水平a=0.05、n=30和k`=3时,查D—W表得,dL=1.214,dU=1.650,这时有dU而且从前面的分析中知道本模型已经通过了多重共线性和异方差检验。
因为中国农村人口众多,潜在劳动力数量巨大,使得劳动力数量在农业生产中的贡献率较低,因此本文经过分析检验把农村从业人员数量从解释变量中去除。
从农业生产理论可分析出化肥施用量与农作物播种面积有较强的相关性,播种面积越大,化肥施用量也随之增加;同时化肥施用量与单位面积产量也有相关性,一定条件下化肥施用量增加,单位面积产量也相应增加,所以最后经过分析检验,去处化肥施用量这个变量。
3、经济意义分析
农业机械总动力代表农业中的技术因素,单位面积谷物产量代表劳动生产率,农作物播种面积的大小直接决定产出量,从而影响农业总产值,故最后采用剩下的这3个变量作为模型中的解释变量来构建回归方程。
在其他条件不变的条件下,X1的系数为0.1105,表示农机总动力每增加1个单位,农业总产值就增加0.1105个单位;x2的系数为0.0719,表示单位面积谷物产量每增加1个单位,农业总产值就增加0.0719个单位;x3的系数为0.0461,表示农作物播种面积每增加1个单位,农业总产值就增加0.0461个单位。
在这三个因素中,农机总动力对农业总产值的影响较大,而考虑到数量级,单位面积谷物产量的影响也是非常大的。
七、预测和运用
本模型可用于截面数据的结构分析(上面也说明了)和预测。
下面是对原截面数据进行的内插预测情况。
结果可以看出,效果较好。
图1预测结果
图2y的实际值、拟合值和残差的分布
表10y的实际值、拟合值和残差
名称
Actual
Fitted
Residual
2
86.7
176.139682727
-89.4396827272
3
899.4
747.262336016
152.137663984
4
191.3
218.994361837
-27.6943618367
5
307.6
445.989671561
-138.389671561
6
503.1
443.138653629
59.9613463709
7
405.9
395.934122806
9.96587719374
8
540.6
691.986074538
-151.386074538
9
95.5
330.770764074
-235.270764074
10
1142.7
920.560893964
222.139106036
11
529.5
422.529047195
106.970952805
12
688
814.183394332
-126.183394332
13
433.2
350.8129507
82.3870493004
14
405.9
412.151742602
-6.25174260248
15
1401.3
1482.60795836
-81.3079583567
16
1331.6
1368.1714953
-36.5714952966
17
658.3
651.764820528
6.53517947184
18
665.7
770.532798369
-104.832798369
19
817.9
574.312341422
243.587658578
20
439.9
410.801902317
29.0980976826
21
141.3
105.141141694
36.1588583062
22
250.4
246.801106842
3.59889315843
23
769.9
697.76905428
72.1309457196
24
279.9
278.199605337
1.70039466306
25
431.3
435.28422494
-3.98422493982
26
27.6
100.844641735
-73.2446417349
27
337.4
286.573204615
50.826795385
28
254
190.866927004
63.1330729958
29
28.9
-1.50409448454
30.4040944845
30
49.4
91.7552743906
-42.3552743906
31
348.8
402.623900746
-53.8239007458
从上面图表反映的预测情况看出,y的估计值(即拟合值)和实际值拟合效果较好,说明模型经过检验、调整后能够较好的反映客观实际,设定合理。