应用回归分析论文.docx
《应用回归分析论文.docx》由会员分享,可在线阅读,更多相关《应用回归分析论文.docx(14页珍藏版)》请在冰豆网上搜索。
应用回归分析论文
应用回归分析论文
JISHOU UNIVERSITY
本科生课程论文
题目:
粮食总产量的影响因素分析
课程名称:
应用回归分析
所属学院:
专业年级:
学生姓名:
学号:
完成时间:
2015年12月23日
粮食总产量的影响因素分析
摘要:
目前,我国70%人口为农村人口,农业生产的发展直接关系广大农民生活的提高,直接关系到国家经济建设目标的实现。
影响粮食产量的因素很多,本文将对影响我国粮食产量的部分因素(包括农用机械总动力、化肥施用量、粮食作物耕种面积)进行分析,并利用spss统计软件,运用逐步回归分析方法,建立了我国粮食产量的回归模型,从中分理出主要影响因素。
研究表明,利用逐步回归分析法建立的模型具有很好的拟合效果,影响我国粮食产量的主要因素为:
化肥施用量、粮食作物耕种面积。
通过分析得出结论:
提高粮食作物耕种面积是粮食增产的最有效途径,不过考虑到我国耕地资源有限,可提高粮食面积单产来达到提高粮食总产量的目标;高度机械化带来农业机械的闲置,农业机械的大量增加在粮食增产上效果并不明显:
盲目增加化肥的使用量并不能从根本上增加粮食产量,关键是要提高化肥的利用率。
关键词:
粮食总产量农用机械总动力化肥施用量粮食作物耕种面积OLS回归多重共线性
一、引言
1998—2003年,我国粮食总产量连续5年下降,总产量由51230万吨下降到43065万吨,下降幅度到16%。
从各个影响因素来看,造成下降的主要原因是耕种面积的减少。
而造成耕种面积减少的根本原因就是来自粮食价格的信号,粮食价格低迷直接造成种粮收益的降低,农民或者改变种植结构,或者索性撂荒,致使粮食耕种面积大幅下降。
2004年以后,我国粮食实现恢复性增产,重视退耕还林草,进行水土治理,改善生态环境,改善农田小气候,同时应加强农田水利建设,进行生产能力建设,保证粮食生产的稳定发展。
二、模型设定及数据准备
影响粮食总产量的因素有很多,包括粮食作物耕种面积、粮食面积单产、有效灌溉面积、化肥用量、农药用量、农业机械总动力、农用塑料薄膜用量、受灾面积、成灾面积等,现选取了五个解释变量粮食播种面积(X1)、农业化肥施用量(X2)、成灾面积(X3)、农业机械总动力(X4)、有效灌溉面积(X5),对我国1990年到2013年的粮食总产量(Y)进行分析,并利用计量经济学方法对所建立模型进行定量分析,研究各影响因素的影响程度。
(数据见附录)。
三、回归模型建立
1.模型设定
首先,根据1990年—2013年的相关数据利用SPSS软件分析和估计模型的参数,得到序列Y、X1、X2、X3、X4、X5的矩阵图。
可以看出,粮食产量及各影响因素的差异明显,其变动的方向基本相同,相互间可能具有一定的相关性,将模型设定为线性回归模型形式:
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+μ
2、估计参数
利用SPSS对上述数据作线性回归分析,估计模型参数,输出结果2-1如下。
输出结果2-1
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
.000
X1
.571
.041
.550
.000
.513
X2
.680
.000
.027
X3
.029
.000
.749
X4
.028
.011
.047
X5
.123
.201
.134
.612
.548
.017
a.因变量:
Y
模型汇总b
模型
R
R方
调整R方
标准估计的误差
更改统计量
Durbin-Watson
R方更改
F更改
df1
df2
Sig.F更改
1
.993a
.985
.981
.985
5
18
.000
a.预测变量:
(常量),X5,X3,X1,X4,X2。
b.因变量:
Y
Anovaa
模型
平方和
df
均方
F
Sig.
1
回归
5
.062
.000b
残差
18
总计
23
a.因变量:
Y
b.预测变量:
(常量),X5,X3,X1,X4,X2。
(1)根据输出结果可以得出,模型估计的结果写为
Y=++
t=
R2=-R2=0.981F=DW=
(2)复相关R=,决定系数R²=,由决定系数看,回归方程高度显著。
(3)由方差分析表可以得出,F=,P值=,表明回归方程高度显著,说明X1、X2、X3、X4、X5整体上对Y有高度显著地线性影响。
四、模型检验
1、经济意义检验
从经济学意义上来说,我国粮食产量Y与粮食播种面积X1、农业化肥使用量X2、农用机械总动力X4、有效灌溉面积X5成正相关,与成灾面积X3成负相关。
但回归求得的函数关系中粮食产量Y与农用机械总动力X4成负相关,符号不符合经济意义。
2、统计检验
(1)拟合度检验。
由回归结果表明,-R2和调整-R2的值都接近于1,表明模型的拟合优度较好。
(2)t检验。
查表可知:
在α=的显著性水平下,自由度n-k-1=18的t统计量的临界值为tα/2(18)=,X1,X2,X3,X4的t值大于该临界值,所以X1,X2,X3,X4在95%的水平下影响显著,通过了变量显著性检验。
(3)F检验。
F统计量的临界值为(5,18)=,F大于该临界值,所以模型的线性关系在95%的置信水平下显著成立。
3、回归模型的检验
(1)多重共线性检验
从输出结果2-1中看到,X4的方差扩大因子VIF4=,远大于10,并且X4的回归系数为负值,说明此回归模型仍然存在强多重共线性,应该剔除变量。
剔除X4,用Y与剩下的四个自变量X1、X2、X3、X5建立回归模型,有关计算结果如输出结果3-1所示。
输出结果3-1
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
.003
X1
.627
.042
.604
.000
.669
X2
.793
.000
.027
X3
.030
.001
.983
X5
.188
.256
.027
a.因变量:
Y
从输出结果3-1中看到,X5的方差扩大因子VIF5=,远大于10,并且X5的回归系数为负值,说明此回归模型仍然存在强多重共线性,应该剔除变量
剔除X5,用Y与剩下的3个自变量X1、X2、X3建立回归模型,有关计算结果如输出结果3-2所示。
输出结果3-2。
系数a
模型
非标准化系数
标准系数
t
Sig.
共线性统计量
B
标准误差
试用版
容差
VIF
1
(常量)
.000
X1
.630
.043
.607
.000
.671
X2
.160
.000
.672
X3
.030
.001
.991
a.因变量:
Y
从输出结果3-2中看到,3个方差扩大因子都小于10,回归系数也都有合理的经济解释,说明此回归模型不存在强多重共线性,可以作为最终回归模型。
回归方程为:
Y=++
(2)逐步回归
用前进法对变量Y、X1、X2、X3作逐步回归,输出结果3-3如下
输出结果3-3
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
.000
X2
.451
.839
.000
2
(常量)
.000
X2
.210
.000
X1
.640
.056
.616
.000
3
(常量)
.000
X2
.160
.000
X1
.630
.043
.607
.000
X3
.030
.001
a.因变量:
Y
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.839a
.703
.690
2
.979b
.959
.955
3
.989c
.977
.974
a.预测变量:
(常量),X2。
b.预测变量:
(常量),X2,X1。
c.预测变量:
(常量),X2,X1,X3。
Anovaa
模型
平方和
df
均方
F
Sig.
1
回归
1
.000b
残差
22
总计
23
2
回归
2
.000c
残差
.413
21
总计
23
3
回归
3
.000d
残差
20
总计
23
a.因变量:
Y
b.预测变量:
(常量),X2。
c.预测变量:
(常量),X2,X1。
d.预测变量:
(常量),X2,X1,X3。
由输出结果3-3可以看到,前进法依次引入了X1、X2、X3变量,最优回归模型为
Y=++综上分析,最终粮食生产的函数应以Y=f(X1,X2,X3)为最优,拟合结果如下:
Y=++(3)异方差检验
用SPSS软件建立Y对X1、X2、X3的普通最小二乘回归,并保留残差,结果如下输出结果3-4所示
输出结果3-4
ANOVA
平方和
df
均方
F
Sig.
方程1
回归
3
.000
残差
20
总计
23
系数
未标准化系数
Beta
t
Sig.
B
标准误
方程1
(常数)
.000
X1
.630
.043
.607
.000
X2
.160
.000
X3
.030
.001
一般认为,如果一个回归模型满足所给出的基本假定,所有残差应在e=0附近随机变化,并在变化幅度不大的一个区域内,所以从残差图看出,模型不存在异方差性。
(4)自相关检验
用DW检验,输出结果如下:
输出结果3-5
模型汇总d
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.839a
.703
.690
2
.979b
.959
.955
3
.989c
.977
.974
a.预测变量:
(常量),X2。
b.预测变量:
(常量),X2,X1。
c.预测变量:
(常量),X2,X1,X3。
d.因变量:
Y
由输出结果3-5可以看出,该回归方程决定系数均显著。
对n=24,k=3,a=,查DW统计表可知,dl=,du==,所以du=五、模型的确定
通过以上检验,最终确定模型为:
Y=++六、结论
由上述的分析结果可以看出在选择的五个因素中,农药化肥施用量、粮食播种面积和成灾面积对粮食产量的影响较为显著,模型在建立的过程中剔除了农业机械总动力和灌溉面积两个因素,因为在模型的建立中参数符号不符合经济意义且参数的t检验和显著性检验不能通过。
从回归模型可以看出,对粮食产量的贡献中化肥施用量最显著。
这是因为在农业的生产过程中,化肥施用由传统的农家肥向现代新型肥料转变,化肥施用量的增加极大地促进了粮食产量的提高。
播种面积对粮食产量的贡献虽然没有化肥施用量显著,但由于耕地面积的数值远远大于化肥施用量,因此耕地面积的增加对粮食产量的提高贡献较大。
成灾面积对粮食产量的影响系数较小,但若受灾面积绝对值较大时,那么灾害会引起粮食产量较大幅度减少,因此减小成灾面积是提高粮食产量的关键。
参考文献
【1】、庞皓,《应用回归分析》,北京:
中国人民大学出版社,第四版
【2】、周四军,《对我国粮食生产影响因素的分析》,《统计与决策》,2003年
【3】、《中国统计年鉴》,2014年
附录
数据
表一中国粮食生产与相关投入资料
年份
中国粮食产量
粮食播种面积
农业化肥施用量
成灾面积
农用机械总动力
有效灌溉面积
Y(万吨)
X1(千公顷)
X2(万吨)
X3(千公顷)
X4(万千瓦)
X5(千公顷)
1990
39151
110933
1931
23656
22950
1991
40208
111268
1999
20393
24836
44403
1992
39408
110123
2142
23945
26575
1993
40755
112205
2357
24449
28067
1994
44624
113466
2590
17819
28708
1995
43529
112314
2806
27814
29389
1996
44264
110560
2930
25895
30308
1997
45649
110509
3152
23133
31817
1998
44510
109544
3318
31383
33802
1999
46662
110060
3594
22267
36118
2000
50454
112548
3828
21233
38547
2001
49417
112912
3981
30309
42016
2002
51230
113787
4084
25181
45208
2003
50839
113161
4124
26731
48996
2004
46218
108463
4146
34374
52574
2005
45264
106080
4254
31793
55172
2006
45706
103891
4339
27319
57930
2007
43070
99410
4412
32516
60387
2008
46947
101606
4637
16297
64028
2009
48402
104278
4766
19966
68398
2010
49804
104958
4928
24632
72522
2011
50160
105638
5108
25064
76590
2012
52871
106793
5239
22283
82190
2013
53082
108986
5404
21234
87496