关于水稻产量影响因素的多元回归分析Word格式文档下载.docx
《关于水稻产量影响因素的多元回归分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《关于水稻产量影响因素的多元回归分析Word格式文档下载.docx(14页珍藏版)》请在冰豆网上搜索。
27.00
154.50
148.00
3.00
26.00
38.00
200.00
154.00
5.00
33.00
20.00
227.50
157.00
9.00
99.00
260.00
153.00
6.50
41.00
43.00
208.00
151.00
39.00
229.50
7.50
37.00
46.00
265.50
8.00
78.00
229.00
155.00
13.50
44.00
52.00
303.50
18.00
51.00
22.00
270.50
156.00
23.00
53.00
298.50
23.50
28.00
24.00
309.50
30.00
59.00
309.00
159.00
48.00
70.00
371.00
164.00
95.50
57.00
402.50
93.00
68.00
429.50
97.50
74.00
32.00
427.50
数据来源:
中国国家统计局,《中国统计年鉴》
在现实生活中,影响水稻产量的因素有很多,但是不能一一列举,我们只是选择了水稻播种面积、化肥施用量、生猪存栏量和降水量4个影响因素作为解释变量进行了回归分析。
变量的定义如下:
Y:
水稻总产量(万公斤)
X1:
水稻播种面积(万亩)
X2:
化肥施用量(万公斤)
X3:
生猪存栏量(万口)
X4:
降水量(10mm)
下面利用SPSS18对变量间的关系进行求解。
3、模型的建立和求解
按:
“图形—旧对话框—散点/点状图”顺序做,做数据散点图,观测因变量和自变量之间关系是否存在线性关系。
图1水稻产量与水稻播种面积之间的简单散点图
图2水稻产量与化肥施用量之间的简单散点图
图3水稻产量与生猪存栏量之间的简单散点图
图4水稻产量与降水量之间的简单散点图
从上面四个散点图可以看出,水稻种植面积、化肥施用量、生猪存栏量和水稻产量存在明显的相关关系,降水量与水稻产量的相关关系不是那么的明显。
这样的话,我们就可以建立水稻产量与水稻播种面积、化肥施用量、生猪存栏量、降水量之间建立线性回归模型。
3.2多元回归线性分析—参数估计
以水稻产量Y为因变量,X1:
水稻播种面积(万亩),X2:
化肥施用量(万公斤),X3:
生猪存栏量(万口),X4:
降水量(10mm)为自变量,用“分析—回归—线性—进入”方法进行参数的最小二乘估计,得到回归系数的表格,结果如表2所示:
表2系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
-160.312
410.391
-.391
.702
1.878
2.836
.105
.662
.519
1.284
.379
.529
3.391
.005
2.090
.885
.370
2.361
.034
.483
.359
.124
1.343
.202
a.因变量:
初步得到该问题的多元回归线性分析模型:
Y=-160.312+1.878X1+1.284X2+2.090X3+0.483X4
从经济意义上讲,水稻的播种面积增大,化肥施用量加大,生猪存栏量变多,,降水量变大,水稻的产量会变大,因变量与4个自变量之间成正相关的关系,得到的模型符合现实的经济意义。
3.3.1回归方程的拟合优度检验
表3显示了相关系数R、相关系数的平方、调整的相关系数的平方和估计值误差和DW,这些数据反映了因变量与自变量之间的线性相关强度。
表3模型汇总b
R
R方
调整R方
标准估计的误差
Durbin-Watson
.958a
.918
.893
26.12780
2.705
a.预测变量:
(常量),降水量(10mm),生猪存栏量(万口),化肥施用量(万公斤),水稻播种面积(万亩)。
b.因变量:
由表3可以看出,R的平方=0.918调整后的R的平方=0.893
样本决定系数和调整样本系数都很接近于1,拟合度很高,故通过拟合优度检验,认为解释变量应该对被解释变量有显著解释能力。
3.3.2回归方程的显著性检验—F检验
表4显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。
方差来源有回归、残差、和总和。
从表中可以看出,F=36.355,回归的自由度是4,残差的自由度是13,总计的自由度是17.显著性水平是0.05.
表4Anovab
平方和
df
均方
F
回归
99271.465
4
24817.866
36.355
.000a
残差
8874.605
13
682.662
总计
108146.069
17
此模型中样本数是18,自由变量是4个,故该模型的F统计量服从F(4,13),由此查表得到临界值F(4,13)=3.18,由上表可知本模型的F值是36.355.大于临界值,故拒绝原假设,认为回归方程显著,即模型通过方程的显著性检验。
3.3.3参数的显著性检验—T检验,显著性水平为0.05
表5系数a
此模型中样本是18,自变量个数是4,则该模型各回归系数的T统计量应服从T(13)的分布,查询临界值为1.77,由上表得到的5个回归系数的T的值分别是-0.391、0.662、3.391、2.361、1.343,水稻播种面积降水量T的绝对值小于临界值,化肥施用量和生猪存栏量大雨临界值,这些模型可能存在多重共线性,下面将进行该模型是否存在多重共线性检验。
4、多重共线性分析
由以下三种方法均能看出该模型是否存在多重共线性。
A、变量间的相关分析
表6相关性
相关性
Pearson相关性
.774**
.782**
.280
.839**
显著性(双侧)
.000
.260
N
18
.826**
-.026
.913**
.917
-.008
.889**
.974
.136
.589
**.在.01水平(双侧)上显著相关。
上表中每一横隔的第一行构成了解释变量间的相关系数矩阵,相关系数汇总如下:
由上图可以看出,水稻播种面积与化肥施用量、生猪存栏量三者之间的相关关系明显,这表明模型存在共线性。
B、共线性诊断
共线性诊断a
维数
特征值
条件索引
方差比例
4.383
1.000
.00
.01
2
.486
3.003
.22
.03
3
.113
6.238
.05
.71
.018
15.426
.52
.82
5
204.508
1.00
.20
.17
.24
第2个特征值,水稻播种面积与化肥施用量发生了多重共线性,第3个特征值化肥施用量和降水量发生了多重共线性,降水量和所有的自变量多重共线性。
C、通过各自变量的方差膨胀因子来判断
容差在0—1之间变化,越接近0说明共线性越强,越接近1说明共线性越弱。
方差膨胀因子VIF,VIF越接近1说明共线性越弱,VIF大于10,说明自变量之间存在严重的多重共线性。
系数a
共线性统计量
容差
VIF
.250
4.002
.259
3.860
.257
3.898
.741
1.350
自变量的VIF都是小于10的,但是水稻播种面积,化肥施用量,生猪存栏量容差接近1,说明共线性强。
模型汇总b
该模型样本个数是18,解释变量是4,显著水平为0.05,此模型的DW=2.705,查到临界值Dl=0.82Du=1.87,DW处于不确定区间,无法用DW检验检验。
6、逐步修正法
对模型进行逐步回归,得到下图:
221.684
10.561
20.991
2.215
.247
.913
8.974
137.123
31.458
4.359
.001
1.369
.366
.564
3.739
.002
.318
3.140
2.385
.851
.423
2.801
.013
得到两个回归模型:
Y1=221.684+2.215X2
Y2=137.123+1.369X2+2.385X3
模型1和模型2都通过了T检验,
Anovac
90221.429
80.534
17924.640
16
1120.290
96376.790
48188.395
61.416
.000b
11769.280
15
784.619
(常量),化肥施用量(万公斤)。
b.预测变量:
(常量),化肥施用量(万公斤),生猪存栏量(万口)。
c.因变量:
由上图可以看出模型1和2都通过了F方检验,回归方程显著。
模型汇总
.913a
.834
.824
33.47073
.944b
.891
.877
28.01105
从拟合优度来看,模型2的拟合优度最高,其次是模型1.