1、关于水稻产量影响因素的多元回归分析摘要1、研究背景及意义2、问题的提出3、模型的建立和求解3.1相关分析简单散点图3.2多元回归分析参数估计3.3三种检验 3.3.1回归方程的拟合优度检验 3.3.2回归方程的显著性检验F检验 3.3.3参数显著性检验t检验4、多重共线性检验分析5、自相关分析6、模型的修正 6.1逐步修正法 关于水稻产量影响因素的多元线性回归分析摘要本文的主要内目的是对影响水稻产量的因素进行分析,主要运用了SPSS18,采用多元线性回归分析的方法对我国最近18年影响水稻产量的主要因素进行了分析,建立了以水稻产量为因变量,水稻播种面积、化肥施用量、生猪存栏量和降水量四种影响因素
2、为自变量的多元线性回归模型,利用模型对各个因素进行了统计分析,并且对模型进行了修正检验,在此基础上提出一些提高水稻产量的合理化建议。 关键词:SPSS18 水稻产量 多元回归线性分析 1、研究背景及意义我国是一个人口大国,众所周知,很多偏远地方的人们仍然处在饥饿的边缘,水稻产量的提高首先可以很好的改善部分地区的粮食紧张问题,为我国经济的发展和社会的稳定提供有效的保障,其次,水稻产量的提高有利于稳定粮食的价格。因此,对影响水稻产量的因素进行多元回归线性分析可以得出各个因素的影响程度,从而采取正确的措施,以最少的投入得到最大的产量,这对于农业的科学发展是十分必要的。 2、问题的提出下面的表格给出了
3、我国最近18年来水稻产量与影响和制约水稻产量的主要因素的有关数据。 表1 18年来水稻产量和相关影响数据水稻播种面积(万亩)化肥施用量(万公斤)生猪存栏量(万口)降水量(10mm)水稻总产量(万公斤)147.002.0015.0027.00154.50148.003.0026.0038.00200.00154.005.0033.0020.00227.50157.009.0038.0099.00260.00153.006.5041.0043.00208.00151.005.0039.0033.00229.50151.007.5037.0046.00265.50154.008.0038.0078.
4、00229.00155.0013.5044.0052.00303.50155.0018.0051.0022.00270.50156.0023.0053.0039.00298.50155.0023.5051.0028.00229.00157.0024.0051.0046.00309.50156.0030.0052.0059.00309.00159.0048.0052.0070.00371.00164.0095.5057.0052.00402.50164.0093.0068.0038.00429.50156.0097.5074.0032.00427.50数据来源:中国国家统计局,中国统计年鉴 在现
5、实生活中,影响水稻产量的因素有很多,但是不能一一列举,我们只是选择了水稻播种面积、化肥施用量、生猪存栏量和降水量4个影响因素作为解释变量进行了回归分析。 变量的定义如下:Y: 水稻总产量(万公斤)X1: 水稻播种面积(万亩)X2: 化肥施用量(万公斤)X3: 生猪存栏量(万口)X4: 降水量(10mm)下面利用SPSS18对变量间的关系进行求解。 3、模型的建立和求解3.1相关分析简单散点图按:“图形旧对话框散点/点状图”顺序做,做数据散点图,观测因变量和自变量之间关系是否存在线性关系。 图1 水稻产量与水稻播种面积之间的简单散点图图2 水稻产量与化肥施用量之间的简单散点图图3 水稻产量与生猪
6、存栏量之间的简单散点图 图4 水稻产量与降水量之间的简单散点图从上面四个散点图可以看出,水稻种植面积、化肥施用量、生猪存栏量和水稻产量存在明显的相关关系,降水量与水稻产量的相关关系不是那么的明显。这样的话,我们就可以建立水稻产量与水稻播种面积、化肥施用量、生猪存栏量、降水量之间建立线性回归模型。3.2多元回归线性分析参数估计 以水稻产量Y为因变量,X1: 水稻播种面积(万亩),X2: 化肥施用量(万公斤),X3: 生猪存栏量(万口),X4: 降水量(10mm)为自变量,用“分析回归线性进入”方法进行参数的最小二乘估计,得到回归系数的表格,结果如表2所示:表2 系数a模型非标准化系数标准系数tS
7、ig.B标准 误差试用版1(常量)-160.312410.391-.391.702水稻播种面积(万亩)1.8782.836.105.662.519化肥施用量(万公斤)1.284.379.5293.391.005生猪存栏量(万口)2.090.885.3702.361.034降水量(10mm).483.359.1241.343.202a. 因变量: 水稻总产量(万公斤)初步得到该问题的多元回归线性分析模型:Y=-160.312+1.878X1+1.284X2+2.090X3+0.483X4从经济意义上讲,水稻的播种面积增大,化肥施用量加大,生猪存栏量变多,降水量变大,水稻的产量会变大,因变量与4个
8、自变量之间成正相关的关系,得到的模型符合现实的经济意义。3.3三种检验3.31回归方程的拟合优度检验 表3显示了相关系数R、相关系数的平方、调整的相关系数的平方和估计值误差和DW,这些数据反映了因变量与自变量之间的线性相关强度。 表3 模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.958a.918.89326.127802.705a. 预测变量: (常量), 降水量(10mm), 生猪存栏量(万口), 化肥施用量(万公斤), 水稻播种面积(万亩)。b. 因变量: 水稻总产量(万公斤) 由表3可以看出,R的平方=0.918 调整后的R的平方=0.893样本决定系
9、数和调整样本系数都很接近于1,拟合度很高,故通过拟合优度检验,认为解释变量应该对被解释变量有显著解释能力。3.3.2回归方程的显著性检验F检验表4显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。方差来源有回归、残差、和总和。从表中可以看出,F=36.355,回归的自由度是4,残差的自由度是13,总计的自由度是17.显著性水平是0.05.表4 Anovab模型平方和df均方FSig.1回归99271.465424817.86636.355.000a残差8874.60513682.662总计108146.06917a. 预测变量: (常量), 降水量(10mm),
10、 生猪存栏量(万口), 化肥施用量(万公斤), 水稻播种面积(万亩)。b. 因变量: 水稻总产量(万公斤)此模型中样本数是18,自由变量是4个,故该模型的F统计量服从F(4,13),由此查表得到临界值F(4,13)=3.18,由上表可知本模型的F值是36.355.大于临界值,故拒绝原假设,认为回归方程显著,即模型通过方程的显著性检验。3.3.3参数的显著性检验T检验,显著性水平为0.05 表5 系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-160.312410.391-.391.702水稻播种面积(万亩)1.8782.836.105.662.519化肥施用量(万公斤)1
11、.284.379.5293.391.005生猪存栏量(万口)2.090.885.3702.361.034降水量(10mm).483.359.1241.343.202a. 因变量: 水稻总产量(万公斤) 此模型中样本是18,自变量个数是4,则该模型各回归系数的T统计量应服从T(13)的分布,查询临界值为1.77,由上表得到的5个回归系数的T的值分别是-0.391、0.662、3.391、2.361、1.343,水稻播种面积降水量T的绝对值小于临界值,化肥施用量和生猪存栏量大雨临界值,这些模型可能存在多重共线性,下面将进行该模型是否存在多重共线性检验。4、多重共线性分析由以下三种方法均能看出该模型
12、是否存在多重共线性。A、变量间的相关分析 表6 相关性相关性水稻播种面积(万亩)化肥施用量(万公斤)生猪存栏量(万口)降水量(10mm)水稻总产量(万公斤)水稻播种面积(万亩)Pearson 相关性1.774*.782*.280.839*显著性(双侧).000.000.260.000N1818181818化肥施用量(万公斤)Pearson 相关性.774*1.826*-.026.913*显著性(双侧).000.000.917.000N1818181818生猪存栏量(万口)Pearson 相关性.782*.826*1-.008.889*显著性(双侧).000.000.974.000N181818
13、1818降水量(10mm)Pearson 相关性.280-.026-.0081.136显著性(双侧).260.917.974.589N1818181818水稻总产量(万公斤)Pearson 相关性.839*.913*.889*.1361显著性(双侧).000.000.000.589N1818181818*. 在 .01 水平(双侧)上显著相关。上表中每一横隔的第一行构成了解释变量间的相关系数矩阵,相关系数汇总如下:水稻播种面积(万亩)化肥施用量(万公斤)生猪存栏量(万口)降水量(10mm)水稻总产量(万公斤)水稻播种面积(万亩)1.774*.782*.280.839*化肥施用量(万公斤).77
14、4*1.826*-.026.913*生猪存栏量(万口).782*.826*1-.008.889*降水量(10mm).280-.026-.0081.136水稻总产量(万公斤).839*.913*.889*.1361由上图可以看出,水稻播种面积与化肥施用量、生猪存栏量三者之间的相关关系明显,这表明模型存在共线性。B、共线性诊断共线性诊断a模型维数特征值条件索引方差比例(常量)水稻播种面积(万亩)化肥施用量(万公斤)生猪存栏量(万口)降水量(10mm)114.3831.000.00.00.00.00.012.4863.003.00.00.22.00.033.1136.238.00.00.05.01.
15、714.01815.426.00.00.52.82.015.000204.5081.001.00.20.17.24a. 因变量: 水稻总产量(万公斤)第2个特征值,水稻播种面积与化肥施用量发生了多重共线性,第3个特征值化肥施用量和降水量发生了多重共线性,降水量和所有的自变量多重共线性。C、通过各自变量的方差膨胀因子来判断容差在01之间变化,越接近0说明共线性越强,越接近1说明共线性越弱。方差膨胀因子VIF,VIF越接近1说明共线性越弱,VIF大于10,说明自变量之间存在严重的多重共线性。系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)-160.3124
16、10.391-.391.702水稻播种面积(万亩)1.8782.836.105.662.519.2504.002化肥施用量(万公斤)1.284.379.5293.391.005.2593.860生猪存栏量(万口)2.090.885.3702.361.034.2573.898降水量(10mm).483.359.1241.343.202.7411.350a. 因变量: 水稻总产量(万公斤)自变量的VIF都是小于10的,但是水稻播种面积,化肥施用量,生猪存栏量容差接近1,说明共线性强。5、自相关分析模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.958a.918.89
17、326.127802.705a. 预测变量: (常量), 降水量(10mm), 生猪存栏量(万口), 化肥施用量(万公斤), 水稻播种面积(万亩)。b. 因变量: 水稻总产量(万公斤)该模型样本个数是18,解释变量是4,显著水平为0.05,此模型的DW=2.705,查到临界值Dl=0.82 Du=1.87,DW处于不确定区间,无法用DW检验检验。6、逐步修正法对模型进行逐步回归,得到下图:系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)221.68410.56120.991.000化肥施用量(万公斤)2.215.247.9138.974.0001.00
18、01.0002(常量)137.12331.4584.359.001化肥施用量(万公斤)1.369.366.5643.739.002.3183.140生猪存栏量(万口)2.385.851.4232.801.013.3183.140a. 因变量: 水稻总产量(万公斤)得到两个回归模型:Y1=221.684+2.215X2Y2=137.123+1.369X2+2.385X3模型1和模型2都通过了T检验,Anovac模型平方和df均方FSig.1回归90221.429190221.42980.534.000a残差17924.640161120.290总计108146.069172回归96376.790
19、248188.39561.416.000b残差11769.28015784.619总计108146.06917a. 预测变量: (常量), 化肥施用量(万公斤)。b. 预测变量: (常量), 化肥施用量(万公斤), 生猪存栏量(万口)。c. 因变量: 水稻总产量(万公斤)由上图可以看出模型1和2都通过了F方检验,回归方程显著。模型汇总模型RR 方调整 R 方标准 估计的误差1.913a.834.82433.470732.944b.891.87728.01105a. 预测变量: (常量), 化肥施用量(万公斤)。b. 预测变量: (常量), 化肥施用量(万公斤), 生猪存栏量(万口)。从拟合优度来看,模型2的拟合优度最高,其次是模型1.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1