关于水稻产量影响因素的多元回归分析致远书屋.docx

上传人:b****4 文档编号:3384898 上传时间:2022-11-22 格式:DOCX 页数:14 大小:66.02KB
下载 相关 举报
关于水稻产量影响因素的多元回归分析致远书屋.docx_第1页
第1页 / 共14页
关于水稻产量影响因素的多元回归分析致远书屋.docx_第2页
第2页 / 共14页
关于水稻产量影响因素的多元回归分析致远书屋.docx_第3页
第3页 / 共14页
关于水稻产量影响因素的多元回归分析致远书屋.docx_第4页
第4页 / 共14页
关于水稻产量影响因素的多元回归分析致远书屋.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

关于水稻产量影响因素的多元回归分析致远书屋.docx

《关于水稻产量影响因素的多元回归分析致远书屋.docx》由会员分享,可在线阅读,更多相关《关于水稻产量影响因素的多元回归分析致远书屋.docx(14页珍藏版)》请在冰豆网上搜索。

关于水稻产量影响因素的多元回归分析致远书屋.docx

关于水稻产量影响因素的多元回归分析致远书屋

摘要

1、研究背景及意义

2、问题的提出

3、模型的建立和求解

3.1相关分析—简单散点图

3.2多元回归分析—参数估计

3.3三种检验

3.3.1回归方程的拟合优度检验

3.3.2回归方程的显著性检验—F检验

3.3.3参数显著性检验—t检验

4、多重共线性检验分析

5、自相关分析

6、模型的修正

6.1逐步修正法

 

关于水稻产量影响因素的多元线性回归分析

摘要

本文的主要内目的是对影响水稻产量的因素进行分析,主要运用了SPSS18,采用多元线性回归分析的方法对我国最近18年影响水稻产量的主要因素进行了分析,建立了以水稻产量为因变量,水稻播种面积、化肥施用量、生猪存栏量和降水量四种影响因素为自变量的多元线性回归模型,利用模型对各个因素进行了统计分析,并且对模型进行了修正检验,在此基础上提出一些提高水稻产量的合理化建议。

关键词:

SPSS18水稻产量多元回归线性分析

1、研究背景及意义

我国是一个人口大国,众所周知,很多偏远地方的人们仍然处在饥饿的边缘,水稻产量的提高首先可以很好的改善部分地区的粮食紧张问题,为我国经济的发展和社会的稳定提供有效的保障,其次,水稻产量的提高有利于稳定粮食的价格。

因此,对影响水稻产量的因素进行多元回归线性分析可以得出各个因素的影响程度,从而采取正确的措施,以最少的投入得到最大的产量,这对于农业的科学发展是十分必要的。

2、问题的提出

下面的表格给出了我国最近18年来水稻产量与影响和制约水稻产量的主要因素的有关数据。

表118年来水稻产量和相关影响数据

水稻播种面积(万亩)

化肥施用量(万公斤)

生猪存栏量(万口)

降水量(10mm)

水稻总产量(万公斤)

147.00

2.00

15.00

27.00

154.50

148.00

3.00

26.00

38.00

200.00

154.00

5.00

33.00

20.00

227.50

157.00

9.00

38.00

99.00

260.00

153.00

6.50

41.00

43.00

208.00

151.00

5.00

39.00

33.00

229.50

151.00

7.50

37.00

46.00

265.50

154.00

8.00

38.00

78.00

229.00

155.00

13.50

44.00

52.00

303.50

155.00

18.00

51.00

22.00

270.50

156.00

23.00

53.00

39.00

298.50

155.00

23.50

51.00

28.00

229.00

157.00

24.00

51.00

46.00

309.50

156.00

30.00

52.00

59.00

309.00

159.00

48.00

52.00

70.00

371.00

164.00

95.50

57.00

52.00

402.50

164.00

93.00

68.00

38.00

429.50

156.00

97.50

74.00

32.00

427.50

数据来源:

中国国家统计局,《中国统计年鉴》

在现实生活中,影响水稻产量的因素有很多,但是不能一一列举,我们只是选择了水稻播种面积、化肥施用量、生猪存栏量和降水量4个影响因素作为解释变量进行了回归分析。

变量的定义如下:

Y:

水稻总产量(万公斤)

X1:

水稻播种面积(万亩)

X2:

化肥施用量(万公斤)

X3:

生猪存栏量(万口)

X4:

降水量(10mm)

下面利用SPSS18对变量间的关系进行求解。

3、模型的建立和求解

3.1相关分析—简单散点图

按:

“图形—旧对话框—散点/点状图”顺序做,做数据散点图,观测因变量和自变量之间关系是否存在线性关系。

图1水稻产量与水稻播种面积之间的简单散点图

图2水稻产量与化肥施用量之间的简单散点图

图3水稻产量与生猪存栏量之间的简单散点图

图4水稻产量与降水量之间的简单散点图

从上面四个散点图可以看出,水稻种植面积、化肥施用量、生猪存栏量和水稻产量存在明显的相关关系,降水量与水稻产量的相关关系不是那么的明显。

这样的话,我们就可以建立水稻产量与水稻播种面积、化肥施用量、生猪存栏量、降水量之间建立线性回归模型。

3.2多元回归线性分析—参数估计

以水稻产量Y为因变量,X1:

水稻播种面积(万亩),X2:

化肥施用量(万公斤),X3:

生猪存栏量(万口),X4:

降水量(10mm)为自变量,用“分析—回归—线性—进入”方法进行参数的最小二乘估计,得到回归系数的表格,结果如表2所示:

表2系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

-160.312

410.391

-.391

.702

水稻播种面积(万亩)

1.878

2.836

.105

.662

.519

化肥施用量(万公斤)

1.284

.379

.529

3.391

.005

生猪存栏量(万口)

2.090

.885

.370

2.361

.034

降水量(10mm)

.483

.359

.124

1.343

.202

a.因变量:

水稻总产量(万公斤)

初步得到该问题的多元回归线性分析模型:

Y=-160.312+1.878X1+1.284X2+2.090X3+0.483X4

从经济意义上讲,水稻的播种面积增大,化肥施用量加大,生猪存栏量变多,,降水量变大,水稻的产量会变大,因变量与4个自变量之间成正相关的关系,得到的模型符合现实的经济意义。

3.3三种检验

3.3.1回归方程的拟合优度检验

表3显示了相关系数R、相关系数的平方、调整的相关系数的平方和估计值误差和DW,这些数据反映了因变量与自变量之间的线性相关强度。

表3模型汇总b

模型

R

R方

调整R方

标准估计的误差

Durbin-Watson

1

.958a

.918

.893

26.12780

2.705

a.预测变量:

(常量),降水量(10mm),生猪存栏量(万口),化肥施用量(万公斤),水稻播种面积(万亩)。

b.因变量:

水稻总产量(万公斤)

由表3可以看出,R的平方=0.918调整后的R的平方=0.893

样本决定系数和调整样本系数都很接近于1,拟合度很高,故通过拟合优度检验,认为解释变量应该对被解释变量有显著解释能力。

3.3.2回归方程的显著性检验—F检验

表4显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。

方差来源有回归、残差、和总和。

从表中可以看出,F=36.355,回归的自由度是4,残差的自由度是13,总计的自由度是17.显著性水平是0.05.

表4Anovab

模型

平方和

df

均方

F

Sig.

1

回归

99271.465

4

24817.866

36.355

.000a

残差

8874.605

13

682.662

总计

108146.069

17

a.预测变量:

(常量),降水量(10mm),生猪存栏量(万口),化肥施用量(万公斤),水稻播种面积(万亩)。

b.因变量:

水稻总产量(万公斤)

此模型中样本数是18,自由变量是4个,故该模型的F统计量服从F(4,13),由此查表得到临界值F(4,13)=3.18,由上表可知本模型的F值是36.355.大于临界值,故拒绝原假设,认为回归方程显著,即模型通过方程的显著性检验。

3.3.3参数的显著性检验—T检验,显著性水平为0.05

表5系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

-160.312

410.391

-.391

.702

水稻播种面积(万亩)

1.878

2.836

.105

.662

.519

化肥施用量(万公斤)

1.284

.379

.529

3.391

.005

生猪存栏量(万口)

2.090

.885

.370

2.361

.034

降水量(10mm)

.483

.359

.124

1.343

.202

a.因变量:

水稻总产量(万公斤)

此模型中样本是18,自变量个数是4,则该模型各回归系数的T统计量应服从T(13)的分布,查询临界值为1.77,由上表得到的5个回归系数的T的值分别是-0.391、0.662、3.391、2.361、1.343,水稻播种面积降水量T的绝对值小于临界值,化肥施用量和生猪存栏量大雨临界值,这些模型可能存在多重共线性,下面将进行该模型是否存在多重共线性检验。

4、多重共线性分析

由以下三种方法均能看出该模型是否存在多重共线性。

A、变量间的相关分析

表6相关性

相关性

水稻播种面积(万亩)

化肥施用量(万公斤)

生猪存栏量(万口)

降水量(10mm)

水稻总产量(万公斤)

水稻播种面积(万亩)

Pearson相关性

1

.774**

.782**

.280

.839**

显著性(双侧)

.000

.000

.260

.000

N

18

18

18

18

18

化肥施用量(万公斤)

Pearson相关性

.774**

1

.826**

-.026

.913**

显著性(双侧)

.000

.000

.917

.000

N

18

18

18

18

18

生猪存栏量(万口)

Pearson相关性

.782**

.826**

1

-.008

.889**

显著性(双侧)

.000

.000

.974

.000

N

18

18

18

18

18

降水量(10mm)

Pearson相关性

.280

-.026

-.008

1

.136

显著性(双侧)

.260

.917

.974

.589

N

18

18

18

18

18

水稻总产量(万公斤)

Pearson相关性

.839**

.913**

.889**

.136

1

显著性(双侧)

.000

.000

.000

.589

N

18

18

18

18

18

**.在.01水平(双侧)上显著相关。

上表中每一横隔的第一行构成了解释变量间的相关系数矩阵,相关系数汇总如下:

水稻播种面积(万亩)

化肥施用量(万公斤)

生猪存栏量(万口)

降水量(10mm)

水稻总产量(万公斤)

水稻播种面积(万亩)

1

.774**

.782**

.280

.839**

化肥施用量(万公斤)

.774**

1

.826**

-.026

.913**

生猪存栏量(万口)

.782**

.826**

1

-.008

.889**

降水量(10mm)

.280

-.026

-.008

1

.136

水稻总产量(万公斤)

.839**

.913**

.889**

.136

1

由上图可以看出,水稻播种面积与化肥施用量、生猪存栏量三者之间的相关关系明显,这表明模型存在共线性。

B、共线性诊断

共线性诊断a

模型

维数

特征值

条件索引

方差比例

(常量)

水稻播种面积(万亩)

化肥施用量(万公斤)

生猪存栏量(万口)

降水量(10mm)

1

1

4.383

1.000

.00

.00

.00

.00

.01

2

.486

3.003

.00

.00

.22

.00

.03

3

.113

6.238

.00

.00

.05

.01

.71

4

.018

15.426

.00

.00

.52

.82

.01

5

.000

204.508

1.00

1.00

.20

.17

.24

a.因变量:

水稻总产量(万公斤)

 

第2个特征值,水稻播种面积与化肥施用量发生了多重共线性,第3个特征值化肥施用量和降水量发生了多重共线性,降水量和所有的自变量多重共线性。

C、通过各自变量的方差膨胀因子来判断

容差在0—1之间变化,越接近0说明共线性越强,越接近1说明共线性越弱。

方差膨胀因子VIF,VIF越接近1说明共线性越弱,VIF大于10,说明自变量之间存在严重的多重共线性。

系数a

模型

非标准化系数

标准系数

t

Sig.

共线性统计量

B

标准误差

试用版

容差

VIF

1

(常量)

-160.312

410.391

-.391

.702

水稻播种面积(万亩)

1.878

2.836

.105

.662

.519

.250

4.002

化肥施用量(万公斤)

1.284

.379

.529

3.391

.005

.259

3.860

生猪存栏量(万口)

2.090

.885

.370

2.361

.034

.257

3.898

降水量(10mm)

.483

.359

.124

1.343

.202

.741

1.350

a.因变量:

水稻总产量(万公斤)

自变量的VIF都是小于10的,但是水稻播种面积,化肥施用量,生猪存栏量容差接近1,说明共线性强。

5、自相关分析

模型汇总b

模型

R

R方

调整R方

标准估计的误差

Durbin-Watson

1

.958a

.918

.893

26.12780

2.705

a.预测变量:

(常量),降水量(10mm),生猪存栏量(万口),化肥施用量(万公斤),水稻播种面积(万亩)。

b.因变量:

水稻总产量(万公斤)

该模型样本个数是18,解释变量是4,显著水平为0.05,此模型的DW=2.705,查到临界值Dl=0.82Du=1.87,DW处于不确定区间,无法用DW检验检验。

6、逐步修正法

对模型进行逐步回归,得到下图:

系数a

模型

非标准化系数

标准系数

t

Sig.

共线性统计量

B

标准误差

试用版

容差

VIF

1

(常量)

221.684

10.561

20.991

.000

化肥施用量(万公斤)

2.215

.247

.913

8.974

.000

1.000

1.000

2

(常量)

137.123

31.458

4.359

.001

化肥施用量(万公斤)

1.369

.366

.564

3.739

.002

.318

3.140

生猪存栏量(万口)

2.385

.851

.423

2.801

.013

.318

3.140

a.因变量:

水稻总产量(万公斤)

得到两个回归模型:

Y1=221.684+2.215X2

Y2=137.123+1.369X2+2.385X3

模型1和模型2都通过了T检验,

Anovac

模型

平方和

df

均方

F

Sig.

1

回归

90221.429

1

90221.429

80.534

.000a

残差

17924.640

16

1120.290

总计

108146.069

17

2

回归

96376.790

2

48188.395

61.416

.000b

残差

11769.280

15

784.619

总计

108146.069

17

a.预测变量:

(常量),化肥施用量(万公斤)。

b.预测变量:

(常量),化肥施用量(万公斤),生猪存栏量(万口)。

c.因变量:

水稻总产量(万公斤)

由上图可以看出模型1和2都通过了F方检验,回归方程显著。

模型汇总

模型

R

R方

调整R方

标准估计的误差

1

.913a

.834

.824

33.47073

2

.944b

.891

.877

28.01105

a.预测变量:

(常量),化肥施用量(万公斤)。

b.预测变量:

(常量),化肥施用量(万公斤),生猪存栏量(万口)。

从拟合优度来看,模型2的拟合优度最高,其次是模型1.

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1