应用回归分析论文.docx

上传人:b****7 文档编号:10067133 上传时间:2023-02-08 格式:DOCX 页数:18 大小:239.74KB
下载 相关 举报
应用回归分析论文.docx_第1页
第1页 / 共18页
应用回归分析论文.docx_第2页
第2页 / 共18页
应用回归分析论文.docx_第3页
第3页 / 共18页
应用回归分析论文.docx_第4页
第4页 / 共18页
应用回归分析论文.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

应用回归分析论文.docx

《应用回归分析论文.docx》由会员分享,可在线阅读,更多相关《应用回归分析论文.docx(18页珍藏版)》请在冰豆网上搜索。

应用回归分析论文.docx

应用回归分析论文

民族大学

实用回归分析论文

(GuizhouMinzuUniversity)

 

论文题目:

影响谷物的因素分析

年级:

2014级

班级:

应用统计班

小组成员:

黄邦秀学号:

201410100318序号:

4

王远学号:

201410100314序号:

26

江倩学号:

201410100326序号:

11

吴堂礼学号:

时间:

2016.12.06

 

影响谷物的因素分析

摘要:

在实际问题的研究中,经常需要研究某一些现象与影响它的某一最主要因素的关系,如影响谷物产量的因素非常多。

本文采用多元线性回归分析方法,以1994—2014年中国谷物产量及其重要因素的时间序列数据为样本,对影响中国谷物生产的多种因素进展了分析。

分析结果说明,近年来我国谷物生产主要受到单产提高缓慢、播种面积波动大、农业根底设施投入缺乏、自然灾害频繁等重要因素的影响。

为提高谷物产量、促进谷物生产,首先应该提供一套促进谷物生产的政策措施,提高谷物种植效益,增加谷物收入是根本。

在这个前提下,才有可能提高单产、稳定面积、加强根底设施建立、提高抗灾能力,增强我国谷物生产能力和生产稳定性。

关键词:

谷物产量影响因素多元线性回归分析

 

一、问题的提出

我国土地资源稀缺,人口多而粮食需求量大,因此粮食产量的稳定增长,直接影响着人民生活和社会的稳定与开展。

粮食生产的不稳定性对国民经济的影响是不可忽略的,主要表达在:

粮食生产不稳定会引发粮食供求关系的变动,尤其当国家粮食储藏缺乏的时候,很容易导致粮价上涨,从而影响整个宏观经济。

因此,对关系国计民生的这个特殊农产品,我们不得不慎重对待。

因此,分析粮食产量波动的原因,并据此提出相应的对策,对保障粮食生产持续稳定开展,具有重要意义。

二、多元线性回归模型的基假设

〔1〕解释变量x1,x2,x3,xp是确定性变量,不是随机变量,且要求rank(k)=p+1

〔2〕随机误差项具有零均值和等方差,即:

这个假定常称为高斯-马尔柯夫条件。

,即,假设观测值没有系统误差,随机误差项

的平均值为零。

随机误差项

的协方差为零,说明随机误差项在不同的样本之间是不相关的〔在正态假定下即为独立的〕,不存在序列相关,并且有相关的精度。

〔3〕正态分布的假定条件为:

对于多元线性回归的矩阵模式

,这个条件便可表示为:

由上述假定和多元正态分布的性质可知,随机向量y服从n维正态分布,回归模型

的期望向量

因此

三、收集整理统计数据

3.1数据的收集

选用了谷物产量y〔万吨〕、谷物零售价格指数x1、受灾面积x2〔万公顷〕,化肥施用量x3〔万吨〕,乡村农林牧渔业从业人员数x4〔万人〕,谷物作物播种面积x5〔千公顷〕,农用机械总动力x6〔万千瓦〕,农村用电量x7〔亿千瓦〕,把这7个指标的1994—2014年21年间的时间序列数据进展回归分析,来分析这些因素与谷物产量的关系。

以谷物产量作为因变量,其它7个指标作为解释变量进展回归分析。

表1-11994-2014年度谷物产量影响因素表

谷物产量(万吨)y

价格指数x1

受灾面积(万公顷)x2

化肥施用量(万吨)x3

乡村农林牧渔业从业人员数(万人)x4

谷物作物播种面积(千公顷)x5

农用机械总动力(万千瓦)x6

农村用电量(亿千瓦时)x7

1994

35450

110.2

3313.3

1513.4

31152.7

113462

16614.2

396.9

1995

38727.5

99.9

3471.3

1659.8

31645.1

114047

19497.2

435.2

1996

40730.5

99.8

3188.7

1739.8

31685

112884

20912.5

464

1997

37910.8

110.9

4436.5

1775.8

30351.5

108845

22950

508.9

1998

39151.2

109.3

4713.5

1930.6

30467.9

110933

24836

586.7

1999

40473.3

106.2

4208.6

1999.3

30870

111268

26575

658.8

2000

39408

114.1

5087.4

2141.5

31455.7

110123

28067

712

2001

40754.9

121.3

4699.1

2357.1

32440.5

112205

28707

790.5

2002

44624.3

95.2

3847.4

2590.3

33336.4

113466

29388

884.5

2003

43529.3

108.6

5547.2

2805.1

34186.3

112314

30308.4

963.2

2004

44265.8

124.3

5133.3

2930.2

34037

110560

31816.6

1106.9

2005

45648.8

127.7

4882.9

3151.9

33258.2

110509

33802.5

1244.9

2006

44510.1

148.7

5504.3

3317.9

32690.3

109544

36118.1

1473.9

2007

46661.8

134.4

4582.1

3593.7

32334.5

110060

38546.9

1655.7

2008

50453.5

107.5

4698.9

3827.9

32260.4

112548

42015.6

1812.7

2009

49417.1

92.1

5342.9

3980.7

32677.9

112912

45207.7

1980.1

2010

51229.5

96.9

5014.5

4083.7

32626.4

113787

48996.1

2042.2

2011

50838.6

96.4

4998.1

4124.3

32911.8

113161

52573.6

2173.2

2012

46217.5

90.1

5468.8

4146.4

32797.5

108463

55172.1

2421.3

2013

45263.7

101.5

5221.5

4253.8

32451

106080

57929.9

2610.8

2014

45705.8

98.6

4711.9

4339.4

31990.6

103891

60386.5

2993.4

注:

数据来源相应年度的?

中国统计年鉴?

、?

中国农村统计年鉴?

、?

中国农业开展报告?

、?

中华人民国年鉴?

、?

中国统计摘要?

3.2确定理论回归模型的数学形式

通过对中国谷物生产及影响因素的初步定性分析后假设,谷物产量与其它7个指标之间存在多元线性关系,即谷物零售价格指数、受灾面积,化肥施用量,乡村农林牧渔业从业人员数,谷物作物播种面积,农用机械总动力,农村用电量之间存在着线性关系,也即可以把谷物产量的线性回归模型初步设定为:

其中,y:

谷物产量,x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量,然后利用已有的数据进展模型拟合,以便发现这些因素之间存在的数量关系。

可能有人会提出质疑,是否遗漏了其它重要的解释变量,确实像农业科技费用等这些因素对谷物产量有重要的影响,但考虑农业科技费用会导致严重的多重共线性(因为它们与谷物单产有极高的正相关性),又考虑到它代表对农业的投入和科技进步,在选用指标中已有灌溉面积、农机总动力等性质相似的指标,再加上分析工具的局限性,因此就舍弃了这几个指标。

这也是线性相关分析的局限性之一

四、模型参数的估计、模型的检验与修改

4.1SPSS软件运用

将收集到的数据运用SPSS软件进展运算,可以得到以上模型设定的参数估计值,结果如下表

表4-1系数a

模型

非标准化系数

标准系数

B

标准误差

试用版

t

Sig.

1

(常量)

37259.895

24839.352

1.500

.157

x1

-29.854

24.382

-.099

-1.224

.243

x2

-1.606

.581

-.251

-2.765

.016

x3

12.870

2.025

2.843

6.354

.000

x4

-.433

.291

-.100

-1.490

.160

x5

.043

.188

.025

.228

.823

x6

.136

.147

.400

.926

.371

x7

-12.366

3.115

-2.192

-3.970

.002

a.因变量:

y

表4-2模型汇总b

模型

R

R方

调整R方

标准估计的误差

Durbin-Watson

1

.987a

.974

.960

906.04373

2.031

a.预测变量:

(常量),x7,x1,x4,x2,x5,x6,x3。

b.因变量:

y

由表4-2得

所以回归方程拟合较好

表4-3Anovab

模型

平方和

df

均方

F

Sig.

1

回归

3.953E8

7

5.647E7

68.795

.000a

残差

1.067E7

13

820915.240

总计

4.060E8

20

a.预测变量:

(常量),x7,x1,x4,x2,x5,x6,x3。

b.因变量:

y

由上表4-1和表4-2数据可得所求回归方程

4.2用SPSS软件,得到相关系数矩阵表

由相关系数矩阵表得如下矩阵:

相关矩阵

从相关矩阵看出,y与x1,x2,x3,x4,x5,x6,x7的相关系数

偏小,P值=0.232;

偏小,P值=0.006;

,P值=0.000;

偏小,P值=0.002;

偏小P值=0.481;

偏小,P值=0.000;

偏小,P值=0.000。

x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量,说明x1谷物零售价格指数、x2受灾面积,x3化肥施用量,x4乡村农林牧渔业从业人员数,x5谷物作物播种面积,x6农用机械总动力,x7农村用电量对谷物产量无显著影响。

自变量之间可能存在多重共线性,SPSS软件同时可以计算出相关系数显著性单侧和双侧检验的P值。

4.3回归方程的显著性检验

F检验

表4-4Anovab

模型

平方和

df

均方

F

Sig.

1

回归

3.953E8

7

5.647E7

68.795

.000a

残差

1.067E7

13

820915.240

总计

4.060E8

20

a.预测变量:

(常量),x7,x1,x4,x2,x5,x6,x3。

b.因变量:

y

,拒绝原假设,即作出7个自变量整体对因变量y显著影响

x1对应的

t,对应的

;x2对应的

t,对应的

;x3对应的

t,对应的

;x4对应的

t,对应的

;x5对应的

t,对应的

;x6对应的

t,对应的

;x7对应的

t,对应的

,所以x1、x4、x5、x6对y没有显著影响,只有x2、x3、x7通过系数的显著性检验。

回归系数没有通过显著性检验的,将用逐步回归法重新建立回归方程。

4.4利用逐步回归法进展修正

4-5模型汇总

模型

R

R方

调整R方

标准估计的误差

1

.896a

.803

.793

2050.32352

2

.966b

.934

.927

1220.78525

3

.974c

.949

.940

1103.98755

a.预测变量:

(常量),x3。

b.预测变量:

(常量),x3,x5。

c.预测变量:

(常量),x3,x5,x7。

4-6Anovad

模型

平方和

df

均方

F

Sig.

1

回归

3.261E8

1

3.261E8

77.577

.000a

残差

7.987E7

19

4203826.532

总计

4.060E8

20

2

回归

3.792E8

2

1.896E8

127.210

.000b

残差

2.683E7

18

1490316.627

总计

4.060E8

20

3

回归

3.853E8

3

1.284E8

105.371

.000c

残差

2.072E7

17

1218788.516

总计

4.060E8

20

a.预测变量:

(常量),x3。

b.预测变量:

(常量),x3,x5。

c.预测变量:

(常量),x3,x5,x7。

d.因变量:

y

4-7系数a

模型

非标准化系数

标准系数

B

标准误差

试用版

t

Sig.

1

(常量)

31827.796

1437.037

22.148

.000

x3

4.057

.461

.896

8.808

.000

2

(常量)

-45087.994

12920.482

-3.490

.003

x3

4.738

.297

1.047

15.950

.000

x5

.675

.113

.392

5.966

.000

3

(常量)

-25062.601

14716.130

-1.703

.107

x3

7.331

1.189

1.620

6.165

.000

x5

.468

.138

.272

3.401

.003

x7

-3.613

1.614

-.641

-2.238

.039

a.因变量:

y

从表输出结果看到,逐步回归的最优子集为模型3,回归方程为:

由回归方程可以看出,对谷物产量有显著性影响的是x3化肥施用量、x5谷物作物播种面积、x7农村用电量,回归方程中2个自变量的系数为正、1个系数为负,即化肥施用量和谷物作物播种面积越大,每万吨谷物产量越大;农村用电量越大,每万吨谷物产量越小。

具体说,在x5、x7保持不变时,x3每增加一个百分点,每万吨谷物产量平均增加7.331万吨,在x3、x7保持不变时,x5每增加一个百分点,每万吨谷物产量平均增加0.468万吨,在x3、x5保持不变时,x7每增加一个百分点,每万吨谷物产量平均减少3.613万吨。

4.5DW检验法

4-8残差统计量a

极小值

极大值

均值

标准偏差

N

预测值

37091.8359

50786.3945

43855.8095

4389.04304

21

残差

-2284.96460

1848.82971

.00000

1017.82623

21

标准预测值

-1.541

1.579

.000

1.000

21

标准残差

-2.070

1.675

.000

.922

21

a.因变量:

y

模型汇总d

模型

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

Durbin-Watson

1

.803

77.577

1

19

.000

2

.131

35.594

1

18

.000

3

.015

5.010

1

17

.039

1.995

d.因变量:

y

由上表4-2可得,DW=1.995,

,所以误差项之间不存在自相关。

五、结果分析

我们进展了一系列的检验和修正后的结果如下:

,DW=1.995,

从模型中可以看出:

1、x1、x2、x4、x6不符合经济意义的检验,因为在实际上,谷物产量是随着x1谷物零售价格指数的增长而增加;谷物产量是随着x2受灾面积增广而减少,谷物产量是随着x4乡村农林牧渔业从业人员数增加而增加,谷物产量是随着x6农用机械总动力增加而减少,所以最新的模型的剔除了这4个在原模型的解释变量。

2、新的模型说明:

化肥施用量每增加1万吨,谷物产量提高7.331万吨;x5谷物作物播种面积增广一个单位,谷物产量提高0.468万吨;x7农村用电量增加一个单位,谷物产量就会减少3.613万吨

3、可见,化肥使用量是影响谷物产量的显著性因素。

但从经济意义上来说,施肥过度反而会导致谷物死亡,从而减产。

4、所以我们的模型所反映的经济意义不能包括现实中的每一种情况。

六、建议

我们知道农业是一个国民经济的根底,谷物生产是关系到一个国家生存与开展的一个永恒的主题,再加上我国的人口庞大的根本国情,告诉我们。

谷物产量对我国具有特别的意义和重要性。

因而谷物产量生产关系到我们上至国家,下至人民的一件大事,每个人都应该促进和稳定谷物产量提高上做出努力,而政府在此当中的那么是起着关键性的作用。

在此,我们建立的模型的根底上,就谷物产量的提高,提出了一些可供参考的政策。

1、通过模型和上面的分析可以看出,谷物播种面积对产量提高有着重要的作用,所以我们应该在合理的根底上有目的的,有规划的提高耕地面积。

2、化肥使用量虽然对谷物增产有着积极作用,但物极必反,过度使用化肥必然在很大程度上降低土地肥力,抑制谷物的生产。

所以在合理控制化肥量的同时,也要加大对化肥质的提高。

总之,任何措施方法都应该在顺应自然的根底上,我们要保证谷物的稳定增长,就一定要注意走谷物生产的课持续开展之路。

七、参考文献

[1]何晓群,文卿.应用回归分析[M].中国人民大学,2015.3

[]茆诗松,程依明.概率论与数理统计教程[M].高等教育,2011.2

九、附录

y

x1

x2

x3

x4

x5

x6

x7

35450.00

110.20

3313.30

1513.40

31152.70

113462.00

16614.20

396.90

38727.50

99.90

3471.30

1659.80

31645.10

114047.00

19497.20

435.20

40730.50

99.80

3188.70

1739.80

31685.00

112884.00

20912.50

464.00

37910.80

110.90

4436.50

1775.80

30351.50

108845.00

22950.00

508.90

39151.20

109.30

4713.50

1930.60

30467.90

110933.00

24836.00

586.70

40473.30

106.20

4208.60

1999.30

30870.00

111268.00

26575.00

658.80

39408.00

114.10

5087.40

2141.50

31455.70

110123.00

28067.00

712.00

40754.90

121.30

4699.10

2357.10

32440.50

112205.00

28707.00

790.50

44624.30

95.20

3847.40

2590.30

33336.40

113466.00

29388.00

884.50

43529.30

108.60

5547.20

2805.10

34186.30

112314.00

30308.40

963.20

44265.80

124.30

5133.30

2930.20

34037.00

110560.00

31816.60

1106.90

45648.80

127.70

4882.90

3151.90

33258.20

110509.00

33802.50

1244.90

44510.10

148.70

5504.30

3317.90

32690.30

109544.00

36118.10

1473.90

46661.80

134.40

4582.10

3593.70

32334.50

110060.00

38546.90

1655.70

50453.50

107.50

4698.90

3827.90

32260.40

112548.00

42015.60

1812.70

49417.10

92.10

5342.90

3980.70

32677.90

112912.00

45207.70

1980.10

51229.50

96.90

5014.50

4083.70

32626.40

113787.00

48996.10

2042.20

50838.60

96.40

4998.10

4124.30

32911.80

113161.00

52573.60

2173.20

46217.50

90.10

5468.80

4146.40

32797.50

108463.00

55172.10

2421.30

45263.70

101.50

5221.50

4253.80

32451.00

106080.00

57929.90

2610.80

45705.80

98.60

4711.90

4339.40

31990.60

103891.00

60386.50

2993.40

RES_1

ZRE_1

RES_2

ZRE_2

RES_3

ZRE_3

-2284.96469

-2.06974

-2284.96469

-2.06974

-2284.96469

-2.06974

-216.36815

-.19599

-216.36815

-.19599

-216.36815

-.19599

1848.82966

1.67468

1848.82966

1.67468

1848.82966

1.67468

818.96416

.74182

818.96416

.74182

818.96416

.74182

227.71623

.20627

227.71623

.20627

227.71623

.20627

1149

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 节日庆典

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1