北航数理统计回归分析大作业Word格式.docx

上传人:b****6 文档编号:21804397 上传时间:2023-02-01 格式:DOCX 页数:12 大小:417.36KB
下载 相关 举报
北航数理统计回归分析大作业Word格式.docx_第1页
第1页 / 共12页
北航数理统计回归分析大作业Word格式.docx_第2页
第2页 / 共12页
北航数理统计回归分析大作业Word格式.docx_第3页
第3页 / 共12页
北航数理统计回归分析大作业Word格式.docx_第4页
第4页 / 共12页
北航数理统计回归分析大作业Word格式.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

北航数理统计回归分析大作业Word格式.docx

《北航数理统计回归分析大作业Word格式.docx》由会员分享,可在线阅读,更多相关《北航数理统计回归分析大作业Word格式.docx(12页珍藏版)》请在冰豆网上搜索。

北航数理统计回归分析大作业Word格式.docx

2解决问题的方法与计算结果

2.1样本数据的采集

本文在进行统计时,查阅《中国统计年鉴》中收录的2010年全国31个省份关于粮食总产量、播种面积、有效灌溉面积、化肥施用量、受灾面积、乡村办水电站相关数据,并将粮食总产量作为因变量,其余各项数据为自变量。

具体数据如表2-1所示。

表2-12010年全国各省份粮食产量及可能影响因素统计表

地区

安徽

3080.5

9053.4

3519.8

319.8

1752.0

810.0

北京

115.7

317.3

211.4

13.7

3.0

72.0

福建

661.9

2270.8

967.5

121.0

605.0

6606.0

甘肃

958.3

3995.2

1278.4

85.3

1304.0

736.0

广东

1316.5

4524.5

1872.5

237.3

724.0

9641.0

广西

1412.3

5896.9

1523.0

237.2

1665.0

2266.0

贵州

1112.3

4889.1

1131.7

86.5

1681.0

1367.0

海南

180.4

833.7

243.8

46.4

306.0

323.0

河北

2975.9

8718.4

4548.0

322.9

1527.0

236.0

河南

5437.1

14248.7

5081.0

655.2

1568.0

545.0

黑龙江

5012.8

12156.2

3875.2

214.9

1432.0

71.0

湖北

2315.8

7997.6

2379.8

350.8

2466.0

1751.0

湖南

2847.5

8216.1

2739.0

236.6

2841.0

4158.0

吉林

2842.5

5221.4

1726.8

182.8

896.0

209.0

江苏

3235.1

7619.6

3819.7

341.1

648.0

133.0

江西

1954.7

5457.7

1852.4

137.6

2075.0

3517.0

辽宁

1765.4

4073.8

1537.5

140.1

756.0

170.0

内蒙古

2158.2

7002.5

3027.5

177.2

2033.0

37.0

宁夏

356.5

1247.9

464.6

37.9

145.0

1.0

青海

102.0

546.9

251.7

8.8

111.0

213.0

山东

4335.7

10818.2

4955.3

475.3

2582.0

89.0

山西

1085.1

3763.9

1274.2

110.4

1396.0

168.0

陕西

1164.9

4185.6

1284.9

196.8

1122.0

585.0

上海

118.4

401.2

201.0

11.8

0.0

四川

3222.9

9478.8

2553.1

248.0

2324.0

4135.0

天津

159.7

459.3

344.6

25.5

33.0

西藏

91.2

240.2

237.0

4.7

51.0

401.0

新疆

1170.7

4758.6

3721.6

167.6

1307.0

455.0

云南

1531.0

6437.3

1588.4

184.6

3215.0

1690.0

浙江

770.7

1451.0

92.2

283.0

3175.0

重庆

1156.1

3359.4

685.3

91.8

575.0

1251.0

注:

分别代表粮食总产量(万吨)、播种面积(千公顷)、有效灌溉面积(千公顷)、化肥施用量(万吨)、受灾面积(千公顷)、乡村办水电站个数。

2.2建模及其结果讨论

本文选取粮食总产量为因变量,播种面积、有效灌溉面积、化肥施用量、受灾面积、乡村办水电站个数为自变量,建立如下统计模型:

其中

是与

无关的未知参量,

是不可观测的随机变量。

选择最优回归方程时,选用逐步回归法,它的基本思想是将一个变量引入,引入的条件是该变量的偏F检验是显著的。

同时,每引入一个新变量后又要对老变量逐个检验,将变得不显著的变量从回归模型中剔除。

这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。

由此可见,逐步回归法是向前法和向后法的一种结合。

将表2-1中数据录入SPSS,生成数据文件,如图2-1所示。

包括2010年我国31个省份相关数据,其中“地区”为字符型变量,其余为数值型变量。

图2-1SPSS数据文件(部分)

各个变量的全部观测量统计量如图2-2所示,包括,平均值、标准差以及观测量个数。

图2-2观测值统计量

在图2-3中给出了相关系数矩阵表,可以从中得到各个变量之间的Pearson相关系数。

从图中可以看出,粮食总产量与播种面积、有效灌溉面积、化肥施用量存在显著相关关系。

图2-3相关系数矩阵

图2-4给出了输入、剔除的变量,从表中我们可以看出播种面积与有效灌溉面积成为输入变量,而其他变量被剔除。

图2-4输入/剔除变量表

图2-5给出了模型整体拟合效果的概述,从表中我们可以看出,模型1的拟合优度系数为0.918,模型二的拟合优度系数为0.935,反映了因变量与自变量之间具有高度显著的线性关系,但是DW=1.486,可能存在序列相关。

图2-5模型概述图

图2-6给出了方差分析表,可以看出模型一回归平方和为54112049.640,残差平方和为10118458.066,模型二回归平方和为56125565.788,残差平方和为8104941.920,总平方和为64230507.708,模型二中回归平方和解释了总发平方和的更大部分,此外,根据F统计量与Sig可知,两个模型的显著性都很高。

图2-6方差分析图

图2-7给出模型参数表,从中可以看出各变量的VIF都不超过10,同时给出了回归系数和变量显著性检验的T值,通过表中的回归系数可以算出两个模型的回归模型,并且通过变量显著性检验的T值,对变量的显著性进行检验,可以看出两个模型解释变量的显著性水平都非常小,甚至趋于0,可以认为解释变量的系数很显著。

图2-7模型参数图

图2-8给出了已排除的变量表,从表中可以看出,在模型一中,被排除的变量为有效灌溉面积、化肥施用量、受灾面积、乡村办水电站个数,而模型二中,被排除的变量为化肥施用量、受灾面积、乡村办水电站个数。

图2-8已排除变量表

图2-9给出了共线性诊断表,可以看出其中的ConditionIndex<

15,两个模型都不存在严重的线性相关。

图2-9共线性诊断图

图2-10给出了残差统计图,图中给出了预测值、残差、标准化预测值、预测值的标准误、残差、标准化残差等的最小值、最大值、均值、标准差及样本容量。

从中也可以看出标准残差的绝对值最大为3.084>

3,可能存在奇异值。

图2-10残差统计图

图2-11给出了残差分析图,其中横坐标X为标准化残差,纵坐标Y为因变量,从图中可以看出散点呈随机分布,且随机分布在标准化残差0值两侧,因此可以认为模型的方差性检验通过,并且模型的拟合程度良好。

图2-11残差分析图

图2-12、2-13分别给出了残差分布直方图与正态概率P-P图。

从这两张图中我们可以判断回归后的实际残差是否符合我们以前残差正态的假设,由2-12看出残差分布不是很明显地服从正态分布,但介于我们样本数量较少,又根据2-13点基本散布在斜线附近,因此,可以认为残差分布基本上是正态的。

图2-12残差分布直方图

图2-13正态概率P-P图

3结论

在上述建模过程中,通过对采集数据用逐步回归法进行了保留与剔除,得出两个较为合适的模型,我们对两个模型进行了方差分析、偏回归系数检验、方差齐性检验、残差的正态检验。

并且通过对两个模型的拟合优度系数,回归平方和占总平方和的比例,最终选择模型二,即

(单位:

万公顷)认为它的拟合效果更好,更能真实反映全国粮食总产量,并利用此模型对次年粮食总产量的数值进行预测。

同时,由于样本数量少,时间不够充裕,模型也存在一些不足,包括DW值小于2,可能存在回归模型中误差项不独立的情况,还有标准残差最大绝对值稍大于3,可能存在奇异值,这些都有可能对我们模型的估计与结论产生不好的影响。

不过综合来看,该模型满足一般需求,能够对全国粮食总产量进行基本的预测。

参考文献

[1]孙海燕,周梦,李卫国,冯伟.应用数理统计[M].北京:

北京航空航天大学数学系,2014:

167-190

[2]吕振通,张凌云.SPSS统计分析与应用[M].北京:

机械工业出版社,2009:

94-105

[3]李兴绪,殷溪源.SPSS经济统计分析[M].北京:

中国统计出版社,2008:

169-185

[4]国家统计局.中国统计年鉴[M].中国统计出版社,2011:

466,473,477,492

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 辩护词

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1