数理统计论文.docx

资源描述

数理统计论文.docx

《数理统计论文.docx》由会员分享，可在线阅读，更多相关《数理统计论文.docx（7页珍藏版）》请在冰豆网上搜索。

数理统计论文.docx

数理统计论文

《数理统计》论文

我国粮食主产区的粮食生产能力

区域差异分析

院（系）名称信息工程学院

专业班级 09普本信计1班

学号 090111043

学生姓名陈祥科

指导教师

2011年06月19日

我国粮食主产区粮食生产能力的区域差异分析

摘要

中国粮食生产历经几次波动后,现在总产处于下滑阶段.为实现粮食总体水平的增长,着力点应放在重点地区上.该论文应用数理统计方差分析与多重比较的方法对中国部分粮食主产地区2001-2010年粮食生产能力进行比较优势分析,确定了粮食年产量的综合优势区.通过分析可知中国粮食生产区域比较优势存在较大的差异,各地应按照比较优势原理进行结构调整,以发挥粮食生产的区域比较优势.

关键词：

正态性检验、方差齐性分析、方差分析、多重比较

1.研究背景 1

2.方差分析理论 1

3.数据的分析 2

3.1数据 2

3.2.数据分析与处理 2

3.2.1.正态性检验 2

3.2.2.方差齐性检验 4

3.2.3方差分析 6

3.2.4求四个水平下的0.95置信区间 9

3.2.5多重比较 10

总结 12

课程感言 12

参考文献 13

1.研究背景

我国是一个有着13亿人口的国家，占世界总人口的21%，但我国的可耕土地面积仅为世界可耕土地面积的7%，粮食问题是关系国家安全和国计民生的重大战略问题，任何时候都不能有丝毫的松懈.我国粮食产量从1998年突破5亿吨大关、人均占有水平达到420公斤后，粮食耕地面积连年递减，产量一路走低.在充分肯定农业结构调整取得成绩的同时，我们必须清醒的认识到，近年来粮食播种面积连年下降，粮食连续减产，粮食安全潜伏一定的隐患.导致粮食产量连年下降的重要原因是有一些地方对调整而难过农业结构片面理解，大幅压缩粮食种植面积造成耕地大量减少.而随着基础建设的扩大、城市建设的发展、各种园区的兴起，耕地还会减少.据国土资源部最新调查显示，中国的耕地面积已从1996年的19.21亿亩减少到2002年的18.89亿亩.面对眼前粮价上涨和耕地减少的新情况.专家指出，从中长期看，由于人口剧增，耕地减少，城市化加快，人民生活水平提高，中国粮食需求将刚性增长，粮食供求关系是偏紧的.粮食是关系国计民生的特殊商品，确保粮食安全是中国一项长期的战略任务为了更改高层次的发展我国的经济，真正实现全民共同富裕的目标，确保粮食安全，解决粮食问题是当务之急.而影响到粮食产量的因素是多方面的.下面提取了我国粮食主产区部分地区粮食年产量来进行分析，希望通过调整把粮食种植放在我国粮食主产区上，从理论上找出提高粮食产量的办法.

2.方差分析理论

在实际问题中，人们常常需要在不同的条件下对所研究的对象进行对比试验，从而得到若干组数据（样本）.方差分析就是一种分析、处理多组实验数据间均值差异的显著性的统计方法.其主要任务是，通过对数据的分析处理，搞清楚各实验条件对实验结果的影响，以便更有效地指导实践，提高经济效益或者科研水平.在统计中，人们称受控制的条件为因素，因素所处的状态称为水平.如果只让一个因素变动，取该因素的多个不同水平进行试验，而其他因素保持不变，称该试验为单因素试验.这篇论文主要进行的就是单因素方差分析问题.经过方差分析之后，如果拒绝原假设，认为各组之间的均值有显著差异，那么，这个判断是对整体而言的，并不是说每两个不同的组之间均值都存在显著差异.那么，如何确定哪两个组之间有显著差异、无显著差异呢？

这就要对每种搭配做一对一的比较，即多重比较.在经过多重比较之后，我们就可以对该问题能有一个比较深入的认识.

3.数据的分析

3.1数据

下面是我国四个粮食主产地区的从2001年—2010年这十年的粮食生产能力的统计数据（单位：

亿公斤）现在想了解这四个省份粮食生产能力区域差异性.

表

（1）2001年—2010年这十年的粮食生产能力的统计数据

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

河南省

409

421

357

426

453

505

524

537

539

543

黑龙江

256

294

298

314

360

378

396

423

435

501

辽宁省

168

169

173

172

174

160

184

186

160

177

吉林省

195

221

226

251

258

275

265

285

246

289

3.2.数据分析与处理

3.2.1.正态性检验

目前对于数据是否服从正态分布常用的方法有：

（1）.用正态概率纸的的检验方法：

观察每组数据画出的图形中的点是否在一条直线的附近，即是否用一条直线来拟合这些数据.若是，则可判定数据服从正态分布，否则便不服从.检验完毕之后，还可用卡方拟合优度的方法检验数据与正态分布拟合的好坏程度.

（2）.对于小样本的数据，还可以应用lillietest这个命令来检验数据是否服从正态分布.下面就用这两种方法来检验粮食年产量的分布是否服从正态分布：

1.打开MATLAB命令窗口，清除变量，编制的程序如下：

河南省：

x=[409421357426453505524537539543];

normplot（x）图

（1）河南正态概率纸

[H,P,Jbstat,CV]=jbtest（x,0.05）

H=0

P=0.3494

Jbstat=0.8684

CV=2.5239

黑龙江：

x=[256294298314360378396423435501];

normplot（x）; 图

（2）黑龙江正态概率纸

[H,P,Jbstat,CV]=jbtest（x,0.05）

H=0

P=0.5000

Jbstat=0.4282

CV=2.5239

辽宁省：

x=[168169173172174160184186160177];

[H,P,LSTAT,CV]=lillietest（x）

H=0

P=0.5000

LSTAT=0.1226

CV=0.2620

吉林省

x=[195221226251258275265285246289];

[H,P,LSTAT,CV]=lillietest（x）

H=0

P=0.5000

LSTAT=0.1325

CV=0.2620

以上使用不同的方法对四个不同的省份的粮食年产量进行正态性检验，根据检验的结果可知，H=0，接受原假设，测试值小于临界值.故四个不同的省份的粮食年产量均服从正态分布.河南省粮食总产量接受原假设的概率为0.37，拟合度并不很好.

3.2.2.方差齐性检验

在进行方差分析时要求r个方差相等，这称为方差齐性.理论研究表明，当正态性假定不满足时对F检验影响较小,即F检验对正态性的偏离具有一定的稳健性，而F检验对方差齐性的偏离较为敏感.所以r个方差的齐性检验就显得十分必要.所谓方差齐性检验是对如下一对假设作出检验：

诸

不全相等.很多统计学家提出了一些很好的检验方法，这里介绍几个最常用的检验，它们是：

Hartley检验，仅适用于样本量相等的场合；Bartlett检验，可用于样本量相等或不等的场合，但是每个样本量不得低于5；修正的Bartlett检验，在样本量较小或较大、相等或不等场合均可使用.

下面用Bartlett检验各组数据的方差是否相等：

下面进行方差齐性检验：

程序如下：

clear;

y=[409421357426453505524537539543256294298314360378396423435501168169173172174160184186160177195221226251258275265285246289];

alpha=0.05;

m1=10;m2=10;m3=10;m4=10;

n=m1+m2+m3+m4;

r=4;

SSE=100529.9

fe=n-r;

c=（1/（m1-1）+1/（m2-1）+1/（m3-1）+1/（m4-1）-1/fe）/（3*（r-1））+1;

s1=var（y（1:

m1））;

s2=var（y（（m1+1）:

（m1+m2）））;

s3=var（y（（m1+m2+1）:

（m1+m2+m3）））;

s4=var（y（（m1+m2+m3+1）:

n））;

chi2EST=（fe*log（SSE/fe）-（m1-1）*log（s1）-（m2-1）*log（s2）-（m3-1）*log（s3）-（m4-1）*log（s4））/c;

LJZ=chi2inv（1-alpha,r-1）;

p=1-chi2cdf（chi2EST,r-1）;

ifchi2EST>LJZ

h=1;

else

h=0;

end

alpha,h,p,chi2EST,LJZ

运行结果：

SSE=1.0053e+005 alpha=0.0500 h=1

p=1.0535e-006

chi2EST=30.5572

LJZ= 7.8147

通过上述的检验显然可知，否定了方差相等.所以用方差分析的方法来检验各粮食主产区的年总产量的均值是否相等，检验的结果是比较粗糙的.

3.2.3方差分析

我们要比较各水平下的均值是否相同, 即要对如下的一个假设进行检验:

原假设

备择假设为H1：

1,2,…,r不全相等

在不会引起误解的情况下，H1通常可省略不写.如果H0成立，因子A的r个水平均值相同，称因子A的r个水平间没有显著差异，简称因子A不显著；反之，当H0不成立时，因子A的r个水平均值不全相同，这时称因子A的不同水平间有显著差异，简称因子A显著.

（1）.首先现在用编写程序的方法进行方差分析

展开阅读全文