人口问题建模.docx

上传人:b****5 文档编号:6701875 上传时间:2023-01-09 格式:DOCX 页数:15 大小:98.64KB
下载 相关 举报
人口问题建模.docx_第1页
第1页 / 共15页
人口问题建模.docx_第2页
第2页 / 共15页
人口问题建模.docx_第3页
第3页 / 共15页
人口问题建模.docx_第4页
第4页 / 共15页
人口问题建模.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

人口问题建模.docx

《人口问题建模.docx》由会员分享,可在线阅读,更多相关《人口问题建模.docx(15页珍藏版)》请在冰豆网上搜索。

人口问题建模.docx

人口问题建模

浙江省人口预测模型摘要

本文对人口预测的数学模型进行了研究。

首先,建立一次线性回归模型,灰色序列预测模型和逻辑斯蒂模型。

考虑到三种模型均具有各自的局限性,又用加权法建立了熵权组合模型,并给出了使预测误差最小的三个预测模型的加权系数,用该模型对人口数量进行预测,得到的结果如下:

单位(万人)表0

年份

2010

2011

2012

2013

2014

2015

2016

2017

2018

人口

5200.40

5256.37

5312.58

5369.28

5426.47

5484.15

5542.34

5601.03

5660.24

年份

2019

2020

2021

2022

2023

2024

2025

2026

2027

2028

人口

5719.97

5780.22

5841.00

5902.32

5964.18

6026.59

6089.54

6153.07

6217.16

6281.821

 

关键字:

一次线性回归灰色序列预测逻辑斯蒂模型

 

一、问题重述

1.背景

人口增长预测是随着社会经济发展而提出来的。

在过去的几千年里,由于人类社会生产力水平低,生产发展缓慢,人口变动和增长也不明显,生产自给自足或进行简单的以货易货,因而对未来人口发展变化的研究并不重要,根本不用进行人口增长预测。

而当今社会,经济发展迅速,生产力达到空前水平,这时的生产不仅为了满足个人需求,还要面向社会的需求,所以必须了解供求关系的未来趋势。

而人口增长预测是对未来进行预测的各环节中的一个重要方面。

准确地预测未来人口的发展趋势,制定合理的人口规划和人口布局方案具有重大的理论意义和实用意义。

2.问题

人口增长预测有短期、中期、长期预测之分,而各个国家和地区要根据实际情况进行短期、中期、长期的人口预测。

例如,中国人口预期寿命约为70岁左右,因此,长期人口预测最好预测到70年以后,中期40—50年,短期可以是5年、10年或20年。

根据2007年初发布的《国家人口发展战略研究报告》(附录一)及《中国人口年鉴》收集的数据(附录二),再结合中国的国情特点,如老龄化进程加速,人口性别比升高,乡村人口城镇化等因素,建立合理的关于中国人口增长的数学模型,并利用此模型对中国人口增长的中短期和长期趋势做出预测,同时指出此模型的合理性和局限性。

 

二、问题的基本假设

问题假设

1.假设本问题所使用的数据均真实有效,具有统计分析价值。

2.假设本问题所研究的是一个封闭系统,也就是说不考虑浙江省与其它省的人口迁移问题。

3.不考虑战争瘟疫等突发事件的影响

 

四数学模型

1:

(1)一元线性回归模型

根据表一中的数据,本文建立一元线性回归模型

进行预测;

为人口数单位:

万人

为年份。

利用Matlab软件,用麦夸特法进行回归拟合,得到拟核值及回归方程,如下:

表一

1990---2009年浙江省人口数量(原始数据X(0)

单位:

(万人)

年份

(年)

1990年

1991年

1992年

1993年

1995年

1996年

人口

4238

4269.5

4304

4334.8

4363.7

4389

4413

年份

1997年

1998年

1999年

2000年

2002年

2003年

人口

(万人)

4434.8

4456.2

4475.4

4679.91

4697.27

4730.76

4763.46

年份

2004年

2005年

2006年

2007年

2009年

2010年

人口

4308.48

4898

4980

5060

5120

5180

5154

(2)由MATLAB拟合得到的一元线性回归函数

x=1990:

2009;

y=[4238,4269.5,4304.4,4334.8,4363.7,4389,4413,4438.4,4456.2,4475.4,4679.91,4697.27,4730.76,4763.46,4803.48,4898,4980,5060,5120,5180]

p=.021*********

(3)一元线性回归函数

y=p(:

1)*x+p(:

2)

(4)由一元线性回归拟合函数得到的预测值

 

表二

单位:

(万人)

年份

2011

2012

2013

2014

2015

2016

2017

2018

2019

人口

5205.01

5255.03

5305.05

5355.07

5405.09

5455.11

5505.13

5555.15

5605.18

年份

2020

2021

2022

2023

2024

2025

2026

2027

2028

人口

5655.20

5705.22

5755.24

5805.26

5855.28

5905.30

5955.33

6005.35

6055.37

2.灰色预测模型

(1).模型建立

灰色系统是指部分信息已知,部分信息未知的系统。

灰色系统的理论实质是将无规律的原始数据进行累加生成数列,再重新建模。

由于生成的模型得到的数据通过累加生成的逆运算――累减生成得到还原模型,再有还原模型作为预测模型。

预测模型,是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线去拟合得到预测值。

灰色预测模型建立过程如下:

1)设原始数据序列

有n个观察值,

,通过累加生成新序列

,利用新生成的序列

去拟和函数曲线。

2)利用拟合出来的函数,求出新生序列

的预测值序列

3)利用

累减还原:

得到灰色预测值序列:

(共n+m个,m个为未来的预测值)。

将序列

分为

,其中

反映

的确定性增长趋势,

反映

的平稳周期变化趋势。

利用灰色GM(1,1)模型对

序列的确定增长趋势进行预测

表三

单位:

(万人)

1990---2009年浙江省人口数量(原始数据

年份

(年)

1990年

1991年

1992年

1993年

1995年

1996年

人口

4238

4269.5

4304

4334.8

4363.7

4389

4413

年份

1997年

1998年

1999年

2000年

2002年

2003年

人口

(万人)

4434.8

4456.2

4475.4

4679.91

4697.27

4730.76

4763.46

年份

2004年

2005年

2006年

2007年

2009年

2010年

人口

4308.48

4898

4980

5060

5120

5180

累加后得到的数据

单位:

(万人)表四

X1

(1)

X1

(2)

X1(3)

X1(4)

X1(5)

X1(6)

X1(7)

X1(8)

X1(9)

X1(10)

4238

8507.5

12811.9

17146.7

21510.4

25899.4

30312.4

34747.2

39203.4

43678.8

X1(11)

X1(12)

X1(13)

X1(14)

X1(15)

X1(16)

X1(17)

X1(18)

X1(19)

48358.71

53055.98

57786.74

62590.22

67488.22

72468.22

77528.22

82648.22

87828.22

4)由表一得到的拟合函数

5)

5)精度

R=0.646991484976592

C=9.6554%(好)

P=0.9453(好)

表五

单位:

(万人)拟合值

年份

1990年

1991年

1992年

1993年

1995年

1996年

预测值

4238

4197.64

4244.76

4292.42

4340.61

4389.34

4438.61

误差

0

71.85

59.63

42.37

23.08

0.34

25.61

误差率

0

0.0168

0.0138

0.0097

0.0052

0.00007

0.0058

年份

1997年

1998年

1999年

2000年

2002年

2003年

预测值

4488.44

4538.83

4589.79

4641.31

4693.42

4746.11

4799.39

误差

53.64

82.63

114.39

38.59

3.84

15.35

35.93

误差率

0.01209

0.0185

0.0255

0.0082

0.00081

0.0032

0.0075

年份

2004年

2005年

2006年

2007年

2009年

2010年

预测值

4853.27

4907.76

4962.86

5018.57

5074

5131.89

5189.50

误差

49.79

9.76

17.13

41.42

45.08

48.10

误差率

0.01036

0.00199

0.0034

0.0081

0.0088

0.0092

表六

预测未来20年人口数量

年份

2011

2012

2013

2014

2015

2016

2017

2018

2019

人口

5247.76

5306.67

5366.25

5426.49

5487.41

5549.02

5611.31

5674.31

5738.01

年份

2020

2021

2022

2023

2024

2025

2026

2027

2028

人口

5802.43

5867.57

5933.44

6000.06

6067.42

6135.53

6204.41

6274.07

6344.50

 

3:

逻辑斯蒂模型(Logisticgrowthmodel)

1)考虑自然资源和环境对人口的影响,并以

记自然资源和环境条件所能允许的最大人口数。

把人口增长的速率除以当时的人口数称为人口的净增长率。

如果人口的净增长率随着

的增加而减小,且当

时,净增长率趋于零。

因此人口方程可写成

其中

为常数,此模型就叫逻辑斯蒂模型。

我们把1990年至2009年浙江省历年年底总人口的数值组成一个观察矩阵,其中的每一个数值称之为观察值。

本文利用spss软件,得出与观察值一一映射的拟核值,残差值和cook距离,见下表:

表七用spss软件得到各观察值所对应的拟核值,残差值和残差率。

表七

单位:

(万人)

年份

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

拟合值

4238

4284.14

4330.78

4377.93

4425.59

4473.77

4522.47

4571.71

4621.48

4671.78

残差

0

-14.64

-26.38

-43.13

-61.89

-84.77

-109.4

-136.9

-165.28

-196.38

残差率

0

0.0034

0.00612

0.00995

0.0141

0.0193

0.0248

0.0308

0.0370

0.0438

年份

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

拟合值

4722.64

4774.05

4826.02

4878.55

4931.65

4985.33

5039.59

5094.44

5149.89

5205.94

残差

42.73

76.78

-95.26

-115.55

-128.17

-87.33

-59.595

-34.447

-29.89

-25.94

残差率

0.0091

0.01634

0.02013

0.02426

0.02668

0.01783

0.01196

0.00680

0.0058

0.00500

2):

本文建立逻辑斯蒂模型:

x.010*********x(i)*(1-x(i)/2627149.97)+x(i);

i是对应的年份。

3):

表八是根据逻辑斯蒂模型预测的未来20年的浙江省人口数量。

表八

单位:

(万人)

年份

2010

2011

2012

2013

2014

2015

2016

2017

2018

人口

5236.37

5293.36

5350.97

5409.20

5468.07

5527.58

5587.73

5648.53

5710.00

年份

2019

2020

2021

2022

2023

2024

2025

2026

2027

2028

人口

5772.13

5834.94

5898.43

5962.61

6027.48

6093.06

6159.35

6226.36

6294.10

6362.57

4.1.4.组合模型建立

1、熵权法的概念及基本步骤

熵权法是一种决定指标的方法,我们知道,综合指标取决于单个指标数的确定,一般情况下的权重是根据经验来确定的,但是这种确定权重的方法缺少科学根据,也不能保证确立的综合指标能反映原始指标的大部分信息,且权重的确立因人而异,所以其应用受到了限制,而熵权法就能够避免这些问题,使权重的确立具有科学的根据,具有说服力。

熵权法的步骤确立如下:

1计算第j项指标下第i个方案的指标比重

2计算指标j的熵值

3计算第j项指标的差异系数

4定义权重

就为熵权法确定的权重。

2、误差指标的选举

为了能全面的各个预测方法以及组合预测的预测效果,必须制定一套切实可行的误差指标。

按照预测效果的评价惯例,本文选取如下指标作为参考:

(1)、平方和误差

(2)、平均绝对值误差

(3)、均方误差

(4)、平均绝对值百分比误差

(5)、均方百分比误差

3、组合模型权重的确定

设以选定m种个体预测方法,n个误差指标,m种个体预测方法对应n个误差指标构成了评价指标值矩阵;

个指标下第

种个体方法的指标比重值

个指标的熵值为:

个指标的权重为:

记矩阵R中每列最优值为

,对该矩阵所有元素做标准化处理,可得:

这样,各个体预测方法的熵权评价值

,可以表示为:

将上式进行归一化处理,即可以得到各个个体的权重。

4.1.6熵权组合模型求解

本文利用Matlab软件对上述的模型、指标进行综合的运算处理,得到熵权系的基本数据资料,见下表:

加权系数为:

0.24282,0.34055,0.41663。

表九是加权后得到的人口数量

单位(万人)表九

年份

2010

2011

2012

2013

2014

2015

2016

2017

2018

人口

5200.40

5256.37

5312.58

5369.28

5426.47

5484.15

5542.34

5601.03

5660.24

年份

2019

2020

2021

2022

2023

2024

2025

2026

2027

2028

人口

5719.97

5780.22

5841.00

5902.32

5964.18

6026.59

6089.54

6153.07

6217.16

6281.821

五模型优缺点的评判

在上文中,每个模型的后面,针对该模型的优缺点本文都做了深刻地评判,此时就不再重复赘言了,却还没有从宏观角度出发,对本文的所有模型进行整体的优缺点的总评判。

优点:

1、具有很好的创新性,在对传统模型的理解的基础,取模型之长,利用熵权法对模型进行组合预测,大幅度提高了预测准确度;

2、本文的思路宽阔,在不同时期,建立起不同的模型,能够与实际紧密的联系,结合当前具体国情,对问题进行求解,使该模型具有很好的推广性和通用性;

3、模型的的计算采用专业软件求解,例如Matlab软件,spss软件,dps软件等,数据可信度较高。

4、对于题目附录里为涉及到的数据,均到“中国统计局”下载官方数据加以补充,并且对论文中涉及到的众多影响因素进行了量化处理,使得论文的说服里更强,实际性更高。

缺点

1、影响人口增长预测的动态因素很多,而且不可能都能波及到,所以模型与实际还是有一些距离的;

2、不同模型在相应的时间阶段具有很高的预测能力,但是一旦脱离了这个时间阶段,模型的预测能力就会回落。

 

六全文总结

人口预测就是根据一个国家、一个地区人口的现状,考虑到社会政治经济条件对人口再生产和转化的影响,分析其发展规律,运用科学的方法测算未来某个时期人口的发展状况。

人口的预测包括通常指的是中短期预测和长期预测。

为了能够提供合理地预测值,本文进行了深刻地研究,建立了4个模型,进行全方位的深刻讨论。

通过,灵敏度的分析比较,模型一适合中短期的预测,模型二综合面广,考虑全面,在本文假设的条件下,就符合浙江省人口特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化都作为模型中的因子元素,对中国的人口未来长期发展状况进行了科学性的预测。

本论文的创新性和技术性主要表现在这几个方面:

1、本文为了提高预测的精确度,对于各种的传统预测方法,有针对性的做了筛选,通过权重关系,建立起了组合模型,特别地在权重问题上,采用了熵权法分配权重,思路巧妙,可以为以后提供合理参考。

2、本文与计算机实用软件,计算机编程紧密的结合在了一起,在本文中运用了诸如spss,dps等一些统计性软件,同时利用Matlab进行了一些编程,大大提升了数据的处理能力,也使得数理统计变得不在十分棘手了。

3、本文的模型具有很好的推广性,而且在其它领域发挥很好的效果。

 

%拟合原始数据的MATLAB程序

X0=[4238,4269.5,4304.4,4334.8,4363.7,4389,4413,4434.8,4456.2,4475.4,4679.91,4697.27,4730.76,4763.46,4803.48,4898,4980,5060,5120,5180];

%formatlong

[m,n]=size(X0);

X1=cumsum(X0);%累加

X2=[];

fori=1:

n-1

X2(i,:

)=X1(i)+X1(i+1);

End

B=-0.5.*X2;

t=ones(n-1,1);

B=[B,t];%求B矩阵

YN=X0(2:

end)

P_t=YN./X1(1:

(length(X0)-1))%对原始数据x0进行光滑性检验

A=inv(B.'*B)*B.'*YN.';

a=A

(1)

u=A

(2)

c=u/a;

b=X0

(1)-c;

X=[num2str(b),'exp','(',num2str(-a),'k',')',num2str(c)];

strcat('X(k+1)=',X)

%symsk;

fort=1:

length(X0);

k(1,t)=t-1;

end

k

Y_k_1=b*exp(-a*k)+c;

forj=1:

length(k)-1

Y(1,j)=Y_k_1(j+1)-Y_k_1(j);

end

XY=[Y_k_1

(1),Y]%预测值

CA=abs(XY-X0);%残差数列

Theta=CA%残差检验,绝对误差序列

XD_Theta=CA./X0%残差检验相对误差检验

AV=mean(CA);%残差数列平均值

R_k=(min(Theta)+0.5*max(Theta))./(Theta+0.5*max(Theta));%P=0.5

R=sum(R_k)/length(R_k)%关联度

Temp0=(CA-AV).^2;

Temp1=sum(Temp0)/length(CA);

S2=sqrt(Temp1);%绝对误差序列的标准差

AV_0=mean(X0);%原始数据平均值

Temp_0=(X0-AV_0).^2;

Temp_1=sum(Temp_0)/length(CA);

S1=sqrt(Temp_1);%原始数列的标准差

TempC=S2/S1*100;%方差比

C=strcat(num2str(TempC),'%')%后验查检验%方差比

SS=0.675*S1;

Delta=abs(CA-AV);

TempN=find(Delta<=SS);

N1=length(TempN);

N2=length(CA);

TempP=N1/N2*100;

P=strcat(num2str(TempP),'%')%后验查检验%计算小误差概率

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 调解书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1