人口老龄化问题建模论文.docx
《人口老龄化问题建模论文.docx》由会员分享,可在线阅读,更多相关《人口老龄化问题建模论文.docx(148页珍藏版)》请在冰豆网上搜索。
人口老龄化问题建模论文
毕业论文声明
本人郑重声明:
1.此毕业论文是本人在指导教师指导下独立进行研究取得的成果。
除了特别加以标注地方外,本文不包含他人或其它机构已经发表或撰写过的研究成果。
对本文研究做出重要贡献的个人与集体均已在文中作了明确标明。
本人完全意识到本声明的法律结果由本人承担。
2.本人完全了解学校、学院有关保留、使用学位论文的规定,同意学校与学院保留并向国家有关部门或机构送交此论文的复印件和电子版,允许此文被查阅和借阅。
本人授权大学学院可以将此文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本文。
3.若在大学学院毕业论文审查小组复审中,发现本文有抄袭,一切后果均由本人承担,与毕业论文指导老师无关。
4.本人所呈交的毕业论文,是在指导老师的指导下独立进行研究所取得的成果。
论文中凡引用他人已经发布或未发表的成果、数据、观点等,均已明确注明出处。
论文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或撰写过的研究成果。
对本文的研究成果做出重要贡献的个人和集体,均已在论文中已明确的方式标明。
学位论文作者(签名):
年月
关于毕业论文使用授权的声明
本人在指导老师的指导下所完成的论文及相关的资料(包括图纸、实验记录、原始数据、实物照片、图片、录音带、设计手稿等),知识产权归属华北电力大学。
本人完全了解大学有关保存,使用毕业论文的规定。
同意学校保存或向国家有关部门或机构送交论文的纸质版或电子版,允许论文被查阅或借阅。
本人授权大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存或编汇本毕业论文。
如果发表相关成果,一定征得指导教师同意,且第一署名单位为大学。
本人毕业后使用毕业论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为大学。
本人完全了解大学关于收集、保存、使用学位论文的规定,同意如下各项内容:
按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存或汇编本学位论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权大学可以将本学位论文的全部或部分内容编入学校有关数据库和收录到《中国学位论文全文数据库》进行信息服务。
在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。
论文作者签名:
日期:
指导教师签名:
日期:
人口老龄化问题
摘要
人口老龄化问题是21世纪中国所面临的严峻社会问题,已引起全社会的广泛关注,但目前我们对老龄化影响因素的研究还不够系统和全面。
本文从老龄化的影响因素出发,建立主成分分析法、线性拟合和灰色预测的数学模型,得到影响人口老龄化的四个主要因素,并科学的预测出了未来几年老龄化人口的数量。
首先,我们通过阅读大量的相关文献,确定出十几个影响人口老龄化的影响因子,并从国家统计局网站上获得相应指标的原始数据,结合合理的假设,建立不同年份各个影响因子的一个二维表。
其次,我们建立主成分分析法模型,将所获得的指标和原始数据进行标准化处理,运用SPSS软件进行分析,得到了影响人口老龄化的主要因素有:
人均GDP,预期平均寿命,教育经费投入,农村人口比重这四个方面。
再次,利用上述已提取的四个影响因素,通过线性拟合得出四个主要因素和人口老龄化的函数关系式:
y=-42.202925370799250+0.679854684616473*x1-0.000002837083521*x2+0.000027713758515*x3+0.016482418326739*x4
再通过灰色预测模型结合上述关系式求解出未来人口老龄化的比重,随后我们将历史年份预测值与真实值进行对比,其结果较为吻合,从而验证出了模型的合理性。
下表为我们预测出的未来6年老龄化人口比重:
2010
2011
2012
2013
2014
2015
7.7
7.9
8.2
8.5
8.9
10.3
最后,我们对此模型进行了优缺点评价和模型改进。
本文特色是将线性拟合和灰色预测模型相结合。
首先根据历史数据,线性拟合出人口老龄化比重与四个影响因素之间的的函数关系式,再运用灰色预测模型预测出四个影响因素的未来指标,最后代入已拟合好的函数关系式中,就可以求解出未来老龄化人口的比重。
关键字:
人口老龄化主成分分析法线性拟合灰色预测
1、问题重述
人口问题是全球最主要的社会问题之一,是当代许多社会问题的核心。
据官方统计,到2050年,世界人口将达到90—100亿,其中60岁以上的人口将达到20亿。
控制人口的增长已迫在眉睫。
而老龄化问题是人口问题中最突出的问题。
目前世界人口老龄化程度较深的国家有日本、意大利、德国等,其高达25%以上,而我国65岁以上的老年人口占总人口7%。
按这个标准,我国已进入老龄化社会。
控制人口老龄化问题已刻不容缓,对社会经济的稳定和可持续发展都有重要意义。
利用附表中的数据及互联网数据,建立数学模型,分析老龄化人口数与诸多影响因素之间的关系,为防止老龄化提供依据,同时预测未来两年我国老龄化人口数量。
2、问题分析
21世纪的中国是一个不可逆转的老龄社会。
日益增多的老龄人口以及与此相伴而生的社会经济问题已引起全社会的广泛关注。
针对影响因素与人口老龄之间的关系和预测未来老龄化人口数量这两个问题我们做了如下分析:
1.就题目中所呈现的我国人口老龄化的现状,我们从影响此现状的因素入手,选择经济、科技、政策、环境等四个方面,并从这四方面展开分析,最终计算出全面合理的影响因素。
2.基于第二问,预测未来人口老龄化的数量也就是先用灰色预测模型,由历史值得出各个影响因素的未来值,再通过线性拟合关系式,运算出结果的过程。
3、模型假设
1、假设在中国统计局网站搜集的数据均真实有效。
2、假设影响人口老龄化各因素之间互不相关。
3、本文以年份为时间变量,忽略了以地区差异性为特点的人口密度指标。
4、符号说明
X
人口老龄化比重
X1
女性比重
X2
农村人口比重
X3
恩格尔系数
X4
预期平均寿命
X5
人均GDP
X6
教育投入
X7
科学技术投入
X8
文体投入
X9
社会保障投入
X10
医疗卫生投入
X11
环境保护
X12
自然增长率
y
人口老龄化比重
常数
预期平均寿命的权重
人均GDP的权重
教育经费投入的权重
农村人口比重的权重
指标编号
年份
第
个指标的各年数据的平均值
第
个指标的各年数据的标准差
原始数据
相关系数矩阵
表4-1-1
5、模型建立与求解
模块Ⅰ(主成分的筛选)
5.1.1数据查找
我们通过中国统计局网站得到所需年份的统计年鉴,对原始因素的相关数据进行了搜集整理,得到与本模型相关的数据。
(详见附录一)
5.1.2模型分析
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在本题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和问题分析的复杂性,我们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
故选用此种方法进行主要因素的提炼。
5.1.3数据标准化处理
将04~09年各个影响因素的有关原始指标数据写成矩阵形式
,然后运用标准化公式
(其
为年份,
为指标编号,
为原始数据,
为第
个指标各年的平均值,
是
的标准差)进行处理(详见附录二),消除各指标受纲量的影响。
5.1.4模型建立
在实际情况中影响人口老龄化的因素较多,包括如下表内的12个以及未列出的各种因素,我们将这些因素的近几年数据找出并将原始数据写成的矩阵输入SPSS软件中经过一些运算得到相关的指标。
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
11.214
93.448
93.448
11.214
93.448
93.448
2
.482
4.017
97.465
.482
4.017
97.465
3
.229
1.907
99.372
.229
1.907
99.372
4
.051
.426
99.798
.051
.426
99.798
5
.024
.202
100.000
.024
.202
100.000
6
6.194E-16
5.161E-15
100.000
7
4.194E-16
3.495E-15
100.000
8
2.078E-16
1.732E-15
100.000
9
5.452E-17
4.543E-16
100.000
10
-1.211E-16
-1.009E-15
100.000
11
-2.883E-16
-2.402E-15
100.000
12
-7.270E-16
-6.058E-15
100.000
表5-1-1
在实际研究中,由于主成分的目的是为了降维,减少变量的个数,故一般选取少量的主成分(不超过5或6个),只要他门所能包含原变量信息的86%以上即可。
由上表可以得到每一个主成分的贡献率和累计贡献率,相关系数的特征值即各主成分的方差,可以看出第一个成分的特征值的累积贡献率已经高达93.448%,所以我们选取第一个成分为主成分。
再由SPSS得到相关系数矩阵
的特征向量如下:
成份矩阵a
成份
1
2
3
4
5
女性比重1
.964
.232
.087
.092
-.004
农村人口比重2
-.985
.118
.046
.108
-.041
恩格尔系数3
-.881
.432
-.171
.052
.078
预期平均寿命4
.997
-.034
-.026
-.038
.059
人均GDP5
.993
.018
-.097
-.031
.050
教育经费投入6
.992
.108
-.067
-.015
.005
科学技术投入7
.984
-.042
.167
.032
.027
文体投入18
.984
.011
.174
.027
.041
社会保障投入9
.966
.162
-.185
-.055
-.055
医疗卫生10
.979
.149
.128
.035
-.032
环境保护11
.971
.222
-.058
-.017
-.063
自然增长率12
-.896
.340
.251
-.139
.003
表5-1-2
由上表,我们在第一个主成分中选取特征向量的绝对值在0.985以上的四个最主要的因素。
主要因素
预期平均寿命
人均GDP
教育经费投入
农村人口比重
特征向量
0.997
0.993
0.992
0.985
5.1.4分析得出结果
根据上表所示,我们据此提取出人均GDP,平均寿命,教育经费投入,农村人口比重这四个主成分。
模块Ⅱ(线性拟合求出各出成分与人口老龄的关系)
5.2.1模型分析
根据模型Ⅰ的提炼,我们得出预期平均寿命,人均GDP,教育经费投入,农村人口比重这四个主成分,据此故列出此四种成分的数据下表:
年份
预期平均寿命
人均GDP
教育投入
农村人口比重
2004
71.74
12335.58
3365.94
58.24
2005
71.96
14185.36
3974.83
57.01
2006
72.19
16499.70
4780.41
56.10
2007
72.43
20169.46
7122.32
55.06
2008
72.72
23707.71
9010.21
54.32
2009
72.96
25575.48
10437.54
53.41
表5-2-1
经过以上计算我们仅仅得出了主成分,但主成分与因变量人口老龄化比重之间的关系还不十分明确,我们可以看到人口老龄化比重是随着人均GDP,平均寿命,教育经费投入的增加而增加,随着农村人口比重的增加而减少。
我们需要某种函数关系,来确定四者与人口老龄化之间的关系。
故而选取线性拟合的方式来建立模型。
5.2.2模型建立
设y为因变量即人口老龄化比重,x1为预期平均寿命,x2为人均GDP,x3为教育经费的投入,x4为农村人口比重可得如下线性方程
根据上面所列线性回归模型在MATLAB软件中编写程序,进行运算得出如下结果(程序见附录三)。
-42.20292537079925
0.679854684616473
-0.000002837083521
0.000027713758515
0.016482418326739
注:
因b2与b3所得结果较小,且对最终运算有较大影响,故运算结果保留小数较多
故所得线性方程为
y=-42.202925370799250+0.679854684616473*x1-0.000002837083521*x2+0.000027713758515*x3+0.016482418326739*x4
5.2.3模型检验
为了分析模型的可靠性,我们进一步,将06到09年的四项主成分数据带入线性方程中进行运算,将预测值与实际值进行比较,得出结论如下表(5-2-2)
数值
年份
实际值
预测值
绝对误差
2004
7.6
7.5
-0.1
2005
7.7
7.7
0
2006
7.9
7.8
-0.1
2007
8.1
8.0
-0.1
2008
8.3
8.3
0
2009
8.5
8.4
-0.1
表5-2-2
从表(5-2-2)可看出,绝对误差的绝对值均在0.1之内,说明回归方程具有较高的代表性和显著性,可以很好的表示这四者之间的关系。
模块Ⅲ(灰色预测模型推测未来人口老龄化比重)
5.3.1模型分析
我们要推测未来人口老龄化比重,需要知道未来人均GDP,平均寿命,教育经费投入,农村人口比重这四者在未来某年的数据,但是这些我们无法从实际中查知,故我们可以利用灰色预测模型进行预测。
模型优势
灰色预测模型介于白色模型和黑色模型之间,白色即数据全部已知,黑色即数据全部未知,灰色则是部分已知部分未知。
灰色预测则是应用灰色模型GM(1,1)对灰色系统进行分析、建模、求解、预测的过程。
由于灰色建模理论应用数据生成手段,弱化了系统的随机性,使紊乱的原始序列呈现某种规律,规律不明显的变得较为明显,建模后还能进行残差辨识,即使较少的历史数据,任意随机分布,也能得到较高的预测精度。
5.3.2模型的建立
首先,分别列出各个主成分的历史数据如表(5-2-1),然后将编写好的灰色预测模型源程序(详见附录四)输入MATLAB软件中,将各个主成分的数据依次输入,再输入预知未来多少年,即可得出预测数据,如下即为人均GDP预测未来6年的数据图(5-3-1):
图5-3-1
百分绝对误差为:
3159.6508%
预测值为:
30485.585635337.142440960.788847479.397255035.394263793.8726
然后依次得出其他主成分未来6年的数据如下表(5-3-1)
成分
数据
年份
平均预期寿命
人均GDP(元)
教育经费投入(万元)
农村人口比重(%)
2010
73.2141
30485.5856
13691.077
52.5345
2011
73.4702
35337.1424
17402.2158
51.6861
2012
73.7273
40960.7888
22119.3056
50.8514
2013
73.9852
47479.3972
28115.0221
50.0302
2014
74.244
55035.3942
35735.9529
49.2222
2015
74.5037
63793.8726
45422.6331
48.4273
表(5-3-1)
5.3.3模型的求解
根据这些预测数据再结合模块Ⅱ中所求得的线性回归方程进行计算得出未来6年的人口老龄化比重预测如下表(5-3-2)
2010
2011
2012
2013
2014
2015
7.7
7.9
8.2
8.5
8.9
10.3
表5-3-2
同时将人口老龄化比重的历史数据和预测数据做如下图(5-3-2):
图5-3-2
6、模型的评价
6.1模型优点
1.选择主成分分析法,结合国家统计局所披露的数据,权威客观的分析出了影响人口老龄化的主要因素。
2.针对许多未知因素仍影响人口老龄化的这一问题,我们采用灰色预测模型,将不明确的因素科学的进行处理,使模型更加准确。
3.结合已有年份的数据及科学研究表明,我们所分析的结果合理准确,具有说服力。
6.2模型缺点
1.因数据的局限,我们只得到了近六年各个因素的指标,使得在大量数据支持方面不是特别的满意。
2.由于人口惯性对人口老龄化的贡献在不同的时间段波动起伏,其相对于长的时间跨度较为敏感,所以针对预测两年的老龄化人口数量,我们把它作为既定的因素,没有考虑进去。
6.3模型改进.
1.更深入的搜集数据,得到尽可能多的年份的数据,使评价结果更具说服力。
2.建立优化模型,考虑人口密度因素,体现老龄化在空间分布上的不平衡。
3.将结果进行优化,我们认为可以从城乡老龄化人口数量,地区老龄化人口数量这两个侧面恰当的反映我国人口老龄化的特点。
7、应对人口老龄化的建议
1.快速提高经济供养能力,适当调整经济政策。
2.充分发挥家庭、社会和个人的作用,构筑三者互为补充的养老体系。
3.借鉴西方发达国家经验,稳妥提高法定退休年龄。
8、参考文献
[1]原新,刘世杰1982-2007我国人口老龄化原因的人口学因解分析
学海2009.4
[2]何建宁,朱霄雪人口老龄化影响因素的灰色关联度分析经济纵横2010年第6期
[3]中华人人民共和国国家统计局2004~2009《中国统计年鉴》
[4]陈金磊甄珍李冉2010上海世博会影响力的定量评估数学模型
2010年
9、附录
附录一
人口老龄化比重
女性比重
农村人口比重
恩格尔系数
2004
7.60
48.48
58.24
47.20
2005
7.70
48.47
57.01
45.50
2006
7.90
48.48
56.10
43.00
2007
8.10
48.50
55.06
43.10
2008
8.30
48.53
54.32
43.67
2009
8.50
48.56
53.41
40.97
预期平均寿命
人均GDP
教育投入
科学技术投入
2004
71.74
12335.58
3365.94
1095.34
2005
71.96
14185.36
3974.83
1334.91
2006
72.19
16499.70
4780.41
1688.50
2007
72.43
20169.46
7122.32
1783.04
2008
72.72
23707.71
9010.21
2129.21
2009
72.96
25575.48
10437.54
2744.52
社会保障投入
医疗卫生
环境保护
自然增长率
2004
1524.50
854.64
93.69
5.87
2005
1817.64
1036.81
132.97
5.89
2006
2123.90
1320.23
161.24
5.28
2007
5447.16
1989.96
995.82
5.17
2008
6804.29
2757.04
1451.36
5.08
2009
7606.68
3994.19
1934.04
5.05
附录二
女性比重
农村人口比重
恩格尔系数
预期平均寿命
2004
-0.79
1.43
1.52
-1.29
2005
-0.86
0.74
0.73
-0.81
2006
-0.65
0.23
-0.42
-0.31
2007
-0.09
-0.35
-0.37
0.21
2008
0.77
-0.77
-0.11
0.84
2009
1.62
-1.28
-1.35
1.36
人均GDP
教育投入
科学技术投入
文体投入
2004
-1.21
-1.07
-1.19
-1.15
2005
-0.86
-0.86
-0.78
-0.75
2006
-0.42
-0.58
-0.18
-0.27
2007
0.27
0.23
-0.02
-0.07
2008
0.94
0.89
0.57
0.61
2009
1.29
1.39
1.61
1.63
社会保障投入
医疗卫生
环境保护
自然增长率
2004
-0.99
-0.94
-0.89
1.24
2005
-0.88
-0.79
-0.84
1.29
2006
-0.77
-0.56
-0.80
-0.28
2007
0.45
0.00
0.26
-0.57
2008
0.95
0.64
0.83
-0.80
2009
1.24
1.66
1.45
-0.88
附录三
formatlong
n=6;m=4;
y=[7.67.77.98.18.38.5];
x1=[71.7471.9672.1972.4372.7272.96];
x2=[12335.5814185.3616499.7020169.4623707.7125575.48];
x3=[3365.943974.834780.417122.329010.2110437.54];
x4=[58.2457