深圳杯数学建模A题答案之欧阳数创编.docx
《深圳杯数学建模A题答案之欧阳数创编.docx》由会员分享,可在线阅读,更多相关《深圳杯数学建模A题答案之欧阳数创编.docx(19页珍藏版)》请在冰豆网上搜索。
深圳杯数学建模A题答案之欧阳数创编
摘要
时间:
2021.03.02
创作:
欧阳数
深圳作为中国经济发展的重点城市,人口与医疗问题已经成为我们的焦点话题,是一个复杂的系统工程。
本文针对深圳地区人口年龄分布情况,外来务工人员的数量,从实际出发,在基于一些合理简化假设的基础上,建立数学模型,并充分利用matlab等软件简化计算,对相关问题进行了有针对性的求解。
在预测未来十年深圳常住人口时,我们运用了matlab一元线性回归对近十年的数据进行了多次拟合,并对这些拟合进行了比较得出深圳常住人口模型公式为:
通过拟合预测出了未来十年深圳市常住人口的数量,同时在网上2000年到2010年的人口结构的数据,通过Leslie矩阵预测出了未来十年人口结构的分布。
通过分析深圳近人口数量和人口结构的变化,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求呈线性递增趋势。
同时选取了高血压,脑出血,癌症这三种疾病进行预测,运用matlab最小二乘法散点拟合,得出这三种疾病的发展趋势,由此预测出未来十年这三种疾病的就医的床位需求。
关键词:
matlab、一元线性回归、Leslie、最小二乘法、床位需求
一、问题重述
从深圳的人口的结构来看,显著的特点是流动人口远远超过户籍人口,且年轻人口占主绝对优势。
流动人口主要从事第二、三产业的企业一线工人等。
年轻人身体好,发病少,导致深圳目前人均医疗设施低于全国类似城市平均水平,但仍能满足现有人口的就医需求。
然而,政策的调整与世界的推移会使深圳市老年人增加。
产业结构的变化也会影流动人口的数量。
直接会导致深圳市未来的医疗需求的变化。
现有人口社会发展模型在面对深圳情况时,难以满足人口和医疗预测的要求。
为了解决此问题,请根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况(医疗设施、医护人员结构等方面)收集数据、建立针对深圳具体情况的数学模型,预测深圳未来的人口增长和医疗需求,解决下面几个问题:
1.分析深圳近十年常住人口、非常住人口变化特征,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求;
2.根据深圳市人口的年龄结构和患病情况及所收集的数据,对几种病进行预测,在不同类型的医疗机构就医的床位需求。
二、问题分析
2.1背景分析
深圳作为我国的经济重镇,深圳经济迅猛发展,带动人口发生了极大变化,大量的人才需求使深圳外来人口大量增加。
劳动力的需求使年轻人占据的深圳的主要地位。
年轻人身体健壮,发病较少,弥补了深圳医疗稍差的缺陷。
然而,由于政府的各项政策(如计划生育等)使得人口结构发生了变化,深圳市统计局12日公布了全市第六次全国人口普查主要数据,显示深圳特区在2000年至2010年的10年中人口增长率近“50%”,人口密度大幅提高。
政府部门需要更详细的人口数量与人口结构的发展趋势,以此为基础来满足深圳市各区几种病的床位需求。
近些年来,对人口结构的分析预测仅限于粗线条分析,只能预测年龄与性别的大致分布范围。
随着人们对健康要求的提高,床位的需求逐渐受到重视,这就是人口与医疗需求的预测。
2.2问题的分析
题目中所给的两个问题都属于预测的数学问题。
其中问题一需要通过对深圳人口数量极其人口结构进行预测,以此为基础预测未来全市和各区医疗床位需求。
为了解决此问题,我们首先要对近十年的常住人口与非常住人口进行分析,其次再对人口数量和结构进行分析,通过对这些已知数据的分析和统计,在预测未来十年深圳常住人口时,我们运用了matlab对近十年的数据进行了多次拟合,并对这些拟合进行了比较得出深圳常住人口模型公式为:
,通过这个模型对未来十年深圳常住人口进行预测。
接而得出未来十年,即得到深圳市2011年到2020年每年的人口增长率,得出深圳市未来十年的人口数量发展趋势。
通过按照年龄来划分儿童、青壮年、老年三个年龄层,求出三个年龄层的比例模型,通过得出关系函数在计算得出未来十年的结构发展趋势。
通过如下关系:
年龄结构和患病率相关,患病率和住院率相关,住院人口数和床位有关,建立数学模型,预测得出未来十年的床位需求数。
对于问题二,要求预测不同类型的医疗机构就医的床位需求,根据问题一中得到的全市人口年龄结构和患病情况,对高血压,癌症,脑出血三种病症在不同类型的医疗机构就医床位需求.按照规模大小划分深圳市的医院类别,再通过各等级医院的床位需求与某种病的患病人数和同一等级医院的数量,可治疗这种病的医院总个数的关系得出不同医疗机构就医床位需求。
三、模型假设
1、假设题目所给的数据真实可靠。
2、假设在深圳政府政策的稳定前提下,生育和死亡率都比较稳定。
3、不考虑战争,瘟疫,大规模流行病对人口的影响。
4、假设深圳市人口为年末常住人口。
5、假设同一年龄段的人死亡率相同,同一年龄段的育龄女性生育率相同。
6、假设当地人们的生育观念不发生太大变化。
7、假设人们生病时都能支付起医疗费。
8、假设各区域的患病者不相互交换,即各区域是相互独立的。
四、定义符号与说明
见文中标注
五、模型的建立与求解
一、问题一的分析
(一)深圳市常住人口的预测
(1)利用现有数据(表一)分析深圳从1979年到2010年的年末常住人口数变化规律。
运用Excel软件画出深圳1979年到2010年的人口数量折线图(图一):
表1:
1979—2010年年末常住人口数
图1:
1979—2010年年末常住人口数
(2)通过现有的数据及其折线图,可以很明显地观察出深圳常住人口数从1980到1992的人口处于缓慢增长,呈线性增长。
但随着深圳高速的发展,优质的社会公共资源对流动人口形成了强大的吸引力,因此外来人口的迁入增多导致从1994年到2010年深圳年末常住人口数的增长率相对以前增大,但也基本保持一次函数的增长。
(3)模型的建立
我们通过运用matlab软件对这一组数据进行多次拟合,其根本思想就是:
观测散点走势来确定拟合函数,利用散点但又不拘泥于散点。
他的整体思路与我们的数据分析非常相似。
并对这些拟合进行了比较得出深圳常住人口模型公式为:
,拟合结果如下图(图二):
图2:
常住人口的拟合结果图
(二)流动人口的预测
从深圳的人口的结构来看,显著的特点是流动人口远远超过户籍人口,因此对深圳流动人口的预测对整个深圳及各区医疗床位需求的预测中起到至关重要的作用。
(1)流动人口定义
流动人口是相对于某地的常住人口而言的,指离开常住户籍所在地,跨越一定的行政辖区范围,在某一地区滞留的人口。
其包括:
1、进入城镇务工、经商、和从事劳动服务的暂住人口;
2、为探亲访友、旅游、求学、治病等而外出的人员;
3、无职业、无收入、无暂住证的三无人员即盲流人口。
为此我们可得:
其中:
——非常住人口总和;
——进入城镇务工、经商、和从事劳动服务的暂住人口总和;
——为探亲访友、旅游、求学、治病等而外出的人员;
——无职业、无收入、无暂住证的三无人员即盲流人口。
(2)求解进入城镇务工、经商、和从事劳动服务的暂住人口:
显然对于
它是深圳市经济发展主要的带动者,因此与深圳市GDP有很大的关系,GDP越多,则深圳市外来人口就越多。
为此我们假设
与外来人口所产生的GDP成正比例关系,由此我们可得:
其中:
——比例因素;
——深圳市t当年GDP总量;
——常住人口GDP值;
——进入城镇务工、经商、和从事劳动服务的暂住人口总和的初始值;
对于一个非平稳序列来说,其数字特征,如均值,方差和协方差等是随着时间的变化而变化的。
也就是说,非平稳序列在各个时间点上的随机规律是不同的,难以通过序列已知的信息去掌握序列整体上的随机性。
而GDP时间序列都是非平稳的,为此我们采用ARIMA模型求解:
ARIMA模型使用包括自回归项(AR项),单整项和MA移动平均项三种形式对扰动项进行建模分析,使模型同时综合考虑了预测变量的过去值,当前值和误差值,从而有效地提高了模型的预测精度。
(1)ARIMA模型的形式:
考虑序列
若其能通过
次差分后变为平稳序列,即
则
为平稳序列,即
于是可建立ARIMA
模型:
经
阶差分后的ARIMA
模型称为ARIMA
模型。
其中
为自回归模型的阶数,
为移动平均的阶数,
为一个白噪声过程。
(2)建立ARIMA模型的一般方法:
1)检验原序列的平稳性检验的标准方法是单位根检验,若序列不满足平稳性条件,则可通过数学方法,如差分变换或者对数差分变换使其满足平稳性条件;
2)通过计算能够描述序列特征的一些统计量,如自相关(ACP)系数和偏自相关(PACP)系数来确定ARIMA
模型的阶数
和
,并根据一定的准则,如ATC准则或SC准则等综合考虑来确定模型的参数;
3)估计模型的未知参数[2],并通过参数的统计量检验其显著性,以及模型的合理性;
4)进行诊断分析,检验模型的拟合值和实际值的残差序列是否为一个白噪声序列。
(3)数据的来源与描述:
从《深圳统计年鉴》各卷统计出1979至2006年深圳国内生产总值,见表5:
并按此数据作图1从中可以粗略地看出
具有长期上升趋势,非水平平稳。
表2:
1979——2006年深圳国内生产总值统计表(亿元)
图3图4
(4)序列的平稳性处理:
对
进行平稳性检验(ADF检验),结果如表2:
表3:
序列ADF检验结果
由表7可知其不平稳。
为了消除原始数据序列的不平稳性,使数据更为平稳,本文采用对深圳国内生产总值序列取对数形式,记为
,序列
一阶差分后的序列记为
二阶差分后的序列记为
,按二阶差分后数据作序列图2,可见时间趋势基本消除,可认为是平稳序列但序列图只能粗略地判断序列具有平稳性,理论上应用单位根检验方法检验。
对
进行平稳性检验(ADF检验),结果如表3:
表4:
序列ADF检验结果
由表7可知其平稳,说明GDP序列为2阶单整序列,即
模型的识别与建立
由以上对序列
的ADF检验,我们可确定
模型中的
应取为2为了确定模型中的
和
作出序列
直至滞后16阶的自相关(ACP)图和偏自相关(PACP)图,分别见图3和图4.
由图7和图8可看出,少InXt序列的自相关图与偏自相关图都是拖尾的,因此可建立:
图5图6
ARIMA模型。
经反复计算比较,最终取
,
建立如下
模型:
(括号中的数据为对应估计值的
检验统计量)
即:
由模型
(1),对其进行回归拟合,模型中的残差序列(Residual)以及过
的实际值(Actual)和拟合值(Fitted)的序列图见图9:
从图9可以看出,模型的拟合值和实际值的变动具有较好的一致性。
其次,模型的残差值较小,消除了线性或者指数趋势,表现得较为平稳,说明模型通过了适应性检验,所以该模型还是比较理想的。
为了进一步检验该模型的效果,记
为该模型的残差序列,对其进行DF检验,得:
,DF的值为-5.3921而在1%显著水平下,DF的临界值为-2.6649,因此,残差序列
即误差项序列能在1%显著水平下被看作白噪声过程,这说明
的拟合值是实际值的无偏估计,模型具有较好的拟合效果。
作出残差序列
前16阶的自相关(ACP)和偏自相关(PACP)图,分别见图10和图11。
从两图我们也可看出,自相关函数和偏自相关函数均落在置信区间内,残差序列应为白噪声过程,这与上面DF检验的结果一致。
图8:
自相关(ACP)图图9:
偏自相关(PACP)图
(5)模型的预测:
由
模型得:
又因为:
可得
的预测公式为:
因此得