冠心病数学建模.docx

上传人:b****6 文档编号:3002966 上传时间:2022-11-17 格式:DOCX 页数:22 大小:177.84KB
下载 相关 举报
冠心病数学建模.docx_第1页
第1页 / 共22页
冠心病数学建模.docx_第2页
第2页 / 共22页
冠心病数学建模.docx_第3页
第3页 / 共22页
冠心病数学建模.docx_第4页
第4页 / 共22页
冠心病数学建模.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

冠心病数学建模.docx

《冠心病数学建模.docx》由会员分享,可在线阅读,更多相关《冠心病数学建模.docx(22页珍藏版)》请在冰豆网上搜索。

冠心病数学建模.docx

冠心病数学建模

附件:

2013年数学建模竞赛培训模拟竞赛答卷论文样式

数学建模竞赛模拟竞赛论文封面

论文题目:

冠心病月就诊人数的预测模型

 

指导教师评阅意见:

冠心病月就诊人数的预测模型

摘要:

冠心病已成为对人类危害最大的疾病之一,与人类的生命安全息息相关。

本文首先对数据进行分析、统计,建立person相关性模型,得到冠心病与环境因素之间的关系,其次通过主成分分析对八种环境因素进行降维,再通过对两个主成分进行多项式回归,建立冠心病预测模型。

对于问题一,由于冠心病的产生与环境的影响存在着紧密的联系,故我们运用相关分析法,分析各环境因素与就诊人数,以及各环境因素之间的正负相关性,同时利用相关分析得到的主要因素与月就诊人数画出近8年的变化情况折线图,得出冠心病的就诊人数呈现一定的周期变化,在第1、12月份最多,并且逐年呈递增趋势。

其次通过对原始数据进行处理,得到每年的就诊人数和2002—2010这8年各环境因素的月平均数的折线图。

通过图表分析得到各个环境因素随月份增加的变化都是同周期的,但平均气压与平均湿度、平均温度的步调相反,与月就诊人数步调一致。

而线性相关性表格如下:

 

平均气压

最高气压

最低气压

平均湿度

最低湿度

平均温度

最高温度

最低温度

就诊数

.054

.058

.049

-.154

-.140

-.150

-.167

-.158

从该表可以看出月就诊数主要受大气的平均气压,平均湿度和最高温度的影响,其相关性系数分别为0.054,-0.154,-0.167(在0.01水平双侧上显著相关),即月就诊人数与平均气压成正相关,与平均湿度和最高温度成负相关,即高气压,低湿度,低温度情况下月就诊数越高。

对于问题二,由于八种环境因素可以进行降维简化处理,且

检验和

检验的取样足够度的Kaiser-Meyer-Olkin度量为0.687,而

小于0.05。

故可以用主成分因子分析法进行处理。

对应数据分析可得:

数据可以由两个主成分进行分析。

这两个主成分子对总方差的贡献率分别为67.919%和24.315%,得到主成分模型为:

然后用Matlab进行多项式回归,得到预测模型为:

根据以上结论,查阅相关资料,对卫生行政部门和医疗机构提出具体的预警和干预的建议方案。

我们指出,受低温和高压的影响,冠心病病例数会出现上升态势,所以应对相应的气候变化做好预警。

 

关键词:

相关分析主成分分析多项式回归预测

一.问题重述

冠心病是目前威胁人类生命的严重疾病之一,这种疾病的诱发已经被证实与环境因素,包括温度和气压之间存在密切的关系。

对冠心病中的发病环境因素进行分析,其目的是为了对冠心病就诊人数的进行预测,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。

数据(见MWQS.xls)来源于南昌市某医院2002年至2010年间共96个月的冠心病发病病例信息以及相应期间当地的气象资料。

请你们根据题目提供的数据,回答以下问题:

1.根据数据基本信息,对月就诊人数及环境因素进行统计描述。

2.研究冠心病月就诊人数与环境因素间的关系,建立冠心病月就诊人数的预测模型。

3.结合1、2中所得结论,对卫生行政部门和医疗机构提出预警和干预的建议方案。

二.问题分析

本问题是针对南昌的月冠心病就诊人数,通过对平均气压、最高气压、最低气压、平均湿度、最低湿度、平均温度、最高温度、最低温度这8个与其相关的环境因素进行研究,探究疾病发病率的规律,对冠心病就诊人数进行预测,以提出最优解决方案。

对于问题一,要求我们根据基本信息,对就诊人数及环境因素进行统计描述。

由于对冠心病起影响作用的因素涉及到诸多方面,因此一方面我们对基本信息进行相关分析,分析各环境因素与就诊人数,以及各环境因素之间的正负相关性,得到不同因素对就诊人数的影响情况以及各因素之间的相关情况,并利用相关分析得到的主要因素与月就诊人数画出近8年的变化情况,直观的对规律进行描述。

另一方面通过对原始数据进行处理,得到每年的就诊人数和8年每月平均最高气压、最低气压、平均气压、平均湿度、最低湿度、平均温度、最高温度以及最低温度。

利用图表分析2002—2010这8年的病例数以及各环境因素随月份变化的趋势,通过分析对就诊人数及环境因素进行统计描述。

对于问题二,需要确定冠心病月就诊人数与环境因素间的关系,得出它们的函数关系式,建立冠心病月就诊人数的预测模型。

现实中,各个环境因素相互影响,八种环境因素通过

检验和

检验,(KMO检验统计量是用于比较变量间简单相关系数和偏相关系数的指标。

主要应用于多元统计的因子分析,而

用于检验相关阵是否为单位阵,即检验各个变量是否各自独立。

)可以用主成分因子分析法进行降维处理。

通过得到的因子再进行多项式回归,得到环境因素与冠心病月就诊人数间的函数关系,利用函数关系式对月就诊人数进行预测。

对于问题三,要求我们对问题一、二所得结果进行整理分析,对未来冠心病的发病人数进行预测并提出有效的预警及干预方案。

我们查阅相关资料,根据前面得到的结果和建立的模型,对卫生行政部门和医疗机构提出具体的预警和干预建议。

三.符号说明与假设

3.1符号说明:

符号

说明

环境影响因素,

,分别表示为“平均气压”

“最高气压”

“最低气压”

“平均湿度”

“最低湿度”

“平均温度”

“最高温度”

“最低温度”

主成分,

置信度

月就诊数

3.2符号假设:

(1)假设仅考虑给出的环境因素对冠心病月就诊人数的关系,其他因素忽略不计;

(2)假设环境不会发生灾害性突变;

(3)假设不存在重复就医的情况。

四.模型建立与求解

4.1问题一

由于原始数据具有很强的直观性与研究价值,且就诊人数与八种环境因素具有很强的关联性,故探究就诊人数必先从原始数据入手

4.1.1基于原始数据统计描述

通过对原始数据进行处理,得到每年的就诊人数和2002—2010这8年的每月平均最高气压、最低气压、平均气压、平均湿度、最低湿度、平均温度、最高温度以及最低温度,数据统计得到以下图表:

图2冠心病年就诊人数柱状图

由图2可得8年间冠心病就诊人数逐年增加,前五年上升趋势缓慢,2006至2007年间涨幅剧增,后又趋于平缓。

图3月平均病例数折线图

图4气压变化折线图

图5湿度变化折线图

图6温度变化折线图

由上图可得病例数在一年中的1月、11月、12月明显高于其他月份;气压变化随着月份呈现U形,两头气压较高;湿度随时间变化不明显,两端略低于中间部分;温度随着月份波动变化,两端也略低于中间,即高气压,低湿度,低温度情况下月就诊人数较高。

可见就诊人数与八种环境具有较强的相关性,为了验证这个结论,我们建立了相关性模型,用spss中的person相关性表格来进一步探究各因素对月就诊人数的影响。

4.1.1基于相关分析法统计描述

相关分析法在计算因素间的相关关系方面有较大的可靠性,同时由于它是对因素间阵列的比较,较好地解决了数据初值化改变原有联系的问题。

所以我们用数理统计中的相关性理论描述月病例数与环境因素之间的相关程度。

为了找到月就诊数和各个环境因素之间的相关关系,先求出月就诊数与各个环境因素的相关系数。

相关分析法的计算公式为:

其中x和y分别表示两个样本数列的平均值。

计算结果

表示两要素之间相关程度的统计指标,其值介于[-1,1],

大于0时正相关,小于0时负相关。

的绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。

Person相关系数(

)又叫相关系数或线性相关系数。

它一般用字母r表示。

它是由两个变量的样本取值得到,这是一个描述线性相关强度的量,取值于-1和1之间。

当两个变量有很强的线性相关时,相关系数接近于1(正相关)或-1(负相关),而当两个变量不那么线性相关时,相关系数就接近0。

表1病例数与各环境因素的相关分析

person相关性

平均气压

最高气压

最低气压

平均湿度

最低湿度

平均温度

最高温度

最低温度

就诊数

平均气压

1

.999**

.998**

-.283**

-.138

-.913**

-.778**

-.782**

.054

最高气压

.999*

1

.995**

-.271**

-.131

-.923**

-.783**

-.788**

.058

最低气压

.998**

.995**

1

-.294**

-.144

-.897**

-.771**

-.774**

.049

平均湿度

-.283*

-.271*

-.294**

1

.943**

.106

.077

.096

-.154

最低湿度

-.138

-.131

-.144

.943**

1

-.020

-.034

.001

-.140

平均温度

-.913**

-.923**

-.897**

.106

-.020

1

.852**

.850**

-.150

最高温度

-.778**

-.783**

-.771**

.077

-.034

.852**

1

.994**

-.167

最低温度

-.782**

-.788**

-.774**

.096

.001

.850**

.994**

1

-.158

就诊数

.054

.058

.049

-.154

-.140

-.150

-.167

-.158

1

**.在.01水平(双侧)上显著相关。

由person相关性表格可以看出,气压因素与就诊数相关系数分别为0.054、0.058、0.049呈现正相关性,湿度因素和温度因素与就诊数呈现负相关性,其中湿度因素与就诊数的相关系数为-0.154、-0.140,而温度因素与就诊数的相关系数为-0.0150、-0.167、-0.158,即气压越高,湿度和温度越低对就诊数的影响越大。

并且由上表可知平均气压、最高气压、最低气压之间具有很强的相关性,平均湿度与最低湿度也具有很强的相关性,平均温度与最高温度、最低温度之间具有较高的相关性。

因此,可以选取平均气压、最低湿度和最高气温作为影响月病例数的主要环境因素。

对于这三种环境因素:

平均气压、最低湿度和最高气温,利用原始数据得到就诊人数与其的关系得到如下图形:

图1月病例数与主要环境因素变化情况散点图

由相关分析所得的主要环境因素作图,分析图1可得平均气压,平均湿度,最高气温,就诊数都呈现周期性变化,且四者大致是同周期的。

但平均气压与平均湿度,平均温度的步调相反,与就诊数步调一致,即高气压,低湿度,低温度情况下月就诊数越高。

综合图形以及线性相关性表格可以得出:

1.由于环境等因素影响,月就诊人数逐年上升。

2.平均气压,平均湿度,最高气温呈现一定的周期变化,且对于平均气压,

第1、12月份高,中间月份低,而温度在1、12月份低,湿度呈波动变化,

气压因素与就诊数相关系数分别为0.054、呈现正相关性,湿度因素和温

度因素与就诊数呈现负相关性,分别为-0.154,-0.167。

4.2问题二

对于该问题,由于八种环境因素较多,故我们首先通过主成分分析法对这八种因素进行降维处理,用得到的两种新成分数据取代原有的八种环境因素数据,再对其进行多项式回归,建立冠心病月就诊人数的预测模型。

4.2.1主成分分析

主成分分析是根据

软件中的降维分析→因子分析→主成分分析得到多个新的成分

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 幼儿读物

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1