脑卒中疾病模型.docx
《脑卒中疾病模型.docx》由会员分享,可在线阅读,更多相关《脑卒中疾病模型.docx(16页珍藏版)》请在冰豆网上搜索。
![脑卒中疾病模型.docx](https://file1.bdocx.com/fileroot1/2022-11/27/e0215800-49d1-47cd-bb46-b0116ef99b9c/e0215800-49d1-47cd-bb46-b0116ef99b9c1.gif)
脑卒中疾病模型
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则•
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
C题
我们的参赛报名号为(如果赛区设置报名号的话):
丫3601
所属学校(请填写完整的全名):
西安欧亚学院
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
日期:
2012年9月7_日
赛区评阅编号(由赛区组委会评阅前进行编号):
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评阅人
评分
备注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
脑卒中发病环境因素分析及干预
摘要
本题主要讨论的是不同人群的性别、职业、年龄段和月份对脑卒中发病人数的影响,以及环境因素对脑卒中发病人数的影响,分别建立概率模型和多元回归模型,用Excel
软件和Matlab软件分别求解,并对脑卒中发病的高危人群给出预警和干预的建议方案。
针对问题一,从附件(Appendix-C1)统计出人群的性别、职业、年龄段和月份各自的人数,先根据脑卒中发病男女人数占脑卒中发病总数人数的比例,建立概率模型,得出男性人数的发病率高于女性人数的发病率。
其次根据脑卒中发病职业人数占脑卒中
发病总数人数的比例,建立概率模型,得出在不同职业下脑中卒的发病率所占的人数可排序为:
农民、退休人员、工人、离退人员、职工、教师、医务人员、渔民。
再次根据脑卒中发病人数占脑卒中发病总数人数的比例,建立概率模型,得出在不同年龄段下发
病率的人数不同,且在60-89岁的年龄段下发病率的人数最多,在10-49岁,90-109
岁的年龄段发病率的人数相对较少。
然后根据相同职业下不同性别脑卒中发病人所占脑卒中发病总人数的比例,建立概率模型,得出在相同的职业下男性的发病率人数高于女性的发病率人数。
最后根据不同年份相同月份的脑卒中发病人数所占脑卒中发病总人数的比例,建立概率模型,得出当季节月份变化时,发病率就有所变化,即脑卒中发病有明显的季节性,冬春季高发,夏秋季低发。
针对问题二,从附件所给出的数据可知,影响脑卒中发病人数的环境因数,主要有8个:
月平均气温、月平均气压、月平均相对湿度、月平均最高气温、月平均最高气压、月平均最低气温、月平均最低气压、月平均最小相对湿度。
因此对附件(Appendix-C2)
统计出8个数据,先以的月平均气温、月平均最高气温、月平均最低气温与脑卒中发病人数之间建立三元回归模型,对求解结果分析,得出月平均气温对脑卒中发病人数影响最大;再以月平均气压、月平均最高气压、月平均最低气压与发病人数之间建立三元回归模型,对求解结果分析,月平均最低气压对发病人数影响最大;然后以月平均相对湿度、月平均最小相对湿度与发病人数之间建立二元回归模型,对求解结果分析,得出月平均最小相对湿度对发病人数影响最大;最后以月平均气温、月平均最低气压、月平均最小相对湿度与脑卒中发病人数之间建立三元模型,对求解结果分析,得出脑卒中发病
人数影响大小的顺序为:
月平均最小相对湿度、月平均最低气压、月平均气温。
一、问题重述
脑卒中(俗称脑中风)是一组急性血管病的总称。
它是目前威胁人类生命的严重疾病之一,而且它的发生是一个很漫长的过程,一旦得病就很难逆转。
这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。
对脑卒中的发病环境因素
进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措
施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。
同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。
数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。
请根据题目提供的数据,回答以下问题:
1•根据病人基本信息,对发病人群进行统计描述。
2•建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。
3•查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2中所
得结论,对高危人群提出预警和干预的建议方案。
二、模型假设
1、假设将附件中所给数据中出现的空格、其他或缺失的数据归为一类;
2、假设重复住院或再发者及发病时间不详者未统计在内;
3、假设
三、符号说明
Qi表示不同性别的发病人数比例;
P表示不同职业的发病人数比例;
Mi表示不同年龄段的发病人数比例;
Fi表示相同职业不同性别的发病人数比例;
Gi表示不同年份相同月份的发病人数比例;
A表示不同的性别总人数(i=1,2);
Bi表示不同职业的总人数(i^1,2,3,4,5,6,7,8);
Ci表示不同年龄段的总人数(i=1,2,3,4,5,6,7,8,9,10,11,1表示0-9岁,2表示10-19,
其他以此类推);
Dj表示相同职业下不同性别的总人数(i=1,2表示性别,j=^1,2,3,4,5,6,7,8表示职业);
Eij表示不同年份相同月份下的总人数(i=1,2,3,表示2007年到2010年;
j=1,2,3...表示相应的月份);
N表示总人数;
F表示月平均人数;
为表示月平均气温;
X2表示月平均最高气温;
X3表示月平均最低气温;
y1
表示月平均气压;
y2
表示月平均最高气压;
y3
表示月平均最低气压;
Z1
表示月平均相对湿度;
Z2
表示月平均最小相对湿度
四、问题分析
本题主要研究了不同人群对脑卒中发病率的影响因素,以及脑卒中发病率与气温、气压、相对湿度间的关系。
针对问题一,我们根据附件(Appendix-C1)所给的数据,由假设1可知,利用Excel软件进行数据筛选统计时,可以将数据中出现的空格、其他或缺失的数据归为一类,然后根据在不同性别、年龄、年份(月份)、职业下所占总人数的比例建立相应的模型,再利用Excel软件筛选统计数据计算并得出结论。
针对问题二,根据附件(Appendix-C2),先统计出月平均气温、月平均气压,月平均相对湿度;月平均最高气温、月平均最高气压、月平均最低气温;月平均最低气压、月平均最小相对湿度的数据。
再根据气温对脑卒中发病人数的影响,建立脑卒中发病人数与月平均气温、月平均最高气温、月平均最低气温的三元回归模型;气压对脑卒中发病人数的影响,建立月平均气压、月平均最高气压、月平均最低气压的三元回归模型;相对湿度对脑卒中发病人数的影响,建立脑卒中发病人数与月平均相对湿度、月平均相对最小湿度的二元回归模型。
通过对各自多元模型的求解,可得出气温、气压、相对湿度,各自相应影响的最大相关系数,最后根据最大相关系数所对应的变量与脑卒中发病人数之间的关系,建立三元回归模型,通过对模型的求解,可得到气温、气压、相对湿度对脑卒中发病率影响大小的排序。
针对问题三,
五、模型建立与求解
5.1问题一
根据对问题一的分析,要统计出各种情况下脑中卒发病人群的总人数,首先要统计出在性别、年龄、年份(月份)、职业下的发病情况,再利用Excel软件作出图表,得出相应的结论。
5.1.1不同性别下的发病人数比例
由问题一的分析可知,根据对不同性别人脑卒中发病人数占脑卒中发病总人数的比例建立概率模型,即
Ai
Qi—
(1)
N
其中,A表示不同的性别脑卒中发病总人数(i=1,2),我们根据所给数据利用Excel软件进行筛选统计数据(见附录1)代入公式
(1),计算并得出结果如下表1所示:
表1性别比例表
性别
比例
男
0.538
女
0.462
由表1可知,男性人数的脑卒中发病率高于女性人数的脑卒中发病率。
5.1.2不同职业下的发病人数比例
由问题一的分析可知,根据对不同职业脑卒中发病人数占脑卒中发病总职业人数的比例建立概率模型:
Bi
P-N
结合假设1可知,我们将附件所给数据中出现的空格、
(2)
其他或缺失的数据归为一类,
其他职业的人数为:
Bi(i=1,2,3,4,5,6,7,8分别表示农民,工人,退休人员,教师,渔
由图1可知,在不同职业下脑中卒的发病率所占的人数可排序为:
农民、退休人员、
工人、离退人员、职工、教师、医务人员、渔民。
5.1.3不同年龄段的发病人数比例
由问题一的分析可知,根据不同年龄段脑卒中发病人数占脑卒中发病总人数的比例,建立概率模型:
MiL(3)
N
其中,Ci表示不同年龄段的总人数(i=1,2,3,“=,11;1表示0-9岁,2表示10-19岁,3表示20-29岁,…,11表示100-109岁),然后我们利用Excel软件统计数据(见附录3)代入公式(3),并计算得出结果如下表2所示:
表2各年龄段人数所占比例表
年龄段
人数
所占比例
0-9岁
192
0.31%
10-19岁
72
0.12%
20-29岁
P242
0.39%
30-39岁
646
1.04%
40-49岁
2833
4.54%
50-59岁
7227
11.59%
60-69岁
15147
24.30%
70-79岁
20560
32.98%
80-89岁
12771
20.49%
90-99岁
2635
4.23%
100-109岁
14
0.01%
由表3可知,在不同年龄段下发病率的人数不同,且在60-89岁的年龄段下发病率
的人数最多,在10-49岁,90-109岁的年龄段发病率的人数相对较少。
5.1.4相同职业下不同性别的发病人数比例
由问题一的分析可知,根据在相同职业下不同性别脑卒中发病人所占脑卒中发病总人数的比例,建立概率模型:
IJ
(4)
Dj
Fi-
N
其中,相同职业下不同性别的发病人数比例为:
FI(1=1,2;1表示男,2表示女),
Dj表示相同职业下不同性别的总人数(I=1,2表示性别,j^1,2,3,4,5,6,7,8表示职业),我们根据所给数据利用Excel软件筛选统计数据(见附录4)代入公式(4),计算并得出结果如下表3所示:
表3相同职业不同性别比例表
职业
男
女
总人数
男所占总比例
女所占总比例
农民
P17047
:
14713
31760
38.9%
P33.6%
工人
2279
1303
3582
5.2%
2.98%
退休人员
3560
2517
6077
8.1%
5.8%
教师
r82
r41
123
0.18%
P0.09%
渔民
10
18
28
0.02%
0.04%
医务人员
22
14
36
0.05%
0.03%
职工
r470
r185
655
1.1%
P0.42%
离退人员
879
571
1450
2.01%
1.48%
由表4可知,在相同的职业下男性的发病率人数高于女性的发病率人数。
如在农民
的职业下男性占了17047人,而女性占了14713人。
5.1.5不同年份相同月份下的发病人数比例
由问题一的分析可知,根据不同年份相同月份的脑卒中发病人数所占脑卒中发病总人数的比例,建立概率模型:
其中,不同年份相同月份的脑卒中发病人数比例为:
G|,Ej表示不同年份相同月
份下的总人数(I=1,2,3,4表示2007年到2010年;j=1,2,3...12表示相应的月份)。
根据附件中所给的数据,利用Excel软件筛选统计数据(见附录5)代入公式(5),计算并画出如下图2所示:
由图2可知,当季节月份变化时,发病率就有所变化,即脑卒中发病有明显的季节性,冬春季高发,夏秋季低发。
女口1、3、5、10月脑卒中发病率较高,2、4、6、7、8、9、11、12月脑卒中发病率较低。
5.1.6
5.2问题二
5.2.1统计数据
利用Excel软件从附件(Appendix-C2)统计出月平均气温、月平均气压,月平均相对湿度;月平均最高气温、月平均最高气压、月平均最低气温;月平均最低气压、月平均最小相对湿度的数据,如表4所示:
5.2.2多元线性回归模型的基本概念
如果一个被解释变量(因变量)y有k个解释变量(自变量)xy,j=1,2,3,...,k,同时,y不仅是xtk的线性函数,而且是参数嘉和二,i",2,3,...k(通常未知)的线性函数,随即误差项为ut,那么多元线性回归模型可以表示为:
yt=一0■」xt1■■2xt2■...■■kxtkut,(t=1,2,...,n)
这里E(yt)二一:
0「凶!
「2Xt2•...「kXtk为总体多元线性回归方程,简称总体回归方程。
其中,k表示解释变量个数,^0称为截距项,「2...I是总体回归系数。
l,i",2,3...k表示在其他自变量保持不变的情况下,自变量Xq变动一个单位所引起的因变量Y平均变动的数量,因而也称之为偏回归系数。
当给定一个样本(yt,X",Xt2,...Xtk),t=1,2,...n时,上述模型可以表示为:
bi=Bo+BiXii+B2X12+…+目kXik+Ui
、2=Po+0iX21+P2X22+...+0kX2k+U2
*y3=Po+卩1X3i+P2X32+…+PkX3k+U3>
yt=】ol-'iXtiI-'2Xt2*・・・I-'kXtkUt
此时,yt与Xq已知,[与ut未知
其相应的矩阵表达式为:
可以简化为:
Y=X一:
•u--总体回归模型的简化形式5.2.3多元线性回归模型假定条件
与一元线性回归模型的基本假定相似,为保证得到最优估计量,多元线性回归模型应满足以下假定条件:
假定1随机误差项Ut满足均值为零,其方差C2相同且为有限值。
假定2随机误差项之间相互独立,无自相关。
假定3解释变量Xy,j=1,2,3,...,k之间线性无关,即解释变量的样本观测值矩阵式满秩
矩阵,否则称解释变量之间存在多重共线性(与课本假定7合并)。
假定4解释变量Xy,j=1,2,3,...,k是确定性变量,与误差项彼此之间相互独立。
假定5解释变量是非随机变量,且当T「:
时,T"XX>Q,Q是一个有限值的非奇异矩阵。
假定6随机误差项服从正态分布。
假定7回归模型是正确设计的
由于附件中所给的都是脑卒中发病人的信息,并且发病人数越多相对应的发病率就越高。
所以,下面我们在建立模型时主要考虑的是发病人数受气温、气压、相对湿度的影响。
5.2.4脑卒中发病人数与气温的关系
由问题一得出的结论可知,当季节月份变化时,发病率就有所变化。
即脑中卒的发病人数与气温具有一定的关系。
以月平均气温、月平均最高气温、月平均最低气温与脑卒中发病人数之间建立三元回归模型:
(6)
F(X)—aoa1x1a2X2a3X3其中,X表示月平均气温;X2表示月平均最高气温;X3表示月平均最低气温。
利用Matlab软件(见源程序一)对(6)式进行求解得出
由此可得:
a0二1129.2,a〔二104.4,a:
二—28.7,a^=—75.2
F(x)=1129.2-104.4咅一28.7X?
-75.2X3
根据对回归模型进行检验,得出r2=0.86,p=0.005,由此可看出r接近于1,
p:
:
:
0.05。
所以此三元回归模型通过检验。
由求解的结果可知,月平均气温对发病人数影响最大。
利用Matlab软件(见源程序五)对附录6进行画图,如下图3所示:
图3
由图3可知,月平均温度与脑卒中发病人数正相关。
即随着月平均温度的增加,脑卒中发病人数也增加。
5.2.5脑卒中发病人数与气压的关系
当气压变化时,发病率就有所变化。
即气压对脑卒中发病人数有一定的影响。
以月平均气压、月平均最高气压、月平均最低气压与发病人数之间建立三元回归模型:
F(y)=bg-by•b?
y2•bsy?
(7)
其中,y1表示月平均气压;y2表示月平均最高气压;y3表示月平均最低气压。
利用Matlab软件(见源程序二)对(7)式进行求解得出
bo=708.37,b1=1.36,b?
=6.24,b^-12.86
由此可得,
F(y)=708.371.36y16.24y2「12.86y3
根据对回归模型进行检验,得出r2=0.92,p=0.003,由此可以看出r接近于1,p:
:
:
0.05。
所以此三元回归模型通过检验。
由求解的结果可知,月平均最低气压对发病人数影响最大。
利用Matlab软件(见源程序六)对附录7进行画图,如下图4所示:
图4
由图4可知,月平均最低气压与脑卒中发病人数负相关。
即随着月平均最低气压的减少,脑卒中发病人数也减少。
526脑卒中发病人数与相对湿度的关系
当相对湿度变化时,发病率就有所变化。
即相对湿度对脑卒中发病人数有一定的影响。
以月平均相对湿度、月平均最小相对湿度与发病人数之间建立二元回归模型:
F(Z)=Co■CiZi-C2Z2(8)
其中,Zi表示月平均相对湿度;Z2表示月平均最小相对湿度。
利用Matlab软件(见源程序三)对(8)式进行求解得出
c0=1500,c=2.2,c2=-7.1
由此可得,
F(z)=15002.2乙勺一7.1z2
根据对回归模型进行检验,得出r2=0.94,p=0.004,由此可以看出r接近于1,
p:
:
:
0.05。
所以三元回归模型通过检验。
由求解的结果可知,月平均最小湿度对发病人数影响最大。
利用Matlab软件(见源程序七)对附录8进行画图,如下图5所示:
5.2.7脑卒中发病人数与月平均气温、月平均最低气压和月平均最小相对湿度的关系
以月平均气温、月平均最低气压和月平均最小相对湿度与脑卒中发病人数之间建立三元回归模型,即
F(x1,y3,z2)=k。
+k1x1+k2y3+k3z2(9)
其中,x表示月平均气温;y3表示月平均最低气压;z2表示月平均最小相对湿度。
利用Matlab软件(见源程序四)对(9)式进行求解得出
k°=2247,匕=-0.6,k2=3,k3=-7.9
由此可得,
F(k)=2247「0.6x1•3y3「7.9z2
根据对回归模型进行检验,得出『=0.95,p=0.004,由此可以看出r接近于1,p:
:
:
0.05。
所以三元回归模型通过检验。
由求解的结果可知,月平均气温、月平均最低气压、月平均最小相对湿度对脑卒中发病人数影响大小顺序为:
月平均最小相对湿度、月平均最低气压、月平均气温。
六、模型评价
优点:
1、运用表格和图像相结合,对于结果的分析更加清晰;
2、利用Excel软件和Matlab软件提高了结果的可行度,数据更加精确;
3、对于题目中的问题做出了合理的假设,多方位联系实际情况对于模型的影响,多层次优化了模型;
4、在利用回归预测法时能考虑疾病的各影响因素及相关关系,要求样本量大且有较好的分布规律。
缺点:
1、在进行实际应用时,受到的限制条件较多;
2、在论文中应用了推理假设,产生了一定的误差。
3、本题对数据依赖性比较大,只是根据题中所给数据做了一个理想化的模型可能与实际不能完全吻合;
4、当受随机扰动等错综因素影响时,外推性差。
七、参考文献
[1]程红萍,钟忠銮,高等数学(第2版)[M]同济大学出版社2009年
[2]雷功炎,《数学建模讲义》(第二版)[M]北京大学出版社1999年
[3]严喜祖,宋中民,毕春加,《数学建模及其实验》[M]科学出版社2009年
[4]王庚,王敏生,《现代数学建模方法》[M]科学出版社2008年
⑸陈恩水,王峰,朱道远,《数学建模与实验》[M]科技出版社2008年
⑹郭大伟,《数学建模》[M],安徽教育出版社2009年
[7]《》[J
附录
附录1男女所占的总人数
性别
人数
总人数
男
6572
10646
5142
10936
33296
女
5351
8854
4712
9701
28618
附录2表2各个职业人数所占的比例表
职业
农民
工人
退休人员
教师
渔民
医务人员
职工
离退人员
人数
[300971
5318
6644
21厂
57
80
539
P1650
所占比例67.5%11.9%14.9%0.5%0.13%0.18%1.2%3.69%
附录3各年龄段发病人数
年龄段
人数
总人数
0-9岁
12
3
8
169
192
10-19岁
3
10
12
17
72
20-29岁
29
43
51
119
242
30-39岁
112
118
188
228
646
40-49岁
485
774
845
729
2833
50-59岁
1004
2346
2312
1565
7227
60-69岁
—2682
P4566
5575
2324「
15147
70-79岁
4289
6827
6541
2903
20560
80-89岁
2442
4319
4348
1662
12771
90-99岁
239
400
1861
135
2635
100-109岁
4
8
0
2
14
附录4各职业男女发病人数
职业
男
女
总人数
农民
17047
14713
31