1、脑卒中发病环境因素分析及干预模型探讨脑卒中发病环境因素分析及干预模型探讨摘 要本文对我国某城市各家医院的脑卒中发病病例信息及相应期间当地的逐日气象资料进行了统计分析,主要采用多元逐步回归方法,建立了气温、气压和相对湿度对脑卒中发病的多元线回归模型,并对模型进行了检验,最终得到了脑卒中发病率与气温、气压和相对湿度之间的关系。针对问题一,我们根据病人基本信息,用Excel软件对数据进行了统计分析,得到了2007年到2010年不同职业和不同年龄段的发病人数。分析表明:随着年龄的增加,脑卒中的发病率也随之增加,其中老年的发病率高达59.16%;职业不同,发病率也不同,农民的发病率为47.87%约占总人
2、数的一半;同时得出男性发病率比女性高。针对问题二,本文通过分析题中附件中所给的数据,利用MATLAB软件工具箱,作出脑卒中发病率与气温、气压、相对湿度的散点图,再对图形进行拟合,建立了多元逐步回归模型,解决了脑卒中发病率与环境因素之间的关系分别成负相关、正相关、负相关。针对问题三,我们查阅相关资料,得到对应结论,对高危人群提出的预警是针对职业为农民和处于老年年龄段的人群在春季定期到医院检查血压、血糖、降低血脂和治疗疾病;干预的建议方案:平衡膳食结构;减轻心理社会因素对血压的影响;有效降压治疗;充分利用社区医疗资源,通过建立健康档案,有助于了解每个居民的生活习惯,健康状况,及时掌握居民的疾病动态
3、;通过健康教育,使人们认识到高血压、糖尿病、高血脂等疾病为脑卒中的可控危险因素,并意识到危险因素长期存在的危害性。此模型很好的体现了影响脑卒中发病率与环境因素之间的关系,具有较强的规律性,并且能够推广到空气质量好坏受环境因素的影响,暴雨的提前预警,未来人口预测等。关键词: 脑卒中发病率 环境因素 多元回归模型 MATLAB Excel软件一、问题重述脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。因此,有必要了解影响脑卒中患者发病的环境因素及发病机制, 为提出综合的干预措施
4、提供依据。数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。我们根据题目提供的数据,主要解决以下问题:1根据病人基本信息,对发病人群进行统计描述。2建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。3查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2中所得结论,对高危人群提出预警和干预的建议方案。二、问题分析脑卒中发病环境因素分析主要是研究在2007-2010年期间,气温、气压及相对湿度与脑卒中发病率之间的关系,以及与此相关的其它指标。因此要对发病环境因
5、素分析,就先要分析清楚各种影响因素的变化规律,然后才能根据各种环境因素对发病率的影响情况,由它们之间的模型关系对未来人群提出预警与干预。根据题目信息分析,发现脑卒中发病率主要与气温、气压、相对湿度、职业、年龄和性别等因素有关。由附录Appendix-C1和Appendix-C2中的数据分析以上因素对发病率的影响。通过查阅和搜集有关高危病人的重要特征和关键指标,以及根据这4年所给数据的统计分析,使用多元逐步回归进行分析建立脑卒中发病率与气温、气压和相对湿度之间的函数关系。最后对脑卒中高危人群提出合理的预警及干预方案,并将模型推广到生活中,比如GDP的增长,环境污染对空气质量的影响等。三、模型假设
6、1.表中数据客观真实,具有可靠性。2.问题的求解只考虑气温、气压和相对湿度三个基本因素。3.假设除去少数异常点外其余所给数据真实。4.将年龄段划分为婴儿、幼儿、儿童、少年、青年、中年、老年和其它6。5.使用气象学上通常所用的阳历记数(即3、4、5月为春季,6、7、8月为夏季,9、10、11月为秋季,12月与次年1、2月为冬季)。6.假设患脑卒的病人在统计过程中没有死亡。7.将年龄和职业代号缺失的病人基本信息记作其它。8.假设统计时所在城市的总人数不变。四、符号说明1.:发病率2.:回归参数;3.:表示在压强影响下各年第月份总和的平均压强;4.:表示在温度影响下各年第月份总和的平均温度;5.:表
7、示在相对湿度影响下各年第月份总和的平均相对湿度;6. =1,2,、12。五、模型的建立与求解问题一 1. 本文首先通过Excel对题中给出数据进行统计分析及处理,分别得出不同月份、不同职业、不同年龄段以及男女的发病人数,并计算出了与之对应的发病率5(发病率是表示在一定期间内,一定人群中某病新发生的病例出现的频率。是反映疾病对人群健康影响和描述疾病分布状态的一项测量指标)。具体公式如下:分子是某时期(年度、季度、月份)内的新发病人数,暴露人口是指观察地区内可能发生该病的人群,对那些不可能再发生该病的人(如已经感染了传染病或因预防接种而获得免疫力的人),理论上不应计入分母内,但实际工作中却难以把这
8、部分人分辨出来。 当描述某地区的某病发病率时,分母多以该地区该时间内的平均人口,这时应注明分母是平均人口。如观察时间以年为单位时,可为年初人口与年终人口相加再除以2,或以当年年中(7月1日零时)的人口数表示。2. 根据附件Appendix-C1中的数据,用Excel软件进行统计整理得到2007-2010年每月份的发病人数。如下表:表1-1 2007-2010年每月份的发病人数2007年2008年2009年2010年合计一月934182790617615428二月732195484714915024三月1019191881517305482四月1049175986016865354五月10521
9、77187418825579六月1022149579416164927七月1012149591317545174八月1197137692116875181九月1221128283316384974十月1375147275817245329十一月1209137766615704822十二月1370132180210784571根据表1-1中的数据可以得出平均每月发病人数占总发病人数的比值,用Excel软件绘出柱形图,如下图:图1-1 2007-2010年平均每月发病人数占总发病人数的比值 由图1-1我们可以直观的看出,4年中每月的发病人数既有上升也有下降,由此很难得到相关规律,因此利用我们对季度
10、的划分,得到不同季度发病人数占总人数的比值。如图1-2:图1-2 不同季度发病人数占总发病人数的比 由图知,随着春夏秋冬季节的变化,发病人群出现下降趋势,可以说明气温对脑卒中发病率有一定的影响。由于春季为头一年的12月与次年的1、2月,温度比较低;夏季为3、4、5月,温度比较适中。说明温度低对脑卒中发病率的影响比较大。3. 根据附件Appendix-C1中的数据,用Excel软件进行统计整理得到2007-2010年不同职业的发病人数。如下表:表1-2 2007-2010年不同职业的发病人数职业农民工人退休人员教师渔民医务人员职工离退人员其它人数/人29605473168962291309361
11、2163217917 图1-3 不同职业的发病人群数占总数的比值由表和图知,农民的发病人群数远远高于其它职业,可以预测部分农民由于忙碌对自己的身体健康状况不够关注。4.不同年龄阶段的发病人数统计如下表表1-3 2007-2010年不同年龄段发病人数年龄阶段婴儿幼儿儿童少年青年中年老年其它发病人数/人012612643138663658810718根据表1-3的数据我们使用Excel软件求出不同年龄阶段的发病人数占发病总人数的比值,得到相应的柱形图如图1-4.注:婴儿0,1) 幼儿1,6) 儿童6,12) 少年12,18) 青年18,40) 中年40,65) 老年65,110) 其它(不包含上述
12、年龄段)图1-4 不同年龄阶段发病人群数占总发病人数数的比值我们对得到的柱形图进行分析发现,随着年龄的增长,发病人数就增加。其中,老年的发病人数最高。可以推测年龄越高,发病率越大。5.最后,我们对发病人群的男女比例进行了统计,得到了表1-4和图1-5表1-4 2007-2010男女分别得发病人群男(人)女(人)合计(人)2007年71226070131922008年102838764190472009年5393459699892010年10592902519617图1-5 男女发病人数分别占总人数的百分比 我们可以得到,男性发病率高于女性发病率。即男性比女性更容易患脑卒中。问题二1.模型的建立
13、根据附件Appendix-C1所给数据,利用Excel2003软件工具箱进行统计分析,得出2007年2010年四年中平均气温、平均气压和平均相对湿度在各月份的平均数据和在四年中各月份的平均气温、平均气压和平均相对湿度的数据(见附录1),利用MATLAB工具作出四年每个可能影响因素与脑卒中发病率的散点图,如图2-1、图2-2和图2-3(程序见附录2,3 ,4)图2-1 2007年2010年平均温度对发病率的散点图图2-2 2007年2010年平均压强对发病率的散点图图2-3 2007年2010年平均相对湿度对发病率的散点图分析图2-1,图2-2,图2-3可以得出脑卒中与温度、湿度及压强的平均值存
14、在线性关系2、模型的求解2.1、 建立多元线性回归模型:利用MATLAB软件求解,得表2-1(程序见附录 5 ): 表2-1参数参数估计()置信区间()00.9738-0.0009 -0.0090.0008 由表2-1可得如下模型:由表2-1对模型分析可知R2=0.2670 ,F=0.9713 , =0.4525,拟合度很低,由此,需对模型进行改进。 2.2、建立多元交互影响回归模型: 利用MATLAB软件求解,得表2-2(程序见附录 6 ): 表2-2参数参数估计值()置信区间()26.6523-0.02610.0451 -0.3625-0.00010.00040.0001由表2-2可得如下
15、模型:由表可知,R2=0.7702,F=2.7934, =0.1397,拟合度很低,由此,不得不对模型进行改进。3、模型的改进3.1由于本题是多元线性回归模型,在Excel2003软件中,对本题中的三个自变量,平均气压、平均温度及相对湿度与脑卒中发病率进行相关性分,分析表明三自变量与脑卒中发病率相关性较好,可以利用Excel2003中的回归分析工具建立回归模型,并得出“归统计表、“方差分析”和“回归结果”3张表图3-13.2、利用Excel回归分析工具建立回归模型(详细过程参考文献2,315页-322页)3.2.1本题中,Multipe R(相关系数)的值为0.99883786和R Squar
16、e(判定系数r2)的值为0.99776819,都非常接近1,所以可以判定变量平均温度、压强及相对湿度与自变量发病率y有较强的关系,标准误差相对于变量的取值也较小,说明回归方程比较可靠。在方差分析表“图-2”中,通过分析残差平方和在总的离差平方和中所占比重来判段拟合结果的优劣,也可以通过计算F统计量进行显著性判断,这里的方差分析基本假设是回归系数为零,H0 :r=0。 本题中,残差平方和只占总的离差平方和的比例不到10%。F统计量的值为1341.579,远远大于F临界值,因此拒绝r=0的原假设,即认为数据间存在明显的相关,从显著性分析(Significance F)也可以看出原假设成立的概率非常
17、小。在两个自变量的线性拟合图中,可以看到人口、经销商数两个自变量对销售总额变量的线性拟合程度都很好,预测值和实测值基本重合,如图所示图3-2 回归分析结果回归分析的目的是找出变量与自变量之间准确的数学关系式,残差分析和拟合分析的作用在于判断通过运算得到的回归方程的可靠性。回归方程由截距和斜率表示,这组参数列在图3-1的第3张表中。根据本例的运算结果,可以得到回归方程为:图3-1第3张表除了给出线性方程的回归参数外,还计算了每个参数的标准误差、T统计量、概率值和在给定置信区间下的估值区间。3.2.2、“残差分析”的输出结果如图3-3所示。在残差分析表中,对于每个实测值给出了按回归方程计算的预测值
18、和预测值与真实值直接的残差、标准残差。图3-4总的看来,残差的值相对较小,说明回归方程可靠。由于本案例在回归选项中选中了“标准残差”,因此表中显示出标准残差。标准残差等于每个残差与总残差均值的差,然后除以残差的标准差。通过残差图能直观地看出残差的分布情况,如果残差图上残差的分布是随机上网,则说明回归预测的系统偏差小,本案例生成的残差图如图3-4所示。图3-53.2.3、“概率分析”的输出结果如图3-5所示。概率分布式按照百分比排位列出实测值,并将实测值和百分比排位为数据源绘制散点图,以此说明数据的线性特征。图3-6如图所示,可以看出实测值良好的线性。此外,还可以在概率图中添加线性区域先,观察实
19、测数据点与趋势线的相互位置关系,判断拟合程度。3.3.1、平均温度、压强差及相对湿度与自变量发病率的关系:重复3.2程序,将压强列数据替换为压强差数,最后可得Multipe R(相关系数)的值为0.999031和R Square(判定系数r2)的值为0.998064,都非常接近1,所以可以判定变量平均温度、压强差及相对湿度与自变量发病率y有较强的关系,标准误差相对于变量的取值也较小,说明回归方程比较可靠。可得到发病率与平均温度、压强差及相对湿度的关系模型如下(运行结果见附录由此模型可知压强差对发病率的影响极大,同时明显改变相对湿度的回归系数,这两因素对发病率存在交互影响。问题三 阅资料和上网搜
20、索文献分析得出有关脑卒中高危人群的重要特征和关键指标,通过1、2问数据的统计分析得出环境、职业、年龄、性别和患病史都将在不同程度上影响脑卒中患病率。将环境因素又细分为气温、气压、相对湿度对发病率的影响;将职业因素考虑1问中的所有因素,因为我们在前面已经由统计数据知道40岁以下患脑卒中的人数较少,患病人群主要集中在老年、中年;同时性别比例也已求出(见一问表格);患病史的有无也是一个检测的指标,因为考虑到这些因素影响程度不同,所有层次分可以很好地解决这一问题。六、模型的评价与推广6.1优点(1)模型的适用范围广,易于推广,模型对生活中的其它现象(如空气质量好坏受环境因素的影响,暴雨的提前预警,未来
21、人口预测等)同样适用。(2)使用多元回归模型建立发病率与气温、气压及相对湿度之间的关系,已经经过残差分析,回归系数全在置信区间,得到了更加精确的模型。(3)从建立的模型来看,更好运用了数形结合的思想,这样使得问题更清晰直观、易于理解。 6.2缺点(1)本题数据比较多,对数据的处理不够精确。(2)分析过程中的随机性和评价者主观上的不确定性及认识上的模糊性。(3)改进模型没有深入讨论交互影响,只是简单得出压强差和湿度对发病率存在交互影响七、参考文献1 颜文勇,王科,数学建模,北京:高等教育出版社,2011。2 赫艳芳,李振宏,李辉,Excel 2003统计与分析,北京:人们邮电出版社,2006。3
22、 王旭,沈阳地区脑卒中发病与气象环境因素的相关性,4 阴阳盛,熊西文,林建华,MATLAB6.1数学软件,大连:大连理工大学出版社,2003。5 百科名片,发病率,6 爱问知识网,年龄划分,7 季度是如何划分的,八、附件附录0 使用MATLAB6.1和EXCEL2003软件附录1 表2-1 四年中平均气温、平均气压和平均相对湿度在各月份的平均数据2007年平均气压(百帕)平均温度(摄氏)平均相对湿度(百分比)2008年平均气压(百帕)平均温度(摄氏)平均相对湿度(百分比)一月1028.234.50373.23一月1027.233.1357.52二月1020.78.770.7二月1027.635
23、7.9三月1018.2811.5669.29三月1018.8111.0857.97四月1016.511.462.6四月1014.615.662.4五月1008.3922.6261.77五月1008.5521.4166.26六月1006.224.775.5六月1005.623.582.4七月1002.9729.39473.32七月1003.6730.1771.32八月1004.9329.5669.10八月1005.8428.0177.32九月1010.524.376.1九月1011.324.979.4十月1018.9519.3471.65十月1018.1919.9177.19十一月1024.11
24、2.662.0十一月1023.212.175.6十二月1023.467.9367.77十二月1025.056.8065.552009年平均气压(百帕)平均温度(摄氏)平均相对湿度(百分比)2010 年平均气压(百帕)平均温度(摄氏)平均相对湿度(百分比)一月1027.6682.961369.6452一月1025.75484.438770.9355二月1019.5578.296479.4629二月1020.76.974.7三月1019.43510.003270.9355三月1020.37108.748470.8065四月1015.68315.906767.3四月1017.912.569.6五月1
25、012.12621.612961.2581五月1009.787120.706568.3871六月1003.3926.0274.3667六月1007.623.776.4七月1003.82628.438775.1290七月1005.222628.587175.5807八月1005.84827.551681.5484八月1007.47130.432371.5807九月1012.1224.3380九月1011.51325.546777.2十月1016.84220.441969.5484十月1018.85218.058174.2903十一月1027.611.033377.4十一月1021.9412.99
26、3368.9十二月1026.75.554871.9032十二月1020.2396.938762.2258附录2x1=1025.75 1020.70 1020.37 1017.88 1009.79 1007.64 1005.22 1007.47 1011.51 1018.85 1021.94 1020.23 ;y=0.0878 0.0812 0.0887 0.0808 0.0902 0.0796 0.0836 0.0804 0.0861 0.0779 0.0739 0.0739;plot(x1,y,*)附录3x2=4.439 6.9 8.75 12.52 20.76 23.7 28.59 30.
27、43 25.55 18.06 12.99 6.94;y=0.0878 0.0812 0.0887 0.0808 0.0902 0.0796 0.0836 0.0804 0.0861 0.0779 0.0739 0.0739;plot(x2,y,*)附录4x3=70.94 74.7 70.81 69.57 68.39 76.4 75.58 71.58 77.2 74.29 68.9 62.23 ;y=0.0878 0.0812 0.0887 0.0808 0.0902 0.0796 0.0836 0.0804 0.0861 0.0779 0.0739 0.0739;plot(x3,y,*)附录5
28、 x1=1025.75 1020.67 1020.37 1017.88 1009.79 1007.64 1005.22 1007.47 1011.51 1018.05 1021.84 1020.23;x2=4.44 6.94 8.75 12.52 20.72 23.7 28.59 30.43 24.55 18.06 12.99 6.94; x3=70.94 64.68 70.81 69.57 68.78 76.4 75.58 71.58 77.2 74.29 68.9 62.22; y=0.0878 0.0812 0.0887 0.0808 0.0902 0.0796 0.0836 0.0804 0.0861 0.0779 0.0739 0.0739;x=ones(
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1