脑卒中发病环境因素分析及干预模型探讨.docx

上传人:b****5 文档编号:11649706 上传时间:2023-03-29 格式:DOCX 页数:26 大小:475.87KB
下载 相关 举报
脑卒中发病环境因素分析及干预模型探讨.docx_第1页
第1页 / 共26页
脑卒中发病环境因素分析及干预模型探讨.docx_第2页
第2页 / 共26页
脑卒中发病环境因素分析及干预模型探讨.docx_第3页
第3页 / 共26页
脑卒中发病环境因素分析及干预模型探讨.docx_第4页
第4页 / 共26页
脑卒中发病环境因素分析及干预模型探讨.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

脑卒中发病环境因素分析及干预模型探讨.docx

《脑卒中发病环境因素分析及干预模型探讨.docx》由会员分享,可在线阅读,更多相关《脑卒中发病环境因素分析及干预模型探讨.docx(26页珍藏版)》请在冰豆网上搜索。

脑卒中发病环境因素分析及干预模型探讨.docx

脑卒中发病环境因素分析及干预模型探讨

 

脑卒中发病环境因素分析及干预模型探讨

摘要

本文对我国某城市各家医院的脑卒中发病病例信息及相应期间当地的逐日气象资料进行了统计分析,主要采用多元逐步回归方法,建立了气温、气压和相对湿度对脑卒中发病的多元线回归模型,并对模型进行了检验,最终得到了脑卒中发病率与气温、气压和相对湿度之间的关系。

针对问题一,我们根据病人基本信息,用Excel软件对数据进行了统计分析,得到了2007年到2010年不同职业和不同年龄段的发病人数。

分析表明:

随着年龄的增加,脑卒中的发病率也随之增加,其中老年的发病率高达59.16%;职业不同,发病率也不同,农民的发病率为47.87%约占总人数的一半;同时得出男性发病率比女性高。

针对问题二,本文通过分析题中附件中所给的数据,利用MATLAB软件工具箱,作出脑卒中发病率与气温、气压、相对湿度的散点图,再对图形进行拟合,建立了多元逐步回归模型,解决了脑卒中发病率与环境因素之间的关系分别成负相关、正相关、负相关。

针对问题三,我们查阅相关资料,得到对应结论,对高危人群提出的预警是针对职业为农民和处于老年年龄段的人群在春季定期到医院检查血压、血糖、降低血脂和治疗疾病;干预的建议方案:

平衡膳食结构;减轻心理社会因素对血压的影响;有效降压治疗;充分利用社区医疗资源,通过建立健康档案,有助于了解每个居民的生活习惯,健康状况,及时掌握居民的疾病动态;通过健康教育,使人们认识到高血压、糖尿病、高血脂等疾病为脑卒中的可控危险因素,并意识到危险因素长期存在的危害性。

此模型很好的体现了影响脑卒中发病率与环境因素之间的关系,具有较强的规律性,并且能够推广到空气质量好坏受环境因素的影响,暴雨的提前预警,未来人口预测等。

关键词:

脑卒中发病率环境因素多元回归模型MATLABExcel软件

 

一、问题重述

脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。

这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。

因此,有必要了解影响脑卒中患者发病的环境因素及发病机制,为提出综合的干预措施提供依据。

数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。

我们根据题目提供的数据,主要解决以下问题:

1.根据病人基本信息,对发病人群进行统计描述。

2.建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。

3.查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2中所得结论,对高危人群提出预警和干预的建议方案。

二、问题分析

脑卒中发病环境因素分析主要是研究在2007-2010年期间,气温、气压及相对湿度与脑卒中发病率之间的关系,以及与此相关的其它指标。

因此要对发病环境因素分析,就先要分析清楚各种影响因素的变化规律,然后才能根据各种环境因素对发病率的影响情况,由它们之间的模型关系对未来人群提出预警与干预。

根据题目信息分析,发现脑卒中发病率主要与气温、气压、相对湿度、职业、年龄和性别等因素有关。

由附录Appendix-C1和Appendix-C2中的数据分析以上因素对发病率的影响。

通过查阅和搜集有关高危病人的重要特征和关键指标,以及根据这4年所给数据的统计分析,使用多元逐步回归进行分析建立脑卒中发病率与气温、气压和相对湿度之间的函数关系。

最后对脑卒中高危人群提出合理的预警及干预方案,并将模型推广到生活中,比如GDP的增长,环境污染对空气质量的影响等。

三、模型假设

1.表中数据客观真实,具有可靠性。

2.问题的求解只考虑气温、气压和相对湿度三个基本因素。

3.假设除去少数异常点外其余所给数据真实。

4.将年龄段划分为婴儿、幼儿、儿童、少年、青年、中年、老年和其它[6]。

5.使用气象学上通常所用的阳历记数(即3、4、5月为春季,6、7、8月为夏季,9、10、11月为秋季,12月与次年1、2月为冬季)。

6.假设患脑卒的病人在统计过程中没有死亡。

7.将年龄和职业代号缺失的病人基本信息记作其它。

8.假设统计时所在城市的总人数不变。

四、符号说明

1.

发病率

2.

回归参数;

3.

表示在压强影响下各年第

月份总和的平均压强;

4.

表示在温度影响下各年第

月份总和的平均温度;

5.

表示在相对湿度影响下各年第

月份总和的平均相对湿度;

6.

=1,2,、、12。

五、模型的建立与求解

问题一

1.本文首先通过Excel对题中给出数据进行统计分析及处理,分别得出不同月份、不同职业、不同年龄段以及男女的发病人数,并计算出了与之对应的发病率[5](发病率是表示在一定期间内,一定人群中某病新发生的病例出现的频率。

是反映疾病对人群健康影响和描述疾病分布状态的一项测量指标)。

具体公式如下:

分子是某时期(年度、季度、月份)内的新发病人数,暴露人口是指观察地区内可能发生该病的人群,对那些不可能再发生该病的人(如已经感染了传染病或因预防接种而获得免疫力的人),理论上不应计入分母内,但实际工作中却难以把这部分人分辨出来。

 当描述某地区的某病发病率时,分母多以该地区该时间内的平均人口,这时应注明分母是平均人口。

如观察时间以年为单位时,可为年初人口与年终人口相加再除以2,或以当年年中(7月1日零时)的人口数表示。

2.根据附件Appendix-C1中的数据,用Excel软件进行统计整理得到2007-2010年每月份的发病人数。

如下表:

表1-12007-2010年每月份的发病人数

2007年

2008年

2009年

2010年

合计

一月

934

1827

906

1761

5428

二月

732

1954

847

1491

5024

三月

1019

1918

815

1730

5482

四月

1049

1759

860

1686

5354

五月

1052

1771

874

1882

5579

六月

1022

1495

794

1616

4927

七月

1012

1495

913

1754

5174

八月

1197

1376

921

1687

5181

九月

1221

1282

833

1638

4974

十月

1375

1472

758

1724

5329

十一月

1209

1377

666

1570

4822

十二月

1370

1321

802

1078

4571

根据表1-1中的数据可以得出平均每月发病人数占总发病人数的比值,用Excel软件绘出柱形图,如下图:

图1-12007-2010年平均每月发病人数占总发病人数的比值

由图1-1我们可以直观的看出,4年中每月的发病人数既有上升也有下降,由此很难得到相关规律,因此利用我们对季度的划分,得到不同季度发病人数占总人数的比值。

如图1-2:

图1-2不同季度发病人数占总发病人数的比

由图知,随着春夏秋冬季节的变化,发病人群出现下降趋势,可以说明气温对脑卒中发病率有一定的影响。

由于春季为头一年的12月与次年的1、2月,温度比较低;夏季为3、4、5月,温度比较适中。

说明温度低对脑卒中发病率的影响比较大。

3.根据附件Appendix-C1中的数据,用Excel软件进行统计整理得到2007-2010年不同职业的发病人数。

如下表:

表1-22007-2010年不同职业的发病人数

职业

农民

工人

退休人员

教师

渔民

医务人员

职工

离退人员

其它

人数/人

29605

4731

6896

229

130

93

612

1632

17917

图1-3不同职业的发病人群数占总数的比值

由表和图知,农民的发病人群数远远高于其它职业,可以预测部分农民由于忙碌对自己的身体健康状况不够关注。

4.不同年龄阶段的发病人数统计如下表

表1-32007-2010年不同年龄段发病人数

年龄阶段

婴儿

幼儿

儿童

少年

青年

中年

老年

其它

发病人数/人

0

12

6

12

643

13866

36588

10718

根据表1-3的数据我们使用Excel软件求出不同年龄阶段的发病人数占发病总人数的比值,得到相应的柱形图如图1-4.

注:

婴儿—[0,1)幼儿—[1,6)儿童—[6,12)少年—[12,18)青年—[18,40)

中年—[40,65)老年—[65,110)其它—(不包含上述年龄段)

图1-4不同年龄阶段发病人群数占总发病人数数的比值

我们对得到的柱形图进行分析发现,随着年龄的增长,发病人数就增加。

其中,老年的发病人数最高。

可以推测年龄越高,发病率越大。

5.最后,我们对发病人群的男女比例进行了统计,得到了表1-4和图1-5

表1-42007-2010男女分别得发病人群

男(人)

女(人)

合计(人)

2007年

7122

6070

13192

2008年

10283

8764

19047

2009年

5393

4596

9989

2010年

10592

9025

19617

图1-5男女发病人数分别占总人数的百分比

我们可以得到,男性发病率高于女性发病率。

即男性比女性更容易患脑卒中。

问题二

1.模型的建立

根据附件Appendix-C1所给数据,利用Excel2003软件工具箱进行统计分析,得出2007年—2010年四年中平均气温、平均气压和平均相对湿度在各月份的平均数据和在四年中各月份的平均气温、平均气压和平均相对湿度的数据(见附录1),利用MATLAB工具作出四年每个可能影响因素与脑卒中发病率的散点图,如图2-1、图2-2和图2-3(程序见附录2,3,4)

 

图2-12007年——2010年平均温度对发病率的散点图

图2-22007年——2010年平均压强对发病率的散点图

图2-32007年——2010年平均相对湿度对发病率的散点图

分析图2-1,图2-2,图2-3可以得出脑卒中与温度、湿度及压强的平均值存在线性关系

2、模型的求解

2.1、建立多元线性回归模型:

利用MATLAB软件求解,得表2-1(程序见附录5):

表2-1

参数

参数估计(

置信区间(

00.9738

-0.0009

-0.009

0.0008

由表2-1可得如下模型:

由表2-1对模型分析可知R2=0.2670,F=0.9713,

=0.4525,拟合度很低,由此,需对模型进行改进。

2.2、建立多元交互影响回归模型:

利用MATLAB软件求解,得表2-2(程序见附录6):

表2-2

参数

参数估计值(

置信区间(

26.6523

-0.0261

0.0451

-0.3625

-0.0001

0.0004

0.0001

由表2-2可得如下模型:

由表可知,R2=0.7702,F=2.7934,

=0.1397,拟合度很低,由此,不得不对模型进行改进。

3、模型的改进

3.1由于本题是多元线性回归模型,在Excel2003软件中,对本题中的三个自变量,平均气压、平均温度及相对湿度与脑卒中发病率进行相关性分,分析表明三自变量与脑卒中发病率相关性较好,可以利用Excel2003中的回归分析工具建立回归模型,并得出“归统计表、“方差分析”和“回归结果”3张表

图3-1

3.2、利用Excel回归分析工具建立回归模型(详细过程参考文献[2],315页-322页)

3.2.1本题中,MultipeR(相关系数)的值为0.99883786和RSquare(判定系数r2)的值为0.99776819,都非常接近1,所以可以判定变量平均温度、压强及相对湿度与自变量发病率y有较强的关系,标准误差相对于变量的取值也较小,说明回归方程比较可靠。

在方差分析表“图-2”中,通过分析残差平方和在总的离差平方和中所占比重来判段拟合结果的优劣,也可以通过计算F统计量进行显著性判断,这里的方差分析基本假设是回归系数为零,H0:

r=0。

本题中,残差平方和只占总的离差平方和的比例不到10%。

F统计量的值为1341.579,远远大于F临界值,因此拒绝r=0的原假设,即认为数据间存在明显的相关,从显著性分析(SignificanceF)也可以看出原假设成立的概率非常小。

在两个自变量的线性拟合图中,可以看到人口、经销商数两个自变量对销售总额变量的线性拟合程度都很好,预测值和实测值基本重合,如图所示

图3-2回归分析结果

回归分析的目的是找出变量与自变量之间准确的数学关系式,残差分析和拟合分析的作用在于判断通过运算得到的回归方程的可靠性。

回归方程由截距和斜率表示,这组参数列在图3-1的第3张表中。

根据本例的运算结果,可以得到回归方程为:

图3-1第3张表除了给出线性方程的回归参数外,还计算了每个参数的标准误差、T统计量、概率值和在给定置信区间下的估值区间。

3.2.2、“残差分析”的输出结果如图3-3所示。

在残差分析表中,对于每个实测值给出了按回归方程计算的预测值和预测值与真实值直接的残差、标准残差。

图3-4

总的看来,残差的值相对较小,说明回归方程可靠。

由于本案例在回归选项中选中了“标准残差”,因此表中显示出标准残差。

标准残差等于每个残差与总残差均值的差,然后除以残差的标准差。

通过残差图能直观地看出残差的分布情况,如果残差图上残差的分布是随机上网,则说明回归预测的系统偏差小,本案例生成的残差图如图3-4所示。

图3-5

3.2.3、“概率分析”的输出结果如图3-5所示。

概率分布式按照百分比排位列出实测值,并将实测值和百分比排位为数据源绘制散点图,以此说明数据的线性特征。

图3-6

如图所示,可以看出实测值良好的线性。

此外,还可以在概率图中添加线性区域先,观察实测数据点与趋势线的相互位置关系,判断拟合程度。

3.3.1、

平均温度、压强差及相对湿度与自变量发病率的关系:

重复3.2程序,将压强列数据替换为压强差数,最后可得MultipeR(相关系数)的值为0.999031和RSquare(判定系数r2)的值为0.998064,都非常接近1,所以可以判定变量平均温度、压强差及相对湿度与自变量发病率y有较强的关系,标准误差相对于变量的取值也较小,说明回归方程比较可靠。

可得到发病率与平均温度、压强差及相对湿度的关系模型如下(运行结果见附录

由此模型可知压强差对发病率的影响极大,同时明显改变相对湿度的回归系数,这两因素对发病率存在交互影响。

问题三

阅资料和上网搜索文献分析得出有关脑卒中高危人群的重要特征和关键指标,通过1、2问数据的统计分析得出环境、职业、年龄、性别和患病史都将在不同程度上影响脑卒中患病率。

将环境因素又细分为气温、气压、相对湿度对发病率的影响;将职业因素考虑1问中的所有因素,因为我们在前面已经由统计数据知道40岁以下患脑卒中的人数较少,患病人群主要集中在老年、中年;同时性别比例也已求出(见一问表格);患病史的有无也是一个检测的指标,因为考虑到这些因素影响程度不同,所有层次分可以很好地解决这一问题。

 

六、模型的评价与推广

6.1优点

(1)模型的适用范围广,易于推广,模型对生活中的其它现象(如空气质量好坏受环境因素的影响,暴雨的提前预警,未来人口预测等)同样适用。

(2)使用多元回归模型建立发病率与气温、气压及相对湿度之间的关系,已经经过残差分析,回归系数全在置信区间,得到了更加精确的模型。

(3)从建立的模型来看,更好运用了数形结合的思想,这样使得问题更清晰直观、易于理解。

6.2缺点

(1)本题数据比较多,对数据的处理不够精确。

(2)分析过程中的随机性和评价者主观上的不确定性及认识上的模糊性。

(3)改进模型没有深入讨论交互影响,只是简单得出压强差和湿度对发病率存在交互影响

七、参考文献

[1]颜文勇,王科,数学建模,北京:

高等教育出版社,2011。

[2]赫艳芳,李振宏,李辉,Excel2003统计与分析,北京:

人们邮电出版社,2006。

[3]王旭,沈阳地区脑卒中发病与气象环境因素的相关性,

[4]阴阳盛,熊西文,林建华,MATLAB6.1数学软件,大连:

大连理工大学出版社,2003。

[5]百科名片,发病率,

[6]爱问知识网,年龄划分,

[7]季度是如何划分的,

 

八、附件

附录0使用MATLAB6.1和EXCEL2003软件

附录1表2-1四年中平均气温、平均气压和平均相对湿度在各月份的平均数据

2007年

平均气压(百帕)

平均温度(摄氏)

平均相对湿度(

百分比)

2008年

平均气压(百帕)

平均温度(摄氏)

平均相对湿度(

百分比)

一月

1028.23

4.503

73.23

一月

1027.23

3.13

57.52

二月

1020.7

8.7

70.7

二月

1027.6

3

57.9

三月

1018.28

11.56

69.29

三月

1018.81

11.08

57.97

四月

1016.5

11.4

62.6

四月

1014.6

15.6

62.4

五月

1008.39

22.62

61.77

五月

1008.55

21.41

66.26

六月

1006.2

24.7

75.5

六月

1005.6

23.5

82.4

七月

1002.97

29.394

73.32

七月

1003.67

30.17

71.32

八月

1004.93

29.56

69.10

八月

1005.84

28.01

77.32

九月

1010.5

24.3

76.1

九月

1011.3

24.9

79.4

十月

1018.95

19.34

71.65

十月

1018.19

19.91

77.19

十一月

1024.1

12.6

62.0

十一月

1023.2

12.1

75.6

十二月

1023.46

7.93

67.77

十二月

1025.05

6.80

65.55

2009年

平均气压(百帕)

平均温度(摄氏)

平均相对湿度(

百分比)

2010年

平均气压(百帕)

平均温度(摄氏)

平均相对湿度(

百分比)

一月

1027.668

2.9613

69.6452

一月

1025.7548

4.4387

70.9355

二月

1019.557

8.2964

79.4629

二月

1020.7

6.9

74.7

三月

1019.435

10.0032

70.9355

三月

1020.3710

8.7484

70.8065

四月

1015.683

15.9067

67.3

四月

1017.9

12.5

69.6

五月

1012.126

21.6129

61.2581

五月

1009.7871

20.7065

68.3871

六月

1003.39

26.02

74.3667

六月

1007.6

23.7

76.4

七月

1003.826

28.4387

75.1290

七月

1005..2226

28.5871

75.5807

八月

1005.848

27.5516

81.5484

八月

1007.471

30.4323

71.5807

九月

1012.12

24.33

80

九月

1011.513

25.5467

77.2

十月

1016.842

20.4419

69.5484

十月

1018.852

18.0581

74.2903

十一月

1027.6

11.0333

77.4

十一月

1021.94

12.9933

68.9

十二月

1026.7

5.5548

71.9032

十二月

1020.239

6.9387

62.2258

附录2

x1=[1025.751020.701020.371017.881009.791007.641005.221007.471011.511018.851021.941020.23];

y=[0.08780.08120.08870.08080.09020.07960.08360.08040.08610.07790.07390.0739];

plot(x1,y,'*')

附录3

x2=[4.4396.98.7512.5220.7623.728.5930.4325.5518.0612.996.94];

y=[0.08780.08120.08870.08080.09020.07960.08360.08040.08610.07790.07390.0739];

plot(x2,y,'*')

附录4

x3=[70.9474.770.8169.5768.3976.475.5871.5877.274.2968.962.23];

y=[0.08780.08120.08870.08080.09020.07960.08360.08040.08610.07790.07390.0739];

plot(x3,y,'*')

附录5

x1=[1025.751020.671020.371017.881009.791007.641005.221007.471011.511018.051021.841020.23];

x2=[4.446.948.7512.5220.7223.728.5930.4324.5518.0612.996.94];

x3=[70.9464.6870.8169.5768.7876.475.5871.5877.274.2968.962.22];

y=[0.08780.08120.08870.08080.09020.07960.08360.08040.08610.07790.07390.0739];

x=[ones(

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1