1、1. 问题重述 SARS是21世纪第一个在世界范围内传播的传染病。SARS的爆发和蔓延给我国的经济发展和人民生活带来了很大影响,我们从中得到了许多重要的经验和教训,认识到定量的研究传染病的传播规律、为预测和控制传染病蔓延创造条件的重要性。所以本文首先评价了一个已有的早期模型的合理性和实用性,然后在此基础上建立了一个更优的模型并给出了分析,最后建立了SARS对经济某个方面影响的模型。二.问题分析(一)通过对早期模型和实际情况的分析,我们认为影响SARS传播因素众多,大致可分为时域因素和地域因素。列举如下:(1)时域因素a媒体宣传:初期疫情较轻,媒体宣传强度很弱,导致民众的自我保护意识不足,容易感
2、染;后期疫情较重,媒体宣传强度很大,民众的自我保护意识大大加强。b政府干预:初期疫情较轻,政府介入不足,后期疫情较重,政府加强干预(如:强行隔离,公共场所消毒等行为)。c认识程度:当一种新的传染病出现时,初期由于人们的认识程度不足,无法采取有效的预防和治疗措施,但随着研究的深入,认识程度会越来越高。(2)地域因素a经济水平和医学水平:经济水平和医学水平高的地区的疫情控制情况会明显比水平低的地方好。b人口密度和人口流动:人口密度和人口流动大的城市若爆发传染病,疫情程度会比人口密度和人口流动小的城市大。c气候:SARS适合在春秋两季传播,且各城市的气候会疫情程度。(二)我们认为在SARS疫情期间考
3、察的人群大致可分为三类:健康人群,感染人群,治愈人群。而感染人群又可分为非传染源和传染源两类。(三)一个较好的传染病传播模型因该具有如下功能: a能较好的描述疫情的大致走势。 b能较精确的给出关键时间(初期爆发时刻;中期稳定时刻;高峰期;0病例增长的时刻),以便政府和卫生部门针对不同作出及时而正确的措施。 c能给出描述疫情的指标,以便政府和卫生部门决定其各项工作的力度。三基本假设1题中所给的数据真实可信。2假定疫情爆发后政府一定会采取措施。3假定北京市医院及医务人员足够多。四变量说明N(t) 累计病例数K 平均每病人每天可传染人数L 平均每个病人可以直接感染他人的天数五早期模型评价(一)早期模
4、型重述假定初始时刻的病例数为N0,平均每病人每天可传染K个人,平均每个病人可以直接感染他人的时间为L天。则在L天之内,累计病例数N(t)随时间t(单位天)的关系是: (1-1)如果不考虑传染期的限制,病例数将按指数规律增长,考虑传染期的限制后,则采用半模拟循环计算的办法,把达到L天的病例从可以引发直接传染的基数中去掉。然后假定从开始至高峰期间均采用同样的K值(从拟合这一阶段的数据得出),到达高峰期后,在10天的范围内逐步调整K值到比较小,然后保持不变,拟合其后在控制阶段的全部数据(认为社会在短期剧烈调整后,进入对疫情控制较好的常态)。(二)早期模型的合理性和实用性的评价A早期模型的优点1模型(
5、1-1)实际上是微分方程在(0L)区间内的特解1。其中N(t)表示t时刻的累计病例数,则(N(t)-N(t-L)表示传染源数量,为病例总数减去失去传染能力的病例数。2参数K和L是描述SARS传播的两个重要参数,并且具有实际的意义:L可理解为平均每个病人在被发现前后可以造成造成直接传染的期限,在此期限后失去传染作用,可能原因是被隔离、病愈或死去等等。K表示某种社会条件下平均每病人每天传播的人数(但并非文中所述的一个病人的感染他人的平均概率)。3通过对模型的分析,可得到一预测疫情发展的参数RKL,R表示平均每个病人在其传染期内感染的总人数。若R1,说明社会上现存传染源人数在上升,疫情将因失控而爆发
6、;若R1,说明社会上现存传染源人数在下降,疫情将得到控制;若R1,说明社会上现存传染源人数不变,疫情将持续下去2。4从拟合的图形来看,此模型对各城市早期的SARS疫情描述的较好,具有一定的通用性。其实际意义就是此模型可大致预测出疫情的爆发点和发展趋势。因为通过对早期数据的拟合确定参数,得出形如(1-1)的一个指数形式的模型,而指数函数的曲线初期增长较慢,后期增长急速,必可大致找到一个“转折点”,而“转折点”所对应的时间便是预测的疫情爆发点。这一数据对于卫生部门十分重要,因为控制疫情的最好时间是在疫情爆发之前。B早期模型的不足之处1首先模型并未给出拟合程度的参数,而当我们试图通过计算得到该模型的
7、拟合程度参数时发现无法进行。原因是原模型求解过程的中间阶段参数K多次手工调整,而且模型中并未给出调整的标准和相关理论,所以我们很难重复该求解过程。由此我们得出结论:该模型的参数取值主观性太强,此作法给阅读者运用并改进模型带来了极大的困难,所以此模型的普适性较差。2在数据不足的情况下因无法进行手工调整,所以该模型用香港后期拟合的K值去预测北京后期疫情的发展趋势。但如问题分析所述,地域因素会造成不同地区的K值不同(如人口密度和人口流动大的城市若爆发传染病,初期的K值会比人口密度和人口流动小的城市大,等等),而很难找到地域因素几乎相同的两城市。所以此作法可能导致预测结果相差较大。图1为用此方法预测的
8、北京后期疫情情况与实际情况的对比图 图1从图中可以看出,预测值与真实值偏差越来越大。对该模型的评价:该模型具有较好的实际意义,能比较合理的反映非典的传播情况和发展趋势,模型中的参数设置也较科学,能较好地反映非典传播的影响因素;但模型的求解过程主观性太强,很难重现,而且参数的取值也很主观,没有取值的标准和理论。综上所述,我们得到结论:该模型较合理,但不实用。六SARS传播模型的建立1模型的建立与参数讨论:假设N(t)为随时间变化的累积SARS病人总数;K(t)为某一天平均每病人传染他人的人数(/天),是时间的函数;L为平均每个病人可传染他人的传染期限(天);则为单位时间(天)内增加的发病的人数,
9、表示第t天时具有传染能力的人数,K(t)(N(t)-N(t-L)就表示t天时增加的被感染的人数。由上分析得到N(t)的微分方程如下: (1)同时,随着时间的变化,由于外界因素的改变,人均日传染数K(t)也会变化:在疫情初发期,由于人们对SARS并没有什么认识,更不知道其严重性,所以即使有患病者,该患病者的活动范围也比较大,可能传染的人数也比较多,故人均日传染数K(t)就比较大并且在一定时间内保持基本稳定;当患者越来越多,疫情越来越严重时,SARS就会受到社会的普遍关注,政府部门也会立即采取强制控制手段来限制疫情的发展,民众自我防范意识在媒体宣传等作用下加强,患病和疑似患病者活动范围受到严格控制
10、,从而人均日传染数K(t)开始快速下降;当人均日传染数K(t)下降到一个较小值之后,由于传染的可能性仍存在,政府部门的控制能力也有一定限度,K(t)的下降速度明显变缓;最后随着累积病例数的稳定,K(t)缓慢降至0。通过以上分析,可以得到如下的类Logstic微分方程:, (2)其中M为K的一个上界,r为衰减系数,它表示K的变化率与K(M-K)成反比,一方面,K的变化率与K本身的大小有关:当K值很大时,疫情较严重,无论政府干预行为还是民众自我保护行为都很强,所以K下降很快;当K很小时,情况相反。另一方面,K的变化率与的(M-K)大小有关:当(M-K)很小时,K的下降“空间”很大,对政府干预和民众
11、保护行为很“敏感”,下降的很快;当(M-K)很大时,K的下降“空间”很小,这时情况相反。图2就反映了我们上面分析的K的变化趋势:图2 人均日传染数K随时间(3月1号起)的变化图参数L可理解为平均每个病人可以造成直接传染的期限,在此期限后他失去传染作用,可能的原因是被严格隔离、病愈不再传染或死去等等。与题目附件一中的讨论一样,我们认为L与医疗机构有关,取L=20这个具有一定统计意义的值。综上,我们得到了SARS传染的微分方程模型如下:,且,L=20(其中“t=1”指出现第一例病人的时间。)2模型的求解:A模型推导求解方程(2),得到人均日传染数K(t)的函数关系式如下: , 其中且其中M为K的一
12、个上界,衰减系数r0,并且由前面的讨论,知当时应有,故应有参数c0;则t=1时(),即M反映了K的初值情况,它与K的初值接近。可见,只要我们根据一些已知数据求出K(t)的函数关系式中参数M,c,r的值,再求出K(t)的表达式,然后把K代入N(t)的方程,就可以求出N(t)的值。求解方法如下:1. 用差分方程替代微分方程求N(t): 由(1)式知,相应的差分方程为若我们已求出K的函数式并把它代入差分方程,在(L=20)的阶段,N(t-L)=0,得到;在的阶段,由递推式。由此我们可求得每天的累积病例数。2. 参数M,c,r的确定:下面我们要求出K具体的函数表达式:由上面K的函数式可知,M,c,r的
13、同时确定比较困难,可以作如下处理1:a先给出一个M的粗糙估计值:由于题中附件一论文的模型中K、L的意义与我们的模型是一致的,并且它对各城市疫情初期进行拟合时都取得了较为满意的效果,故它所取K的初值K0具有一定的合理性;而且在初期政府没采取措施的情况下,K变化并不大。我们可以将K0作为上界M的一个初步估计值;b 然后根据已知的数据拟合出c,r的值:在M已定的情况下, K(t)变为如下形式:由推出假设已知对应于连续天数(t1,t2,tn)的n个K的数据(K1,K2,Kn),可计算出相应n个(K0)的值,我们通过线性回归来拟合,采用最小二乘法计算出a,b的值,则c,r可由求得;其中由上面的差分方程,
14、我们可根据已知的连续m天的实际累积病例的数据,通过下式求连续的n个K值(K1,K2,Kn):可见要确定c,r至少需要n=2个K值,故m不小于(L+n+1)即23,这就是说我们至少需要知道连续23天的实际累积病例的数据;c把上面求得的M,c,r代入K的表达式,从而求出的K具体的表达式;将它代入N(t)的差分方程,由步骤1)可求得与已知连续m天的数据相应的拟合累积病例值,求出这些拟合的值分别与对应的实际值的差的平方和D;d在(K0,K1)区间内(K1可取一较大的值)改变M的值,重复上面b,c的操作,找出差值平方和D的最小者对应的M,c,r的值作为拟合式采用的参数值。这样,确定出M,c,r的值从而求
15、出K的具体表达式后,我们按步骤1)就可求出从t=1开始的累积病例数N(t)的所有值。B计算结果(对北京的拟合与预测):1. 原早期模型中K的初值0.13913,所以取M的粗糙估计值 M=0.13913;2. 我们代入已知的4月20号(t=51)开始到5月19号的30个数据(m=30),先计算出K的相应9个值K(71)K(79)(由上知K值个数n=m-L-1=9,K值从(t+L)天开始算起);3. 按A中所述方法,求得,从而得到K(t)的函数式:,其中且把K(t)的函数式代入N(t)的式子,由N(t)的差分递推公式,算出t从1到115天即从北京出现第一例病例的3月1号起, 到6月23号之间的每日
16、累积病例数(6月23号以前的数据题目中已给出,便于对比),得到如下结果:a计算累积病例数N(t)与实际所给数据近似程度比较好(相差最大是在后部,在100左右),并且最终稳定于2420(人)左右,比实际数据低了100人;在只利用5月19号以前的数据情况下,预测5月15号以后日增病例数会降到10以下,5月末时日增病例数基本为0,这也与实际数据相符;图3为计算累积病例数N(t)与实际所给数据随时间的变化图:(其中“O”表示拟合与预测曲线,“*”表示实际数据,拟合的数据从3月1号起到6月23号,实际数据也到6月23号为止)图3 从3月1号开始的计算累积病例数随时间变化图(第1天为3月1号)b从图4中病
17、例数日增量随时间的变化可见,在4月15日左右为疫情的爆发点,在此之前,病例数增长缓慢,在此以后的相当一段时间内,病例数增长很快。拟合显示在4月30号左右为疫情的高峰期,这也与实际数据相符。图4 拟合数据的日增量(人)随时间变化图(3月1号起)4. 我们还可以尽可能减小利用的数据个数至理论上的23个,但由于实际上的累积病例数存在随机误差,用于计算参数M,c,r的K值也会有随机波动;经试验,最少要利用25个数据(从4月20日起到5月14号)就可以对发展趋势进行计算与预测,此时与实际所给数据的拟合结果比上面拟合得差,但仍能较好地反映数据变化的趋势,仍不失为可行的拟合与预测。3模型的分析与参数K的讨论
18、:1)人均日传染数K值的分析:K值在疫情初期变化缓慢,说明民众意识不强,政府也没有足够重视;在疫情爆发阶段开始后,K值迅速减小,体现了政府采取强有力的措施来抑制病情的发展,民众自身防范意识的加强等方面,所以虽然在爆发后的20多天内病例数增长很快,但由于K值的迅速减小,使得病情在爆发后的1个多月后得到有效抑制,病例数增长明显变慢,最后K值降至0,在5月25号以后累积病例数基本稳定到2420人左右。K值实际减小的快慢和它的取值情况,说明了政府的控制力度和民众的防范力度,这也涉及到社会经济部门和公共事业的实际发展情况,K越小,由于社会中(包括医院)的经营和流动始终存在,要想再继续减小K的值就越难。当
19、K减小到一定程度后,此后的K值在实际处理上可以取一个比较小的定值代入模型进行计算。2)对爆发早期采取严格控制的讨论由实际数据知,在疫情爆发阶段,每隔5天就会增加500个以上的病例,这个数目是很大的,卫生部门应尽可能早地采取控制措施。对于我们的模型,我们认为提前5天采取严格的隔离措施主要反映在迅速减小人均日传染数K值上,所以对采取控制措施早晚的讨论体现在对K的变化快慢的调整上。下表显示的是我们调整K的变化速度,从而大值估计出每提前或延后5天所带来的不同结果:开始采取严格措施的时间4月15号4月20号4月25号4月30号从疫情爆发到基本稳定所花时间估计20多天40多天60天以上更多最终累积病例数估
20、计170024203000以上上表中,在4月30号以后才采取严格措施时,较好的情况是累积病例数最后稳定于一个可观数目;较差的情况是累积病例数持续上升,后果可以说不堪设想;图5显示了在4月25号后采取加强措施后,在较好情况下的累积病例数随时间变化情况:(“O”表示拟合与模拟曲线,“*”表示实际数据,时间从3月1号起)图5 在4月25号开始严格控制后累积病例数随时间变化图由此可见:在疫情爆发初期阶段,每延迟5天采取严格隔离的措施,最后累积病例数目在控制好的情况下只会增加700左右,并且处于能够控制的范围;但在控制差的情况下,疫情将大面积蔓延,可能造成难以挽回的损失。所以在疫情爆发初期,政府应尽可能
21、地提前采取措施来严格控制疫情的传播,从而大大减小疫情传播范围,这对控制疫情的传播有着至关重要的影响。3)对疫情爆发中后期控制情况的讨论:在疫情爆发的中后期,当人均日传染数K减小到一定程度时,若政府和卫生部门的工作稍有放松,或就让K一直保持某一稳定的水平,则由于累积病例基数大,疫情仍有可能继续快速发展,病例日增速度仍然不会慢,下面给出在某一天以后,K值保持一定的情况下,累积病例数发展状况的大致估计:a中期估计:若5月5号后的K值保持在5月5号时的0.06左右,此后的日增病例数将曲折上升(大于原日增病例峰值120),累积病例数也会不断上升并超过7000;b后期估计:若5月10号后的K值保持在5月1
22、0号时的0.03左右,此后日增病例会由最大值持续缓慢减小至0,在7月前后,最终累积病例数会达到3500左右;图6显示了在5月10号以后K值保持0.03时累积病例数随时间变化情况:(“O”表示拟合与预测曲线,“*”表示实际数据)图6 5月10号以后K值不变时累积病例数随时间变化情况以上数据表明:a在爆发阶段的中期,如果卫生部门的控制稍有放松,或就让K一直保持当前控制的水平,最后累积病例数可能大大超过实际数据,疫情将会发展得不可收拾;所以这个时期段卫生部门尤其要抓紧工作,严格隔离,继续努力让人均日传染数K值尽可能减小,最后才不会造成很大的损失;b在爆发阶段的后期,如果卫生部门让K一直保持当前控制的
23、水平,则最后累积病例数有可能超过实际数据,但已经比上面的结果好得多;这个时候,卫生部门要继续让人均日传染数K值减小至0已经比较困难,只有尽可能地严格控制,让最后累积病例数尽可能比我们上面估计的3500低。4)对疫情平稳阶段复发可能性的讨论:当疫情基本稳定,累计病例数基本不再上升时,如果放松警惕,人均日传染数K值就又会恢复到疫情爆发阶段的值,这时只要再出现一例病例,疫情就将再度爆发,后果将十分严重;这说明在疫情已经得到有效抑制后,政府部门一定不能放松警惕,仍然要做好疫情传染的预防与隔离工作,从而在新病例出现时,人均日传染数K将仍在控制之内,疫情就不会再度爆发。图7是模拟当疫情基本稳定,社会警惕程
24、度恢复到疫情出现以前时,在7月20号以后又出现一例病例后的极端情况。(“O”表示拟和与模拟曲线,“*”表示实际数据)5)实际累积病例数据的分析:我们根据中期一部分实际数据进行拟合和预测,发现实际累积病例数据与我们预测基本相符,说明实际上K值由大变小的速度的确很快,疫情传染得到了很有效的控制,表明政府部门在疫情爆发阶段采取的控制工作做得很好,民众自身防范工作也做得很到位,从而北京在较短时期内有效地控制了非典的传播。通过北京与香港的数据相比较可知,北京的控制工作的确比香港做得还要好。图7 累积病例数(人)随时间的增长情况(3月1号起)4模型的评价:1)我们建立的模型实际上是对原早期模型的发展与改进
25、,主要改进体现在对人均日传染率K的函数化上面,我们考虑了政府和民众等影响因素,合理地描述了K的变化,从而得到比较好的拟合与预测曲线:由此可见,我们的模型是优于原早期模型的;2)对于参数L,我们借鉴了原早期模型中L的取值情况,这是因为影响它的因素比较复杂,并且L也与当前医疗水平有关,是一个具有统计意义的参数,我们不便随意改变它的值;在模型中参数L直接影响了我们用于确定K时所用数据的个数,当然L比较小时所用数据越少;3)此模型具有一定的普适性,但由于所提供的数据限制,我们只能取疫情爆发后到接近稳定的30来个数据进行拟合与预测;如果我们有前面早期的数据,我们也可以根据它们来计算得到结果。5总结: 从
26、上面的分析我们认识到,建立一个真正能够预测以及能为预防和控制提供可靠、足够信息的模型非常重要。现总结出建立此类模型的步骤:1)收集完整而准确的前期数据。2)全面分析影响疫情的各种因素,找出各因素之间的关系以及作用的时间段和范围,得出哪些是重要因素,哪些是次要因素。3)用曲线拟合前期数据,观察其大致走势(突增,拐点等)并分析其原因。4)分析拟合函数的参数值,讨论其是否有实际的意义(如反映疫情的严重程度,爆发点的时刻等)5)通过4分析所得的结论,赋予拟合函数的参数实际的意义并较正确的描述参数。6)得到完整的预测函数,预测疫情中后期的走势,分析出预防和控制所需的重要数据(如爆发点,疫情高峰时刻,疫情控制时刻,是否可能复发等)7)进行参数的灵敏度分析:分析哪些参数可作较大变动,哪些参数只能微调,进一步分析参数变动后对整个疫情走势的影响。反映到实际工作中便是哪些工作必须做到家,丝毫不能放松,那些工作可适当缓一缓。从而给政府和卫生部门安排工作提出宝贵意见。8)实时监控疫情走势,采集更多的数据以验证模型和改进模型,若有预料之外的干扰因素出现,应及时修正模型,重新预测其后期走势。然而在按上述过程建立模型的过
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1