新传染病的logistic模型研究Word格式.docx
《新传染病的logistic模型研究Word格式.docx》由会员分享,可在线阅读,更多相关《新传染病的logistic模型研究Word格式.docx(9页珍藏版)》请在冰豆网上搜索。
XUFu-xia1.2 SHIDao-ji1 DONGYong-quan2
(1.SchoolofScience,TanjinUniversity,Tianjin300072,China2.Math.DepartmentofTangshanTeacherCollege,Tangshan063000,China)
Abstract:
Thispaperindicatesintheorythatitispracticableusinglogistic
modeltodescribethepopdiseaselaw,about3parametersofthemodelcanbeestimatedwithR.Makefulluseoftheinformationoflogisticcurve,weobtainedthegraduallygrowthperiod,fastgrowthperiod,slowgrowthperiodbyfistandsecondderivativeofvelocityfuntionofincreasingorgrowthprocessoflogisticcurve,thensolvesanexamplewiththemodel.ItisemphasizedthatlogisticmodelismorepracticalthanSIRorsomeothersbecauseoftheformer’sparametersisdeterminedmoreeasilytogetthequantitativeresultswhosefiterrorisminor.
Keyword:
logisticmodel;
growthfactor;
keyperiod;
SARS;
methodoftheminimum
squars
长期以来,建立传染病的数学模型来描述传染病的传播过程、分析受感染人数的变化规律、预报传染病高潮的到来等,一直是各国有关专家和官员关注的课题。
一般的传染病数学模型[1-3]都是以SI(人群分为易感染者Susceptible和已感染者Infective)模型、SIS(人群分为易感染者、已感染者和治愈后重新变为易感染者)模型、SIR(人群分为易感染者、已感染者和治愈后获得免疫力的移出者Removed )模型为基础进行研究的,这也是经典的研究传染病模型的方法。
这些方法的一个共同特点是:
模型假设越来越接近实际,所用数学方法越来越深奥,模型的数学表达式越来越复杂冗长,甚至变得不可求解(虽然具有理论意义),忽略了数学模型的实用性和应用的广泛性。
例如SIR模型,其理论虽然精确,但模型的解析表达式无法求出,只能通过讨论解的性质来确定其中的参数,这给解决实际问题带来困难。
Logistic分布是一个具有较大实用价值的连续型分布,最初起源于生物群体的Logistic增生曲
线
呈S型[4],在经济学、政治学、人口统计学和植物种群生态学等方面都有广泛的应用[5-7]。
文[8]
J
用logistic模型分析了SARS的传播规律,但未从理论上阐明该模型适用于研究一般的传染病的传播规律,而且由于用logistic模型得到的结果比用纯粹的统计回归模型——抛物线模型还要差
(前者的残差标准误大),这使得人们对用logistic模型描述传染病的传播规律产生怀疑。
本文通过进一步的研究发现:
用logistic模型拟合的误差大是因为参数估计不准确所致,为此我们应用最新的自由(免费)统计软件R,由原来估计两个参数改为对三个参数的逐步逼近,得到了拟合精度高于文[8]中抛物线模型的logistic模型。
进一步充分利用Logistic模型曲线的载荷信息,通过求解其速度函数的一阶和二阶导数,得到了传染病传播过程的渐增期,快增期和缓增期,对传染病的logistic模型进行了全面深刻的理论分析和实证说明,为预测和控制传染病的蔓延提供了方法。
本文的另一个目的在于通过对模型参数的估计,介绍免费的统计软件R的强大统计作图功能,尤其适用于生物医学方面的统计工作,文[9]是这方面的专著。
1.建立模型
要预报未来若干天的传染病感染人数,最重要的影响因素是初始时刻的传染病例数和今后若干天的病例增长率(新感染病例率减去治愈率)。
记初始时刻的病例数为x0,t天后的病例数为x(t),传染病增长率为r(r>
0),则预报公式为:
9
x(t)=x(1+r)t
<
1>
将上述离散型的模型<
式连续化,就得到指数增长模型:
记时刻t的传染病例数为x(t),当考察一个国家或一个很大的地区时,x(t)是较大的整数,可将x(t)视为连续可微函数,则t到
Dt时间内传染病例数的增量为:
x(t+Dt)-x(t)=rx(t)Dt
<
2>
于是,x(t)满足如下的微分方程:
ì
ï
dx(t)=rx(t)
í
dt
î
x(0)=x0
3>
解之得:
x(t)=xert
4>
上式表明传染病例数将按指数规律无限增长(r>
0),这不符合实际情况,因为随着传染病例数的增加,政府、医疗部门和居民等都不会无动于衷,任其泛滥,而是采取各种有效措施来预防和控制传染病的迅速蔓延[10],传染病增长率会随着传染病人数的增加而逐渐减少。
将传染病增长率r表示为传染病例数x(t)的函数r(x),按照上面的分析r(x)应是x的减函数,
一个最简单的假设是r(x)是x的线性函数:
r(x)=r0-s×
x(t)
r0,s>
0
5>
这里r0表示初始时刻的增长率,显然,对于任意的x>
0,增长率r(x)<
r0. 为了确定系数
s的意义,引入最大传染病例数xm,当x=xm时增长率应为零,即r(xm)=0,代入<
式得到
s=r0xm
,所以传染病增长率r(x)可表示为:
r(x)=r(1-x(t))
6>
xm
其中r0,xm可以根据传染病统计数据确定,因子(1-
作用。
在<
式的假设下,<
式变为:
x(t)
)体现了对传染病例数增长的阻滞
dx(t)=r(1-x(t))x(t)
dt x
7>
m
非线性微分方程<
式可用分离变量法求解得:
x(t)= xm
8>
1+(xm
x0
式即为所求的传染病Logistic数学模型。
2.模型分析
-1)e-r0t
(1)上述模型应用的关键是3个参数xm,x0和r0的确定:
xm表示最大传染病例数,它应该比
传染病的实际统计数据中的最大值大一点,但具体取多大合适,只能凭经验或试验的方法估计;
x0表示初始时刻的传染病例数,由于传染病的数据是在疾病爆发后统计出来的,初始数据x0不容易精确得到,当然第3个参数初始传染病增长率r0也就不可能得到准确的估计,文[8]采用了将x0取定为统计数据的第一个值,对其它两个参数用最小二乘法估计,所以误差较大(还有一个原
因是我们已经将离散的问题连续化,所以取定了一个离散值作为初始值,自然会造成误差的增大)。
本文考虑到3个参数之间的关系,对它们实行同步最小二乘估计,减小了估计的误差,用统计软件R可以实现这个过程,祥见第3部分的讨论。
(2)Logistic曲线的特点是开始增长缓慢,而在以后某一范围内迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长的S型。
下面对方程<
式进行解析,充分了解上述Logistic方程所载荷的信息,以期对传染病的传播规律进行深入研究。
(ⅰ)求方程的一阶导数得到传染过程的速度函数:
xr(xm
dx m0x
v(t)=
=0
9>
dt [1+(xm
-1)e-r0t]2
再求方程<
生长速度函数的一阶导数,并令其等于0:
xr(xm-1)e-rt[(xm-1)e-r0t-r]
d2x
m0x x 0
=0 0 =0
10>
dt2
[1+(xm
-1)e-r0t]3
ln(xm-1)
t= x0r0
11>
可见当t=
r0
时,传染病传播速度最快,为其高峰期。
(ⅱ)求方程<
生长速度函数的二阶导数,并令其等于0:
xr3(xm
-1)e-rt[1-4(xm-1)re-rt+(xm
-1)2e-2r0t]
d3x
m0 x
x 0 x
=0 0 0 =0
12>
dt3
求解得:
-1)e-r0t]4
t1=
ln(xm
-1)-1.317
,
t2=
-1)+1.317
13>
这是速度函数的两个拐点,加上高峰点,这样Logistic曲线有三个关键点,其横坐标分别是:
ln(xm-1)
t= x0 ,
这三个点对应者传染病传染过程的三个关键时期:
始盛期,高峰期,盛末期,也可用速度函数
的两个拐点将Logistic曲线的生长过程分为渐增期t
=0~
,快