1、状态转移模型2状态转移模型2马氏链模型随着人类的进化,为了揭示生命的奥秘,人们越来越注重遗传学的研究,特别是遗传特征的逐代传播,已引起人们广泛的注意。无论是人,还是动、植物都会将本身的特征遗传给下一代,这主要是因为后代继承了双亲的基因,形成自己的基因对,基因又确定了后代所表现的特征。本节将利用数学的马氏链方法来建立相应的遗传模型等,并讨论几个简单而又有趣的实例。马氏链研究的是一类重要的随机过程,研究对象的状态s(t)是不确定的,它可能取K种状态si(i=1,k)之一,有时甚至可取无穷多种状态。在建模时,时间变量也被离散化,我们希望通过建立两个相邻时刻研究对象取各种状态的概率之间的联系来研究其变
2、化规律,故马氏链研究的也是一类状态转移问题。例设某商店经营情况可能有三种状态:好、一般和不好。根据统计资料,上月状态为Si,下月状态为Sj的概率为pij,0pij1例中的关系既可用一转移矩阵表示?p11?A?p21?p31p12p22p32p13?p23?p33?例研究某一草原生态系统中物质磷的循环,考i+1时段状态状态转移概率虑土壤中含磷、牧草含磷、牛羊体内含磷和流失于S1S2S3S4系统之外四种状态,分别以S1,S2,S3和S4表示S1土壤含这四种状态。以年为时间参数,一年内如果土壤中磷的磷以的概率被牧草生长吸收,水土流失于系统S2牧草含外的概率为;牧草中的含磷以的概率被牛羊磷i时段状吃掉
3、而转换到牛羊体内,的概率随牧草枯死腐败态S3羊体含归还土壤;牛羊体中的磷以的概率因粪便排泄磷而还归土壤,又以自身的比率因屠宰后投放市S4流失系0001场而转移到系统外。我们可以建立一个马尔柯夫链统外来研究此生态系统问题,其转移概率列表于下:相应的转移矩阵为:?M?001?0且Sj+1=SjM首先,任一转移矩阵的行向量均为概率向量,即有马氏链模型的性质完全其转移矩0?Pig?1n阵决定,故研究马氏链的数学工具是线性代数中有关矩阵的理论。Pig?1?j?1这样的矩阵被称为随机矩阵。常染色体遗传模型在常染色体遗传中,后代从每个亲体的基因对中各继承一父体母体的基因型个基因,形成自己的基因时,基因对也称
4、为基因型。如果我们所考虑的遗传特征是两个基因A和a控制的,那么就有三种基因对,记为AA,Aa,aa。AAAaaaAaaaaa000后AA1下面给出双亲体基因型的所有可能的结合,以及其后代形成代Aa0表所示。10每种基因型的概率,如基因aa0001双亲随机结合的较一般模型相对比较复杂,这些我们仅研究型一个较简单的特例。例农场的植物园中某种植物的基因型为AA,Aa和aa。农场计划采用AA型的植物与每种基因型植物相结合的方案培育植物后代。那么经过若干年后,相结合的方案培育植物后代。那么经过若干年后,这种植物的任一代的三种基因型分布情况如何?这种植物的任一代的三种基因型分布情况如何?假设:令n=0,1
5、,2,。设an,bn和cn分别表示第n代植物中,基因型为AA,Aa和aa的植物占植物总数的百分比。令x (n)为第n代植物的基因型分布:?a0?an?x(n)?bn?cn?当n=0时x(0)表示植物基因型的初始分布?b0?c0?显然有a0?b0?c0?1第n代的分布与第n1代的分布之间的关系是通过表确定的。建模根据假设(ii),先考虑第n代中的AA型。于第n1代的AA型与AA型结合。后代全部是AA型;第n1代的Aa型与AA型结合,后代是AA型的可能性为1/2,而第n1代的aa型与AA型结合,后代不可能是AA型。因此当n=1,2时即1an?1?an?1?bn?1?0?cn?121an?an?1?
6、bn?1()2类似可推出1bn?bn?1?cn?12()cn=0()将、式相加,得an?bn?cn?an?1?bn?1?cn?1根据假设(I),可递推得出:an?bn?cn?a0?b0?c0?1对于()式.()式和()式,我们采用矩阵形式简记为x?M?0?0?(n)?Mx(n?1),n?1,2,?()其中?110?2120?(n)?1,x?0?an?bn?cn?式递推,得()式给出第n代基因型的分布与初始分布的关系。为了计算出Mn,我们将M对角化,即求出可逆矩阵P和对角库D,使M=PDP-1因而有Mn=PDnP-1, n=1,2,n其中?0?x(n)?Mx(n?1)?Mx2(n?2)?Mxn(
7、0)这里1,2,3是矩阵M的三个特征值。对于()式中的M,易求得它的特征值和特征向量:=1,=1/2,=0?D?0n1?2?3?01?n2?n?3?1?2?3因此?1?D?0?0?01200?1?1?1? e?1? e?2?0?,e1?0?2?3?0?0?0?1?所以1?11?P?e1?e2?e3?0?1?2?1?00?通过计算,P-1=P,因此有x(n)?PDPxn?1(0)10?111?n?1?0?1?2? ?0?2?1?00?0?00?111?a0?0? ?0?1?2? ?b0?00?1c0?0?即nn?1?1?1?11?1?2?2?an?a0?nn?1?11?(n)x?bn?0? ?b
8、0?2?2?c0?cn?0?00?nn?1?1?1?a0?b0?c0?b0?c0?2?2?nn?1?11?b0?c0?2?2?0?nn?1?所以有?1?1?an?1?b0?c0?2?2?nn?1?1?1?c母体的基因型?bn?b0?父体0221?42?cn?0AAAaAaaaaa?AA?n?1?AA101/4后当时,?,所以从式得到代Aa?2?001/2基an?1,bn?0,cn?0因aa011/4即在极限的情况下,培育的植物都是AA型。型若在上述问题中,不选用基因AA型的植物与每一植物结合,而是将具有相同基因型植物相结合,那么后代具有三种基因型的概率如表所示。1?并且x?Mx,其中10?4?
9、1M?00?M的特征值为2?011?1?1?1,?2?1,?3?4?2通过计算,可以解出与?1、?2相对应的两个线性无关的特征向量e1和e2,及与相对应的特征内量e3:?1?0?1?e1?0?,e2?0?,e3?2?1?1?1?(n)n(0)因此?101?1P?00?2?,P?111?1?120?111?1?0?0?2?x(n)?PDPx?10?00?11n?1(0)010?0?1?0? 1?n?1?0?2?1211?2?0?a0?1 ?b0?0?c0?解得:当1?,所以0n?时,?2?1?1?n?1?an?a0?b022?n?1?bn?b0?2?1?1?n?1?cn?c0?b0?2?2?n?
10、1?1?2? ?0?1?0?因此,如果用基因型相同的植物培育后代,在极限情况下,后代仅具有基因AA和aa。11an?a0?b0,bn?0,cn?c0?b022例常染体隐性疾病模型现在世界上已经发现的遗传病有将近4000种。在一般情况下,遗传疾病和特殊的种族、部落及群体有关。例如,遗传病库利氏贫血症的患者以居住在地中海沿岸为多,镰状网性贫血症一般流行在黑人中,家族黑蒙性白痴症则流行在东欧犹太人中间。患者经常未到成年就痛苦地死去,而他们的父母则是疾病的病源。假若我们能识别这些疾病的隐性患者,并且规定两个隐性患者不能结合,那么未来的儿童,虽然有可能是隐性患者,但绝不会出现显性特征,不会受到疾病的折磨
11、。假设父母的基因型常染色体遗传的正常基因记为A,不正常基因记为a,并以AA,Aa,aa分别表示正常人,隐性患者,显性患AAAAAAAa者的基因型现在,我们考虑在控设an,bn分别表示第n代中基因型为制结合的情况下,如AA11/2AA,Aa的人占总人数的百分比,后何确定后代中隐性患记x(n)?an?,n=1,2,Aa01/2因为使每个儿童至少有一个正常的父型亲或母亲,因此隐性患者必须与正常人结合,其后代的基因型概率下表给出:11an?an?1?bn?1bn?0?an?1?bn?11?221?(n)(n?1)2所以x?Mx,n?1,2,?,其中M?1?如果初始分布x(0)已知,那么第n代基因型分布
12、为?0?2?(n)n0建模假设,从第n1代到第n代基因型分布的变化取决于方程解将M对角化,即求出特征值及其所对应的特征向量,得x?Mx,n?1,2,?0?111n?1n?D?,P?p?1?, P?0?0?1?2?计算x(n)?PDPxn?1(0)0?1a11?n?11?0? 1?0?1?b0?0?1?0?2?=nn?1?1?11?0?a0?b0?b0?a22? ?nn0?1?b?1?b0?0?2?2?因为n?1?an?1?b0?2?()每代隐性患者?n的概率是前一?1?b?bn?1,2,?n0?代隐性患者概2?率的1/2。,1bn?0a0?b0?1,所以当n?时,an?隐性患者逐渐消失。从()
13、式中可知1bn?bn?12()模型讨论研究在随机结合的情况下,隐性患者的变化是很有意思的,但随机结合导致了非线性化问题,超出了本章范围,然而用其它技巧,在随机结合的情况下可以把式改写为bn?1bn?,n?1,2?11?bn?12下面给会出数值例子:()某地区有10%的黑人是镰状网性盆血症隐性患者,如果控制结合,根据式可知下一代的隐性患者将减少到5%;如果随机结合,根据式,可以预言下一代人中有%是隐性患者,并且可计算出大约每出生400个黑人孩子,其中有一个是显性患者。近亲繁殖是指父母双方有一个或两个共同的祖先,一般追踪到四代,即至少有相同的曾祖父或外曾祖父。为简单起见,我们来考察一对表兄妹结婚的
14、情况,其中代表男性,代表女性。设曾祖父有某基因对A1A2,曾祖母有某基因对A3A4,容易求得:祖父母取得A1的概率为1/2,故祖父母同有A1基因的概率为1/4;父母同有A1基因的概率为1/16,而子女从父母那里获得基因对A1A1的概率为1/64,而获得相同基因对A1A1,A2A2,A3A3或A4A4之一的概率为1/16,此概率被称为表兄妹(或堂兄妹)结婚(表亲)的近交系数。类似可求得半堂亲的近交系数为1/32,从表亲的近交系数为1/64;非近亲结婚不可能发生重复取某祖先的一对基因对中的某一基因作为自己的基因对的情况,故近交系数为0。设某群体中存在近亲婚配现象,称各种近交系数的数学期望为该群体的
15、近交系数。例如,某村镇共有2000对婚配关系,其中有59对表亲,22对半堂亲和28对从表亲,则该村镇的近亲系数为591221281F?设某基因对A、a两种基因组成,出现A的概率为p,出现现在,我们来研究近亲结a的概率为q=1-p。在随机交配群体中,其子女为AA、Aa及婚会产生什么结果。aa型的概率分别为p2、2pq及q2。对近交系数为F的群体,根据条件概率公式,后代出现aa型基因对的概率为qF?q(1?F)?q?Fq(1?q)?q?Fpq222同样,后代出现AA型基因对的概率为p2+Fpq。Aa型不可能是共同祖先同一基因的重复,故其出现的概率为2pq(1-F)。比较存在近亲交配的群体与不允许近
16、亲交配(F=0)的群体,令?p?q?Fpq?R?1?F2?q?q?若a为某种隐性疾病的基因,易见,在近交群体中,后代产生遗传病的概率增大了,且F越大,后代患遗传病的概率也越大。2例如,苯丙酮尿症是一种隐性基因纯合子aa型疾病,隐性基因出现的频率q?1,求表兄妹结婚及非近亲结婚的子女中患有苯丙酮尿症的概率。100前,表兄妹结婚的近交系数为1/16,故其子女发生该疾病的概率为1?99?1?1?4q?Fpq?10?100?16?100?100?22而对禁止近亲结婚的群体,子女发生该疾病的概率为q2=10-4。表兄妹结婚使子女发生该疾病的概率增大了大约倍,此可见,为了提高全民族的身体素质,近亲结婚是应
17、当禁止的。例链遗传模型的一个实例X链遗传是指另一种遗传方式:雄性具有一个基因A或a,雌性具有两个基因AA,或Aa,或aa。其遗传规律是雄性后代以相等概率得到母体两个基因中的一个,雌性后代从父体中得到一个基因,并从母体的两个基因中等可能地得到一个。下面,研究与X链遗传有关的近亲繁殖过程。假设从一对雌雄结合开始,在它们的后代中,任选雌雄各一个成配偶,然后在它们产生的后代中任选两个结成配偶,如此继续下去, (在家畜、家禽饲养中常见这种现象)父体与母体的基因型组成同胞对,同胞对的形式有(A,AA),(A,Aa),(A,aa),(a,AA),(a,Aa),(a,aa) 6种。初始一对雌雄的同胞对,是这六
18、种类型中的任一种,其后代的基因型如下表所示。父体母体的基因型在每一代中,配偶的同胞对也是六种类型之一,并有确定的概率。为计算这些概率,设an,bn,cn,dn,en,fn (A,AA)(A,Aa)(A,aa),AA)(a,Aa),aa)分别是第n代中配偶的同胞对为(aA,AA),(A,Aa)(a,(A,aa),(a,AA),(a,Aa),(a,aa)型的概率,n=0,1,。令AA10101/21/2(n)T后xa?(a0,d,e,f),n?0,1,?n,bn,cnnnn1011/21/2代如果第Aa)型,那么它AAn1代配偶的同胞对是10(A,0001/2基因A和a,它们的雌因们的雄性后代将等
19、可能地得到基Aa01101/21/2型性后代的基因型将等可能地是AA或Aa。又于第naa000011/2代雌雄结合是随机的,那么第n代配偶的同胞对将等可能地为四种类型(A,AA),(A,Aa),(a,AA),(a,Aa)之一,对于其它类型的同胞对,我们可以进行同样分析,因此有(n)(n?1)x?Mx,n?1,2,?()其中?1?0?0?M?0?0?0?14140141400001000010000141401414?0?0?0?0?0?1?从式中易得x(n)?Mx,n?1,2,?n0经过计算,矩阵M的特征值和特征向量为1111?6?(1?5)?4?,?5?(1?5),?2?1,?3?,?1?1
20、,4242?1?0?1?1?0?0?2?6?0?0?1?3?e1?, e2?, e3?, e4?0?0?1?3?0?0?2?6?0?1?1?1?1?4(?3?1?1?(?1?e5?4?1(?1?4?1?1?(?3?4?5)?5)?5)?5)?, ?1?4(?3?1?1?(?1?e6?4?1(?1?4?1?1?(?3?4?5)?5)?5)?5)?M对角化,则有x(n)?PDPx,n?1(0)n?1,2,?()其中:?1?0?0P?0?0?0?10?11(?3?402?6110?1?3(?1?41013(?1?40?261111?1(?3?415)(?3?4115)(?1?415)(?1?4115
21、)(?3?4?5)?5)?5)?5)?1?0?0?0nD?0?0?010000?1?2?00n0000?1?4(1?5)?0n00000?1?4(1?0n?1?0?2?000000?n?5)?P?1?1?0?0?0?0?0?2313181?2455?202055?202013231?41?12555?5231314112555?513231?81245?205?20520520?0?1?0?0?0?0?当?1?0?0nn?时D?0?0?0因此,当n?00000?10000?00000?00000?00000?00000?时,式中x(n)?1?0?0?P?0?0?000000?10000?000
22、00?1(0)?P?x00000?00000?00000?2121?a?b?c?d?e即00000?3333?0?0?(n)x?0?0?1?212?b0?c0?d0?e0?f0?333?3?因此,在极限情况下所有同胞对或者是型,或者是型。如果初始的父母体同胞对是型,即b0=1,而a0=c0=d0=e0=f0=0,于是,当n?时x(n)1?2?,0,0,0,0,?3?3T即同胞对是(A,AA)型的概率是2/3,是(a,aa)型的概率为1/3。根据转移矩阵的不同结构,马氏链可以分为多个不同的类型,这里,我们只简单介绍其中常见而又较为重要的两类:正则链与吸收链。定义2对于马氏链,若存在一正整数K,使
23、其转移矩阵的K次幂MK0,则称此马尔链为一正则链。定理2若A为正则链的转移矩阵,则必有:t当t?时,A?W,其中W为一分量均大于零的随机矩阵。W的所有行向量均相同。定理3记定理2中的随机矩阵W的行向量为V=(v1,vn),则:t?t对任意随机向量x,有xA?VV是A的不动点向量,即VA=V, A的不动点向量是唯一的。定义3状态Si 称为马氏链的吸收状态,若转移矩阵的第i 行满足:Pii=1,Pij=0定义4马氏链被称为吸收链,若其满足以下两个条件:至少存在一个吸收状态。从任一状态出发,经有限步转移总可到达某一吸收状态根据定义3,例中状态S4即为一吸收链具有r个吸收状态,nr个非吸收状态的吸收链
24、,它的nn转移矩阵的标准形式为?Ir?O?T?R?S?其中Ir为r 阶单位阵,O为rs零阵,R为sr 矩阵,S为ss矩阵。令?Ir?O?nT?R?S?上式中的子阵Sn表达了以任何非吸收状态作为初始状态,经过n步转移后,处于s个非吸收状态的概率。在吸收链中,令F=(IS) -1,称F为基矩阵。定理4吸收链的基矩阵F中的每个元素,表示从一个非吸收状态出发,过程到达每个非吸收状态的平均转移次数。定理5设N=FC,F为吸收链的基矩阵,C=(1,1,1)T,则N的每个元素表示从非吸收状态出发,到达某个吸收状态被吸收之前的平均转移次数。定理6设B=FR=,其中F为吸收链的基矩阵,R为T中的子阵,则bij表
25、示从非吸收状态i出发,被吸收状态j吸收的概率。例甲乙两队进行一场抢答竞赛,竞赛规则规定:开始时每队各记2分,抢答题开始后,如甲取胜则甲加1分而乙减1分,反之则乙加1分甲减1分,(每题必需决出胜负)。规则还规定,当其中一方的得分达到4分时,竞赛结束。现希望知道:甲队获胜的概率有多大?竞赛从开始到结束,平均转移的次数为多少?甲获得1、2、3分的平均次数是多少?设甲胜一题的概率为p,p与两队的实力有关。甲队得分有5种可能,即0,1,2,3,4。我们分别记为状态S0,S1,S2,S3,S4,其中S0和S4是吸收状态,a1,a2和a3是非吸收状态。过程以S2作为初始状态。根据甲队赢得1分的概率为p,建立
26、转移矩阵:S0S1S2S3S4S0?100?S1?1?p0pA?S2?01?p0?S3?001?pS4?00?000p000?0?0?p?1?将上式改记为标准形式T:?I2?0?T?R?S?其中?1?p?R?0?00?p?0?0?, S?1?p0?p?1?p?00?p?0?计算F:?100?0p?F?010?1?p0?001?01?p?0?1?p?p?1?0?0?1p?q1?pq?pp2?10?1?p?p?11?p?1令q=1-p,则?1?pq1?F?q?1?2pq?q2?因为a2是初始状态,根据定理4,甲队获分为1,2,3分的平均次数为q/(1?2pq),1/(1?2pq),p/(1?2pq)。又?1?pq1?N?F?C?q?1?2pq?q2?p2?1?1p? ?1?q1?pq?1?p=122(1?pq?p?p,q?1?p,q?q?1?pq)1?2pq122(1?2p,2,1?2q)1?2pq根据定理5,以a2为初始状态,甲队最终获胜的平均转移欠数为2/(1?2pq)。又因为,?1?pq1?。qB?F?R?1?2pq?q2?1?p?1p? ?0?q1?pq?0pp20?0?p?3?(1?pq)p?p1?22?qp ?1?2pq?q3?(1?pq)p?根据定理6,甲队最后获胜的概率b24?p/(1?2pq)2
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1