《生物信息学)分子进化系统分析.pptx

上传人:b****1 文档编号:1764843 上传时间:2022-10-23 格式:PPTX 页数:77 大小:1.30MB
下载 相关 举报
《生物信息学)分子进化系统分析.pptx_第1页
第1页 / 共77页
《生物信息学)分子进化系统分析.pptx_第2页
第2页 / 共77页
《生物信息学)分子进化系统分析.pptx_第3页
第3页 / 共77页
《生物信息学)分子进化系统分析.pptx_第4页
第4页 / 共77页
《生物信息学)分子进化系统分析.pptx_第5页
第5页 / 共77页
点击查看更多>>
下载资源
资源描述

《生物信息学)分子进化系统分析.pptx

《《生物信息学)分子进化系统分析.pptx》由会员分享,可在线阅读,更多相关《《生物信息学)分子进化系统分析.pptx(77页珍藏版)》请在冰豆网上搜索。

《生物信息学)分子进化系统分析.pptx

分子系统发育分析系统发育分析的发展分子系统树的构建分子进化系统的应用系统发育分析的目的1.物种来源?

如人类源自哪里?

2.现有的多样性丰富生物他们之间的亲缘关系是怎样的?

进化论达尔文:

物种起源华莱士:

论变种无限地离开其原始模式的倾向生物是进化的产物,由共同祖先由远及近依次进化而来。

研究的局限:

在时间的横断面怎样确定物种之间的进化关系?

进化关系的反映是不同分类单元与共同祖先的相对近度进化分类学派(传统的分类)支序分类学派数值分类学派分子系统学老虎蜥蜴鳄鱼鸳鸯哺乳纲鸟纲爬行纲进化分类学派传统的分类系统与系统发育关系:

系统发育关系图与传统发育关系不对应。

传统的分类系统不一定能准确反映系统发育关系;支序分类学派主张以生物的血亲关系来重建系统发育关系和分类系统。

由于血亲关系无法直接观察和实验,因而只能利用生物的共有衍征来重建和推导同源特征(homology):

后代所具有的起源于共同祖先同一特征的特征。

相似的特征不一定同源(异源同形)共有祖征(symplesiomorphy):

两个或两个以上分类单位具有某特征起源于比最近的共同祖先更早的祖先共有衍征(synapomorphy):

某一特征起源于最近的共同祖先。

自有新征(autapomorphy):

某一支系独有的特征。

姐妹群(sistergroup):

当两个分类单元共有一个不为第三者所有的祖先时,互为姐妹群,关系最近。

鳄鱼鸭嘴兽袋鼠老虎有脊柱被毛、有乳腺胎生长孕期共有祖征(老虎袋鼠)共有衍征(老虎,袋鼠,鸭嘴兽)祖征与衍征的判断:

1.化石标准2.外群比较:

所研究的某一特定类型的群称为内群;不包括在内群中,与内群又有一定关系的群称为外群。

将内群某一特征与外群相应特征比较,往往可得到演化极向。

3.个体发育信息:

个体发育史早期特征往往是祖征态4.系统发育关系的推导:

必须利用共有衍征假设有5个分类单元和4个特征,来推导分类单元间的系统发育关系。

0表示祖征,1表示衍征EDCBA非同源假设少实际上,上表的四个物种分别:

A:

智人,B:

红袋鼠;C:

鸭嘴兽;D:

鸡蛋白链为肌球蛋白链。

通过其他特征,如A,B,C的共有衍征(毛发、乳腺,听小骨)和A,B的共有衍征(胎生、牙齿、乳头)验证,确实是图11比较好。

增加特征数可以提高准确性。

数值分类学派数值分类派认为上述两种方法存在主观因素影响,希望建立客观的,可重复的分类系统。

认为两个物种关系越近,其共有性状及其相似性就越多,性状反映了共同基因的多少,他们的相似程度和相互关系反映了遗传关系。

建立的方法:

1.用来分类的特征越多,包含的信息越大;2.各性状之间是等权的;3.两个分类单元之间的全面相似性由统一公式算;4.分类系统由相似度和差异建立缺点1.根据无进化意义的性质进行归类不恰当2.形态特征与基因型不是对应关系3.生物某些特征不是等权的,把所有特征都等权本身就是主观4.生物个体在幼体和成体变化较大,雌雄个体差异也大,还有环境因素,因此实际才用的特征并不多,总体相似的估计比较困难分子进化系统分子系统学:

利用分子标记(主要是DNA,RNA和蛋白质分子或片段)来探讨生物系统发育和进化过程的学科。

内容提要分子进化分析介绍系统发育树重建方法从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。

蛋白和核酸序列通过序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律。

分子进化研究的目的系统发育树是什么?

对一组实际对象的世系关系的描述(如基因,物种等)。

一个系统发育树末端分支末端物种顶端叶子中间节点中间枝条节点根AEBCDFG树只代表分支的拓扑结构EDCFGAB分子进化研究的基础(假设)核苷酸和氨基酸序列中含有生物进化历史的全部信息。

在各种不同的发育谱系及足够大的进化时间尺度中,许多序列的进化速率几乎是恒定不变的。

(分子钟理论,1965)分子进化研究的基础(理论)虽然很多时候仍然存在争议,但是分子进化确实能阐述一些生物系统发生的内在规律。

分子进化研究的基础(实际)序列分歧度分歧时间x从一个分歧数据可以推测其他y分子钟理论直系同源(orthologs):

同源的基因是由于共同的祖先基因进化而产生的.旁系同源(paralogs):

同源的基因是由于基因复制产生的.(以上定义源自Fitch,W.M.(1970)Distinguishinghomologousfromanalogousproteins.Syst.Zool.19,99113)直系同源与旁系同源paralogsorthologsparalogsorthologsErikL.L.SonnhammerOrthology,paralogyandproposedclassificationforparalogsubtypesTRENDSinGeneticsVol.18No.12December2002http:

/tig.trends.com0168-9525/02/$seefrontmatter2002ElsevierScienceLtd.All以上两个概念代表了两个不同的进化事件用于分子进化分析中的序列必须是直系同源的,才能真实反映进化过程。

Bacterium1Bacterium2Bacterium3Eukaryote1Eukaryote2Eukaryote3Eukaryote4Bacterium1Bacterium2Bacterium3Eukaryote1Eukaryote3Eukaryote4Phylogramsshowbranchorderandbranchlengths进化树,有分支和支长信息Eukaryote22.进化分支图,进化树Cladogramsshowbranchingorder-branchlengthsaremeaningless进化分支图,只用分支信息,无支长信息。

Rootedbyoutgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoterooteukaryoteeukaryoteeukaryote无根树eukaryotebacteriaoutgrouparchaeaarchaeaarchaeaeukaryoteMonophyleticgroup(单源群)Monophyleticgroup3.有根树,无根树,外围群有根树外围群系统发生树性质:

(1)如果是一棵有根树,则树根代表在进化历史上是最早的、并且与其它所有分类单元都有联系的分类单元;2如果找不到可以作为树根的单元,则系统发生树是无根树;3从根节点出发到任何一个节点的路径指明进化时间或者进化距离。

4.基因树,物种树WeoftenassumethatgenetreesgiveusspeciestreesabcABDGenetreeSpeciestree系统发育树重建分析步骤多序列比对(自动比对,手工比对)建立取代模型(建树方法)建立进化树进化树评估序列对比:

软件:

clustalw序列比对后,核苷酸或氨基酸序列的差异可以通过模型转化成距离Judes和Cautor假设每一碱基具有同等机率突变为另外3种碱基中的任何一种,其频率常数为/3,为碱基替换频率。

提出了序列距离K系统发育树重建的基本方法1.距离法(distance)2.特征法最大简约法(maximumparsimony,MP)最大似然法(maximumlikelihood,ML)距离法距离法又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。

进化树的构建则是基于这个矩阵中的进化距离关系。

计算序列的距离,建立距离矩阵通过距离矩阵建进化树由进化距离构建进化树的方法有很多,常见有:

1.Fitch-MargoliashMethod(FM法)2.Neighbor-JoiningMethod(NJ法/邻接法)3.UnweightedPairGroupMethod(UPGMA法)通过矩阵建树的方法非加权配对法(UPGMA)算法示意图应用算术平均数的非加权成组配对法,unweightedpair-groupmethodusinganarithmeticaverage距离最近人类(hu),黑猩猩(ch),猩猩(or),长臂猿(gi),大猩猩(go)人类(hu),黑猩猩(ch),猩猩(or),长臂猿(gi),大猩猩(go)距离最近邻接法(NJ法)UPGMA假定各分支的进化速度和程度是一致的。

邻接法的关键步骤:

一是计算发散系数ri,二是生成一个速率校正矩阵。

该方法通过确定距离最近(或相邻)的成对分类单位来使系统树的总距离达到最小。

Mijdijor与gi的Mij最小,它们用新的节点代替or与giMij最小,它们用节点1代替,则新节点(节点1)到这二个节点的距离为节点1到其它各节点的距离见表在该矩阵中,人(hu)和黑猩猩(ch)的Mij值最小,则它们又形成一个新节点(节点2),依次类推,便可最终完成矩阵的计算和邻接法无根系统树距离dij(上对角线部分)和Mij(下对角线部分)特征法构建进化树最大简约法(MP)最大简约法(maximumparsimony,MP)最早源于形态性状研究,现在已经推广到分子序列的进化分析中。

最大简约法的理论基础是奥卡姆(Ockham)哲学原则,这个原则认为:

解释一个过程的最好理论是所需假设数目最少的那一个。

对所有可能的拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最优树。

优点:

最大简约法不需要在处理核苷酸或者氨基酸替代的时候引入假设(替代模型)。

此外,最大简约法对于分析某些特殊的分子数据如插入、缺失等序列有用。

最大简约法(MP)缺点:

在分析的序列位点上没有回复突变或平行突变,且被检验的序列位点数很大的时候,最大简约法能够推导获得一个很好的进化树。

然而在分析序列上存在较多的回复突变或平行突变,而被检验的序列位点数又比较少的时候,最大简约法可能会给出一个不合理的或者错误的进化树推导结果。

最大简约法(MP)最大似然法(ML)最大似然法(maximumlikelihood,ML)最早应用于系统发育分析是在对基因频率数据的分析上,后来基于分子序列的分析中也已经引入了最大似然法的分析方法。

最大似然法分析中,选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树。

在最大似然法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率求最大值来估计枝长。

最大似然法(ML)最大似然法的建树过程是个很费时的过程,因为在分析过程中有很大的计算量,每个步骤都要考虑内部节点的所有可能性。

最大似然法是一个比较成熟的参数估计的统计学方法,具有很好的统计学理论基础,在当样本量很大的时候,似然法可以获得参数统计的最小方差。

只要使用了一个合理的、正确的替代模型,最大似然法可以推导出一个很好的进化树结果。

最大似然法(ML)由于最大似然法的分析过程需要耗费较多的时间,针对这种情况,发展出了许多优化的可以加快最大似然法寻找最优树的搜索方法,如启发式搜索,分枝交换搜索等。

最大似然法具有坚实的统计学理论基础,充分的使用了分析序列中的信息资源,只要采用了合理的替代模型,可以得出很好的进化树分析结果。

最大似然法(ML)Bayes法与ML法利用先验概论进行计算不同,Bayes法采用后概率运算和构树。

后验概率就是根据所要研究序列的实际进化状况对先验概率进行调整后得到的进化模型和概率。

与ML法一样,bayes也要选择一个进化模型,抽样统计分析所要研究的序列各位点的实际状态,将统计分析结果代人公式后计算出后验概率,再根据后验概论进

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 初中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1