mega操作过程-多序列比对进化树.ppt

上传人:b****2 文档编号:1892502 上传时间:2022-10-25 格式:PPT 页数:173 大小:4.11MB
下载 相关 举报
mega操作过程-多序列比对进化树.ppt_第1页
第1页 / 共173页
mega操作过程-多序列比对进化树.ppt_第2页
第2页 / 共173页
mega操作过程-多序列比对进化树.ppt_第3页
第3页 / 共173页
mega操作过程-多序列比对进化树.ppt_第4页
第4页 / 共173页
mega操作过程-多序列比对进化树.ppt_第5页
第5页 / 共173页
点击查看更多>>
下载资源
资源描述

mega操作过程-多序列比对进化树.ppt

《mega操作过程-多序列比对进化树.ppt》由会员分享,可在线阅读,更多相关《mega操作过程-多序列比对进化树.ppt(173页珍藏版)》请在冰豆网上搜索。

mega操作过程-多序列比对进化树.ppt

基础生物信息学及应用基础生物信息学及应用王兴平王兴平基基础础生生物物信信息息学学及及应应用用多序列比对多序列比对分子进化分析分子进化分析系统发生树构建系统发生树构建核酸序列的预测与鉴定核酸序列的预测与鉴定酶切图谱制作酶切图谱制作引物设计引物设计内内容容基基础础生生物物信信息息学学及及应应用用多序列比对多序列比对基基础础生生物物信信息息学学及及应应用用n内容:

内容:

多序列比对多序列比对多序列比对程序及应用多序列比对程序及应用基基础础生生物物信信息息学学及及应应用用第一节、多序列比对第一节、多序列比对(MultiplesequencealignmentMultiplesequencealignment)n概念概念n多序列比对的意义多序列比对的意义n多序列比对的打分函数多序列比对的打分函数n多序列比对的方法多序列比对的方法基基础础生生物物信信息息学学及及应应用用11、概念、概念n多序列比对(多序列比对(MultiplesequencealignmentMultiplesequencealignment)alignmultiplerelatedsequencestoachievealignmultiplerelatedsequencestoachieveoptimalmatchingofthesequences.optimalmatchingofthesequences.为了便于描述,对多序列比对过程可以给出下面的定义:

把多序为了便于描述,对多序列比对过程可以给出下面的定义:

把多序列比对看作一张二维表,表中每一行代表一个序列,每一列代表列比对看作一张二维表,表中每一行代表一个序列,每一列代表一个残基的位置。

将序列依照下列规则填入表中:

一个残基的位置。

将序列依照下列规则填入表中:

(aa)一个序列所有残基的相对位置保持不变;)一个序列所有残基的相对位置保持不变;(bb)将不同序列间相同或相似的残基放入同一列,即尽可能将序列)将不同序列间相同或相似的残基放入同一列,即尽可能将序列间相同或相似残基上下对齐(下表)。

间相同或相似残基上下对齐(下表)。

基基础础生生物物信信息息学学及及应应用用1234567891YDGGAV-EALYDGG-EALFEGGILVEALFD-GILVQAVYEGGAVVQAL表表11多序列比对的定义多序列比对的定义表表示示五五个个短短序序列列(I-VI-V)的的比比对对结结果果。

通通过过插插入入空空位位,使使55个个序序列列中中大多数相同或相似残基放入同一列,并保持每个序列残基顺序不变大多数相同或相似残基放入同一列,并保持每个序列残基顺序不变基基础础生生物物信信息息学学及及应应用用22、多序列比对的意义、多序列比对的意义n用于描述一组序列之间的相似性关系,以便了解一个分用于描述一组序列之间的相似性关系,以便了解一个分子子家族的基本特征家族的基本特征,寻找,寻找motifmotif,保守区域等。

,保守区域等。

n用于描述一组同源序列之间的亲缘关系的远近,应用到用于描述一组同源序列之间的亲缘关系的远近,应用到分子进化分析中。

分子进化分析中。

序列同源性分析序列同源性分析:

是将待研究序列加入到一组与之:

是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。

较,以确定该序列与其它序列间的同源性大小。

n其他应用,如构建其他应用,如构建profileprofile,打分矩阵等,打分矩阵等基基础础生生物物信信息息学学及及应应用用n手工比对手工比对在运行经过测试并具有比较高的可信度的计算机程序(辅助在运行经过测试并具有比较高的可信度的计算机程序(辅助编辑软件如编辑软件如bioeditbioedit,seaviewseaview,GenedocGenedoc等)基础上,结合实等)基础上,结合实验结果或文献资料,对多序列比对结果进行手工修饰,应该验结果或文献资料,对多序列比对结果进行手工修饰,应该说是非常必要的。

说是非常必要的。

为了便于进行交互式手工比对,通常使用不同颜色表示具有为了便于进行交互式手工比对,通常使用不同颜色表示具有不同特性的残基,以帮助判别序列之间的相似性。

不同特性的残基,以帮助判别序列之间的相似性。

n计算机程序自动比对计算机程序自动比对通过特定的算法(如穷举法,启发式算法等),由计算机程通过特定的算法(如穷举法,启发式算法等),由计算机程序自动搜索最佳的多序列比对状态。

序自动搜索最佳的多序列比对状态。

33、多序列比对的方法、多序列比对的方法基基础础生生物物信信息息学学及及应应用用穷举法穷举法n穷举法(穷举法(exhaustivealignmentmethodexhaustivealignmentmethod)将序列两两比对时的二维动态规划矩阵扩展到多维矩阵。

即用将序列两两比对时的二维动态规划矩阵扩展到多维矩阵。

即用矩阵的维数来反映比对的序列数目。

这种方法的计算量很大,矩阵的维数来反映比对的序列数目。

这种方法的计算量很大,对于计算机系统的资源要求比较高,一般只有在进行少数的较对于计算机系统的资源要求比较高,一般只有在进行少数的较短的序列的比对的时候才会用到这个方法短的序列的比对的时候才会用到这个方法DCA(Divide-and-ConquerAlignmentDCA(Divide-and-ConquerAlignment):

):

aweb-basedaweb-basedprogramthatisprogramthatissemiexhaustivesemiexhaustivehttp:

/bibiserv.techfak.uni-bielefeld.de/dcahttp:

/bibiserv.techfak.uni-bielefeld.de/dca/基基础础生生物物信信息息学学及及应应用用启发式算法启发式算法n启发式算法(启发式算法(heuristicalgorithmsheuristicalgorithms):

大多数实用的多序列比对程序采用大多数实用的多序列比对程序采用启发式算法启发式算法(heuristicalgorithmsheuristicalgorithms),以降低运算复杂度。

),以降低运算复杂度。

随着序列数量的增加,算法复杂性也不断增加。

用随着序列数量的增加,算法复杂性也不断增加。

用OO(m1m2m3m1m2m3mnmn)表示对)表示对nn个序列进行比对时的算法复杂性,个序列进行比对时的算法复杂性,其中其中mnmn是最后一条序列的长度。

若序列长度相差不大,则是最后一条序列的长度。

若序列长度相差不大,则可简化成可简化成OO(mmnn),其中),其中nn表示序列的数目,表示序列的数目,mm表示序列的长表示序列的长度。

显然,随着序列数量的增加,序列比对的算法复杂性度。

显然,随着序列数量的增加,序列比对的算法复杂性按指数规律增长。

按指数规律增长。

基基础础生生物物信信息息学学及及应应用用第二节第二节多序列比对程序及应用多序列比对程序及应用nProgressiveAlignmentMethodProgressiveAlignmentMethodnIterativeAlignmentIterativeAlignmentnBlock-BasedAlignmentBlock-BasedAlignmentnDNASTARDNASTARnDNAMANDNAMAN基基础础生生物物信信息息学学及及应应用用11、ProgressiveAlignmentMethodProgressiveAlignmentMethodnClustalClustal:

ClustalClustal,是由,是由FengFeng和和DoolittleDoolittle于于19871987年提出的。

年提出的。

ClustalClustal程序有许多版本程序有许多版本ClustalWClustalW(ThompsonThompson等,等,19941994)是目前使用最广泛的多序列)是目前使用最广泛的多序列比对程序比对程序它的它的PCPC版本是版本是ClustalXClustalX作为程序的一部分,作为程序的一部分,ClustalClustal可以输出用于构建进化可以输出用于构建进化树的数据。

树的数据。

基基础础生生物物信信息息学学及及应应用用nClustalWClustalW程序:

程序:

ClustalWClustalW程序可以自由使用程序可以自由使用在在NCBI/EBINCBI/EBI的的FTPFTP服务器上可以找到下载的软件包。

服务器上可以找到下载的软件包。

CClustallustalWW程序用选项单逐步指导用户进行操作,用户程序用选项单逐步指导用户进行操作,用户可根据需要选择打分矩阵、设置空位罚分等。

可根据需要选择打分矩阵、设置空位罚分等。

ftp:

/ftp:

/ftp.ebi.ac.ukftp.ebi.ac.uk/pub/software/pub/software/EBIEBI的主页还提供了基于的主页还提供了基于WebWeb的的CClustallustalWW服务,用户可以服务,用户可以把序列和各种要求通过表单提交到服务器上,服务器把序列和各种要求通过表单提交到服务器上,服务器把计算的结果用把计算的结果用EmailEmail返回用户(或在线交互使用)。

返回用户(或在线交互使用)。

http:

/http:

/www.ebi.ac.uk/clustalwwww.ebi.ac.uk/clustalw/ProgressiveAlignmentMethodProgressiveAlignmentMethod基基础础生生物物信信息息学学及及应应用用nClustalWClustalW程序程序CClustallustalWW对输入序列的格式比较灵活,可以是对输入序列的格式比较灵活,可以是FASTAFASTA格式,还可格式,还可以是以是PIRPIR、SWISS-PROTSWISS-PROT、GDEGDE、ClustalClustal、GCG/MSFGCG/MSF、RSFRSF等格式。

等格式。

输出格式也可以选择,有输出格式也可以选择,有ALNALN、GCGGCG、PHYLIPPHYLIP和和GDEGDE等,用户可以等,用户可以根据自己的需要选择合适的输出格式。

根据自己的需要选择合适的输出格式。

用用CClustallustalWW得到的多序列比对结果中,所有序列排列在一起,得到的多序列比对结果中,所有序列排列在一起,并以特定的符号代表各个位点上残基的保守性,并以特定的符号代表各个位点上残基的保守性,“*”号表示保号表示保守性极高的残基位点;守性极高的残基位点;“.”号代表保守性略低的残基位点。

号代表保守性略低的残基位点。

ProgressiveAlignmentMethod基基础础生生物物信信息息学学及及应应用用nClustalClustalWW使用使用输入地址:

输入地址:

http:

/www.ebi.ac.uk/clustalw/http:

/www.ebi.ac.uk/clustalw/设置选项设置选项(nextnext)ProgressiveAlignmentMethodProgressiveAlignmentMethod基基础础生生物物信信息息学学及及应应用用nClustalClustalWW使用使用一些选项说明一些选项说明PHYLOGENETICTREEPHYLOGENETI

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 政史地

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1