Clustalx多序列比对生物信息学.docx

上传人:b****8 文档编号:9396093 上传时间:2023-02-04 格式:DOCX 页数:11 大小:39.22KB
下载 相关 举报
Clustalx多序列比对生物信息学.docx_第1页
第1页 / 共11页
Clustalx多序列比对生物信息学.docx_第2页
第2页 / 共11页
Clustalx多序列比对生物信息学.docx_第3页
第3页 / 共11页
Clustalx多序列比对生物信息学.docx_第4页
第4页 / 共11页
Clustalx多序列比对生物信息学.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

Clustalx多序列比对生物信息学.docx

《Clustalx多序列比对生物信息学.docx》由会员分享,可在线阅读,更多相关《Clustalx多序列比对生物信息学.docx(11页珍藏版)》请在冰豆网上搜索。

Clustalx多序列比对生物信息学.docx

Clustalx多序列比对生物信息学

Clustalx多序列比对-生物信息学

实验三:

多条序列比对——Clustalx

实习目的:

了解掌握Clustalx软件的应用,学会做多条序列比对并分析。

实习内容:

一、ClustalX的使用

Clustal是一种利用渐近法(progressivealignment)进行多条序列比对的软件。

即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果。

1.准备要比对的序列

请查找至少存在于5个物种中的同源序列(核酸或蛋白质皆可),并保存为fasta格式,存为文本文件(所有的序列请粘贴到同一个文本文件中)。

选择NM、XM或NP打头的序列,不要选择NC或NW打头的序列,那是全基因组序列。

建议关键词:

hemoglobin,trypsin,peroxidase,p53,SuperoxideDismutase,h5n1,etc.

2.打开clustalX程序

开始菜单,程序,clustalX2-clustalX2

3.载入序列

点最上方的File菜单,选择LoadSequence-选择你刚保存的序列文件,点打开。

”后的字符。

注意:

ClustalX程序无法识别汉字,无法识别在左侧窗口里是fasta格式序列的标识号,取自序列第一行“>

带空位的文件夹名,如mydocument。

各位同学的序列文件不要保存在桌面上或带汉字的文件夹中,推荐保存在D盘根目录下。

4.比对参数的选择

可以对两条序列比对的参数和多条序列比对的参数进行设置。

a.两条序列比对的参数设置

点击Alilgnment菜单,选择AlignmentParameters,再选择PairwiseAlignmentParameters。

首先可以选择比对的效果,是slow/accurate还是fast/approximate。

第一种模式采用的是动态规划算法进行比对的,第二种模式采用的是启发式的算法。

除非序列非常长,一般采用第一种模式。

可以选择空位罚分系统,要使用的DNA或蛋白质替换矩阵,也可以自己上传某个替换矩阵进行比对。

b.多条序列比对参数设置

点击Alilgnment菜单,选择AlignmentParameters,再选择MultipleAlignmentParameters。

5.更改输出格式

点击Alignment菜单,选择OutputFormatOptions。

默认的是输出clustalformat,如果需要其它格式,可在复选框里打勾。

PHYLIP格式是利用PHYLIP软件进行建树时,需要输入的格式。

6.进行比对

点击Aliglnment菜单,选择DoCompleteAlignment.此时出现一个对话框,提示你比对结果保存的位置,你在上一步选择了多少种输出格式,这里就需要给出多少个文件的路径。

选择好了点OK即可。

要得到理想的比对结果,你可能需要选择不同的参数,进行多次比对,最后再对各种比对结果进行分析,选择哪个是最合理的结果(theresultmakingbiologicalsense)。

比对结束后生成的aln文件是多条序列比对的结果,可以用记事本打开浏览。

在某一列比对结果下方如果出现*,说明这列是完全匹配。

dnd文件是比对过程中生成的进化树,可以用treeview打开浏览。

7.迭代比对

如果序列比对结果不理想,可以采用迭代选项,多次迭代寻找最佳比对结果。

点击Alignment菜单,选择iteration,选择iterateeachalignmentstep或iteratefinalalignment.然后再点击Aliglnment菜单,选择DoCompleteAlignment进行比对。

8.概型(Profile)比对模式

以上介绍的都是MultiplealignmentMode,ClustalX还提供了一个概型比对模式,在菜单栏下方选择ProfileAlignment

1

Mode,可以对两个比对结果(alignment,termedprofilehere)进行再比对,或将一条序列与一个比对结果(profile)进

行比对。

二、Treeview

Clustalx产生的guidetree(即后缀为dnd文件),可以通过treeview软件浏览。

解压缩并安装treev32.rar文件。

双击后缀为dnd文件,选择treeview程序打开即可。

作业:

1.Clustalx是多条序列比对软件,为什么需要设置两条序列比对的参数,

答:

Clustal是一种利用渐近法(progressivealignment)进行多条序列比对的软件。

即从多条序列中最相似(距离最近)

的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果,既是采用两两

比较后再继续进行比较的方法,所以,需要设置两条序列比对的参数。

2.利用entrez或srs搜索来自于不同物种的同源序列(othologs),利用clustalX进行比对,给出所选序列简要信息(fasta

格式第一行),比对所用的参数,比对过程中产生的guidetree(dnd文件),并分析比对结果(序列之间相似度关系,

保守位点所在位置等)。

答:

简要信息:

>gi|23466358|gb|AF349413.3|DaniorerioestrogenreceptorbetabmRNA,completecds>gi|145308317|gb|EF530592.1|ParamisgurnusdabryanusestrogenreceptorbetamRNA,partialcds>gi|32186925|gb|AY305027.1|HalichoerestenuispinisestrogenreceptorbetamRNA,completecds>gi|2073112|dbj|AB003356.1|AnguillajaponicamRNAforestrogenreceptor,completecds>gi|89037528|ref|NW_925528.1|Homosapienschromosome14genomiccontig,alternateassembly(basedonCelera),wholegenomeshotgunsequence

>gi|30962102|emb|AJ314602.1|CandidiabarbatusmRNAforputativeestrogenreceptor>gi|61097789|dbj|AB190290.1|RutilusrutilusERbmRNAforestrogenreceptorbeta,completecds

比对所用参数:

Guidetree:

比对结果见附表1:

附表1:

2

CandidiaTATCACTATGGTGTCTGGTCATGTG---AGGGATGCAAGGCT---------TTTTTCAAARutilusTATCACTATGGTGTCTGGTCATGTG---AGGGGTGCAAGGCT---------TTCTTCAAADanioTATCACTATGGTGTCTGGTCATGTG---AAGGGTGCAAGGCT---------TTCTTCAAGParamisgurnusTATCACTACGGGGTGTGGTCATGCG---AGGGGTGCAAGGCT---------TTCTTCAAAHalichoeresTATCACTACGGTGTGTGGTCCTGCG---AGGGCTGTAAAGCA---------TTTTTCAAGAnguillaTATCACTACGGGGTGTGGTCCTGCG---AAGGCTGCAAGGCC---------TTCTTCAAGHomoTA-CACTGAGGGACTGAGCCTGGTGTATATGGCAGCAAGACTGGATGGTGGCTTTGCAGC

***********************

Candidia------CGGAGCATTCAAGGACACAATGACT--ATATGTG----TCCAGCCACCAACC--Rutilus------CGGAGCATTCAAGGACACAATGACT--ATATTTG----TCCAGCCACCAACC--Danio------CGTAGCATTCAAGGTCACAATGACT--ATATTTG----TCCAGCCACCAACC--Paramisgurnus------CGAAGCATTCAAGGACACAATGACT--ACATTTG----TCCAGCCACCAACC--Halichoeres------AGGAGTATCCAAGGACACAACGACT--ACATCTG----CCCTGCAACAAATC--Anguilla------AGGAGCATCCAAGGGCACAATGGCT--ACATCTG----CCCCGCCACCAACC--HomoAGTCTCCAGAGCATTCCATGAGATCCGGGCTCGAAATCCAGCATTTCAGCCACAAACTTT

*********************

CandidiaAGTGCACCATTG-------ACAAGAGCCGACGCAAAAGCTG-CCAGGCCTGTCGACTCCGRutilusAGTGCACTATTG-------ACAAGAGCCGACGCAAGAGCTG-CCAGGCCTGTCGACTCCGDanioAGTGCACTATTG-------ACAAGAGCAGACGCAAGAGCTG-TCAGGCCTGTCGACTCCGParamisgurnusAGTGCACCATCG-------ACAAGAGTCGTCGTAAGAGCTG-TCAGGCCTGTCGATTCCGHalichoeresAATGCACTATCG-------ACAAGAACCGGCGTAAGAGCTG-CCAAGCCTGCCGCCTACGAnguillaAGTGCACCATCG-------ACAAGAACCGGCGCAAGAGCTG-CCAGGCCTGCCGACTCCGHomoGATGGACTTTGGCTCAGGTACTGGTTCTGTCACCTGGGCTGCTCACAGTATTTGGGGCCA

*******************

CandidiaCAAGTGCTATGAA---ATGGGCATGATGAAGTGTGGTGTGAGGCGGG----AACGCTGCARutilusCAAGTGCTATGAA---ACAGGCATGATGAAGTGTGGTGTGAGGCGGG----AACGCTGCADanioCAAGTGCTATGAA---GTGGACATGATGAAGTGTGGTGTGAGGAGGG----AGCGCTGCAParamisgurnusCAAGTGCTATGAA---GTGGGCATGATGAAGTGTGGTGTGAGGCGAG----AACGGTGCAHalichoeresTAAATGCTACGAA---GTGGGCATGATGAAATGTGGTGTAAGACGTG----AACGCTGCAAnguillaCAAGTGCTACGAA---GTGGGCATGATGAAGTGTGGTGTGAGACGGG----AGCGTTGTAHomoGAGCCTACGTGAATATATGTGTGTGGACAGATCAGCTGCCATGTTGGTTTTGGCAGAAAA

***************

CandidiaGTTACCGTGGTGCTCGTCATCGTCGCAAC---CCCCAGATCAGGGACAGCTCGGGCGGGGRutilusGTTACCGCGGTGCTCGTCATCGTCGAAAT---CCCCCGATCAGAGACGGCTTGGGCGAGGDanioGTTATCGAGGTGCTCGACATCGTCGTAAC---CCCCAAATCAGAGACAGCTCTGGCGGGGParamisgurnusGTTACCGCGGTGCCCGTCATCGTCGCCAT---CCCCAGACGAGAGACGGCTCAGGCAAAGHalichoeresGCTATCGAGGAACCCGACACCGCCGTGGTGGACTCCAGCCTCGGGATCCCACAGGCAGGGAnguillaCCTACCGGGGGGCGCGACACCGCCGCATG---CCCCACATCCGCGAGTTGGCGGGCACAGHomoACTACTGAAAGGTGGTTCAGAATCTGGGGAG-CCTTATATTCCAGGTGTCTTTTTCAGAC

*********CandidiaCTTTAG---------GGGTCAGAG-GTTGTTCCCAGCATCATTTAGAAATTCCT--CTCARutilusTGTTAG---------GGGTCAGAG-GTTGTTCCCAGCATAATTTAGAAATTCCT--CTCA

3

DanioTGGTAG---------GACTCAGAG-GTCAATCCCAGCAGCATCTAGAGTTCCCC--CTCAParamisgurnusCATTAG---------GGGTCAGAG-GTCGCTCCCAGCATAATCTAGAATTTCCG--TTCAHalichoeresGTTTGGTCAGAGTGGGGCTTGGTT-CTCGAGCCCAAAGGCATCTCCACCTTGAGGGTCCCAnguilla---------------GGGGCGGGG-CCAGGACCCAGAGGCGGGGCGAGGG---------AHomoAGTTTCTACCTGTATCACCCAAGGTGCAGTTTGATGTAGTAGTGTCAGCTTTTTC-CTTA

*

CandidiaATCCCACTCATCACCTCTTCCCTTCAGGGGGCAG--AGCTGAGGGGTGTGGCC-----TGRutilusATCCCACTGATCACCTCTTCCCTTCTGGGGGCAG--AGCTGAGGGGTGTGTCC-----TGDanioGTCCCTCTCAGCACCTCTTTCCTTCAGGGGGCAG--AGCTGAGGGACGGGGCC-----TGParamisgurnusTCTCCCCTCATCAACTCGTCCCTTCGGGTGGCGC--ATCCGAGGGCCGTGGCC-----TGHalichoeresCTCACCCCTGTCACCCCCCTCCCTCAGATGAGCC--ACGTACACCACGCAGCCA----TG

GCAGTCCTCGGCGC----TCAnguillaGTC---------------GTCCCTCAGACGCAGG--AGGC

HomoAGTGAACTGCCCAGCAAGGCTGACCGCACTGAGGTAGTTCAAACCTTATGGCGTAAGACA

**

CandidiaAGCTTCTCCCCTGAGCAGTTGGTGAACTGCATTCTGG--AGGCAGAGCCTCCTCAGATTTRutilusAGCTTCTCCCCTGAGCAGTTGGTGAACTGTATTCTGG--AGGCGGAGCCTCCTCAGATTTDanioAACTATTCCCCTGAACAATTGGTCAGCTGTATTCTAG--AGGCGGAGCCACCTCAAATTTParamisgurnus------TCCGCTGAGCAGCTGGTGAACTGTATTCTAG--AGGCGGAGCCTCCTCAGATTTHalichoeresAG------CCCAGAGGAATTCATCATGCGCATCATGG--AAGCAGAGCCACCAGAGATCTAnguillaA------CGCCGGAGCAGTTAATCAACCGCATCATCG--AGGCGGAGCCGCCGGAGATCTHomoGGTCATTTCCTGGTACTGGTGGAGAATGGAACAAAAGCTGGGCACAGCCTTCTCATGGAT

***************

CandidiaGCCTGAGA----------GAGCCAGTGAAGAAGCCATACACGGAGGC-CAGCATGATGATRutilusGCCTGAAA----------GAGCCAGTGAAAAAGCCGTACACTGAGGC-CAGCATGATGATDanioACCTGAGA----------GAGCCGGTGAAAAAGCCATACACTGAGGC-TAGCATGATGATParamisgurnusACCTGAAA----------GAGCAGGTGCAGAAGCCGTACACTGAGGC-CAGCATGATGATHalichoeresACCTCATG----------GAGGAGCAGAAGAAGCCTTTTACCGAGGC-CAGCATGATGATAnguillaACCTCATG----------AAGGAGCTGAAGAAGCCCTTCACCGAGGA-CAGCATGATGATHomoGCCAGGGATCTGGTCCTTAAGGGAAAAGAGAAGTCACCTTTGGACCCTCGACCTGGTTTT

****************

CandidiaGTCACTCACCAGCCTTGCTGACAAGGAACTGGTGCTCA--TGATCAGCTGGGCCAAGAAGRutilusGTCACTAACCACCCTCGCTGACAAGGAACTGGTGCTCA--TGATCAGCTGGGCCAAGAAGDanioGTCACTAACAAGCCTCGCCGACAAGGAGCTGGTGCTCA--TGATTAGCTGGGCGAAGAAGParamisgurnusGTCACTAACCAACCTTGCTGACAGGGAACTGGTGCTCA--TGATCAGCTGGGCTAAAAAAHalichoeresGTCCCTCACAAACCTGGCAGACAAGGAGCTGGTGCTTA--TGATCAGCTGGGCTAAAAAGAnguillaGTCACTCACCAACCTGGCCGACAAGGAGCTCGTCCTCA--TGATCAGCTGGGCCAAAAAGHomoGTCTTTGCCCCGTGTCCCCATGAACTCCCTTGTCCCCAGTTGACCAACCTGGCCTGTAGC

***********************CandidiaATACCA-GGTTTTGTGGAGCTGACACTTTCAGATCAGGTGCATCTATTGGAATGCTGCTGRutilusATACCA-GGTTTCGTGGAGCTGACGCTTTCAGATCAGGTGCATCTATTGGAATGCTGCTGDanioATACCA-GGTTTTGTAGAGTTGACTTTGTCAGATCAGGTGCATTTGCTGGAATGCTGCTGParamisgurnusATACCA-GGTTTTGTGGAGCTGTGTTTGTCTGATCAGGTGCATCTGTTGGAATGCTGTTG

4

HalichoeresATCCCT-GGCTTTGTCGAGCTGTGTCTAGCTGATCAGATTCACCTCCTAAAGTGCTGCTGAnguillaATCCCT-GGGTTTGTGGAGCTGGACCTGTCTGACCAAGTACACCTGCTGGAGTGCTGTTGHomoTTCTCACAGGCGTACCATCCCATCCCCTTCAGCTGGAACA-AGAAACCAAAGGAAGAAAA

*******

CandidiaGCTGGATATTCTGATGTTGGGATTGATGTGGAGATCTGTGGATCATCCTGGGAAACTCATRutilusGCTGGATATTCTGATGTTGGGATTGATGTGGAGATCTGTGGATCATCCCGGGAAACTCATDanioGCTGGATATTCTGATGTTAGGATTGATGTGGAGATCTGTGGATCATCCTGGGAAACTCATParamisgurnusGCTGGATATTCTGATGTTGGGACTGATGTGGAGATCCGTAGATCATCCTGGGAAACTCATHalichoeresGTTGGAAATTCTGATGCTGGGCCTGATGTGGAGGTCTGTGGATCATCCTGGGAAACTAATAnguillaGCTGGAGGTGCTGATGCTGGGCCTGATGTGGAGGTCTGTGGATCACCCTGGGAAACTCATHomoGTTCTCTATGGTGATCCTTGCTCGGGGGTCTCCAGAGGAGGCTCATCGCTGGCCCCGTAT

***********************

CandidiaCTTCTCACCTGACCTCAAACTGAACAGGGATGAGTGGAATTGTGT-TGAAGGCATCATGGRutilusCTTCTCACCCGACCTCAAACTGAACAGGGGTGAATGGAATTGTGT-TGAAGGCATCATGGDanioCTTCACCCCTGACCTCAAGCTCAACAGGGAGGAAGGGAATTGTGT-TGAAGGCATCATGGParamisgurnusCTTCTCACCAGACCTCAAGCTCAACCGGGACGAATGGGGTTGTGT-TGAAGGCATCATGGHalichoeresCTTCTCTCCTGACTTCAAACTCAACAGAGAGGAGGGTCAGTGTGT-GGAGGGCATCATGGAnguillaCTTTTCCCCAGACCTCAAGCTCAACAGGGATGAGGGAAGTTGTGT-GGAGGGGATCCTGGHomoCACTCAGCCTGTCCTTAAACGGCCTCGCCATGTGCATTGTCACTTGTGCTGTCCAGATGG

*****************

CandidiaAGATCTTTGACATGCTGCTGGCCACGACCTCCAGATTCAG--AGAATTGAAGCTACAGAGRutilusAGATCTTTGACATGCTGCTGGCCACCACCTCCAGATTCAG--AGAACTGAAGCTACAGAGDanioAGATTTTTGACATGCTGCTGGCCACCACCTCTC

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 农学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1