生物信息实验报告4四多序列分析及系统进化树构建Word文档格式.docx
《生物信息实验报告4四多序列分析及系统进化树构建Word文档格式.docx》由会员分享,可在线阅读,更多相关《生物信息实验报告4四多序列分析及系统进化树构建Word文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
找到相似度最高的几个序列,通常把序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSATA格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如
>
XXXX
AGGCTTAACACATGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGCC
表1氨基酸序列的同源性比对
物种
(Species)
GenBank登录号
(GenBankAccessionNo.)
相似性
(Similarity)
Anophelesgambiae
CAC35008.1
47%
Nasoniavitripennis
XP_001602830
49%
Xiphophorusxiphidium
AAP55673
46%
Camponotusfloridanus
EFN60989
Daniorerio
NP_919405
Drosophilamelanogaster
AAR85245
Gryllusbimacµ
latus
BAG65666
48%
Xenopus(Silurana)tropicalis
XP_002939960
Lymnaeastagnalis
ABQ10634
Gallusgallus
NP_990828
Rattusnorvegicus
EDL97896.1
2、仿刺参EGFR氨基酸序列通过GENBANK数据库比较,经CLUSTALW多重序列比对分析(图1)(注:
图为部分比对序列图)。
3、
应用MEGA5.1软件在Bootstrap置信值为1000的条件下构建同源关系树(图2)。
在同源关系树中,直观的显示了仿刺参EGFR基因与其他各物种之间的相互关系。
由同源树可已看出,仿刺参EGFR序列自聚为一支,在分子进化地位上与其生物学分类一致,因而得到的关系树反映了上述物种进化关系的远近。
图1仿刺参与其他物种的EGFR氨基酸序列比较
注:
“*”表示相同氨基酸,“:
”“·
”表示相似氨基酸,“-”表示此位置缺失氨基酸
A
图2根据EGFR氨基酸序列构建的系统进化树
用MEGA5.1软件Njboostrap方法构建,分支上的数字代表boostrap值
具体操作步骤如下:
点击File/loadsequences,将整理好的*.txt序列文件导入clustalx1.83,如图
接着点击Alignment/DoCompleteAligment
程序自动运行,得出结果,自动输出*.aln和*.dnd为后缀的两个文件,并自动存入你*.txt文件所在的文件夹内。
序列比对也可以直接用MEGA来做。
4、运行程序MEGA5.1,如下图所示:
点击:
File导入Clustal程序得到的*.aln文件。
再点File/ConverttoMEGAFormat,打开转换文件对话框,从目的文件夹中选中Clustal对比分析后所产生的*.aln文件,转换为*.meg文件。
转换时一路确认相关界面。
最后查看meg序列文件最后是否正常,命名新文件存盘保存*.meg文件,*.meg文件会和aln文件保存在上述*.txt同一个文件夹中。
点击OK键,新建文件名*.meg,然后保存。
5、关闭转换窗口,回到主窗口,现在点面板上的“Data”打开刚才的*.meg文件。
如果为蛋白质序列,选择“Proteinsequence”,点击“OK”,得到以下图示。
选择默认的Standard,点击OK后,如图所示。
点击程序中的
,可以得到下图
在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标,可对所选择的序列进行编辑,完成后点击close即可。
另外,通过点击“C”“V”“Pi”“S”可以分别看到序列的保守区、可变区、最大简约信息位点、单序列位点变异。
序列编辑完成后,可进行保存,点击保存后出现以下界面,点击ok即可。
用Bootstrap构建进化树,MEGA的主要功能就是做Bootstrap验证的进化树分析,
具体构建过程如下
1参数的设置:
点击
,选择该菜单中的Construct/testNeighbor-Joiningtree,选择前面转换得到的*meg文件,对下图的参数进行设置:
说明:
系统进化树的测试方法TestofPhylogeny,通常要选择Bootstrapmethod,也可以选择不进行测试;
重复次数No.ofbootstrapReplications——通常设定至少要大于100比较好,随机数种子可以自己随意设定,不会影响计算结果。
一般选择500或1000。
Model/Method——通常选择Kimura2-parameter。
设定完成,点compute,开始计算得到进化树构建的结果。
如下图所示;
该窗口中有两个属性页,一个是原始树Originaltree,一个是bootstrap验证过的一致树Bootstrapconcensustree。
树枝上的数字表示bootstrap验证中该树枝可信度的百分比。
得到构建的进化树后可以对该进化树进行优化。
(2)保存成到word文档中:
点击下图中的Image,选择子菜单中的CopytoClipboard.
然后在Word中粘贴即可。
(1)利用该软件可得到不同树型,如下图所示:
除此之外,还可以有多种树型,根据需要来选择。
2)显示建树的相关信息:
点击图标i。
3)点击优化图标,可进行各项优化:
Tree栏中,可以进行树型选择:
rectangulartree/circletree/radiationtree。
每种树都可以进行长度,宽度或角度等的设定
Branch:
可对树枝上的信息进行修改。
Lable:
可对树枝的名字进行修改。
Scale:
标尺设置
Cutoff:
cutoffforconsensustree。
一般为50%。
9、进化树的分类优化
Placerootonbranch:
可以来回转换。
Flipsubtree:
180度翻转分枝,名字翻转180度。
Swabsubtree:
交换分枝,名字不翻转。
Compress/expandsubtree与Setdivergenttime:
可以把同一分枝的基因压缩或扩展。
点击Compress/expandsubtree后,在要压缩的分枝处点击,出现以下界面,在name/caption中输入文件名(例如wwww),其他还有很多的选项,设置好了,点击OK。
所得到的结果,可以在压缩和扩展之间转换。