Phylip中文使用说明.docx

上传人:b****2 文档编号:24350037 上传时间:2023-05-26 格式:DOCX 页数:10 大小:116.02KB
下载 相关 举报
Phylip中文使用说明.docx_第1页
第1页 / 共10页
Phylip中文使用说明.docx_第2页
第2页 / 共10页
Phylip中文使用说明.docx_第3页
第3页 / 共10页
Phylip中文使用说明.docx_第4页
第4页 / 共10页
Phylip中文使用说明.docx_第5页
第5页 / 共10页
点击查看更多>>
下载资源
资源描述

Phylip中文使用说明.docx

《Phylip中文使用说明.docx》由会员分享,可在线阅读,更多相关《Phylip中文使用说明.docx(10页珍藏版)》请在冰豆网上搜索。

Phylip中文使用说明.docx

Phylip中文使用说明

Phylip中文使用说

Introduction

PHYLIP程序的运行

这些程序要按照一定的顺序来运行。

前一个程序的输出作为下一个程序的输入。

如何合理的组合这些程序也很关键。

在windows中,PHYLIP程序可通过双击程序的图标来启动,或是在命令行中输入程序的名称来启动。

我们建议使用命令行方式,因为你也许能看到一些错误提示。

它启动的方是:

开始->所有程序->附件->命令提示符。

大部分PHYLIP程序运行方法相同。

程序把infile作为默认输入文件,如果没有找到它将要求用户输入数据文件的名称。

输出结果写在outfile文件中。

有些则写在outfile和outtree或plotfile中。

因为大部分程序使用默认的输入和输出文件名,所以在下一步的分析前,要重命名你想保存的文件。

比如,你用Dnadist得到了距离矩阵(outfile),你还想试试不同的设置,那么再做矩阵计算前,你可以把outfile重命名为dnadist_outfile,或其它名称,这样你就能区别两次的结果了。

 

程序

 

重抽样工具

该程序生成一系列的特殊的随机样本,保存在outfile中。

这些样本在后继的分析中作为一个序列对文件,要设置选项M(usemultipledatasets)。

Seqboot         生成随机样本,用bootstrap和jack-knife方法。

距离方法:

顺序使用这些程序。

首先,用dandist或protdist程序计算序列比对结果的距离矩阵。

接着这个矩阵被fitch、kitsch或neighbor程序转换为树。

Dandist和protdist程序的输出文件是outfile。

在运行fitch、kitsch或neighbor前,outfile应该重命名为infile或另外的名字。

fitch、kitsch和neighbor的输出文件是outfile和outtree。

Dnadist                DNA距离矩阵计算器

Protdist                蛋白质距离矩阵计算器

Fitch                    没有分子时钟的Fitch-Margoliash树

Kitsch                  有分子时钟的Fitch-Margoliash树

Neighbor       Neighbor-Joining和UPGMA树

 

基于字符的方法

这些程序读入一个序列对,它们的输出文件是outfile和outtree。

Dnapars               DNA简约法

Dnapenny            DNA简约法usingbranch-and-bound

Dnaml                 DNA最大似然,无分子时钟

Dnamlk                DNA最大似然,有分子时钟

Protpars               蛋白质简约法

Proml                  蛋白质最大似然法

 

 

画树

这些程序可画newick格式的树。

如,danml程序生成的树。

Drawgram和drawtree生成文件为plotfile,而retree生成outtree。

Drawgram            画有根树

Drawtree              画无根树

Retree                  interactivetree-rearrangement

一致树

用多重树构建一致树。

如,dnapars可生成多重树,可用consense程序来汇总。

Bootstrap的结果也由它来汇总为一棵majorityruletree。

Consense              drawsconsensustreesfrommultipletrees

 

树的距离

计算多个树间的基于拓朴结构的距离。

该方法可用来比较不同分析方法的结果。

Treedist                计算树拓朴结构间的距离

 

Example距离法

一.获取序列

一般自己通过测序得到一段序列(已知或未知的都可以),通过NCBI的BLAST获取相似性较高的一组序列,下载保存为FASTA格式。

用BIOEDIT等软件编辑序列名称,注意PHYLIP在DOS下运行,文件名不能超过10位,超过的会自动截留前面10位。

二、多序列比对

目前一般应用CLASTALX进行,注意输出格式选用PHY格式。

生成的指导树文件(DND文件)可以直接用TREEVIEW打开编辑,形式上和最终生成的进化树类似,但是注意不是真正的进化树。

在clusterx中,生成的phylip文件的序列名称被截断成10字符,所以命名时注意要让树中出现什么名字。

 

三、构建进化树

N-J法建树

依次应用PHYLIP软件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打开。

具体步骤如下:

(1)打开seqboot.exe

Seqboot首先检查该程序所在文件夹中是否有infile文件。

如果没有找到infile,它就会提示你输入序列比对文件。

输入文件名:

输入你用CLASTALX生成的PHY文件(*.phy)。

J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。

在此选择BootStrap

R为bootstrap的次数,R选项让使用者输入重复的replicate数目。

所谓replicate就是用Bootstrap法生成的一个多序列组。

根据多序列中所含的序列的数目的不同可以选取不同的,常用100或者1000。

(设你输入的值为M,即下两步DNADIST.EXE、NEIGHBOR.EXE中的M值也为100或者1000)

当我们设置好条件后,键入Y按回车。

得到一个文件outfile,这个文件包括了1000个replicate。

输入Randomnumberseedoddnumber:

(4N+1)(eg:

1、5、9…)

改好了y

得到outfile(在phylip文件夹内)

改名为seqbootoutfile

 

(2)打开Dnadist.EXE

输入seqbootoutfile

得到dnadist的菜单

NucleicacidsequenceDistanceMatrixprogram,version3.66

Settingsforthisrun:

DDistance(F84,Kimura,Jukes-Cantor,LogDet)?

F84

GGammadistributedratesacrosssites?

No

TTransition/transversionratio?

2.0

COnecategoryofsubstitutionrates?

Yes

WUseweightsforsites?

No

FUseempiricalbasefrequencies?

Yes

LFormofdistancematrix?

Square

MAnalyzemultipledatasets?

No

IInputsequencesinterleaved?

Yes

0Terminaltype(IBMPC,ANSI,none)?

ANSI

1PrintoutthedataatstartofrunNo

2PrintindicationsofprogressofrunYes

Ytoaccepttheseortypetheletterforonetochange

输入d按回车将循环得到不同的进化模式(一般不选)

输入m修改M值,再按D,然后输入1000(M值对应前面BootStrap中的重复数值)

y

得到outfile(在phylip文件夹内)

改名为dnadistoutfile

(3)打开Neighboor.EXE

输入dnadistoutfile

菜单

Neighbor-Joining/UPGMAmethodversion3.66

Settingsforthisrun:

NNeighbor-joiningorUPGMAtree?

Neighbor-joining

OOutgrouproot?

No,useasoutgroupspecies1

LLower-triangulardatamatrix?

No

RUpper-triangulardatamatrix?

No

SSubreplicates?

No

JRandomizeinputorderofspecies?

No.Useinputorder

MAnalyzemultipledatasets?

No

0Terminaltype(IBMPC,ANSI,none)?

ANSI

1PrintoutthedataatstartofrunNo

2PrintindicationsofprogressofrunYes

3PrintouttreeYes

4Writeouttreesontotreefile?

Yes

Ytoaccepttheseortypetheletterforonetochange

选项J,设置随即分布

选项O是让使用者设定一个序列作为outgroup,这个不选,在后期用treeview或者mega打开再选择。

输入m,修改M=1000(M值)

输入Randomnumberseedoddnumber:

(4N+1)(eg:

1、5、9…)

按Y

得到outfile和outtree(在phylip文件夹内)

改outtree为neighborouttree,outfile改为neighboroutfile

 

(4)打开consense.exe

输入neighborouttree

y

得到outfile和outtree(在phylip文件夹内)

Outfile可以改为*.txt文件,用记事本打开阅读。

outtree可改为njouttree

想用treeview看到树图的bootstrap值必须用consense做出的outtree

 

(5)打开drawgram.exe(有根)或者drawtree.exe(无根)(这一步也可以不做)

该程序首先寻找文件fontfile,如果找不到它(如果你没有把字体文件之一改为fontfile的话),它会提示输入一个字体文件。

输入font1。

P选择图像输出格式

W对应的最终画图设备改为MS-windowsbitmap。

它还要要求你输入树的维数,比如说2000*2000。

Y按回车。

Drawgram打开一个新的窗口,你可以看到一棵树,如果你满意这个结果,选择file菜单中的plot。

在当前文件夹中出现一个plotfile文件。

如果你将它重命名为plotfile.bmp,就可用图形工具将它打开了。

四、进化树编辑和阅读

outtree可改为*.tre文件,直接双击在treeview里看;也可以不改文件扩展名,直接用treeview、PHYLODRAW、NJPLOT等软件打开编辑。

TREEVIEW可以显示BOOTSTRAN值,序列较多(60条以上)的时候打开直接显示有明显的重叠,可以在打印预览中显示,或输出为EMFWMF图片文件看,但是序列较多时BOOTSTRAN值的显示位置比较乱,和序列名称有重叠。

PHYLODRAW的编辑功能较强,可以自由调节X、Y轴的长度。

输出格式为BMP、PS格式。

缺点是不能直接显示BOOTSTRAN值,包括打开TREEVIEW输出的NEX文件,而且输出的BMP文件不全,类似截屏文件,可以用PHOTOSHOP进行拼接合成,添加BOOTSTRAN值和注解符号等。

据说也可以将PS文件用记事本打开,改变其中的字号,然后通过ADOBE DISTRILLOR将PS转化为PDF,就可以解决问题。

如果发现还有重叠,可以再次改变PS文件中的字号大小,直到合适为止。

NJPLOT可以显示BOOTSTRAN值和分值长度。

但是不能调节图片X、Y轴的长度。

也可以用CLASTALX中的BOOTSTRANN-JTREE法生成进化树,TREE菜单输出格式选项(OUTPUTFORMATOPTION)中的BOOTSTRANLABELSON选NODE(节点)。

在treeview里,选择tree菜单,然后把showinternaledgelables的选项打勾了,直接打开生成的文件bootstrap的值就可以显示出来

建MP,ML树将Dnadist和Neighboot两步分修别改为Dnapars和Dnaml,两步变作一步,其余步骤相同。

蛋白质距离法构建N-J树

蛋白质构建树软件使用步骤

DNA构建树软件使用步骤

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1