用Phylomatic和PhyloCom进行.docx
《用Phylomatic和PhyloCom进行.docx》由会员分享,可在线阅读,更多相关《用Phylomatic和PhyloCom进行.docx(14页珍藏版)》请在冰豆网上搜索。
用Phylomatic和PhyloCom进行
用Phylomatic和PhyloCom进行
群落系统进化分析
张金龙
(中国科学院植物研究所)
Phylomatic和PhyloCom软件,是哈佛大学的CamWebb博士、俄勒冈大学的SteveKembel博士、加州大学伯克利分校的DavidAckerly教授编写的一套用于群落物种组成系统发育关系的软件。
Phylomatic是在线软件,可以利用植物名录,按照APGIII的被子植物科的拓扑结构,生成进化树。
由于当前物种测序还不够充分,某一个群落中或某一个地区所有物种的某几个基因的序列还不能全部拿到,因此可以用Phylomatic建立基于APGIII骨架的进化树。
PhyloCom软件是用来进行群落系统发育与进化分析的。
PhyloCom可以为Phylomatic软件得到的进化树拓扑结构,按照一定的规则拟合一定的枝长,其功能还包括:
计算群落的系统发育多样性(PD),计算群落的系统发育结构(communitystructure),计算群落的系统发育距离(communityphylogeneticdistance),分析群落的性状进化(AOT)。
下面就介绍如何使用Phylomatic和Phylocom进行相应的分析。
一 Phylomatic 建立进化树
1 物种名录的准备
复制拉丁文属名,打开 查询每个属所在的科等信息
图1 查询属名所在的APG科
输出结果如下:
图2 属名查询结果
新建一个Excel空白文档,将结果粘贴到Excel中
选中粘贴过来的列,点击Excel的菜单,数据>分列>分隔符号>空格
从中选择APGFam列
图 3 选取APG科名
将没有查到的属,手动添加相应的科名。
整理种名,去掉去空格和括号,报名命名人等信息
将种名中所有的空格用“.”或者“_”代替。
按照科/属/种的顺序,将各列粘贴到一个新的excel表格中。
图4 删除物种的命名人和括号
图5 将物种内的空格用“_”替换,并粘贴到对应的科属
删除其中的非被子植物。
将非被子植物删除后,选中全部内容,复制后粘贴到记事本中。
将其中的制表符,用“/”来替换。
所得数据,形式如下:
图 6 将excel表格中的数据粘贴到记事本中,并将tab制表符替换为“/”
将所有的科名首字母,改为小写字母。
将所得数据,粘贴到Phylomatic在线对话框中。
2 Phylomatic建树
图 7 将科的起始字母替换为小写字母,并粘贴到phylomatic的对话框中。
数据输出形式,选择默认的Newick即可。
点击提交,即可得到无枝长的,newick格式的进化树。
(((((((((Castanopsis_eyrei,Castanopsis_carlesii,Castanopsis_fargesii,Castanopsis_tibetana)castanopsis,(Cyclobalanopsis_gracilis,Cyclobalanopsis_glauca)cyclobalanopsis,Lithocarpus_glaber)fagaceae,Myrica_rubra),Elaeocarpus_decipiens),Syzygium_buxifolium),(Daphniphyllum_oldhamii,Loropetalum_chinense)),(((Rhododendron_latoucheae,Rhododendron_ovatum)rhododendron,Vaccinium_carlesii)ericaceae,(Schima_superba,Adinandra_millettii,Eurya_muricata,Camellia_fraterna,Ternstroemia_gymnanthera)theaceae)),((Machilus_thunbergii,
图 8 输出的进化树
将输出网页中的进化树,复制到记事本中,并另存为phylo文件,该文件不要有任何扩展名。
二 PhyloCom软件的使用
本部分内容包括:
用PhyloCom的bladj模块为进化树添加枝长,.利用PhyloCom中的练习数据,计算群落的系统发育多样性,系统发育结构等。
1 下载phylocom软件
图 9 填写信息,并下载phylocom
首先提交相应的信息,之后,便可下载phylocom软件
将下载的文件解压缩,
图 10 将下载zip文件解压缩
Example_data 中是练习数据
Mac 中是苹果机的运行软件
R,是驱动Phylocom的R脚本
Src 是Phylocom的源程序,phylocom是C语言写的。
W32 是Windows平台下可以运行的exe程序
Phylocom_manual是说明书
README注意事项
2 创建工作路径
在C盘根目录下,创建一个名为phylocom的文件夹。
将w32中的文件,拷贝到该文件夹C:
\phylocom。
再将做好的包含进化树的phylo文件,拷贝到该文件夹C:
\phylocom
将\example_data\bladj_example 文件夹下的 文件,拷贝到C:
\phylocom,并将 改名为ages,也不留任何扩展名。
图 12 将ages文件和phylo文件phylocom,exe程序拷贝到C:
\phylocom文件夹
3用bladj为进化树拟合枝长
运行Phylocom
开始 > 运行 > 输入 cmd > cdC:
\phylcom
图 13 用cdC:
\phylocom切换路径。
图 14 用Phylocom的bladj拟合枝长,并存储到out文件中
输入 phylocombladj>
则生成的就是含有枝长的进化树
该进化树可以用TreeView软件,Figtree软件查看。
图 15用Figtree软件绘制的进化树
4phylomatic软件生成的进化树在R中的操作
在R软件的ape程序包中,计算,即所得有枝长进化树中,物种两两之间的进化距离(分化时间)
图 16在R软件的ape程序包中,读取phylomatic树出现的问题
Phylomatic建立的进化树,在ape程序包中,不能正常读取,提示“Thereisapparentlytworootedgesinyourfile:
cannotreadtreefile.
ReadingNewickfileabortedattree”
图 17 用记事本打开拟合好枝长的进化树,删除最外面的euphyllophyte及相应括号,保留“;”
删除进化树中最外面的一层,euphyllophyte,包括前面的一对括号,即紧挨着euphyllophyte的“)”和最前面的“(”。
最后的分号保留。
之后,即可在ape中读取。
在R中读取进化树,并计算物种之间的进化距离脚本:
library(ape)
setwd("C:
/phylocom/")
tr<-("")
phylodist<-(tr))
5 在phylocom软件中,计算其他指数
在解压缩的phylocom文件夹下,的example_data 文件夹中,还有sample文件,sample文件第一列,表示样方的名称,第二列,是个体数,第三列,是物种名。
物种名一定要与phylo文件中的物种名完全对应。
可以将example_data 中的sample文件和phylo文件拷贝到C:
\phylocom文件夹下,
在开始>cmd>cdC:
\phylocom>输入:
phylocomcomstruct>
计算群路的系统发育结构。
图 18 用phylocom计算系统发育多样性指数
输入
phylocompd>计算每个群落的系统发育多样性
输入
phylocomcomdist>计算群落两两之间系统发育距离
参考资料: