生物信息学作业实验53.docx
《生物信息学作业实验53.docx》由会员分享,可在线阅读,更多相关《生物信息学作业实验53.docx(13页珍藏版)》请在冰豆网上搜索。
生物信息学作业实验53
广州大学学生实验报告
开课学院及实验室:
生命科学学院计机楼4072013年11月29日
学院
生命科学学院
年级、专业、班
生物工程
姓名
学号
10142000
实验课程名称
生物信息学
成绩
实验项目名称
实验5-3多重序列比对及系统发生树的构建
指导教师
一、实验目的
1、熟悉构建分子系统发生树的基本过程,获得使用不同建树方法、建树材料和建树参数对建树结果影响的正确认识;
2、掌握使用Clustalx进行序列多重比对的操作方法;
3、掌握使用Phylip软件构建系统发生树的操作方法。
二、实验内容
1、采用以上例子给出的DNA序列进行系统发育树的构建结果。
(包括序列比对结果及最终生成的树)
2、以下给出的是蛋白质序列,使用以上方法构建系统发育树。
(包括序列比对结果及最终生成的树)
>RAT
MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNNPKGMIPLKGSTLTSPCQDFGKRMFVLK
ITTTKQQDHFFQAAYLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDPEKGI
>HUMAN
MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK
ITTTKQQDHFFQAAFLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDTEKGI
>CANFA
MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK
ITTTKQQDHFFQAAFLEERDSWVRDTKKAIKCIEGGQKFARKSTRRSIRLPETVDLGALYLSMKDIEKGI
>MOUSE
MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVLK
ITTTKQQDHFFQAAFLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDPEKGI
>Canis
MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK
ITTTKQQDHFFQAAFLEERDSWVRDTKKAIKCIEGGQKFARKSTRRSIRLPETVDLGALYLSMKDIEKGI
>Gallusgallus
MEREPMRIREGYLVKKGSMFNTWKPMWVVLLEDGIEFYKRKSDNSPKGMIPLKGSTINSPCQDFGKRMFV
FKLTAAKQQDHFFQASYLEERDAWVRDIKKAIQCIDGGQRFARKSTRKSIRLPETINLSALYLSMKDPEK
>Daniorerio
MEPTTIREGYLVKKGTVLNSWKAVWVVLKDDAIEFFKKKTDRNAKGMIPLKGATLTSPCQDFSKRALVFK
VSTAKNQDHYFQATHLEEREHWVKDIRRAITCLQGGKKFARKSTRRSIRLPESVNLSELYVCMKDPDRGV
>chimpanzee
MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK
ITTTKQQDHFFQAAFLEERDAWVRDMKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDTEKGI
3、以上构建系统进化树的方法为N-J法,请总结采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。
三、实验步骤
1、DNA序列进行系统发育树的构建结果
图中的8和50分别表示8个序列和每个序列有50个碱基。
2、用PHYLIP软件推导进化树
1、进入EXE文件夹,点击SEQBOOT程序输入test.phy文件名,回车。
图中的D、J、R、I、O、1、2代表可选择的选项,键入这些字母,程序的条件就会发生改变。
D选项无须改变。
J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。
文章上面提到用Bootstraping法对进化树进行评估,所谓Bootstraping法就是从整个序列的碱基(氨基酸)中任意选取一半,剩下的一半序列随机补齐组成一个新的序列。
这样,一个序列就可以变成了许多序列。
一个多序列组也就可以变成许多个多序列组。
根据某种算法(最大简约性法、最大可能性法、除权配对法或邻位相连法)每个多序列组都可以生成一个进化树。
将生成的许多进化树进行比较,按照多数规则(majority-rule)我们就会得到一个最“逼真”的进化树。
Jackknife则是另外一种随机选取序列的方法。
它与Bootstrap法的区别是不将剩下的一半序列补齐,只生成一个缩短了一半的新序列。
Permute是另外一种取样方法,其目的与Bootstrap和Jackknife法不同,这里不再介绍。
R选项让使用者输入replicate的数目。
所谓replicate就是用Bootstrap法生成的一个多序列组。
根据多序列中所含的序列的数目的不同可以选取不同的replicate,此处选200,输入Y确认参数并在Randomnumberseed(mustbeodd)?
的下面输入一个奇数(比如3)。
当我们设置好条件后按回车,程序开始运行,并在EXE文件夹中产生一个文件outfile,Outfile用记事本打开如下:
这个文件包括了200个replicate。
2、文件outfile改为infile。
点击DNADIST程序。
选项M是输入刚才设置的replicate的数目,输入D选择datasets,输入200。
设置好条件后,输入Y确认参数。
程序开始运行,并在EXE文件夹中产生outfile,部分内容如下:
3、EXE文件夹中选择通过距离矩阵推测进化树的算法,点击NEIGHBOR程序。
输入M更改参数。
输入200。
输入奇数种子3。
输Y确认参数。
程序开始运行,并在EXE文件夹中产生outfile和outtree两个结果输出。
outtree文件是一个树文件,可以用treeview等软件打开。
outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用记事本直接打开。
部分内容如下:
4、将EXE文件夹中原有的outfile改为其他名,新生成的的outfile和outtree文件名改为infile、intree。
点击CONSENSE程序。
输入Y确认设置。
EXE文件夹中新生成outfile和outtree。
Outfile文件用记事本打开,内容如下:
5、将EXE文件夹中原有的outfile和outtree改为其他名,新生成的outfile和outtree改为infile和intree。
点击DRAWTREE程序,输入font1文件名,作为参数。
输Y确认参数。
程序开始运行,并出现TreePreview图。
6、点击DRAWGRAM程序,输入font1文件名,作为参数。
输Y确认参数。
程序开始运行,并出现TreePreview图。
1以FASTA格式准备8个蛋白质序列test.seq(或txt)文件。
2、双击进入CLUSTALX程序,点FILE进入LOADSEQUENCE,打开test.seq(或txt)文件。
点ALIGNMENT,在默认alignmentparameters下,点击DocompleteAlignment。
在新出现的窗口中点击ALIGN进行比对,这时输出两个文件(默认输出文件格式为Clustal格式):
比对文件test.aln和向导树文件test.dnd。
3、点FILE进入Savesequenceas,在format框中选PHYLIP,文件在PHYLIP软件目录下以test.phy存在,点击OK。
将PHYLIP软件目录下的test.phy文件拷贝到EXE文件夹中。
用计事本方式打开的test.phy文件的部分序列如下:
二、用PHYLIP软件推导进化树。
1、进入EXE文件夹,点击SEQBOOT程序输入test.phy文件名,回车。
依次输入r200y3
2、文件outfile改为infile。
点击protdist程序。
选项M是输入刚才设置的replicate的数目,输入D选择datasets,输入200。
设置好条件后,输入Y确认参数。
程序开始运行,并在EXE文件夹中产生outfile
3将outfile文件名改为infile,为避免与原先infile文件重复,将原先文件名改为infile1。
EXE文件夹中选择通过距离矩阵推测进化树的算法,点击NEIGHBOR程序。
输入M更改参数。
输入200。
输入奇数种子3。
输Y确认参数。
程序开始运行,并在EXE文件夹中产生outfile和outtree两个结果输出。
outtree文件是一个树文件,可以用treeview等软件打开。
outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用记事本直接打开。
部分内容如下:
4、将EXE文件夹中原有的outfile改为其他名,新生成的的outfile和outtree文件名改为infile、intree。
点击CONSENSE程序。
输入Y确认设置。
EXE文件夹中新生成outfile和outtree。
Outfile文件用记事本打开,内容如下:
5、将EXE文件夹中原有的outfile和outtree改为其他名,新生成的outfile和outtree改为infile和intree。
点击DRAWTREE程序,输入font1文件名,作为参数。
输Y确认参数。
程序开始运行,并出现TreePreview图。
6、点击DRAWGRAM程序,输入font1文件名,作为参数。
输Y确认参数。
程序开始运行,并出现TreePreview图。
3,采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。
DNA采用的是这个exe
而蛋白质的构建采用的是这一个
____________________________________________________________________________________________________________________________________