生物信息学作业实验53.docx

上传人:b****7 文档编号:10832223 上传时间:2023-02-23 格式:DOCX 页数:13 大小:583.63KB
下载 相关 举报
生物信息学作业实验53.docx_第1页
第1页 / 共13页
生物信息学作业实验53.docx_第2页
第2页 / 共13页
生物信息学作业实验53.docx_第3页
第3页 / 共13页
生物信息学作业实验53.docx_第4页
第4页 / 共13页
生物信息学作业实验53.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

生物信息学作业实验53.docx

《生物信息学作业实验53.docx》由会员分享,可在线阅读,更多相关《生物信息学作业实验53.docx(13页珍藏版)》请在冰豆网上搜索。

生物信息学作业实验53.docx

生物信息学作业实验53

广州大学学生实验报告

开课学院及实验室:

生命科学学院计机楼4072013年11月29日

学院

生命科学学院

年级、专业、班

生物工程

姓名

学号

10142000

实验课程名称

生物信息学 

成绩

 

实验项目名称

 实验5-3多重序列比对及系统发生树的构建

指导教师

 

一、实验目的

1、熟悉构建分子系统发生树的基本过程,获得使用不同建树方法、建树材料和建树参数对建树结果影响的正确认识;

2、掌握使用Clustalx进行序列多重比对的操作方法;

3、掌握使用Phylip软件构建系统发生树的操作方法。

二、实验内容

1、采用以上例子给出的DNA序列进行系统发育树的构建结果。

(包括序列比对结果及最终生成的树)

2、以下给出的是蛋白质序列,使用以上方法构建系统发育树。

(包括序列比对结果及最终生成的树)

>RAT

MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNNPKGMIPLKGSTLTSPCQDFGKRMFVLK

ITTTKQQDHFFQAAYLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDPEKGI

>HUMAN

MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK

ITTTKQQDHFFQAAFLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDTEKGI

>CANFA

MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK

ITTTKQQDHFFQAAFLEERDSWVRDTKKAIKCIEGGQKFARKSTRRSIRLPETVDLGALYLSMKDIEKGI

>MOUSE

MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVLK

ITTTKQQDHFFQAAFLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDPEKGI

>Canis

MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK

ITTTKQQDHFFQAAFLEERDSWVRDTKKAIKCIEGGQKFARKSTRRSIRLPETVDLGALYLSMKDIEKGI

>Gallusgallus

MEREPMRIREGYLVKKGSMFNTWKPMWVVLLEDGIEFYKRKSDNSPKGMIPLKGSTINSPCQDFGKRMFV

FKLTAAKQQDHFFQASYLEERDAWVRDIKKAIQCIDGGQRFARKSTRKSIRLPETINLSALYLSMKDPEK

>Daniorerio

MEPTTIREGYLVKKGTVLNSWKAVWVVLKDDAIEFFKKKTDRNAKGMIPLKGATLTSPCQDFSKRALVFK

VSTAKNQDHYFQATHLEEREHWVKDIRRAITCLQGGKKFARKSTRRSIRLPESVNLSELYVCMKDPDRGV

>chimpanzee

MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK

ITTTKQQDHFFQAAFLEERDAWVRDMKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDTEKGI

3、以上构建系统进化树的方法为N-J法,请总结采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。

三、实验步骤

1、DNA序列进行系统发育树的构建结果

图中的8和50分别表示8个序列和每个序列有50个碱基。

2、用PHYLIP软件推导进化树

1、进入EXE文件夹,点击SEQBOOT程序输入test.phy文件名,回车。

图中的D、J、R、I、O、1、2代表可选择的选项,键入这些字母,程序的条件就会发生改变。

D选项无须改变。

J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。

文章上面提到用Bootstraping法对进化树进行评估,所谓Bootstraping法就是从整个序列的碱基(氨基酸)中任意选取一半,剩下的一半序列随机补齐组成一个新的序列。

这样,一个序列就可以变成了许多序列。

一个多序列组也就可以变成许多个多序列组。

根据某种算法(最大简约性法、最大可能性法、除权配对法或邻位相连法)每个多序列组都可以生成一个进化树。

将生成的许多进化树进行比较,按照多数规则(majority-rule)我们就会得到一个最“逼真”的进化树。

Jackknife则是另外一种随机选取序列的方法。

它与Bootstrap法的区别是不将剩下的一半序列补齐,只生成一个缩短了一半的新序列。

Permute是另外一种取样方法,其目的与Bootstrap和Jackknife法不同,这里不再介绍。

R选项让使用者输入replicate的数目。

所谓replicate就是用Bootstrap法生成的一个多序列组。

根据多序列中所含的序列的数目的不同可以选取不同的replicate,此处选200,输入Y确认参数并在Randomnumberseed(mustbeodd)?

的下面输入一个奇数(比如3)。

当我们设置好条件后按回车,程序开始运行,并在EXE文件夹中产生一个文件outfile,Outfile用记事本打开如下:

这个文件包括了200个replicate。

2、文件outfile改为infile。

点击DNADIST程序。

选项M是输入刚才设置的replicate的数目,输入D选择datasets,输入200。

设置好条件后,输入Y确认参数。

程序开始运行,并在EXE文件夹中产生outfile,部分内容如下:

3、EXE文件夹中选择通过距离矩阵推测进化树的算法,点击NEIGHBOR程序。

输入M更改参数。

输入200。

输入奇数种子3。

输Y确认参数。

程序开始运行,并在EXE文件夹中产生outfile和outtree两个结果输出。

outtree文件是一个树文件,可以用treeview等软件打开。

outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用记事本直接打开。

部分内容如下:

4、将EXE文件夹中原有的outfile改为其他名,新生成的的outfile和outtree文件名改为infile、intree。

点击CONSENSE程序。

输入Y确认设置。

EXE文件夹中新生成outfile和outtree。

Outfile文件用记事本打开,内容如下:

5、将EXE文件夹中原有的outfile和outtree改为其他名,新生成的outfile和outtree改为infile和intree。

点击DRAWTREE程序,输入font1文件名,作为参数。

输Y确认参数。

程序开始运行,并出现TreePreview图。

6、点击DRAWGRAM程序,输入font1文件名,作为参数。

输Y确认参数。

程序开始运行,并出现TreePreview图。

1以FASTA格式准备8个蛋白质序列test.seq(或txt)文件。

2、双击进入CLUSTALX程序,点FILE进入LOADSEQUENCE,打开test.seq(或txt)文件。

点ALIGNMENT,在默认alignmentparameters下,点击DocompleteAlignment。

在新出现的窗口中点击ALIGN进行比对,这时输出两个文件(默认输出文件格式为Clustal格式):

比对文件test.aln和向导树文件test.dnd。

3、点FILE进入Savesequenceas,在format框中选PHYLIP,文件在PHYLIP软件目录下以test.phy存在,点击OK。

将PHYLIP软件目录下的test.phy文件拷贝到EXE文件夹中。

用计事本方式打开的test.phy文件的部分序列如下:

二、用PHYLIP软件推导进化树。

1、进入EXE文件夹,点击SEQBOOT程序输入test.phy文件名,回车。

依次输入r200y3

2、文件outfile改为infile。

点击protdist程序。

选项M是输入刚才设置的replicate的数目,输入D选择datasets,输入200。

 

设置好条件后,输入Y确认参数。

程序开始运行,并在EXE文件夹中产生outfile

3将outfile文件名改为infile,为避免与原先infile文件重复,将原先文件名改为infile1。

EXE文件夹中选择通过距离矩阵推测进化树的算法,点击NEIGHBOR程序。

输入M更改参数。

输入200。

输入奇数种子3。

输Y确认参数。

程序开始运行,并在EXE文件夹中产生outfile和outtree两个结果输出。

outtree文件是一个树文件,可以用treeview等软件打开。

outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用记事本直接打开。

部分内容如下:

 

4、将EXE文件夹中原有的outfile改为其他名,新生成的的outfile和outtree文件名改为infile、intree。

点击CONSENSE程序。

输入Y确认设置。

EXE文件夹中新生成outfile和outtree。

Outfile文件用记事本打开,内容如下:

5、将EXE文件夹中原有的outfile和outtree改为其他名,新生成的outfile和outtree改为infile和intree。

点击DRAWTREE程序,输入font1文件名,作为参数。

输Y确认参数。

程序开始运行,并出现TreePreview图。

6、点击DRAWGRAM程序,输入font1文件名,作为参数。

输Y确认参数。

程序开始运行,并出现TreePreview图。

3,采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。

 

DNA采用的是这个exe

而蛋白质的构建采用的是这一个

 

____________________________________________________________________________________________________________________________________

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 政史地

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1