生物信息学教程.docx

上传人:b****5 文档编号:7687358 上传时间:2023-01-25 格式:DOCX 页数:11 大小:607.77KB
下载 相关 举报
生物信息学教程.docx_第1页
第1页 / 共11页
生物信息学教程.docx_第2页
第2页 / 共11页
生物信息学教程.docx_第3页
第3页 / 共11页
生物信息学教程.docx_第4页
第4页 / 共11页
生物信息学教程.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

生物信息学教程.docx

《生物信息学教程.docx》由会员分享,可在线阅读,更多相关《生物信息学教程.docx(11页珍藏版)》请在冰豆网上搜索。

生物信息学教程.docx

生物信息学教程

生物信息学(在对网页进行COPY时,先将要COPY内容COPY到记事本上,再COPY到WORD上,能减少等待的时间。

3、利用NeedlemanWunsch动态规划算法,为两条核酸序列建立全局比对打分,打分参数如下:

匹配得分=+2,失配得分=-1,空位罚分=-2。

这两条序列一条7个核苷酸,一条5个,两条序列的第1、2及最后一个核苷酸相同,其余任意。

写出两序列间的一个最优全局比对(20分)。

解法:

方法原理可参见课本P43~45.

首先绘制表格,对0行0列赋值,如下:

(已好赋值)

——

X

X

X

X

X

X

X

——

0

-2

-4

-6

-8

-10

-12

-14

X

-2

X

-4

X

-6

X

-8

X

-10

X为核酸残基

然后设定两条序列(注意题目要求),接着按照下面的关系去填充空格

1)若是A-A,则让所要填充空格的左斜上角的数加+2,所得数填到空格里。

C-C(这种情况是匹配)

G-G

T-T

2若是A-C,则让所要填充空格上面一格数加-2,所要填充空格下面一格数加-2,两数作比A-G较,取最大值数填充到空格里。

(这种情况是空位)

T-C

T-G

 

3)若是A-T,则属于可以采用错配和空位打分,即是所要填充空格的左斜上角数-1,

所要填充空格上面一格数加-2,所要填充空格下面一格数加-2,所得三个数字作比较,取最大值填充到空格里。

C-G(这种情况是错配和空位)

 

最后回溯,用箭头标志出所填空格数字的途径,选出最优路径,列出最优全局比对。

 

2、用PubMed搜索出与食用菌(mushroom,orediblefungi)多糖(polysaccharide)抗氧化相关的文章至少10篇,列出题目、作者、文献出处等相关信息(20分)。

解法:

打开这个网站:

http:

//www.ncbi.nlm.nih.gov/sites/entrez?

db=pubmed

在Search一栏输入

((XXXX)ANDXXXX)ANDXXXX

其中XXXX为你所要搜索的关键词

等待结果(最好选取含有关键词的论文题目)

最后直接COPY(不用打开每一篇文章)

例如以下这个:

其中第一行就是论文题目,第二行就是相关作者,第三行就是文献出处。

 

1、到蛋白质序列数据库中查询一条杆状病毒(Baculovirus)DNA聚合酶(DNApolymerase)的完整序列,写出序列名称、登录号及来源物种的分类情况,然后用Blast(注意:

写出所用程序及所搜索的数据库名称)搜索到数据库中和它相似程度较高的10条序列(写出这些序列的名称和登陆号及来源物种的分类情况。

要求至少包括3-4个属,每个属中选择1-2个种),对这10条序列进行多序列比对后(写出比对所用程序及比对结果),使用phylip软件,用距离法对它们进行分子进化分析(包括对进化树进行统计评估),说明这种蛋白质的进化历程(60分)。

解法:

打开网站http:

//www.ncbi.nlm.nih.gov/protein/

在Search一栏输入:

BaculovirusDNApolymerase

等待结果出来

现就第一条序列说明,点击打开

序列名称就是:

DNApolymerase[Orgyiapseudotsugatasinglecapsidnuclopolyhedrovirus]

登陆号就是LOCUS后面的字母与数字:

AAB04046

来源物种的分类情况就是ORGANISM后面的英文:

Orgyiapseudotsugatasinglecapsidnuclopolyhedrovirus

Viruses;dsDNAviruses,noRNAstage;Baculoviridae;

Alphabaculovirus.

(其中最后一个英文单词是物种分类中的属,而序列名称就是物种分类中的种)

然后使用BLAST,即点击页面右边的RUNBLAST,等待。

进入页面

其中在Database中可以选择所要搜索的数据库有nr、refseq等等,而所用程序则在页面最上面的blastp、blastx等等中选择。

选择好之后,点击页面最下面的BLAST。

等待结果。

然后从上面选取10条序列,注意要选择至少包括3-4个属,每个属中选择1-2个种,因此需要打开序列来查看每条序列的生物地位。

每条序列打开后,需要获取它们的FASTA格式的序列来分析。

 

序列的获取可按下面步骤来

点击在序列名称下面的FASTA,然后就会出现如下图

点击右上角的Sendto,再点击File,最后点击CreateFile,就会下载FASTA格式的序列下来的了,用记事本格式可以打开来。

将10条所选取序列都下载下来,将10条序列的全部内容都复制在同一个记事本里。

如下:

(下图仅有两条序列)

然后保存。

接着使用clustalx软件来作多序列比对

1)输入序列,就是那记事本里的10条序列(注意打开时要输入文档的名字)

2)开始序列比对

3)比对完成后,选择保存结果文件的格式,这里选择PHYLIP格式。

(注意文件放置的位置)

4)最后可以用treev32(注意要先安装程序),打开dnd文件,可以看到如下图的对比结果。

 

最后就是使用phylip软件,注意使用之前要将刚所得的PHY格式的文件放入到系X:

\XXXX\XXXX\phylip-3.69\phylip-3.69\exe文件夹里面,并改名为1(方便以后的操作)

以下方法为参照《坑人的生物信息学修正版》一文,特此感谢原文作者,哈哈。

———————————————————————————————————————

运行phylip-3.69\phylip-3.69\exe里的

输入你刚才生成的phy文件的全名,回车。

按y就可以了

随便输一个奇数,小一点的,再回车

再按回车,就会在exe文件夹生成一个outfile的文件

帮它改个名吧,我这里改为2,不改名的自重

运行

输入刚生成的文件的名字

按m回车

按D回车

输入100,回车

按y,回车,静心等待

,按回车,生成一个outfile的文件,帮它改个名吧,我这里改为3

运行

,输入刚刚生成的文件的名字,如下图,回车

按m回车

输入100,回车

随便输一个奇数,小一点的,再回车

按y,回车

再按回车,生成一个outfile的文件和一个outtree文件,改名不解释,我这里树为4,outfile为5,4就是画出来的树

打开

,输入树的名字,回车

按y,回车,

再按回车,生成一个outfile的文件和一个outtree文件。

Outtree就是优化分析后得出的树

———————————————————————————————————————

最后用treev32打开Outtree文件查看,可以得到最优树。

在treev32软件上端的

点击Tree中的Showinternaledgelabels可以显示每棵进化树分支上的数字。

分析:

节点的数值代表可信度,枝长代表遗传距离

进化树给出分支层次或拓扑图形,它是产生新的基因复制或享有共同祖先的生物体的歧异点的一种反映,树枝的长度反映当这些事件发生时就存在的蛋白质与现在的蛋白质之间的进化距离。

从这些角度着手,更多的需要自行摸索了。

 

以上教程有不对地方,请指正,哈哈。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 电子电路

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1