ImageVerifierCode 换一换
格式:DOCX , 页数:18 ,大小:2.01MB ,
资源ID:11606968      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/11606968.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(《生物信息学》课程期末报告.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

《生物信息学》课程期末报告.docx

1、生物信息学课程期末报告兰 州 理 工 大 学生物信息学课程期末报告姓名:XX 学号:XXXXXXXX班级:一班专业:生物工程2014年12月15日1 描述NCBI或ExPASy主页结构和主要内容答:首先,输入网址http:/www.ncbi.nlm.nih.gov/,进入NCBI主页,其主页面如下图所示。 本文将从以下两个方面介绍NCBI:About the NCBI(关于NCBI)、Resources(资源)及部分常用数据库的简单介绍。1.About the NCBI(关于NCBI)使用NCBI查找需要的信息之前,我们不妨先了解一下NCBI。点击位于主页中央的“About the NCBI”

2、选项(即“Welcome to NCBI”下方),可以进入一个新页面如下图所示,其主要包含NCBI at a Glance、Databases and Tools、Outreach and Education和News四部分内容。NCBI at a Glance(NCBI概览)为我们提供了以下五个方面的信息以便我们更好了解NCBI:Our Mission(任务)-知道NCBI是如何促进NIH完成“揭示新知识”的目标;Programs and Activities(项目和活动)-了解NCBI的基本研究项目和由他们发展和传播的软件及工具;Organizational Structure(建制)-清

3、楚组成NCBI的各个分部及其功能;Researchers at NCBI(NCBI的研究者)-了解NCBI的研究者所做的基础研究;Contact Information(联系方式)-可以直接咨询的地方。Databases and Tools(数据库和工具)为我们汇总了NCBI中所有的资源,也即主页中点击“All Resourcrs”打开后的页面。Outreach and Education(宣传和教育)中提供各种教育资源,包括教程,习题集,在线工具,常见问题解答和文档,与Databases中的“NCBI Education Page”指向同一页面。News会更新有关NCBI的各种消息,部分内容

4、会以时间顺序展示在主页的右下方的“NCBI Announcements(公告)”一栏中。2.Resources(资源)NCBI提供的各种资源可以说是组成NCBI的主体部分,访问者可以利用这些资源查询或获取所需要的有用的信息。最简单的查询方式是在首页上方的查询栏里输入关键词,在左边下拉选项中选中合适的数据库,再点击“search”即可。或者先进入合适的数据库和工具页面后再查询。如何在主页上找到合适的资源?方法有三种。第一种是点击主页右边第二行的“Resources List(A-Z)”则进入站点地图,所有资源以字母排列顺序汇总于此,通过名称找到所需要的资源。第二种是点击“All Resource

5、s”,这里是将所有资源分成Databases(数据库)、Downloads(下载)、Submissions(上传)、Tools(工具)等不同功能类型便于查找,如下图所示。第三种方法中,资源根据内容不同被划分成十四类,即主页左边浅蓝色方框的后十四栏:Chemicals & Bioassay(化学与生物测定)、Data & Software(数据及应用软件)、DNA & RNA(DNA和RNA)、Domains & Structures(结构域和三维结构)、Genes & Expression(基因和表达)、Genetics & Medicine(遗传学与医学)、Genomes & Maps(基因

6、组和遗传图谱)、Homology(同源性)、Literature(文献)、Proteins(蛋白质)、Sequence Analysis(序列分析)、Taxonomy(分类)、Training & Tutorials(培训教程)、Variation(变异)。我们可以通过需要查询的内容不同在这十四个分类中更快地找到合适的资源。而且每个分类下同样有Databases、Downloads、Submissions、Tools四种小类型。另外,在右边还将展示该分类中常用的Quick Links(快速链接),类似于主页中的Popular Resources(热门资源)的作用,将使用频率较高的资源单独列出,

7、减少繁琐的查找步骤,节约时间。另外,值得一提的是,所有资源都会有附有“how to”或者各种“Help Manual”帮助我们学习使用NCBI来完成特定的任务,Training & Tutorials即是汇总了所有这类帮助的资源,甚至可以在这里找到视频教程。3.部分常用数据库的简单介绍GenBank:一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。访问GenBank 通过Entrez Nucleotides来查询。用accession number,作者姓名

8、,物种,基因/蛋白名字,还有许多其他的文本术语来查询。用BLAST来在GenBank和其他数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。MMDB(分子模型数据库): 一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。MMDB是来源于Brookhaven蛋白数据库(PDB)三维结构的一部分,排除了那些理论模型。MMDB重新组织和验证了这些信息,从而保证在化学和大分子三维结构之间的交叉参考。数据的说明书包括生物多聚体的空间结构,这个分子在化学上是

9、如何组织的,以及联系两者的一套指针。利用将化学,序列,和结构信息整合在一起,MMDB计划成为基于结构的同源模型化和蛋白结构预测的资源服务。PubMed :一个关于生物医药科学的检索系统,包括引用,摘要,和杂志的索引术语。它包括直接由出版商提供给NCBI的文献引用以及链接到在出版商网址上的全文的URLs。PubMed包括MEDLINE和PREMEDLINE的完整内容。它还包括一些被MEDLINE认为超出范围的文章和杂志,(这些文章或杂志)由于内容或在某一时期不在索引范围内。因此PubMed是比MEDLINE的更大的集合。 Entrez:对GenBank, EMBL, DDBJ, PIR-Inte

10、rnational, PRF, Swiss-Prot, and PDB数据库中的核酸和蛋白,包括了来自70000个物种的序列序列数据提供整合的访问,同时提供对3D蛋白结构,基因组图谱信息和PubMed MEDLINE的访问。Entrez包含了对每个数据库记录的预先计算好的相似搜索,产生一个相关序列,结构,和MEDLINE记录的表。Entrez可以用很广泛的文本方式来搜索,比如作者名字,杂志名字,基因或蛋白名字,物种,唯一的标号(如:accession number,序列ID,PubMed ID,MEDLINE UID),和其他的术语,根据被搜索的数据库来确定。使用新的Linkout服务,外部资

11、源可以被链接到Entrez纪录。BLAST:一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST能够在小于15秒的时间内对整个DNA数据库执行序列搜索。2 Search the human preproinsulin sequence from the NCBI databases.Describe your searching process and results.答:打开NCBI主页在“nucleotide”数据库中输入“preproinsulin”点击“search”,在右边分类中选择“homo sapiens”缩小范围,共得到28个结果,如下图,并选择第1

12、个打开。点开第一条,可以在GenBank中得到一些基本信息如下图:将数据库信息下载并用snapgene打开后可以更直观的对其序列进行分析,如下图:同时,我们还可以获得其他很有价值的信息,比如下图显示的都是关于研究人类胰岛素的比较新的成果,但两者的所给出的DNA长度有显著差异。然后找到它们(包括前面找到的第一条信息)能够翻译成preproinsulin的区域进行对比,部分结果如下图所示:由此可见,它们这一段区域几乎是相同的,所以虽然信息来源不同,侧重点不同,因此不可避免的所展示的部分也有差别,可是核心序列仍然是一致的。除此之外,我们还能在NCBI中找到关于人类preproinsulin的mRNA

13、及蛋白质序列信息,如下图:总结:前胰岛素原在人胰腺细胞内质网合成,含有信号肽(24AA)、A链(21AA)、C链(35AA)和B链(30AA)。前胰岛素原在胰岛细胞高尔基体中脱去信号肽,形成含86个氨基酸残基的胰岛素原,经蛋白酶将C链水解,A,B链由2个二硫键相连成为有生物活性的胰岛素(A链本身还有一个链内二硫键)。3.将人,猪,牛,狗,鼠,羊,马,兔的前胰岛素原氨基酸序列制成进化树。答:在NCBI中找到人类的propreinsulin的蛋白质序列后,点击右边的“run blast”进行操作。 进入新页面后选择需要的物种序列进行下载,如下图:下载后保存为FASTA格式或者TXT格式。首先使用C

14、LC DNA workbench6.6软件进行建树,将每个序列输入并保存,然后右击选择先对比(要保存)再建树,如下图操作:得到对比结果如下图:得到NJ树如下图所示:可以从CLC DNAworkbench建构的NJ树中看到,人类和灵长类哺乳动物(大猩猩、食蟹猴)的前胰岛素原的氨基酸序列极为相似。但如果使用mega6.6同样构造NJ树,过程如下:(先对比再建树)系统进化树的测试方法TestofPhylogeny,通常要选择Bootstrapmethod,也可以选择不进行测试;重复次数No.ofbootstrapReplications通常设定500或1000,其中“testofphylogeny”

15、即测试系统选择“Bootstrapmethod”即自展值,是用来检验你所计算的进化树分支可信度的。简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如果没出现就给0分,这样经过你给定的repetitions次(至少1000次)重排构树打分后,每个分枝就都得出分值,计算机会给你换算成bootstrap值。得到NJ树如下图:用mega6.6尝试做MP树,但耗时较长,得到结果如下:对于以上进化树节点的数值代表可信度,即那些数值bootstrap值,代表物种(属)之间的种属相似度,数值越大,亲缘关系越近,枝长代表遗传距离。一

16、般通过NJ构建进化树,并且进行Bootstrap分析所得到的结果已足够。如果序列近缘,可以再使用MP构建进化树,进行比较。使用两种方法得到的树,如果差别不大,并且Bootstrap总体较高,则得到的进化树较为可靠。结论:从三个进化树结果来看,与人类前胰岛素原蛋白质序列较相似,亲缘关系较近的是灵长类哺乳动物。但bootstrap值有半数左右小于70,可信度并不非常高,且三个树相似度同样不非常高。原因可能是建树的方法或者参数不合适,也可能是在blast过程中选择了同源性不高的序列进行对比建树。更重要的是需要加深对进化树的理论知识的了解,才能把握构造进化树的方法。4 Searching struct

17、ure of human preproinsulin position of -s-s- 。答:打开NCBI主页在“structure”中输入“preproinsulin”,得到四个结果,但都不符合所需的人类前胰岛素原结构。因此以“insulin human”为关键词继续查找。 选择第12个“人类胰岛素的单斜晶体形式(Insulin, Monoclinic Crystal FormHormone)” ,打开页面如下:从右上角可以获知该结构的基本信息,左边是参考文献。点击图形右边的“view structure”可下载3D图形,如下图则分别是胰岛素六聚体和单体三维图:还可以从右上角点击进入PDB数据库在线或者下载查看蛋白质的三维结构图:结论:A链第7个半胱氨酸(Cys)与B链第7个Cys,A链第20个Cys与B链第19个Cys中的巯基形成链间二硫键。另外,A链的第6个Cys和A链第11个Cys的巯基形成链内的二硫键。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1