生物信息学学习心得文档格式.docx

资源描述

生物信息学学习心得文档格式.docx

《生物信息学学习心得文档格式.docx》由会员分享，可在线阅读，更多相关《生物信息学学习心得文档格式.docx（17页珍藏版）》请在冰豆网上搜索。

生物信息学学习心得文档格式.docx

《生物信息学手册》郝柏林等著，上海科技出版社，XX；

《生物信息学实验指导》胡松年等著，浙江大学出版社，XX。

实验二利用blast进行序列比对

了解blast及其子程序的原理和基本参数，熟练地应用网络平台和linux计算平台进行本地blast序列比对，熟悉blast结果的格式和内容并能描述其主要意义，同时比较网上平台和本地平台的优缺点。

利用实验一下载的核算和蛋白质序列，提交到ncbi或者其他拥有blast运算平台的网页上，观察其基本参数设定库文件类型，并得到计算结果；

同时在本地服务器上学会用formatdb格式化库文件，并输入blast命令进行计算，获得结果文件。

1.向网上blast服务器提交序列，得到匹配结果；

2.本地使用blast，格式化库文件，输入命令行得到匹配结果；

3.对结果文件进行简要描述，阐述生物学意义。

实验报告：

1.阐述blast原理和比对步骤；

2.不同类型blast的结果及其说明；

不同平台运行blast的需求比较。

《生物信息学实验指导》胡松年等著，浙江大学出版社，XX；

。

实验三利用clustalx（w）进行

多序列联配

掌握用clustalx（w）工具及其基本参数，对具有一定同源性和相似性的核酸与蛋白质序列进行联配和聚类分析，由此对这些物种的亲缘关系进行判断，并且对这些序列在分子进化过程中的保守性做出估计。

首先对于输入的每一条序列，两两之间进行联配，总共进行n*（n-1）/2次联配，这一步通过一种快速的近似算法实现，其得分用来计算指导树，系统树图能用于指导后面进行的多序列联配的过程。

系统树图是通过upgma方法计算的。

在系统树图绘制完以后，输入的所有序列按照得分高低被分成n-1个组，然后再对组与组之间进行联配，这一步用myers和miller算法实现。

1.明确软件所支持的输入文件格式，搜集整理出合适的数据；

2.在windows环境运行clustalx，在linux环境运行clustalw；

3.实验结果及分析，用treev32或njplotwin95生成nj聚类图。

1.整理好的符合clustal的序列数据；

2.提交数据网页记录和各步骤记录；

3.提供聚类图和多序列联配图，并说明意义。

实验四ests分析

熟悉使用一系列生物信息学分析工具对测序得到ests序列数据进行聚类处理，由此对获得表达基因的丰度等相关信息，并且对这些表达基因进行功能的初步诠释，为后续实验通过设计race引物获得全长基因，以及进一步的功能注

释和代谢途径分析做好准备。

首先用crossmatch程序去除ests原始序列中的载体成分和引物成分，然后用phrap生成congtig和singlet，用blast程序进一步将有同源性的contig和singlet进行功能聚类，最后通过blast对聚类获得的cluster进行功能注释。

在实验过程中将用到一些本实验室写好的perl程序用于连接各数据库和工具软件。

1.运行codoncodealigner程序，并用它建立工程文件，导入例子文件

夹里面的数据；

练习对序列的各种查看方式。

2.使用codoncodealigner程序里的clipends,trimvector,assemble

等功能，完成序列的剪切、去杂质、组装工作。

1.实验各步骤记录和中间结果文件；

2.举例简要说明结果文件中数据的生物学意义。

《基因表达序列标签（est）数据分析手册》胡松年等著，浙江大学出版社，XX。

实验五利用primerpremier5.0设计

race引物

熟悉pcr引物设计工具primerpremier5.0的一些基本功能，能够根据实验需要选择相应的引物设计方法设计pcr引物。

pcr实验是当代分子生物学的基本实验之一，由于目标序列和实验目的的不同，相应设计引物的要求也不一样。

本实验延续ests分析结果，对于其中需要获得全长的基因进行race引物的设计，及5’和3’race引物，配合接头序列设计单向引物，并模拟练习通过连接获得全长的基因cds序列。

最后设计已知全长基因序列的pcr扩增引物。

1.从网站下载并安装primerpremier5.0；

2.从genbank中任意获取一个dna序列，设计出该序列的合适引物；

1.实验各步骤使用的数据、运算平台、结果文件记录；

2.比较不同引物设计平台和不同pcr实验的差别；

《生物信息学实验指导》胡松年等著，浙江大学出版社，XX;

。

实验八perl程序的安装、编写、调试实验目的：

培养学生能在windows和linux两种平台安装perl解释器、编写perl程序以及debug和运行的能力，熟悉perl语言基本语法，学会熟练编写和运用perl程序进行基础生物信息学研究。

perl语言是一门通用的脚本语言，具有强大的字符串处理功能，是生物信息学研究的强大帮手，学会了perl语言，就能方便地处理生物信息学研究中遇到的各种字符串文本，促进研究的快速进行。

1.下载perl程序在windows和linux下的安装包并进行安装；

2.编写简单的perl程序，并学会debug；

3.编写具有简单功能的碱基处理perl程序。

1.perl解释器安装方法；

2.perl解释器debug方法；

perl语言在生物信息学研究中所起到的积极作用。

《perl编程24学时教程》（美）皮尔斯著王建华等译，机械工业出版社，XX；

《生物信息学实验指导》胡松年等著，浙江大学出版社，XX

第二篇：

生物信息学

生物信息学（bioinformatics）是在生命科学的研究中，以计算机为工具对生物信息进行储存、检索和分析的科学。

它是当今生命科学和自然科学的重大前沿领域之一，同时也将是21世纪自然科学的核心领域之一。

其研究重点主要体现在基因组学（genomics）和蛋白质组学（proteomics）两方面，具体说就是从核酸和蛋白质序列出发，分析序列中表达的结构功能的生物信息。

具体而言，生物信息学作为一门新的学科领域，它是把基因组dna序列信息分析作为源头，在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测，然后依据特定蛋白质的功能进行必要的药物设计。

基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。

从生物信息学研究的具体内容上看，生物信息学应包括这3个主要部分：

（1）新算法和统计学方法研究；

（2）各类数据的分析和解释；

（3）研制有效利用和管理数据新工具。

生物信息学是一门利用计算机技术研究生物系统之规律的学科。

目前的生物信息学基本上只是分子生物学与信息技术（尤其是因特网技术）的结合体。

生物信息学的研究材料和结果就是各种各样的生物学数据，其研究工具是计算机，研究方法包括对生物学数据的搜索（收集和筛选）、处理（编辑、整理、管理和显示）及利用（计算、模拟）。

1990年代以来，伴随着各种基因组测序计划的展开和分子结构测定技术的突破和internet的普及，数以百计的生物学数据库如雨后春笋般迅速出现和成长。

对生物信息学工作者提出了严峻的挑战：

数以亿计的acgt序列中包涵着什么信息？

基因组中的这些信息怎样控制有机体的发育？

基因组本身又是怎样进化的？

生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。

这个难题已困扰理论生物学家达半个多世纪，如今找到问题答案要求正变得日益迫切。

诺贝尔奖获得者w.gilbert在1991年曾经指出：

“传统生物学解决问题的方式是实验的。

现在，基于全部基因都将知晓，并以电子可操作的方式驻留在数据库中，新的生物学研究模式的出发点应是理论的。

一个科学家将从理论推测出发，然后再回到实验中去，追踪或验证这些理论假设”。

生物信息学的主要研究方向：

基因组学-蛋白质组学-系统生物学-比较基因组学，1989年在美国举办生物化学系统论与生物数学的计算机模型国际会议，生物信息学发展到了计算生物学、计算系统生物学的时代。

姑且不去引用生物信息学冗长的定义，以通俗的语言阐述其核心应用即是：

随着包括人类基因组计划在内的生物基因组测序工程的里程碑式的进展，由此产生的包括生物体生老病死的生物数据以前所未有的速度递增，目前已达到每14个月翻一番的速度。

同时随着互联网的普及，数以百计的生物学数据库如雨后春笋般迅速出现和成长。

然而这些仅仅是原始生物信息的获取，是生物信息学产业发展的初组阶段，这一阶段的生物信息学企业大都以出售生物数据库为生。

以人类基因组测序而闻名的塞莱拉公司即是这一阶段的成功代表。

原始的生物信息资源挖掘出来后，生命科学工作者面临着严峻的挑战：

生物信息学产业的高级阶段体现于此，人类从此进入了以生物信息学为中心的后基因组时代。

结合生物信息学的新药创新工程即是这一阶段的典型应用。

第三篇：

刚刚接触生物信息的时候，大家都比较迷茫，我觉得它是一个交叉学科，要想学好得有一定的毅力。

我的导师要求我至少作到以下几个方面：

1，数学基础要好点。

线代，高数，统计等。

2，计算机知识。

windows,linux,unix系统等，各种常用生物软件的使用。

可以自己找来一个个试。

3，matlab里面有的关于生物方面的工具包也很多的。

4，生物知识，不用说的。

其他：

如果要深入的话，最好会编程。

什么java，perl，等。

我是刚开始学。

大家多指教。

导师推荐了好几本书：

《生物信息学概论》"

introductiontobioinformatics"

（英）tkattwood,djparry-smith著罗静初等译北京大学出版社XX年4月第一版本书从生物信息学的研究对象、意义出发，介绍生物信息学研究的基本方法和常用工具。

主要介绍的是核酸和蛋白质序列的计算机分析方法，探讨利用现有的计算机程序，从现有的数据库中能够获取什么、不能够获取什么。

全书共分十章：

1.概论，2.信息网络，3.蛋白质信息资源，4.基因组信息资源，5.dna序列分析，6.双序列比对，7.多序列比对，8.二次数据库搜索，9.数据库搜索实例，10.序列分析软件包。

每章末尾均提供了进一步阅读指南和有关的网址。

这本书的一大特色在于丰富的例子和图表，使读者可以很直观的了解和掌握书中的内容。

此外，书的末尾还附有与生物信息学相关的词汇表。

总的说来，这本书实用性强，可以作为高等院校生物信息学教材，也可以作为生命科学和生物技术各领域分子生物学研究和开发工作者的生物信息学参考书。

《生物信息学手册》郝柏林张淑誉编著上海科学技术出版社XX年10月第一版一本手册式的生物信息学书籍。

除了介绍了生物信息学，还包括了计算机及计算机网络（这一部分提供了一些网址）和分子生物学的知识。

更为重要的是，该书的主要部分?

;

生物信息数据库"

和"

服务、软件和算法"

部分，提供了大量的网址。

几乎是每一个条目下面都有不少网址。

这本书将网络上的生物信息学资源进行了索引式的介绍，并作了必要的说明。

书中列举了近千条网址和引文，基本涵盖了生物学研究的各个方面，堪称生物信息的汪洋大海中的导航图。

对生物信息学的服务、软件和算法，本书也作了较全面的描述。

本书可供广大生命科学工作者以及由物理学、数学和计算机学转入生命科学领域的研究教学人员参阅（上面可以查到很多网址）。

《生物信息学》赵国屏等编著科学出版社XX年4月第一版本书是"

863"

生物高科技丛书之一。

它比较全面地介绍了生物信息学的若干个主要分支，并特别介绍了与人类基因组研究

相关的生物信息学的一些较新成果；

着重介绍了数据库和数据库的查询、序列的同源比较及其在生物进化研究中的应用；

以生物芯片中的生物信息学问题为例，介绍与基因表达相关的生物信息学问题；

还介绍了蛋白质结构研究中的生物信息学问题，以及与分子设计和药物设计相关的生物信息学技术。

本书可供生物信息学专业和生命科学相关专业的本科生、研究生和教学科研人员阅读学习，也可供相关专业的科技和应用机构的科研、管理和决策人员参考。

注意，本书有很大篇幅是讲基因芯片和蛋白质结构预测的。

《生物信息学--基因和蛋白质分析的实用指南》"

bioinformatics--a

practicalguidetotheanalysisofgenesandproteins"

andreasd.baxevanisb.f.francisouellette著李衍达孙之荣等译清华大学出版社XX年8月第一版这本书由前卫计算生物学家撰写，贯穿了已有的工具和数据库，包括应用软件、因特网资源、向数据库提交dna序列以及进行序列分析和利用核酸序列与蛋白质序列进行预测的的方法。

以下是该书的目录：

1.因特网与生物学家，2.genebank序列数据库，3.结构数据库，4.应用gcg进行序列分析，5.生物数据库的信息检索，6.ncbi数据模型，7.序列比对和数据库搜索，

8.多序列比对和实际应用，9.系统发育分析，10.利用核酸序列的预测方法，11.利用蛋白质序列的预测方法，12.鼠类和人类公用物理图谱数据库漫游，13.acedb:

基因组信息数据库，14.提交dna序列数据库。

本书有很多实际的序列和序列分析的例子。

这本书适合高等院校的师生和从事生物工程研究的科技工作者阅读。

在第14章提及的通讯资源：

互联网和通信地址；

电话和传真号码

ddbj/embl和genbank的一般联系信息以及提交dna序列到这些数据库的入口。

ddbj（信息生物学中心，nig）

地址：

ddbj，1111yata，mishima，shiznoka411，japan

传真：

81-559-81-6849

e-mail

提交：

ddbjsub@ddbj.nig.ac.jp

更新：

ddbjupd@ddbj.nig.ac.jp

信息：

ddbj@ddbj.nig.ac.jp

互联网

主页：

webin：

genbank（国家生物技术信息中心，nih）

genbanknationalcenterforbiotechnologyinformation,nationtionallibraryofmedicine,nationalinstitutesofhealth,building38a,room8n805,bethesdamdXX4

电话：

301-496-2475

301-480-9241

gb-sub@ncbi.nlm.nih.gov

est/gss/stsbatch-sub@ncbi.nlm.nih.gov

update@ncbi.nlm.nih.gov

datalib@ebi.ac.uk

bankit:

在dna序列数据库中使用的遗传密码：

ddbj/embl/genbank特征表文档可用方式获得或者从ebi或ncbi的ftp服务器上得到postscript文件。

ftp:

//ncbi.nlm.nih.gov/genbank/docs/ftp:

//ftp.ebi.ac.uk/pub/databases/embl/doc/

embl和genbank数据库的版本信息

emblftp:

//ftp.ebi.ac.uk/pub/databases/embl/release/relnotes.doc

genbankftp:

//ncbi.nlm.nih.gov/genbank/gbrel.txt

sequin:

dna序列数据库的提交和更新工具http:

//.ncbi.nlm.nih.gov/sequin

est,sts和gts主页，获取信息和向这些特定genbank数据库提交序列

esthttp:

//.ncbi.nlm.nih.gov/dbest

stshttp:

//.ncbi.nlm.nih.gov/dbsts

gsshttp:

//.ncbi.nlm.nih.gov/dbgss

htgs主页：

高吞吐量基因组序列资源，工具和信息http:

//.ncbi.nlm.nih.gov/htgs

第四篇：

浅谈对生物信息学的认识

摘要生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学,是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。

经过一学期的学习，我学到了很多很有用的知识，给我印象最深的有序列比对、蛋白质结构分析、核酸序列分析、数据库及数据库检索等内容。

关键字：

生物信息学认识基因组学数据库

时光飞逝，一学期马上就要结束了，本学期的专业选修课也即将结束。

在上课之前，我一直认为生物信息学就是在讲关于人类及动物的基因，以及基因之间的差别。

但是，刚上了几节课，我就发现生物信息学根本不是我想象的那么简单，就这样我怀着对自己的怀疑和对这门课的好奇走进了这门课。

生物信息学是一门新兴的、正在迅速发展的交叉学科,

美国国家基因组研究中心认为,生物信息学是一个代表生物学、数学和计算机的综合力量的新兴学（bioinformaticsisanemergingscientificdisciplinerepresentingthebinedpowerofbiology,mathematics,andputers）。

现代生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的

科学,是现代生命科学与信息科学、计算机科学、数学、统计学、

物理学和化学等学科相互渗透而形成的交叉学科。

在这短短的一学期课中，在老师的带领下，我们学到了很多关

于生物信息学的知识，其中给我印象最深的有序列比对、蛋白质结

构分析、核酸序列分析、数据库及数据库检索等内容。

比如，序列比对，它的基本问题是比较两个或两个以上符号序列

的相似性或不相似性。

从生物学角度来看，它包含很多意义；

如从

相互重叠的序列片段中重构dna的完整序列等。

老师主要给我们介

绍了blast比对。

再如，对蛋白质的分析。

比如我们实验测定了一条蛋白质序列

或者从dna序列翻译得来一条蛋白质序列，我们要借助生物信息学

方法来对它进行基本性质及结构分析。

其中基本性质包括它的分子

量、氨基酸数目、排列顺序、等电点分析等。

结构分析包括跨膜螺

旋分析等。

要运用的工具是protparamtool和tmhmm。

对于这两

个工具我都进行了实际操作练习，我觉得这对我们以后的理论学习

和实验分析都非常重要。

现代生物信息学的主要研究领域及其进展

1、基因组学和蛋白组学研究

基因组和蛋白组研究是生物信息学的主要内容.同样,生物信息

学是基因组和蛋白组研究中必不可少的工具。

基因组学（genomics）和蛋白组学（proteomics）的实质就是分析和解读核酸和蛋白质序列中所表达的结构与功能的生物信息.这方面的研究已成为生物信息学的主要研究内容之一.

一种生物的全部遗传构成被称为该种生物的基因组.有关基因组的研究称为基因组学.其中,序列基因组学（sequencegenomics）主要研究测序和核苷酸序列;

结构基因组学（structuralgenomics）着重于遗传图谱、物理图谱和测序等方面的研究;

功能基因组学

（functionalgenomics）则研究以转录图为基础的基因组表达图谱;

比较基因组学（parativege2nomics）的研究内容包括对不同进化阶段基因组的比较和不同种群和群体基因组的比较。

蛋白组和蛋白组学的概念是随基因组和基因组学的出现而出现的.蛋白组（proteme）的概念是由于基因表达水平并不能代表细胞中活性蛋白质的数量,基因组序列并不能描述活性蛋白质所必需的翻译后修饰和反映蛋白质种类和含量的动态变化过程而提出的.在一定条件下某一基因组蛋白质表达的数量类型称为蛋白组,代表这一有机体全部蛋白质组成及其作用方式.有关蛋白组的研究称为蛋白组学.其中,蛋白组的研究技术与方法、双向凝胶电泳图谱以及对不同条件下蛋白组变化的比较分析是蛋白组学的主要研究内容。

生物信息学在基因组和蛋白组研究中所起的作用主要有:

（1）基因组信息结构的计算分析.即对基因组数据进行大规模并

展开阅读全文