生物信息学.docx

上传人:b****6 文档编号:4300623 上传时间:2022-11-29 格式:DOCX 页数:12 大小:1.27MB
下载 相关 举报
生物信息学.docx_第1页
第1页 / 共12页
生物信息学.docx_第2页
第2页 / 共12页
生物信息学.docx_第3页
第3页 / 共12页
生物信息学.docx_第4页
第4页 / 共12页
生物信息学.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

生物信息学.docx

《生物信息学.docx》由会员分享,可在线阅读,更多相关《生物信息学.docx(12页珍藏版)》请在冰豆网上搜索。

生物信息学.docx

生物信息学

什么是系统生物学

作为人类基因组计划的发起人之一,美国科学家莱诺伊·胡德(LeroyHood)也是系统生物学的组学(omics)生物技术开创者之一。

依据Hood的定义:

系统生物学是研究生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系的学科。

也就是说,系统生物学不同于以往的实验生物学——仅关心个别的基因和蛋白质,它要研究所有的基因、所有的蛋白质以及组分间的所有相互关系。

系统生物学的主要特征

研究对象:

各种生物分子的整合

研究对象:

各种层次的整合

研究策略:

实验科学与理论科学的整合

系统生物学-研究思路及特点

系统生物学识别目标生物系统中的各种因素,然后构架一个系统模型,在其中赋予这个生物系统能动性。

在此模型中研究细胞、组织、器官和生物体整体水平,研究结构和功能各异的各种分子及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为。

系统生物学最大的特点即整合。

这里的整合主要包括三重含义。

首先,把系统内不同性质的构成要素(DNA、mRNA、蛋白质、生物小分子等)整合在一起进行研究;其次,对于多细胞生物,系统生物学要实现从基因到细胞、到器官、到组织甚至是个体的各个层次的整合。

第三,研究思路和方法的整合。

经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。

而基因组学、蛋白质组学和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。

而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的研究。

基因(Gene):

基因是一段具有特定功能和结构的连续的DNA片断,是编码蛋白质或RNA分子遗传信息的基本遗传单位。

基因组(Genome):

一个生物体、细胞器或病毒的整套基因和染色体组成,即全部基因的总称(包括所有的编码区和非编码区)

基因组学(Genomics):

以基因组分析为手段,对所有基因进行基因组作图、核苷酸序列分析、基因定位、时序表达模式和基因功能分析的一门科学。

功能基因组学

利用结构基因组学提供的信息和产物,通过在基因组系统水平上全面分析基因的功能。

基因功能发现、基因表达分析、突变检测、基因组的表达与调控研究。

单一基因--蛋白质基因组--蛋白质组,系统研究。

对成千上万的基因表达进行分析和比较,从基因组整体水平上对基因的活动规律进行阐述。

一个细胞的转录表达水平能够精确特异地反映类型、发育阶段以及状态。

蛋白质组学:

蛋白质组(Proteome):

一个组织或一个细胞中基因组所表达的全部蛋白质,或在特定条件下,一个细胞内所存在的所有蛋白质

蛋白质组学:

研究细胞内所有蛋白质及其动态变化规律的科学。

功能蛋白质组(FunctionalProteome):

在特定时间、特定环境和实验条件下基因组活跃表达的蛋白质。

功能蛋白质组是总蛋白质组的一部分。

蛋白质组和功能蛋白质组是生命科学的新的研究内容。

功能基因组学研究策略及主要内容

基因的功能主要包括:

生物化学功能,细胞学功能及发育的功能。

目前,基因功能的研究方法主要包括:

新基因的生物信息学分析

体内表达规律分析(转录和翻译水平)、

功能获得(基因转染和转基因)研究、

功能失活(基因沉默和基因敲除)研究、

基因编码产物相互作用蛋白的研究(免疫共沉淀和酵母双杂交)

基因多样性研究(SNPs分析)等。

3.1新基因的生物信息学分析(基因结构及编码产物功能预测)

3.1.2新基因的结构区域预测:

①对编码区进行统计特性分析

②启动子分析 启动子是基因表达所必需的重要序列信号,识别出启动子对认识基因组功能、基因表达调控机制以及人类疾病与启动子多态性或突变有很大的帮助。

③内含子/外显子剪接位点(GT/AG规则)

④翻译起始位点(“Kozak规则”)

⑤翻译终止信号

3.1.3新基因的功能预测:

序列同源比较:

主要方法有同源检索(NCBI数据库的Blastn)和多序列对齐(multiplesequencealignment,MSA)

3.1.4蛋白质结构与功能预测:

从氨基酸组成辨识蛋白质、蛋白质物理性质预测(如等电点、分子量、酶切特性、疏水性等)。

蛋白质结构预测(蛋白质二、三级结构及特殊结构预测)、蛋白质功能的预测(通过相似序列的数据库比对确定功能、确定序列特性、通过序列模体数据库等的比对确定功能)

蛋白质物理性质的预测

蛋白质二级结构的预测

蛋白质三级结构预测

基因芯片制作技术

基因芯片又称DNA芯片(genechip)或DNA微阵列,是将大量DNA片段通过一定方式固定于某种固相载体(如含硅玻片或硅芯片)表面,形成致密、有序的DNA分子点阵。

基因芯片的技术基本原理

基因芯片技术原理即DNA探针与靶基因碱基杂交形成DNA双链或DNA/RNA双链。

其主要内容包括以下四项:

1)DNA芯片制作;

2)样品DNA或RNA的制备,利用常规方法,纯化DNA或RNA待测样品,并用荧光分子予以标记。

3)分子杂交,标记后的样品与芯片上的核酸阵列均经变性后进行杂交;

4)杂交信号检测分析,DNA芯片上的探针与样品DNA杂交后,互补序列之间结合,大量杂交信号被平行采集,通过其聚焦荧光或激光扫描仪,将采集的信号传递至计算机系统进行分析,从而鉴定样品中的基因成分。

蛋白质组学

研究和阐述在不同条件下,蛋白质组中全部蛋白质的结构、性质与功能,影响因素及其相互联系。

生理功能的蛋白质组学(functionalproteomics)

结构蛋白质组学(structuralproteomics)

亚细胞结构的蛋白质组学(subcellularproteomics)

各种疾病的蛋白质组学(diseaseproteomics)

蛋白质组研究中的关键技术

双向凝胶电泳是利用不同蛋白质的物理、化学性质的差异,把复杂蛋白混合物中的蛋白质在二维平面上展开。

质谱分析

蛋白芯片

 

蛋白质结构实验分析主要有三大技术平台

(一)X-衍射蛋白质晶体结构分析

是目前分辨率最高的结构测定方法,高通量晶体结构分析中的几大重要环节是:

数据处理与分析、重原子的定位、密度修饰、分子替换、图形整合、模型加工和确认。

摸索蛋白质结晶条件、快速处理晶体结构数据和减少差错是目前蛋白质晶体结构分析的两大难题或瓶颈。

晶体结构分析的常用软件有SOLVE,RESOLVE等

(二)核磁共振波谱分析

利用核磁共振原理,检测分子质量小于60kμ的蛋白质,通过对其核磁共振谱线特征参数的测定来分析蛋白质的结构与性质,就是将原始资料利用傅里叶变换转换为不同的峰值,然后采集各种不同的峰组成图谱,并利用生物信息学方法筛选出具有特定结构特征的图谱。

常用NMRPipe和SPARKY软件处理这些过程,使用XEASY,DYANA和GARANT等软件分析侧链或骨架结构。

(三)冷冻电镜技术

采用高压快速液氮冷冻方法使样品包埋在玻璃态的水环境中,使我们能够观察到生物大分子在天然状态下的结构;同时冷冻的速度极快,把细胞在其生理活动的某些特定时刻固定下来,显示此时的结构特点,进而可通过不同功能状态的瞬时构象变化来研究生物分子的功能。

冷冻电镜获得的是处于天然状态下未经染色的分子的二维投影像。

将样品进行不同角度的倾斜所获得的数据进行综合分析,并依据样品的不同特性使用不同的重构技术获得分子的结构,在此基础上观察多种成分的图像变化,追踪生物大分子的装配及其动力学过程。

(一)穿线法预测蛋白质高级结构

穿线法是用于检测进化相关的序列和相似的折叠,接受与靶蛋白非常相似的结构。

该方法已相对成熟,进一步的研发主要在结构的优化,使提炼的结构模板更加接近其天然结构。

穿线法是蛋白质结构预测最活跃的领域之一,大量的算法包括序列profile–profilealignments(PPA)、structuralprofilealignments、隐马尔可夫模型,以及其他机器学习算法等。

(二)比较建模法预测蛋白质高级结构

1.比较建模的原理比较建模法又称为同源建模法(Homologymodeling),它是基于进化相关的序列具有相似的三维结构,且进化过程中三维结构比序列保守而利用进化相关的结构模板信息建模。

2.比较建模的基本步骤

①将靶序列作为查询序列来搜索PDB

②将靶序列和模板序列进行序列比对

③以模板结构骨架作为模型,建立靶蛋白质骨架模型

④对侧链建模,包括构建环区(loops)和侧链,优化侧链位置,并从模板结构到靶精炼整个模型

⑤优化和评估产生的模型。

3.比较建模法的局限性

传统的比较建模是通过PSI-BLAST找到已知结构的相关蛋白。

最近如进行profile-profile比较和有效利用结构信息的更加复杂的方法已显著增加了不仅比对的质量而且远程同源(remotehomologue)检测的能力。

因此,比较建模和折叠识别在基于模板的建模方法中的区别现已十分模糊。

开发新的比较建模和折叠识别的算法导致网上各种预测方法的出现,这包括结构预测meta-服务器

4.常用建模服务器和软件简介

蛋白质三维结构预测服务通过因特网对公众免费开放(同源建模):

瑞士生物信息研究所SWISS-MODEL

丹麦技术大学生物序列分析中心CPHmodels

比利时拿摩大学ESyPred3D

英国癌症研究中心3DJigsaw

AccelrysDiscoveryStudio软件

InsightII

FAMS

(三)蛋白质三维结构的从头预测方法

从头预测可以分为两个主要方向:

(1)根据已经预测的二级结构,把可信度较高的二级结构进一步组装,得到最后的蛋白质结构。

(2)不依赖二级结构预测的结果,直接预测三维结构。

(四)蛋白质高级结构的其他预测方法

相似的序列常常意味着相似的结构,这种认识虽然对大多数蛋白确实如此,但自1990年以来,随着结构数据的增加,人们明显地发现:

惊人相似的蛋白折叠不一定来自任何明显相似的序列,许多结构相同的蛋白质,它们的序列并没有相似性。

1960年Perutz等显示,肌红蛋白(myoglobin)和血红蛋白(hemoglobin)这两种最早通过X-射线解析的蛋白尽管其序列不同,但具有相似的结构;Alexander等人发现:

两条序列有88%的序列一致但明显不同的折叠。

最新的研究显示,少至3个氨基酸的突变足以引入根本不同的折叠方法。

折叠识别法包括两步:

①将目的蛋白的序列和已知的折叠结构进行匹配,在已知的结构中找到一个或几个匹配最好的结构模型,作为目的蛋白的预测结构

②基于已有的知识找到最好的模型

基于结构预测蛋白质功能

如蛋白质间序列相似性高于40%,该蛋白质同其相似序列蛋白可能有保守序列发挥的相同生物化学作用;但当序列保守性低于40%时,可从高级结构预测功能。

蛋白质有多个功能域和结构域,从高级结构预测功能实际上是预测蛋白质的每项基本生物化学作用。

一、基于结构分类的蛋白质功能预测

1.基于结构进行蛋白质功能注释的方法是搜索与目标蛋白质结构相似的蛋白质,并将其功能转移给输入目标蛋白质。

2.此过程中需要进行蛋白质的结构比对和判断结构相似程度。

3.可将这种相似性估值转化为序列比对问题,利用序列比对经典算法来解决结构比对问题,如DaliLite,SSM,STRUCTAL,MultiProt和3DCoffee等。

二、基于结构预测蛋白质间相互作用

应用蛋白质的高级结构信息辅助进行相互作用蛋白质预测的策略

1.基于结构的物理对接

2.识别相互作用界面序列特性模式进行预测

1)决策树残基法

2)关联性突变法

3)联用方法

4)人工神经网络学习法

三、其他蛋白质功能预测方法

不同的蛋白质,由于结构不同而执行不同的生物学功能,其特定的空间结构是行使生物功能的基础。

基于结构预测功能联系的方法

1.基于基序的方法

2.基于表面的方法

3.基于学习的方法

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 理化生

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1