第八章分子文档格式.docx

上传人:b****5 文档编号:19676229 上传时间:2023-01-08 格式:DOCX 页数:14 大小:72.40KB
下载 相关 举报
第八章分子文档格式.docx_第1页
第1页 / 共14页
第八章分子文档格式.docx_第2页
第2页 / 共14页
第八章分子文档格式.docx_第3页
第3页 / 共14页
第八章分子文档格式.docx_第4页
第4页 / 共14页
第八章分子文档格式.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

第八章分子文档格式.docx

《第八章分子文档格式.docx》由会员分享,可在线阅读,更多相关《第八章分子文档格式.docx(14页珍藏版)》请在冰豆网上搜索。

第八章分子文档格式.docx

8.2.1几个易混淆的基本概念

Structure(结构)、build(构造)、configuration(构型)、conformation(构象)。

结构:

是比较广义的术语,构造、构型、构象都可以用来描述分子结构。

构造:

是说明分子中原子的连接性次序和键性(单、双键等)。

构型:

是分子中原子在空间的排列状况。

构象:

则是分子通过单键旋转形成各原子或原子团的空间排列。

因此,构造,构型,构象是在三个不同层次上描述分子的结构。

分子的构象是以构型为前提的。

一种构型对应无数个构象,否则一种构型就是对应一种构象(如乙烯)。

构型有静止的含义,而构象有动感。

几个不同含义构象的概念

活性构象(药效构象):

与受体结合的构象称为活性构象,活性构象不一定是能量最低的构象。

但必定是优势构象或近似的优势构象(低能构象)。

晶体构象:

是分子堆积产生的。

结晶状态代表的是最低能量的分子构象(晶体状态)。

溶液构象:

是溶液中存在的构象,这种构象在溶液中可能存在几个构象之间的平衡,溶剂的极性也会使构象发生变化。

8.2.2构象搜索的方法

构象搜索的方法常用的有:

1、系统搜索方法;

2、模型构型方法;

3、距离几何方法;

4、分子动力学模拟方法;

5、MonteCarlo模拟方法;

6、遗传算法。

下面介绍几种方法

1、系统搜索方法

所谓系统搜索方法:

是系统地搜索整个构象空间,借以寻找能量最小点。

最基本的系统搜索方法是格点搜索,即在构象空间中以小的间隔变量进行逐点搜索,如果变量足够小的话则有可能搜索到全部的可能性。

系统搜索方法的优越性体现在自由度在10—20的分子的构象分析。

为了加快搜索的速率现在提出了不少改进算法,如树状搜索方法、过滤算法等。

下面重点介绍格点搜索和树状搜索方法。

(1)格点搜索方法

格点搜索方法的要素:

(步骤)

(a)固定键长、键角

(b)确定分子中所有旋转键

(c)设定步长

(d)极小化(优化)

为了说明格点搜索的算法,下面举一例说明(P415)

exAladipeptide(丙氨酸二肽)

对完成Alanine二肽的构象空间的一个格点搜索,一系列构象将通过系统地改变

之间产生。

在图8.2中在Ramachandro等值线图上这相当于画一个二维的格点,每一格点相应于一个由格点搜索产生的一个构象。

它能够容易地看到随一些

的结合。

甚至对一个相对大的扭转步长(增量)由格点搜索所产生的大量构象比在表面上产生极小点多得多;

许多初始构象极小化(优化)到同样的极小能结构。

而且许多初始构象在能量上是非常高的。

格点搜索的一个主要缺点(不是)是被产生和优化的结构数随可旋转键的数以一个特别的形式而增加。

如下式所出:

Numberofconformation

(8.1)

是对键

所选的两面角步长,N为旋转键的数。

如N=5,

,构象数为248832。

69hr(1s)

如N=7,

,构象数为36million。

415天

树状搜索广泛用于表示不同的状态,具体的如图8.4所示。

树中包含由边(edges)连结的一些节(nodes)。

每一个边暗示与之相连的两个节的存在;

每一个节代表一个体系可能产生的状态。

图中,具体的术语定义如下:

a.根节(roodnode):

表示体系的初始状态。

b.未端节(terminalnodes):

表示无子代(孩子)的节。

c.目标节(goalnode):

表示一个特殊类型的末端节。

(它对应于一个可接受的解)

假定,我们想利用格点搜索方法来寻找一个简单的烷烃,(如正已烷)的构象空间。

首先我们将设定:

a.未端甲基基团的旋转被忽略,只变化三个旋转键;

同时,b.要求每一可变键产生三个值,即,相应于反式(

)、旁式(+)(+

)和旁式(-)(

)三个低能构象。

然而,搜索的结果得到27个terminalnodes(

),如图8.5中所示。

其中,

rootnode:

表示起始点,没有任何旋转角指配它。

当第一个可旋转键设定第一个可旋转角为

时,相应的rootnode0移到了node1。

当第二个可旋转键设定为

时,相应的rootnode1移到了node4。

当第三个可旋转键设定为

时,node4移到了node13,node13为terminalnode,它将作为进一步极小化的备用构象。

为了进一步产生构象,继续改变三个旋转角中的一个,最方便的方法,就是设定键3为旁式(+)构象(

),它等价于将node13移回到node4,然后再移到terminalnode14。

这样得到第二个完成结束的构象。

用这种方式通过树状搜索的过程(所谓的往返)分子的所有构象都能被产生。

这种搜索算法,就是众所周知的一级深度搜索。

一级深度搜索的有效性,可以通知撤散那些违背或被某些能量和几何标准的结构来提高。

具有高能立体相互作用的结构在能量优化阶段前将被拒绝(排除),这样,在所有旋转角被指定前,通过检查部分限制构象能进一步提高系统搜索的有效性。

譬如,我们产生一部分的结构,它包含一个在空间上很接近的非成键的原子,如图8.6所示。

由图可见,在已烷中,如果在已边远中,如果第一个旋转键设定为旁式(+),即

构象和第二个键设定为旁式(-),即

构象(如图8.6所示的减烷的破坏),那么,一个高能的结构就被产生。

不管什么值指定给第三个旋转角,这样的高能立体障碍将永远存在。

因此,所有处在搜索树node9number9inFig.8.5以下的结构都将被淘汰或者删去。

如果在分子中存在违规(破坏)的这些部分可通过一个随后的扭曲角的指定,使得它相对于其它部分不再移动是可能的,这是很重要的。

环状分子利用系统搜索来分析构象常常是困难。

一般的步骤是:

首先开环,得到一个“伪非环”分子;

然后再作为一个正常的环状分子来处理。

下面以环已烷为例加以说明(如图8.7)

当我们搜索环分子的构象空间时,为了保证环是精确形成的,附加的控制(条件)必须被包括。

例如,正已烷的所有反式结构是一个完全地可接受的构象。

而环已烷不是一个可接受的构象,原因是在环封闭的原子之间不合理的键长。

因此它一般采用(实践)控制若干分子内的参数,当利用系统搜索来寻找环体系的构象空间时;

这些参数通常包括在环封闭的键之间的键长和键角。

(图8.8)。

在某些程序中,其它的内参数也被控制。

(如,扭曲角调整为环封闭的键)。

对系统搜索环为什么出问题有疑问的主要原因是:

a.这些控制常常在构象分析的后期才被应用。

b.在结构被拒绝和接受前,它几乎是一个完整的环。

c.当限制环状分子时一个简单的控制是保证(确保)在每一步上生长链的距离由开始原子足够短到使维持的键能够接近环。

当可旋转键以同方向的方式被加工时,系统搜索是最有效的。

这样保证一旦一个原子相对于已经讨论的原子在空间上被固定,那么它就不再被移动。

对一个环状分子这就意味搜索在分子的一个末端开始并且移向下键。

含有环的分子通过开环的处理,得到像以上描述的伪—环状分子,然后再加工(图8.9)。

任何系统搜索最后(终极地)要求在网格的分辨力和有效的计算机能力(资源)之间得到一个平衡。

太细的一个网格然而搜索可能化费太长时间,太粗的网格,然而重要的极小值可能被错过。

非成键的标准,决定一个结构是否被拒绝,也必须被指定。

非成键的标准,常常被称为一个bumpcheck(碰撞控制)并且通常设置为一个适中的值(2.0Å

),因为能量极小化中,步长将能够排除结构中的次要问题时对环状分子,环封闭的标准也可能性影响结果。

因此也必须记住各种截断(cutoffs)是互相依赖的,所以变化一个可能要求其它的也被指定(改变)。

(2)树状搜索方法

树状搜索方法是让搜索沿着一个方向进行,通过不断分支搜索空间。

具体地就是从肽链的一端出发,首先搜索第一个二面角的优势值,然后在第一个二面角选定某些优势值的基础上搜索第二个二面角,并且依次进行下去,逐渐地走遍整个构象空间。

图8.4示出了树状搜索的示意图。

加新内容

(3)过滤算法

过滤算法是在搜索过程中不断地消除构象空间中的不合理部分,以便尽可能地减少可能性,节省计算时间。

过滤的标准有:

选用合理的初始二面角值,环闭合,跨环距离等等。

加新内容

2、模型搭建的方法

系统搜索方法不能用于包含很多二面角自由度的分子体系,但是在这个方法基础上发展起来的“搭建(build-up)”过程可以在一定程度上打破这个限制。

这个方法假定分子的构象主要依赖于短程作用力,象搭积木似地建造模型。

首先把分子分成小片段,大约2—3个残基为一单位,然后对分子的各个小片段采用系统搜索方法寻找最低能量构象,然后把两个最低能量构象连接起来进行最小化,选择低能量构象再接上第三段,依次进行下去,最后得到整个分子的构象。

为了构象分析而采纳(用)的片段和模块搭建方法,是通过分子片段的三维结构连结在一起而构建一个分子的构象。

这种方法将预期成为比正常系统搜索更加有效,因为片段构象的组合通常比扭曲角值的组合少得多。

尤其对环状的碎片(片段),它在任何情况下对系统搜索方法是有问题的。

例如,在图8.10中的分子能通过所示的分子片段联接在一起而构成。

许多分子模拟体系对由分子碎片构建的结构要求一个简易(轻便),虽然使用者通常必须人工指定被联接的片段且如何使之成为贡献,很清楚,如果每一个片段能产生一个系列构象,那么它对用手(亲自,实际)扭住(执行)是不实际的(不实用的,做不到的),因此,自动方法的手段被要求。

3、距离几何方法

距离几何方法是由Crippen等人发展起来的,其基本思想是从分子中原子间距离入手,构造距离矩阵,通过对距离矩阵的变换和求解,得到分子坐标。

3.1构造距离矩阵

距离矩阵是一个表示各个原子间距离的方阵,对于键合原子而言,其原子间距离即是键长。

对于其它非键合原子间距离,有一定的取值范围。

例如1-3原子间的距离的下值和上值分别是两个键长之差和两个键长之和,这是由三角形的性质决定的。

1-4原子间的距离上值为此四个原子构成的二面角为180°

时,1-4原子间的距离,下值则是二面角为0°

时,1-4原子的距离。

对其它原子对的下值为两个原子的范得华半径之和;

而上值常常取一个较大的数。

3.2构造G矩阵

G矩阵被定义为从原点到原子

的向量的点积,即

矩阵的矩阵元素

可以由距离矩阵通过余弦定理获得:

分别为原子

到原点的距离,

为原子

之间的距离。

如果以质心为坐标原点,那么各原子到原点的距离可以用下式表示:

3.3求解各原子的笛卡尔坐标

首先对G矩阵进行变换:

上式中,

为矩阵的本征值;

为本征向量。

其中X为原子坐标矩阵,

原子的坐标;

为G矩阵中三个最大的本征值,

时的本征向量。

距离几何构象搜索方法是通过下面过程实现的。

随机地改变距离矩阵中原子间的距离(当然要在上值和下值之间),得到一个新的距离距阵,根据距离矩阵构造G矩阵,对G矩阵进行变换得到一组新的原子坐标,然后对此构象进行分子力学优化。

循环此过程,可得到一系列低能构象。

分子动力学方法

分子动力学方法利用牛顿力学基本原理,通过求解运动方程得到体系中所有原子的轨迹,并从轨迹中计算得到各种性质。

对于一个质量为mi的原子,其位置矢量为Xi,该原子在t时刻的加速度为

所以

从上式可见,只要给定原子的初始位置和初始速度,积分上式即可求得原子的运动轨迹。

静态的平衡性质通过平均轨迹而得到,此外还可以获得一些动力学性质,如果将体系保持在一个固定的非平衡状态,还可以获得非平衡性质。

分子动力学方法的威力在于它可以跨过较大的能垒,在温度T时,每一个自由度可跨越kBT的能垒。

因此可以通过升温搜索很大的构象空间。

高温下整体能量和势能波动较大,意味着构象的变化。

当总能量中出现最小点后,系统将在常温(300K)下平衡。

这样便可以获得低能量构象。

分子动力学方法搜索构型空间的缺点是难以产生大的拓扑重排,因此不适于过大的体系。

因为对于大的体系,即使是很小的能垒,跨越的时间也要超出模拟时间。

下面以一个算例来说明分子动力学在多肽构象分析中的应用。

人绒毛膜促性腺激素(称简hCG)是一种有希望的避孕疫苗。

采用动力学方法对与hCG免疫性质有关的三段多肽进行了计算。

选用的三段多肽分别是hCGβ末端(109—145)的三十七肽(简称)CTP),hCGα(46—55)+hCGβ(106—116)的二十一肽(简称P21)以及hCGα(43—49)+hCGβ(110—116)的十四肽(简称P14)。

其中CTP片段是其它糖蛋白激素所没有的,对于研究高度专一性的抗hCG的疫苗具有重要的意义;

P21是很好的hCG的多肽抗原模拟物;

P14的结果恰恰相反。

计算采用CHARMM程序进行。

多肽的初始模型是采用标准的键长和键角数据搭建的,并进行了初步的能量优化。

分子动力学计算中,先对初始模型升温,经3000步(每步0.001ps)升温到300K,在300K、600K和900K各平衡20ps(20000步·

0.001ps)。

然后在900K下进行100ps的模拟(步长为0.001ps)记录下轨迹文件和能量文件,画出能量-时间曲线图。

大约每间隔1ps选择1个能量极小的点,共选择100个点,并对各点所代表的构象进行能量优化。

计算构象之间的最小均方差(RMS)值,根据RMS值的大小做出灰度图。

三段多肽的灰度图分别见图6-4,图6-5,图6-6。

灰度图是一个100·

100的方阵。

由于在动力学模拟中构象是连续产生的,每一个构象都是从前一个构象轻微小的变化而来,因此沿对角线可以画出一个个的方块,每一方块中的构象构成了一个构象家族。

根据构象家族可以对多肽构象进行分类。

从灰度图上可以看出,CTP分成6个构象家族,P21分成13个构象家族,P14分成10个构象家族。

蒙特卡罗方法

蒙特卡罗方法是一种随机模拟方法,有时也称作随机抽样技术或统计试验方法。

1953年Metropolis提出了Metropolis取样法,其基本原理如下:

(1)体系首先有一个起始构象ri,构象发生微小的随机变化产生新的构象ri+1,相应的能量也发生变化,能量变化ΔE=E(ri+1)–E(ri);

(2)当ΔE<0时,接受构象变化并新构象成为下一步的初始构象;

(3)当ΔE>0时,则在(0,1)间选择一个随机数R,将其与P(ΔE)=exp(-ΔE/kBT)相比较,若R<(ΔE)则接受,新的构象成为下一次随机变化的起始点;

否则拒绝变化,老的构象仍是下一次随机变化的起始点。

整个过程将会产生一个波尔兹曼集合。

蒙持卡罗方法的优点是取样的构型恰当,对低能量取样几率大;

缺点是计算量极大。

2.模拟退火方法

模拟退火方法也称作蒙特卡罗退火方法,几率上升方法,统计降温方法或者随机弛豫方法。

模拟退火方法是蒙特卡罗方法的Metropolis采样算法搜集构型空间,但它不同于蒙特卡罗方法之处在于运用体系能量的同时还把温度也作为体系的一个变量。

整个过程分为两个步骤:

第一步,升温熔化体系。

首先在高温下将体系加热熔化。

第二步,逐渐降温。

在任一个温度下,体系的初始构象ri,相应能量为E(ri),构象发生微小的随机变化产生新的构象ri+1,相应的能量为E(ri+1),能量变化为ΔE=E(ri+1)–E(ri)。

当ΔE<0时,接受构象变化;

当ΔE>0时,则在(0,1)间选择一个随机数R,将其与P(ΔE)=exp(-ΔE/kBT)相比较,

若R<P(ΔE)则接受变化,新的构象成为下一次随机变化的起始点;

不断循环往复,便可以模拟出该温度下体系构象的波尔慈曼分布。

在每一温度下都进行这个过程,直至体系温度降到足够低,即体系“冻结”在某个固定的构象上。

模拟退火效率如何取决于一些参数的设置,例如初始温度、降温因子以及随机数种子等,这些参数设定了退火的进程,决定了退火的效益。

模拟退火方法可以有效地寻找分子的优势构象。

通常要进行多次计算,所得到的一批低能量构象或许会收敛于同一构象,或许可以分为几组,但也可能发散,这取决于分子体系本身的性质。

模拟退火方法的优点在于它取舍构象时不仅接受能量下降的变化,同时也接受部分能量上升的变化,因而就有可能跳出局部势阱,寻找到能量最低点。

同时模拟退火方法不依靠于起始构象,这样就消除了凭人的直觉来进行构象分析的缺陷。

下面举一例来说明

强啡肽(1—13)是一个含有13个氨基酸残基的活性肽,共有73个可旋转二面角。

采用模拟退火方法进行计算,结果显示强啡肽(1—13)的柔性很大,这与二维核磁实验的结果一致。

寻找到的优势构象具有连续的转角结构,中间部位似于螺旋结构。

沿着多肽骨架,疏水残基侧链集中在一侧,大多数亲水残基侧链重中的相反的一侧。

残基的这种排列可能有利于它对受体的识别和结合。

3.距离几何方法

距离几何方法也是目前一种通用的算法,它把一系列原子间的距离限制转换为与限制相吻合的原子构型。

在距离几何方法中,分子的结构用成对的原子间距离来描述,用距离矩阵的方法加以表达。

距离矩阵的右上角是原子对距离的上限,左下角是下限。

这样的一个矩阵描述一个带有特定限制的分子的可及构象空间。

距离几何方法计算是在特定限制范围中随机选择原子对间距产生的一系列随机构型,然后再将得到的距离矩阵转化为三维直角空间的结构。

距离几何方法可以有效地产生一系列与原子间距离相兼容的构象。

特别是在已知一些二维核磁数据的基础上,可以建立分子的三维结构模型。

这个方法不仅适用于小分子的构象分析,也适用于确定大分子的溶液构象。

但由于它不能采用能量函数,从而失掉了很多信息,造成了结果的不唯一性;

同时距离几何方法也不能正确处理溶剂构型。

4.遗传算法

遗传算法对于柔性很大的分子进行构象搜寻有一定的优点。

遗传算法是通常带有进化信息的遗传物质也就是染色体,利用繁殖、杂交和变异等操作,达到搜寻的最终目标。

JudsonR.S.等人运用遗传算法对构象搜寻进行了研究。

用一条染色体编码柔性分子的构象,每条染色体包含有N个基因(N个基因等于分子中可旋转键数目),每个基因对应一根旋转键,用6个bit表示,相应的角度分辨率为5°

每个构象用分子力学计算的能量值作为其适应值。

群体规模取分子中可以旋转键数目的10倍,但最大不超过100。

JudsonR.S.等人首先从剑桥结构数据库(CSD)中取出72个分子,这些分子中旋转键数目在1~12之间,然后用遗传算法分别搜寻了每个分子的低能构象,最后对搜寻的最好结果进行进化,并把优化后的结构与剑桥结构数据库中的晶体结构进行比较。

比较结果发现,63个分子的最终构象能量都与晶体构象能量相同或稍低,即使在另外9个分子中,偏差最大的也是只有3.3kJ/mol。

与Sybyl软件中的CSEARCH方法比较,分子的旋转键超过8个的,遗传算法效率更高。

5.量子力学与分子力学相结合的方法

在第二节力场中所讨论的势能函数是分子力学形式的。

这种力场不能应用于键的形成和断裂,无法研究反应过程。

量子力学可以研究反应过程,例如键的形成和断裂、电子转移过程以及激发态异构化等;

但是量子力学计算非常耗费时间,对于复杂体系是难以实现的。

摆脱这种困境的一个有效方法是将量子力学方法与分子力学方法结合起来;

用量子力学方法处理体系中发生化学变化或电子转移的区域,用分子力学方法处理体系中的其它区域。

这个方法称作量子力学与分子力学相结合的方法,即QM/MM方法。

方法中重要的一步是根据研究的目的划分体系,通常将体系划分为如下几个区域:

量子力学区域,分子力学区域和边界区域。

量子力学区域是体系中发生化学变化的部分,在这个区域中原子采用核和电子表达。

这个区域正是一般的分子力学无能为力的区域,因而必须采用量子力学方法。

分子力学区域包括体系中剩余的原子,原子间的相互作用采用经验势能函数表达。

边界区域考虑体系的周围环境,通常采用周期性或随机性的边界方式处理。

如何划分体系,没有绝对的规则,基本的一条原则是直接与反应有关的区域一定要用量子力学方法来处理;

其它部分的划分比较自由,通常需要根据体系的性质和计算能力来划分。

例如在有的实例中体系划分为两个区域:

量子力学区域和分子力学区域,而没有边界区域。

体系的总能量由4项组成

式中:

EQM量子力学能量;

EMM分子力学区域中总能量;

EQM/MM量子力学区域和分子力学区域原子之间的相互作用,表达式类似于EMM项;

Eboundary是边界区域的能量。

量子力学和分子力学相结合的势能函数形式可以象一般的分子力学函数形式一样用于几何优化,分子动力学,蒙特卡罗模拟以及动力学微扰理论计算。

差别在于可以描述反应过程和激发态。

例如在分子动力学模拟中可以进行电荷分析,获知电子云随时间或在环境的影响下沿反应轨道扭曲的信息。

目前已有不少研究小组运用QM/MM方法研究反应过程。

对于量子力学部分,有采用从头计算方法的,也有采用半经验方法的。

下面以P.A.Kollman和M.Karplus两个研究小组的工作为例,具体说明QM/MM方法的应用。

5.1从头计算方法与分子力学方法

P.A.Kollman研究小组把从头计算方法与分子力学方法相结合,研究胰蛋白酶催化的水解过程。

作者选择了胰蛋酶和三肽底物Ac-Phe-Val-Lys(Me)作为研究对象。

胰蛋白酶催化底物酰胺键的断裂过程是:

(1)质子从丝

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 兵器核科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1