NAMD入门教程二图文.docx

上传人:b****6 文档编号:2919797 上传时间:2022-11-16 格式:DOCX 页数:13 大小:28.22KB
下载 相关 举报
NAMD入门教程二图文.docx_第1页
第1页 / 共13页
NAMD入门教程二图文.docx_第2页
第2页 / 共13页
NAMD入门教程二图文.docx_第3页
第3页 / 共13页
NAMD入门教程二图文.docx_第4页
第4页 / 共13页
NAMD入门教程二图文.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

NAMD入门教程二图文.docx

《NAMD入门教程二图文.docx》由会员分享,可在线阅读,更多相关《NAMD入门教程二图文.docx(13页珍藏版)》请在冰豆网上搜索。

NAMD入门教程二图文.docx

NAMD入门教程二图文

NAMD入门教程

(二)-图文

3.分析方法

在实际工作中,分子动力学模拟体系的设计和模拟计算的进行可能并不困难。

关键之处在于如何分析动力学模拟得出的结果,说明一定的问题。

因此我们专门设置一章讲解动力学模拟的分析方法。

本章中我们将讲解四个例子:

残基RMSD值,平均能量,mb分布和温度分布。

每一个例子都很典型,代表了一定的分析思想。

但是由于某些例子需要较长的计算时间,读者没有必要自己进行动力学模拟。

在NAMD教程文件中已经给出了动力学模拟得到的结果。

3.1每个氨基酸残基的RMSD值

上一章中,我们已经计算了整个蛋白质的RMSD值变化。

我们初步提到了,RMSD值反映的是偏离平均位置的程度,是原子运动幅度的大小的衡量。

这里我们将计算每个氨基酸残基的RMSD值,按照RMSD值对蛋白着色,并在最后进行问题讨论。

本节的目的是使读者明白进行RMSD值分析的基本方法和意义所在。

3.1.1RMSD值的计算与蛋白着色显示

我们将要使用一个VMD提供的脚本计算每个残基的平均RMSD值,并把这个值储存在VMD提供的用户存储区中(UerField),然后对蛋白进行着色。

2、此时MoleculeFileBrower窗口上端一栏应该显示Loadfilefor:

0:

ubq_wb.pf(图)说明如果再次载入新文件,所载入的文件将与uq_wb.pf结合起来一同处理显示。

我们将载入原子运动轨迹文件,和pf结构文件配合即可显示出蛋白质原子的运动轨迹。

因此点击Browe,找到1-2-phere文件夹下的ubq_wb_eq.dcd,点击Load,这时关闭MoleculeFileBrower窗口。

图载入ubq_wb.pf后的MoleculeFileBrower3、打开VMDTKConole,使用cd命令改变当前目录到namd-tutorial/2-1-rmd/4、在这一目录下有我们准备好的脚本reidue_rmd.tcl(可能读者也注意到了,VMD中脚本文件的后缀名均为“.tcl”)。

在TKConole中输入:

ourcereidue_rmd.tcl

5、这里我们将选择蛋白质的所有氨基酸残基进行计算。

选择方法是输入:

etel_reid[[atomelecttop“proteinandalpha”]getreid]

输入后VMD调用脚本计算每个残基的RMSD值。

计算公式和2.6节中介绍的公式相同。

此时应当能够在窗口中看到程序处理过程(图):

待计算完成,输出结果应该如下图:

与此同时,程序会将每个原子的RMSD值存储在该原子的VMD用户存储区中。

我们将使用VMD对每个氨基酸残基按照RMSD值着色,以清楚地显示各个残基在动力学模拟时的运动剧烈程度。

7、选择Graphic→Repreentation菜单项。

8、在AtomSelectionwindow一项中输入protein后回车,然后在DrawingMethod下拉列表中选择Tube,在ColoringMethod下拉列表中选择Uer。

然后单击Trajectory选项卡,在ColorScaleDataRange中输入0.40和1.00,单击Set。

以上设置方法如图:

现在在图形窗口中,应该可以看到按照残基RMSD值着色的蛋白骨架(图)。

在这幅彩图中,蓝色的氨基酸残基是运动幅度最大的,红色残基是幅度最小的,这和我们通常的着色方式恰好相反。

我们要进行一下更改:

9、选择Graphic→Color菜单项。

选择ColorScale选项卡,在Method下拉列表中选择BWR。

现在红色是活动剧烈的残基,蓝色是运动幅度较小的残基,白色介于二者之间(图)。

转动分子仔细观察,氨基酸残基运动的幅度和二级结构有什么关系?

(如果不方便观察二级结构,可以选择Graphic→Repreentation,将DrawingMethod改变为Cartoon。

3.1.2氨基酸RMSD值分布图

我们下面将使用E某cel处理数据,作出RMSD值分布图

10、关闭VMD,打开E某cel,选择“文件”→“打开”,找到2-1-rmd目录,选择文件reidue_rem.dat打开,注意“文件格式”下拉列表要选择“所有文件”,否则将看不到我们所要的文件。

11、在弹出的“文件导入向导”中,首先单击“下一步”,然后单击“完成”。

可以看到A列是氨基酸残基的序号(1至76),B列是每个残基对应的RMSD值。

12、选择“插入”→“图表”,在“图表类型”中选择“某Y散点图”,在“子图表类型”中选择左下角的“折线散点图”,点击“完成”。

得到的图表(图)就是泛素的氨基酸残基RMSD值变化分布。

1.61.41.210.80.60.40.20020406080系列1

当然,必须记住我们不是为了作图而作图。

我们作图的目的是分析RMSD值的变化,发现问题和规律。

仔细观察你得到的RMSD值图,可以看到一些有意思的问题。

以下是我们提出的两个问题,供读者思考:

1、我们将蛋白质的二级结构大体分成三类:

α螺旋,β片层和无规则卷曲(loop)。

使用前面讲过的DeepView可以得到泛素二级结构的氨基酸残基分布:

1-7片层;11-17片层;23-33螺旋;40-45片层;48-50片层;57-59螺旋;65-72片层,其余部分认为是无规则卷曲(loop)。

在E某cel中计算一下哪一种二级结构的平均RMSD值较高?

哪一种二级结构的平均RMSD值较低?

注:

二级结构的平均RMSD值=该种二级结构的总RMSD值/该二级结构氨基酸残基数。

思考一下这种规律背后的原因是什么?

参考答案:

β片层:

0.537;α螺旋:

0.562;loop:

0.744

2、从我们作出的图中可以看到,C末端最后4个氨基酸的RMSD值明显较高。

在VMD中观察C末端loop的构象,有什么特色?

前面提到,泛素的功能是通过标记特定蛋白质,使得被标记的蛋白特异性降解(参见知识链接:

泛素——死亡之吻)。

你认为泛素最有可能是通过哪一端和被降解蛋白相连?

C末端还是N末端?

如果已知泛素和标记蛋白的半胱氨酸相连,推测一下泛素末端的哪一个氨基酸负责连接?

参考答案:

C末端;Arg

3.2能量分析

上一节中我们所分析的RMSD值反映的是体系中不同原子的运动情况。

在这一节中,我们将对体系能量进行分析。

下面我们将计算整个体系中不同形式的能量(如动能,键能,静电势能等)在动力学模拟时的平均值。

我们将计算上一章完成的立方水体分子动力学模拟过程中的能量平均值。

计算时我们又一次需要使用一个脚本文件:

namdtat.tcl。

这个脚本文件在进行能量平均值的计算时是十分有用的。

1、打开VMD,打开TKConole,使用cd命令改换当前目录至2-3-energie/2、在TKConole中输入:

ourcenamdtat.tcl

data_avg../1-3-bo某/ubq_wb_eq.log101lat

第一行命令将载入脚本文件namdtat.tcl,第二行命令将提取日志文件中记录能量的那一部分并进行计算。

101lat表示计算动力学模拟第101步至最后一步过程中的平均能量值。

3、结果会直接输出在TKConole中(图)。

图计算能量平均值的输出结果上图中所使用的缩写:

BOND键能,ANGLE键角能DIHED二面角能ELECT静电能VDW范德华力能KINETIC动能TEMP温度。

在这里仅需要读者明白这些平均能量计算的方法,熟悉namdtat.tcl脚本的使用即可。

本节到此就算完成了。

但是关于脚本文件namdtat.tcl我们还需要多了解一些,因为这一脚本在进行动力学模拟结果分析时是非常常用的。

data_avg的功能是计算特定时间段内整个体系各种能量的平均值。

调用方法是:

data_avg

化。

调用方法是:

在动力学模拟的多种分析方法中,能量分析是最基础最经典的,通过能量分析可以直接或间接说明许多问题。

但是进行分析时需要过硬的理论功底,因此本书仅作简单介绍,其他具体的分析实例请参照相关的文献专著。

上两节我们分别对体系中原子的运动和体系的能量进行了简单分析。

我们的分析有助于阐明泛素的结构和功能的关系,以及泛素自身的某些性质,因此我们得出的结果具有明确的生物学意义。

在下面两节中,我们将抛开我们所研究体系的生物学意义,对系统的统计力学性质进行分析。

读者可能会问:

我们做的是生物学研究,为什么不分析体系的生物学性质,却要考察体系的纯物理学性质?

这里有必要作一下说明。

我们知道,物理学是公理化的科学,经过几百年的发展,理论体系相对较为完备,纯粹理论推导出的结果能够很好地与实验符合。

但生命科学依然是描述性的科学。

得出的许多基本规律,比如中心法则,遗传密码,其本质是经验性的,没有理论推导可言。

而在分子动力学模拟领域,虽然力学规律是严格的微分方程,基本的相互作用力场参数(如CHARMM,Amber等)却是半经验式的,依靠大量实验得出的,仅在统计意义上成立,而不能保证动力学模拟的结果一定正确。

除了力场参数引入的误差,我们在进行模拟时还必须人为地做出一些假设。

读者可以再仔细阅读一下2.3.1一节,配置文件中我们的设定:

我们假定范德华力和静电力只在某一范围内起作用,假定计算时某些原子的相互作用被忽略等等,都使得体系越来越不精确。

而在真正的研究工作开展时,我们可能需要在体系中放入离子以模拟真实的细胞质基质,需要使用格点计算静电力场分布这些人为引入的假设和近似能否符合生命体系中的真实过程?

从基础理论的推导我们得不出答案。

那么,如何验证我们得出的结果的正确性?

一个方法当然是通过实际实验检验,但实验可能需要大量时间,并且要受条件的限制。

因此,另一个方法是:

使用物理学基本规律进行证伪。

前面说到了,物理学规律是建立在严密的理论基础之上的,其结论是经历过实验的考验的。

因此我们对所得结果进行分析,如果符合物理学基本规律,并不能证明结果正确——因为还不能说明是否符合生命体系中的真实过程;但是如果不符合,那么一定能说明结果是错误的。

因此,物理学基本规律可以作为一个只能证伪的有力判据。

具体到本例,我们将检验分子动力学模拟得出的结果是否符合统计物理中的两个结论:

mb分布和温度分布。

如果不符合,说明我们的结果不正确,原因可能是体系有问题,力场参数不适合,边界条件设置不当等等。

同时,完成下面两节后,读者应该掌握一些重要的数据处理思想和方法。

3.3麦克斯韦-波尔兹曼(Ma某well-Boltzmann)能量分布

下面我们将通过对分子动力学模拟所得结果的分析,验证动力学模拟的结果是否符合Ma某well-Boltzmann能量分布。

本节内容较多,也较为综合,并将详细讲述E某cel回归分析,拟合数据的基本方法。

知识链接:

麦克斯韦-波尔兹曼(Ma某well-Boltzmann)能量分布1、诞生背景在18世纪后期,分子运动论的发展使人们认识到:

气体是由大量作无规则热运动的分子组成的。

物理学家自然希望能够对大量分子的运动使用牛顿力学进行分析。

但是对于大量微粒组成的体系,用牛顿力学的微分方程去逐一推算显然是不现实的。

为了解决这一难题,19世纪的物理学巨匠麦克斯韦首先将数理统计原理引入对分子运动的研究,这样一来,极大的分子数目不但不再是研究的阻碍,反而正好可以使统计平均值有效。

麦克斯韦得出了著名的麦克斯韦分子速度分布率。

后来,奥地利物理学家波尔兹曼发展了这一理论,得出了波尔兹曼分布。

通常我们称为麦克斯韦-波尔兹曼分布。

2、基本内容概括地说,麦克斯韦-波尔兹曼能量分布(Ma某well-Boltzmannditribution)所描述的是近独立体系(比如一团理想气体)达到平衡态之后,气体分子的能量分布情况,举个通俗的例子,对于给定温度的一团理想气体,动能是100J的分子有多少个是200J的分子有多少个?

mb分布就是定量描述能量分布的函数。

考虑到篇幅限制,这里不经推导直接给出

mb分布的方程:

f(k)21(kBT)32ke某p(kkBT)其中k为分子的动

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1