NAMD入门教程一Word文档格式.docx

上传人:b****5 文档编号:17155910 上传时间:2022-11-28 格式:DOCX 页数:32 大小:1.10MB
下载 相关 举报
NAMD入门教程一Word文档格式.docx_第1页
第1页 / 共32页
NAMD入门教程一Word文档格式.docx_第2页
第2页 / 共32页
NAMD入门教程一Word文档格式.docx_第3页
第3页 / 共32页
NAMD入门教程一Word文档格式.docx_第4页
第4页 / 共32页
NAMD入门教程一Word文档格式.docx_第5页
第5页 / 共32页
点击查看更多>>
下载资源
资源描述

NAMD入门教程一Word文档格式.docx

《NAMD入门教程一Word文档格式.docx》由会员分享,可在线阅读,更多相关《NAMD入门教程一Word文档格式.docx(32页珍藏版)》请在冰豆网上搜索。

NAMD入门教程一Word文档格式.docx

1、分子动力学模拟概论

分子动力学模拟(MolecularDynamicsSimulation)就是指利用计算机软件,根据牛顿力学的基本原理,模拟大分子的相互作用与运动变化的研究方法。

生命科学的研究往往离不开各种仪器,试管与活的有机体,通过实验手段研究生命现象背后的规律。

那么,为什么我们要将生命大分子抽象成二进制数据,由计算机软件模拟其行为呢?

首先,从理论基础上讲,我们能够使用计算机模拟生物大分子的行为。

生物体系非常复杂,但生物大分子如蛋白质,脂肪,多糖等也就是许多原子由化学键连接起来形成的,所有原子的运动规律都符合量子力学方程,在较大尺度上也近似符合牛顿力学方程,它的行为就是要受物理学基本规律支配的。

因此我们可以将利用纯数学的手段,近似模拟生物大分子的行为、

其次,从研究需要上讲,我们不仅希望从宏观上研究生命大分子溶液体系的行为,还想直接研究单个生物大分子在原子尺度上的行为,而这就是目前的实验仪器难以达到的。

比如,我们希望直接研究蛋白质从伸展的肽链折叠成球形的具体过程,使用仪器手段只能收集到间接的数据,但使用软件模拟则可以形象直观的模拟出整个折叠过程,可以具体求算每个键能、键角的变化,研究某几个氨基酸残基之间的相互作用,以及对蛋白质折叠的意义。

总之,目前的生物学研究需要我们利用计算机模拟生物大分子的行为,以弥补实验手段的限制,希望能自下而上地阐明生物大分子结构与功能的关系。

最后,从实际意义上讲,分子动力学模拟可以用来指导实验,提供思路与理论依据;

分子动力学模拟所得结果的正确性也需要回到实验验证。

这样,我们可以将分子动力学模拟与实验研究结合成一个整体,从而能够全面地,深入地研究生命现象的本质规律。

*暂缺相关文献

随着分子动力学模拟技术的飞速发展,逐步形成了一些商品化的软件。

应用于生物大分子领域的商品化分子模拟软件主要有InsightⅡ以及Sybyl,分子模拟就是其中的一个重要的模块。

InsightⅡ中分子动力学模块使用的就是由美国哈佛大学MartinKarplus研究小组等开发的CHARMM(ChemistryatHarvardMacromolecularMechanics),同时它本身也就是一个商品化的软件。

而Amber(AssistedModelBuildingwithEnergyRefinement)则就是另一个非常有名分子动力学模拟软件,它就是由美国UCSF的Kollman教授的课题组开发的,商业化程度与易用性要好于CHARMM,当前版本9、0。

以上两个研究小组都为其软件开发了相应的力场,并且现在已经成为分子动力学模拟的经典力场。

此外免费与部分免费的软件有NAMD,Gromos,Gromacs,DL_POLY,Tinker等。

在上述软件中,我们选择NAMD作为本章的示范软件。

NAMD就是由美国伊利诺斯大学理论与计算生物物理研究组开发的一套分子动力学模拟软件,适用于计算生物大分子,并行计算效率非常高,可以使用Amber,CHARMM,X-PLOR,GROMACS,OPLS等多种力场,而且可以兼容Amber,CHARMM的文件格式。

NAMD支持几乎所有操作系统,而且免费获取,开放源代码。

如配合分子可视化、结果分析软件VMD以及格点计算软件BioCoRE则可使用更多、更强大的功能,进行更大规模的计算,可以说集众多优势于一身。

不仅如此,利用NAMD还可以进行极具特色的IMD(InteractiveMolecularDynamics,交互式分子动力学模拟)与SMD(SteeredMolecularDynamics,可控式分子动力学模拟)。

在本教程中,我们将首先讲解使用NAMD进行分子动力学模拟的基本流程,然后讲解经典的结果分析方法,最后我们将简单介绍SMD的基本思想与过程。

2、NAMD分子动力学入门

2、1软件基本设置

NAMD的最新版本就是2、6版,可以从免费得到(需要进行免费注册)。

此外,我们还需要VMD作为分子可视化与辅助分析软件,可以从免费得到,最新版本就是VMD1、85。

NAMD安装方法:

事实上NAMD就是不需要安装的。

请新建文件夹namd-tutorial,在该目录中新建文件夹NAMD,下载完成NAMD2、6软件包后,将压缩文件解压到文件夹NAMD中,就可以使用。

下文中为了叙述方便,我们将默认读者的NAMD主程序位于、、/namd-tutorial/NAMD目录中(安装VMD程序时可以安装到任意目录,不影响教程操作)。

此外,本教程还需要一系列教程文件。

所需文件均可以从下载(图)

下载完成教程所用文件后,请把所有内容解压到namd-tutorial目录下,此后的部分我们将默认教程所用文件位于、、/namd-tutorial目录中。

完成上述准备之后,请打开Windows资源管理器,namd-tutorial目录的结构应该如下:

(如果目录形式不一致,请务必进行调整)

该文件夹中有我们进行动力学模拟所需的所有文件。

最后,还需要交代的就是,NAMD不同于我们所熟悉的大多数Windows软件:

它不具有图形界面。

打个比方说,我们平常使用Word,Excel,Photoshop等有图形界面的软件,好像就是面对面聊天;

而现在使用不具有图形界面的NAMD就像就是书信往来:

动力学模拟的所有参数设定都需要用户通过一个文本文件通知NAMD,NAMD进行处理计算,然后再通过许多输出文件输出结果。

不借助其她软件,用户无法直接瞧到NAMD的工作状态。

由于进行动力学模拟的准备与结果的可视化分析,必不可少的软件就是VMD,下面的讲解中也将大量用到VMD。

我们假定读者已经对VMD的基本操作有一定的了解。

VMD的入门教程可参见本章附录。

下面,我们将使用NAMD进行简单的分子动力学模拟,并进行初步的分析。

我们将要进行动力学模拟的分子就是一个76个氨基酸的小肽:

泛素。

知识连接:

泛素——“死亡之吻”

泛素就是一个由76个氨基酸组成的高度保守的多肽链,因其广泛分布于各类细胞而得名。

泛素共价地结合于底物蛋白质的赖氨酸残基,被泛素标记的蛋白质将被特异性地识别,并在蛋白酶体中迅速降解。

泛素因此得名——“死亡之吻”。

因为被其标记的蛋白都摆脱不了被降解的厄运。

随着研究的进一步深入,蛋白质降解过程中泛素的枢纽作用越来越得到重视。

蛋白质降解异常与许多疾病(恶性肿瘤,神经退行性疾患等)的发生密切相关。

而泛素在蛋白质降解中的作用机制如能被阐明,将对解释多种疾病的发生机制与有重要意义。

Hershko、Ciechanover、Rose三名杰出科学家在泛素标记的蛋白质降解方面做出了突出贡献,她们荣获2004年度诺贝尔化学奖。

使用NAMD进行分子动力学模拟之前,我们需要为NAMD准备好各种必须的数据文件,以供NAMD使用。

这些文件包括:

♦蛋白质分子的PDB文件。

该文件负责储存蛋白质中所有原子的坐标。

在后续课程中我们还会了解到,PDB文件还可以储存原子运动的速度等信息。

♦蛋白质分子的PSF文件。

该文件负责储存蛋白质的结构信息。

注意PDB文件只记录原子的空间位置,并不储存蛋白质中原子之间的成键情况。

成键情况由PSF文件负责记录。

♦力场参数文件(forcefieldfile)。

力场参数文件就是分子动力学模拟的核心,文件中的数学方程决定了原子在力场中的受力如何计算。

常用的四种力场就是CHAEMM,X-PLOR,AMBER与GROMACS。

NAMD可以使用以上任何一种力场进行分子动力学模拟。

♦配置文件(configurationfile)配置文件的目的就是告知NAMD分子动力学模拟的各种参数,比如PDB文件与PSF文件的储存位置,结果应当储存在哪里,体系的温度等等

上述四种文件中,PDB文件通常就是从蛋白质结构数据库(ProteinDataBank)中获得。

力场参数文件也可以从网上下载,而PSF文件与用户配置文件就是用户根据具体要求自己生成的。

下面我们将首先制作蛋白质结构文件(PSF)。

1、单击开始菜单→程序→VMD,打开VMD窗口

2、在VMD主窗口中,单击File→NewMolecule打开Molecule对话框;

单击Browse…按钮,在弹出的文件浏览中找到namd-tutorial/1-1-build文件夹,在此文件夹中选择1UBQ、pdb,单击Load按钮载入1UBQ、pdb。

提示:

关于文件后缀名

如果浏览文件时瞧不到“、psf”“、pdb”等后缀名,可以在“我的电脑”中选择“工具”→“文件夹选项”,在“查瞧”选项卡中取消“隐藏已知文件类型的扩展名”。

强烈推荐读者取消这一项,因为这还涉及到下文中的许多操作。

载入之后在图形窗口(VMD1.8.5、OpenGLDisplay)中应当可以瞧到下图(图):

可以瞧到,所有的氧原子用红色表示,碳原子以天蓝色表示(碳原子所连的键也就是天蓝色,所以整个蛋白骨架为天蓝色),硫原子以黄色表示。

注意到没有出现氢原子,这就是因为此结构就是由X射线晶体衍射得来的,而X射线衍射一般得不到氢原子的精确位置。

注意:

蛋白周围的红点实际上就是水分子,由于没有氢,所以仅显示出一个一个的氧原子。

我们只需要蛋白质分子的结构,因此下面我们将首先除去pdb文件中带有的水分子。

4、单击Extension→TKConsole菜单项,弹出VMDTkConsole窗口。

首先用cd命令改变当前目录到namd-tutorial/1-1-build下。

然后输入下列命令:

setubq[atomselecttopprotein]

$ubqwritepdbubqp、pdb

(每输入一行命令后按回车键,下同。

另外,尤其要注意空格的有无与空格的位置,否则空格位置不对可能造成命令执行错误)

VMDTKConsole(VMD控制台)中改变当前目录的方法

在Windows命令行模式中与VMDTKConsole中都就是用cd命令改换当前目录的。

但就是注意二者的使用方法不同。

这里简单说明VMDTKConsole中改变当前目录的方法,Windows命令行改变目录的方法将在后面说明。

在VMDTKConsole中,改变目录的命令十分简单。

无论就是改变到哪一个目录,只需要输入:

cd目标目录

比如本例中,假设需要改变目录到E:

/namd-tutorial/1-1-build,无论当前目录就是什么,只需要在VMDTKConsole中输入以下命令即可:

cde:

/namd-tutorial/1-1build

输入以上命令之后,VMD已经在1-1-build目录下生成了文件ubqp、pdb。

这一PDB文件仅包含泛素蛋白,不含水分子。

5、在VMD主窗口中单击1UBQ、pdb,选择Molecule→DeleteMolecule菜单项删除当前分子。

6、下面我们将生成泛素蛋白的psf文件。

VMD组件中实际上提供了一个全自动的psf文件生成器(选择Extensions→Modeling→AutomaticPSFBuilder菜单项)。

但我们将人工制作所需要的psf文件,以让读者明白制作的详细流程。

制作时,需要使用VMD提供的psfgen软件包。

7、首先,打开写字板,输入以下内容:

packagerequirepsfgen

topologytopall27_prot_lipid、inp

pdbaliasresidueHISHSE

pdbaliasatomILECD1CD

segmentU{pdbubqp、pdb}

coordpdbubqp、pdbU

guesscoord

writepdbubq、pdb

writepsfubq、psf

8、输入完成之后,保存文件。

注意文件保存在1-1-build目录中,文件名为ubq、pgn,文件类型选择文本文档。

然后退出写字板。

这样我们便制作了pgn文件,这一文件可以被psfgen软件包所识别,并处理成我们想要的psf文件。

我们需要在VMD中使用该文件调用psfgen数据包

下面我们详细介绍一下刚刚输入的每一行命令的意义:

packagerequirepsfgen:

通知VMD我们将要调用psfgen数据包

topologytopall27_prot_lipid、inp:

载入拓扑文件top_all27_prot_lipid、inp

pdbaliasresidueHISHSE:

改变组氨酸残基名,使得残基名称能够与拓扑文件中的一致。

在pdb文件中组氨酸残基名就是HIS,而在拓扑文件中组氨酸残基名为HSE,HSD,HSP三种。

分别对应组氨酸的三个不同的带电荷形式。

pdbaliasatomILECD1CD:

改变异亮氨酸中的原子名。

pdb文件中异亮氨酸δ碳的名称为CD1,而拓扑文件中原子名应该为CD。

segmentU{pdbubqp、pdb}:

生成一个集合(segment)U,包含ubqp、pdb中的所有原子。

coordpdbubqp、pdbU:

从ubqp、pdb中读取坐标,比较各个原子的名称就是否对应,然后旧的集合名被改换成新的名称“U”。

guesscoord:

根据拓扑文件推测缺少的原子(氢原子)的空间位置。

writepdbubq、pdb:

生成新的pdb文件,包含所有原子的坐标,包括刚刚推测出的氢原子。

writepsfubq、psf:

生成psf文件,该文件包含蛋白结构的全部信息。

知识链接:

组氨酸的三种离子模式

PDB文件中原子的命名方式

9、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。

然后输入以下命令:

sourceubq、pgn

这样我们就成功得到了含有氢原子的psf文件。

同时,可以瞧到VMDTKConsole中显示出系统返回的信息。

信息显示我们的系统中有1231个原子,631个原子的坐标就是推测的(图)。

现在在您的1-1-build文件夹下应当有ubq、pdb与ubq、psf两个文件。

到此为止,我们已经成功制作了下一步分子动力学模拟所需的psf文件。

2、2蛋白质的溶质化

显然在真实情况下,蛋白质不就是在真空中存在下面。

所以我们需要把蛋白质放入一个水环境中,以更真实的模拟生物体内的环境。

我们可以使用两种水体环境进行动力学模拟:

♦球状水体(watersphere)。

水体包围蛋白质,四周则就是真空,动力学模拟时没有周期性边界条件(periodicboundarycondition)

♦立方水体(waterbox)。

立方水体就是正六面体形状的水体(不一定就是正立方体)。

使用立方水体需要我们设定周期性边界条件。

2.2.1生成球状水体(watersphere)

我们将使用一个脚本文件建立球状水体。

脚本文件在1-1-build目录下,文件名就是wat_sphere、tcl。

1、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。

sourcewat_sphere、tcl

输入之后VMD将会调用脚本文件,之后VMD会反馈一系列信息(图),

2、由所给的信息我们可以瞧出,VMD生成了两个文件:

ubq_ws、pdb文件与ubq_ws、psf。

在最后两行还给出了生成的球状水体的质心坐标(centerofmassofsphere)与球状水体的半径(radiusofsphere),精确到小数点后第十位。

记下这些数字,以后我们还会用到。

这时在图形窗口中却会出现一个立方水体包围的蛋白质分子(图)。

不过没有关系,在VMD主窗口中可见分子名为del_water,并不就是我们所要的结果。

我们的最终结果已经储存在1-1-build中,文件名分别为ubq_ws、pdb与ubq_ws、psf。

3、下面我们将瞧一下生成的球形水体究竟就是什么样子的。

在主窗口中单击del_water分子,选择Molecule→DeleteMolecule菜单项删除该分子;

然后选择File→NewMolecule,单击Browse按钮,在1-1-build目录下找到ubq_ws、pdb文件,单击Load载入该蛋白,可以瞧到球状水体包围的蛋白(如图)。

说明我们已经成功地生成了球状水体包围的泛素分子。

2.2.2生成立方水体(waterbox)

下面我们将把泛素放入一个立方体状的水环境中。

我们使用的就是VMD提供的solvate软件包。

该软件包位于VMD的/plugins/noarch/tcl目录下。

不过我们不需要自己找到它。

只要通知VMD我们将使用该软件包,VMD就会载入它。

1、打开VMD,选择Extensions→TKConsole菜单项,在VMDTKConsole窗口中输入:

packagerequiresolvate

这时VMD就会载入solvate软件包。

窗口返回数字:

1、2说明我们所使用的软件包就是solvate1、2。

确保当前目录就是1-1-build,否则用cd命令改变当前目录至1-1-build,然后输入:

solvateubq、psfubq、pdb–t5–oubq_wb

等待运行结束,VMD就调用solvate将ubq、pdb与ubq、psf所储存的蛋白放入一个立方水体中。

在图形窗口可以见到一个立方形的水体包围蛋白(如图)。

参数–t5通知程序如何确定立方体的各边长。

方法就是在每个坐标方向上选择坐标最大的那个原子,然后再延伸5A,即为该方向立方体面的边界。

生成的立方水体并不一定就是正立方体。

各边长取决于坐标最大(距离原点最远)的原子的位置。

还有一个参数–oubq_wb就是为了通知程序生成的文件名。

运行结束后我们得到的两个文件就就是ubq_wb、psf与ubq_wb、pdb。

2、在VMDTkConsole中输入:

seteveryone[atomselecttopall]

measureminmax$everyone

这时返回的数值就是整个体系中离原点最近的点与最远的点的坐标。

我们需要的就是整个立方体的中心,可以自己计算也可以用下面的命令:

measurecenter$everyone

这时返回的三个数值就就是体系的中心。

记下这三个数值,我们以后还会用到。

返回值如图:

在开始下一节之前,我们要将生成的文件拷贝到common公用目录下以方便访问。

在Windows资源管理器中找到1-1-build目录,按Ctrl选择以下六个文件:

ubq、pdb,ubq、psf,ubq_ws、pdb,ubq_ws、psf,ubq_wb、pdb,ubq_ws、psf,然后把它们拷贝到namd-tutorial/common目录下。

此处生成的立方水体事实上过小了。

在实际应用时,应当保证水体足够大,以防止蛋白在拉伸运动时超出水环境。

也要避免在使用周期边界条件时蛋白与四周各个单元的蛋白镜像相碰撞。

周期边界条件的详细知识见下文。

此外,还应当注意的就是在实际应用时应当在水环境中放入离子。

特别就是当蛋白质的净电荷不为0时,更应当设定离子数目以使得整个体系就是中性的。

在放入离子时应当将它们放在体系中静电势能的最低点,以节省计算时间。

因为离子总会向势能最低点自发运动。

2、3球状水体中泛素(Ubiquitin)的分子动力学模拟

在这一节中,我们将要对球状水体的泛素分子进行最简单的动力学模拟。

首先,我们要进行的分子动力学模拟的目的就是什么?

我们将泛素放入球状水体中,水体周围就是真空,然后NAMD会根据我们设定好的温度值按照Boltzmann-Maxwell分子速率分布给各原子赋予一定的初始速度,接下来就就是要根据牛顿力学方程,求解个水分子以及蛋白质中各原子的运动轨迹。

我们得到的结果,就就是模拟泛素这一小肽在溶液状态下的运动状态。

能量最小化与能量平衡(MinimizationandEquilibration)

本次动力学模拟实际包括两个过程:

能量最小化与能量平衡(MinimizationandEquilibration)。

能量最小化时,NAMD设定各原子的速度为0,然后不断改变各个原子的相对位置并计算体系总能量,搜索最低势能点,作为分子动力学模拟的初始状态。

这一过程就是不记录原子运动轨迹的。

因为原子的位置改变只就是因为NAMD需要搜索最低能量状态,而不就是真实的相互作用引起的运动。

能量平衡就是让蛋白质与水分子在设定好的环境温度(即原子的速度)下相互作用,达到能量平衡分配,整个体系达到稳定状态(熵达到极大值)。

为什么需要首先进行能量最小化?

这就是因为我们提供的体系有可能包含极度扭曲,拉伸或压缩变形的键与键角。

它们就是解析结构或同源模建时引入的错误结构,含有很高的能量。

如果不首先进行最小化,直接进行能量平衡,蛋白质会与水分子相互作用,恢复伸展状态,释放掉这些错误结构中的高能量。

这一过程就是没有意义的——因为它就是错误结构引起的反应,并不就是蛋白质在溶液中的真实状态。

从而就浪费了计算时间。

不仅如此,能量释放引起的剧烈运动与相互作用最终可能使得蛋白质的行为不符合溶液中的真实行为。

所以有必要在能量平衡之前,首先人为搜索能量最低点,作为分子动力学模拟的初始状态。

一般地,分子动力学模拟包括多个能量最小化与平衡过程。

通常我们会首先将蛋白质固定而仅允许水分子运动,进行能量最小化与能量平衡;

然后允许蛋白质与水分子同时运动,再次经历能量最小化与能量平衡这一循环。

第一步的目的就是使水分子达到能量最小,这通常就是一个很快的过程。

然后再放开蛋白质,使整个系统达到能量最小。

这样可以减小计算量,并防止由于一开始蛋白结构很不稳定而结果产生假象。

在上一节中我们已经获得了所需要的ubq_ws、pdb与ubq_ws、psf两个文件。

对照本章开始提到NAMD所需的四个文件知,还需要有配置文件就可以提交NAMD进行动力学模拟了。

(力场参数文件在common文件夹中)。

下面我们将首先得到配置文件。

2.3.1配置文件

前面我们把使用NAMD比作写信,这里的“信”就就是指的配置文件。

配置文件记录了进行动力学模拟所需的全部参数与设置,NAMD只要得到这一文件就可以按照相应指令进行操作。

对于本次动力学模拟,在namd-tutorial/1-2-sphere目录下可以得到已经预先制作完毕的配置文件。

下面我们将要仔细

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 数学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1