蛋 白 质 晶 体 学 简 介文档格式.docx
《蛋 白 质 晶 体 学 简 介文档格式.docx》由会员分享,可在线阅读,更多相关《蛋 白 质 晶 体 学 简 介文档格式.docx(29页珍藏版)》请在冰豆网上搜索。
以后又有了分子置换法(MR);
由于可变波长的同步辐射加速器的应用,近年来又发展了多波长反常散射法(MAD)。
随着科学技术的发展,高速大容量计算机的出现,在衍射数据的收集方法上经历了一个否定之否定螺旋式上升的发展。
从最初的有层线屏的底片法,到以后有计算机控制的逐点收集的衍射仪法,到目前有各种形式的面探测器,大大加快了衍射数据收集的速度。
X-射线光源的强度也有了极大的提高,第三代同步辐射加速器,结合Laue法的应用,使晶体学出现了一个崭新的领域,研究时间分辨的动态晶体学。
因此,以一章的篇幅,把蛋白质晶体学作一个全面完整的介绍,那是很困难的。
牛津大学Stuart教授是国际上最著名的结构生物学家之一,笔者聆听过他在牛津大学的“蛋白质晶体学讲座”,他以他多年来在该研究领域成功的经验、独特的手笔介绍了该领域的基础本概念和最新方法。
正因为如此,并征得他本人同意,本讲义将他的讲稿为主,而不另写(也因为限于笔者的水平)。
希望读者建立起对蛋白质晶体学这门发展中的学科的正确的、国际规范化的全新的概念,为此,本讲义还将附加中英文专业术语解释;
同时了解当前最新的研究方法,特别是在实际应用中的经验和特别需要注意的问题,这一点与其它同类书籍有着很大的不同,这不但对于正在从事生物大分子晶体结构测定的研究人员也具有极其重要的参考价值,同时可以作为其他相关学科对蛋白质晶体学有兴趣的本科生、研究生和科研人员的入门书。
此外,蛋白质结晶学是一个专业跨度较大,同时专业性又非常强的领域,因此,本讲义仅仅是试图让大家建立起对蛋白质结晶学这门学科的正确的概念,同时也概括了当前研究中最新的方法以及必要的基本原则。
更详细的参考书、有关结构解析的程序包、网页地址、有关国际组织及数据库的分类在讲义的最后部分中列出。
2蛋白质结构测定的基本步骤
X射线晶体学可在原子或接近原子的水平上分析蛋白质的精细三维结构。
3?
以上分辨率的蛋白质精细结构可提供丰富的信息,如特定原子的位置,它们之间的相互关系(如氢键等),溶剂的亲和性及分子内柔性的变化等。
目前,应用X射线晶体学技术可以测定分子量达到107D级的全病毒.和2.5x106D级的核糖体。
其关键在于是否能够获得高度有序的蛋白质晶体。
X射线晶体学研究通常采用的X射线波长与化学键键长相当,也与晶体内的原子间距离相应,约为1?
左右。
一个晶体包括上亿个有序排列的基本单元(如一个蛋白质分子);
在晶体的所有重复单元中,每个原子的核外电子对X射线散射的波形是可以叠加的。
散射可通过傅立叶综合计算重复单元(蛋白质等)的电子密度图然而电子密度图的计算必须得到散射光束的振幅(可直接测量)和它们的相位(不能直接测量,因而存在相位问题)。
蛋白质结构测定主要包括以下几个过程:
第一步结晶:
需要通过大量的条件筛选和优化以使蛋白质分子间的弱相互作用促使蛋白质分子形成高度有序的晶体而不是随机聚合形成沉淀。
这就要求溶液中的蛋白质处于过饱和状态,并只形成少数的成核中心,使晶体能持续地慢慢地生长成大单晶。
第二步数据收集:
通常利用(单波长)X射线光束照射在一定角度范围内旋转的蛋白质晶体,同时记录晶体对X-光散射的强度。
这些强度可转换为结构测定中的结构因子的振幅(|Fhkl|.此外,在Laue法中,晶体通常保持静止而使用连续X光波长(白光)收集数据。
第三步相角的测定:
结构因子的振幅(|Fhkl|)及相角(?
hkl)是物理上相对独立的量。
由于结构因子相角的全部信息在收集数据时丢失,因此必须通过其它途径来得到它们的数值。
除结晶外,相角的测定在结构分析中仍然是一个问题最多的部分。
第四步相角的改进(优化):
电子密度图的质量及其后的可解释性主要决定于相角的准确性。
有的情况下采用晶胞中不对称单元中的等同部分(例如,一个以上的等同分子)的电
子密度平均,有可能大大地改善误差较大的起始相角。
第五步电子密度图的解释:
相位确定后,可开始计算电子密度图。
若从电子密度图能跟踪出肽链走向和分辨出二级结构(如基于高分辨率的数据,通常这意味着衍射数据的分辨率至少达到3.5?
),则可能推出多肽链的三维折叠方式。
进而根据氨基酸序列,就可能构建出原子坐标形式的蛋白质结构模型.。
第六步修正:
考虑到已建立的立体化学资料(如键长,键角等)的限制,根据X射线衍射数据对初始的蛋白质分子模型进行修正。
下面我们将着重论述以上各阶段的主要内容。
3结晶
蛋白质结晶技术的综述请参看参考书5-7。
通常只需要毫克级的均一的蛋白纯品(通常纯度至少超过95%)便可进行蛋白质结晶研究。
最初的条件实验一般需要1-2mg,但最终得到解析出蛋白质结构所需的数据,可能需要几毫克或更多的蛋白质样品。
在摸索晶体生长条件时应考虑分子生物学家或蛋白质化学家所提示的溶液中影响蛋白质稳定性及构象的各种因素;
尽量避免蛋白质样品的反复冻融,已经证明许多蛋白冷冻干燥处理后对结晶不利;
使用5-50mg/ml甚至更高浓度的蛋白质溶液,一般来说,浓度越高,效果越好,至少起始时是如此。
不过也有浓度为2mg/ml蛋白质结晶的先例;
过滤蛋白质溶液,缓冲液等,清洁任何玻璃或塑料表面上的尘粒(光学商店清洁镜头的除尘器效果很好),以最大限度地减少成核中心的数量。
摸索蛋白质结晶条件最常用的方法是应用汽相扩散技术的悬滴法(图1a).因为此法不但可节省样品而且可有效利用储存空间。
此法是使任何挥发性的组分在小液滴和大样品池间达到平衡,使蛋白质液滴中沉淀剂及蛋白质的浓度逐渐增加,达到过饱和状态,最终析出晶体。
晶体生长的基本装置是Linbro多孔组织培养板及用二甲基二氯硅烷硅化后
的玻片或塑料盖玻片。
悬滴法长晶体包括以下四个步骤:
第一步,在作结晶实验之前,最好对蛋白质样品进行离心,以除去不溶解的蛋白和杂质,以减少不必要的成核中心,此外,对蛋白质样品进行超滤,也是值得推荐的。
第二步,采用“吹气法”除去培养晶体用的组织培养板和盖玻片上可能带有的灰尘。
第三步,在组织培养板的孔中加入0.2-0.5ml经过超滤的含沉淀剂及添加剂的缓冲液,作为池液,孔边缘涂上真空脂。
第四步,吸1ul或2ul池液放到硅化后的盖玻片上,加等体积蛋白溶液至此池液上(这个体积比将决定平衡后的蛋白质浓度),混合均匀,应避免气泡出现。
第五步,翻转盖玻片盖在孔上,检查密封是否良好。
上述方法中步骤2和4目前己可在自动化仪器中进行(8),但是,绝大部分拥有该仪器的实验室最终还是乐意采用手工方法。
起始的条件实验常在感兴趣的区域(通常低于沉淀蛋白所需的浓度)进行,然后再进行实验条件的优化。
一般的,蛋白质晶体生长所需的硫酸胺等沉淀剂浓度在理想浓度的1%或2%偏差范围内,但对于不同分子量的聚乙醇胺(PEG)则可宽松一些。
晶体在数小时至数月后出现。
通常,微晶可用作晶种以长出合用的晶体(9)。
汽相扩散法的另一种形式是坐滴法(图1c),坐滴中含池液和蛋白溶液各1-2ul。
此方法对于以下情况非常适用:
即使用非离子去垢剂作为添加剂表面张力较低时;
或用PEG或乙醇作为沉淀剂(由于凝结等问题,悬滴体积趋于增大)时;
反向扩散导致液滴增大时;
或结晶条件已确定,需要大量晶体时。
除汽相扩散技术外,微量透析法(DialysisbuttonsfromCambridgeRepetitionEngineers)和微量批处理法(DouglasInstrumentsLtd)也是值得了解的。
由于多种因素的影响,蛋白质结晶仍是一门艺术。
表1列出了一些目前经常用到的进行蛋白质结晶的基本条件和思路。
硫酸胺,二甲基-2,4-戊烷二醇(MPD)及PEG4000是初次结晶时经常使用的沉淀剂,在参考书7中列出了用这些沉淀剂进行的一些研究项目,表1中列出的很多方案在参考书5-7中都有介绍。
应用不完全因子法筛选实验条件的子集合方法目前在几个实验室经常使用(HamptonResearch)(10)。
动态光散射法目前已被发展用于监测潜在的结晶条件,可以作为摸索结晶条件的辅助工具(11)。
当单独的蛋白质不能结晶时,往往能与其抗体(Fab片断)以及其他生物大分子共结晶(12)。
非离子去垢剂可辅助几个完整膜蛋白的结晶而大大拓宽了晶体学的研究领域(13,14)。
糖基化位点较多的蛋白也需要特殊考虑,一个方法是使用神经氨酸酶的处理方法以降低糖基化水平。
最近有建议使用甘油作为辅助溶剂以帮助柔性较大的蛋白结晶(15)。
然而分子内的高柔性常常迫使人们使用截去蛋白的N端或C端(柔性过大的部分)以后再进行结晶。
在初次出现晶体时,往往需要回答以下两个问题:
1.是盐晶体吗?
盐晶体通常具有很高的双折射和很高的密度,硬玻璃样的外表,因而易于区分;
用衍射来鉴定,它在高分辨率下(通常6?
下什么也没有)只有少数几个很强衍射点。
2.其次是它们能给出有用的衍射吗?
遗憾的是宏观观察时很有序的(甚至是双折射)的
真正蛋白质晶体可能在微观上仍不够有序而不能衍射,或只能达到较低的分辨率(低于4?
),
形成多晶或双晶的晶体当然是无法使用的。
根据我们的经验,添加剂如β-正辛基?
-D-吡喃型葡糖(苷)甙(β-octylglucoside)可能有助于消除孪晶的问题(16)。
表1:
结晶实验中的常用条件和思路
沉淀剂
盐:
硫酸胺,甲酸胺,柠檬酸钠
PEG:
400,4000,3000,6000,8000,20000
有机溶剂:
MPD,乙醇(4?
C,很难避免其蒸发)
混合物:
PEG+0.5-1MLiCl或NaCl,盐+2-4%有机溶剂
添加剂
0.25%-1%非离子去垢剂如β-正辛基?
-D-吡喃型葡糖(苷)甙(β-octylglucoside)
二氧六环(Dioxane)
金属离子如Ca2+,Zn2+
还原剂:
DTT
甘油
可变条件
pH
缓冲液类型
温度:
通常尝试5?
C和20?
C
结晶环境:
重力或微重力(太空中结晶,很费钱!
)
共晶生长试剂
抑制剂
辅因子
底物
单克隆抗体片断(Fabs)
蛋白样品的变化
采用限制性蛋白酶酶解
采用基因工程方法修饰N端或C端(如截短)
采用不同种类的蛋白或突变体蛋白
采用不同表达系统(如“对付”糖基化等)
通过测量蛋白质晶体的密度可计算晶体中溶剂所占体积的比例及不对称单元中蛋白质分子的数目。
测量可采用蔗糖密度梯度法,对于含溶剂较多的晶体,由于蔗糖掺入晶体内,必须进行相对于时间进程的一系列密度测量,这样才可推知时间为零时的正确密度。
方法2:
相对于时间进程的晶体密度测定方法步骤如下
1.制备浓度梯度为5%的从10%(w/w)到60%的蔗糖溶液系列。
2.从高浓度到低浓度一层一层地铺在超离心管中,对溶液加热可以增加流动性,因此可能有助于这一步实验的进行。
3.使用范围在1.05-1.25g/cm3的已知密度的二甲苯或溴苯进行校正。
在梯度中加入一系列已知密度的小液滴,在水平转头中离心(30’s,多少转?
),即可确定梯度标记图。
4.在梯度中加入一个晶体,离心30秒测量位置,然后推算出密度,随后以几分钟为时间段进行重复测量。
5.将测量结果拟合为一次指数函数的形式并外推获得时间为零时的晶体密度数值.
假设蛋白质的一个典型蛋白质结构部分具有特定的体积为0.74cm3/g,可用下式进行计算:
Mp[Da]=2.324(v/n)[?
3]{?
c[g/cm3]-1}
V:
单位晶胞体积n:
单位晶胞内不对称单元的数量
?
c:
晶体密度Mp:
不对称单位的蛋白质质量
4数据收集
采用同步辐射加速器光源收集数据,体积为0.1x0.1x0.1mm3或更小一些的有序晶体已足够。
在一般实验室里用旋转阳极作为X光光源收集数据,则需要较大的晶体。
蛋白质晶体通常装在适当内径的玻璃或石英毛细管中(AstrophysicsResearchLtd.),见图2a。
参考书20中给出了详细的晶体操作注意事项。
易碎的平板样晶体可装在特制的扁平毛细管中(20)。
如计划在数据收集过程中浸入底物则可将晶体装在一个流动的小盒中(20)。
室温下,晶体
在X射线照射下会受到损伤,影响它的寿命。
在低温条件下收集数据,将会延长晶体寿命,
提高数据的质量。
高盐环境中生长的晶体,通常冷冻至–10℃不会有不良影响。
在低温条件下收集数据,可用Cryo装置。
通过表面张力将晶体悬置在一个薄金属圈限定的液滴中(22),然后,将晶体快速冷冻至液氮温度(通常在100K左右),这样可大大延长晶体寿命(23),见图2b。
但使用者必须预先评估特定的晶体在实现这个过程中经常遇到的困难与使用此法的益处。
只有为每一个新蛋白质晶体建立一个最佳的条件(主要是选择合适的冷冻保护剂)才能真正地受惠于低温数据收集。
一些对温度变化特别敏感的晶体,必须严格在其生长温度的环境中安装。
图2a
图2b
进行酶作用机理研究的时间分辨结构测定工作要求数据收集的速度能够跟得上反应速度。
这时可用极高光通量和准直度的同步辐射加速器作为X-光光源,并用Laue法(白光)收集数据,以满足其速度上的要求。
总而言之,数据收集是一个较为专业化的领域,在这里就不再论述了。
表2列出了与数据收集有关的资料,如X-光光源,探测器及数据收集方法等。
封闭管是最弱的X射线源,目前大多数实验室使用旋转阳极或同步辐射加速器作为X-光光源。
同步辐射加速器的优点是:
1.首先是具有高度平行的强光束。
这对于具有较大的晶胞及高分辨率数据衍射能力弱的晶体是很必要的;
2.其次是它的波长较短,同步辐射加速器X-光光束波长一般小于1?
。
短波长可以减少吸收,有利于延长晶体寿命。
3.第三是波长可调性。
这对于Laue法数据收集及单晶的多波长反常散射法(MAD)很重要。
与铜靶相比,旋转金靶阳极具有X射线波长短的优点,金靶的特征发射光谱包括了PtLIII的吸收边缘,因而,一般实验室中的旋转阳极,MAD法可有一些应用(参见参考书26)。
随着工作波长在1?
以下的探测器的使用,应重新评价不同阳极材料的不同优点。
单位晶胞很大(晶胞大于200?
)的晶体的在一般实验室中的旋转阳极上的数据收集通常要求
配备聚焦能力较强的Frank型棱镜系统。
对于要求相对较低的一般实验室中的旋转阳极上数据收集,我们现常用易于匹配且更富于变化的光学系统,例如石墨单色器和平行光管。
同样,随着新的探测器的应用,我们应重新认真评价X光光学系统及在同步辐射加速器上应用的技术在一般实验室中的X-光系统上的推广和应用。
表2数据收集
X射线源
密封管
旋转阳极
同步辐射加速器
X射线棱镜(一般实验室中)
镍过滤器
石墨单色器
Frank反射镜
光纤系统
X射线探测器
线性比例计数器
摄影胶片
外部带磷光体的电视区域监测器:
FAST
多丝正比计数器:
Hamlin/Xuong,Xentronics
Imagingplates图像盘
CCD
数据收集方法
衍射仪法
徊摆法
Laue法(白光辐射)
目前探测器主要有摄影胶片、电子面探测器、图像盘(ImagingPlate)以及CCD。
目前较为广泛采用的是图像盘或CCD,这两种检测方式可在较宽的X射线波长范围内提供较高的灵敏度及低背景,适于衍射较弱的晶体。
必须指出,在一般实验室采用大面积、高分辨率探测器,需要新一代X-光光学系统去匹配才能有效益。
用回摆法收集数据是目前最常用的方法。
下面就有关参数的选择提供一些参考意见:
第一,准直光束的大小应与晶体的尺寸相当或略小;
第二,晶体到探测器的距离应根据晶胞的大小来决定,晶胞越大距离越远,以保证衍射点不重叠;
第三,回摆范围也与晶胞大小有关,晶胞越大回摆范围越窄,图像盘的回摆范围一般为10__20,在不增加衍射点的重叠情况下,尽可能加大回摆角度。
但对于电子面探测器应窄一些,以增加信噪比,一般为0.250或更小。
第四,曝光时间取决于良好的统计计数与X射线光束下晶体有限的寿命之间的平衡,减少曝光时间可以相对多收数据,虽然数据可能会弱一点以至数据内部一致性会稍差一些,但可能提供一套更为完整的数据,减少某些系统误差;
第五,一般以晶体的主对称轴为回摆轴收集数据最为有效(可在最小的回摆范围收到全套数据);
当然这些还与空间群、晶胞大小以及晶体外形有关。
作为在实验室面探测器上进行日常数据收集的一种策略,故意设置晶体在1800旋转范围进行收集一段空一段(如150,再空150)的分段收集,可在相对小的旋转角度内收集到一套完整的数据。
但在当需要反常散射测量时(因为后者需要在同一图上收集Bijvoet点对)就不太适合了。
在常规的光束下使用回摆法时,位于旋转轴的附近数据一般来说是无法测量的。
但如果使用较短的波长,可以减小旋转轴附近的不可测区域;
另外将晶体的对称轴校准在离旋转轴几度的地方,即使晶轴略微偏离旋转轴,则倒易格子中的对称性经常允许记录与旋转轴附近对称性相关的数据,这也可减少盲区。
蛋白质可能的空间群见表3,晶体形态学常常给出晶体学轴的对称性和取向的线索,经典的空间群的初次鉴定通常在旋进相机上进行,但根据我们的经验,在晶体轴的00,900以及适当的话300或450回摆照相经常足以确定晶胞的大小及晶体学点群(表3)。
由原始数据的系统消光规律可以定义晶体的螺旋轴。
我们认为首先是收集数据,不要将非常珍贵的晶体浪费在了解晶胞的特点上,可在一个较低的对称空间群上处理数据,并检查可能的对称等效点。
除非有相位信息,许多对映体结构不能被区分,如P3121和P3221。
但这并不影响数据收集和处理。
数据处理一般包括以下几个步骤:
第一步指标化,以确定晶胞参数和格子类型。
这一步现在经常采用自动指标化算法(29),以保证在X光束下晶体寿命不会浪费在晶体的定向上;
第二步预测全部衍射点的记录位置;
第三步整合(现经常使用‘profilefitting’(30)):
包括预定点位置的强度测量及适当背景值的估算;
第四步对称等效点的比例因子的校正和平均、归并以给出一套独立数据,在此过程中,还需要校正随时间变化的晶体损伤及晶体外形不规则所造成的吸收效应的差别。
上述方案中,适当时候,也需要进行对探测器及光源依赖的校正。
有的时候,需要进行特殊的吸收效应校正(31)。
后修正(post-refinement)对于不完整衍射点(partiality)强度偏差的估计有改善作用,尤其是在病毒晶体学中尤为适用(32)。
强度数据最终统一后(scaling),一般情况下,所得到的强度的R因子的变化应在3%(良好的数据)和11%(很弱的数据)之间。
衍射强度的R因子定义为:
对于某些空间群(见表3)倒易格子的几何对称性比其强度的对称性高(这样对指标的选择可能存在歧义),因此,对于一个独立指标数据群可能要求在计算前进行指标操作,当格子表现出赝对称性时可能也是这样(如两个几乎相同的晶胞尺寸)(33)。
数据收集过程中的晶体在毛细管中的滑动可能导致对该部分数据分开处理。
一套完整的原始数据,它的完整度(completeness)应超过80%,而且缺失数据在倒易空间中应随机分布;
全部数据至少高于独立数据(即它的丰度redundancy)2-3倍以上,以便得到正确的比例因子,提高数据的精度。
数据的质量对结构分析中以后各阶段的重要性是不言而喻的,不过,如果因为数据的收集量大(redundancy高)而使得数据的Rmerge增加了一点并不是坏事,因为统计测量的信息量的真相将表现在最终的电子密度图中,在这种情况下最终的准确性将会提高。
Rmerge作为分辨率函数的指标必须进行监测,很多人认为一个分析的最高分辨率的壳层的Rmerge不应超过25%,数据的完整性对初始相位及结构测定是很重要的,而对于以后的差值电子密度图就不太重要了。
对于非晶体学对称性,差值电子密度图所需的数据部分可进行粗略估计,如对于五重对称,一个(随机样品)的完整数据的1/5应就足够了。
5.相位测定
在晶体中一个不对称单元中有多个相同的蛋白质分子时,一些有价值的分子之间堆积的信
息
可直接从结构振幅计算得出,而不必要预先知道任何相位信息:
1.例如自身旋转函数可检查分子间是否