结构测定大分子结构 X射线课件PPT格式课件下载.ppt
《结构测定大分子结构 X射线课件PPT格式课件下载.ppt》由会员分享,可在线阅读,更多相关《结构测定大分子结构 X射线课件PPT格式课件下载.ppt(133页珍藏版)》请在冰豆网上搜索。
![结构测定大分子结构 X射线课件PPT格式课件下载.ppt](https://file1.bdocx.com/fileroot1/2022-10/5/5550eb63-d8ce-43aa-9daf-3386bfe78223/5550eb63-d8ce-43aa-9daf-3386bfe782231.gif)
,同源的两种含义:
Homology:
两条多肽链相应位点的氨基酸不同,但是尺寸、疏水性等化学性质类似;
(positive)Identity:
两条多肽链相应位置的氨基酸完全相同。
根据序列查找同源结构,BLAST!
http:
/www.ncbi.nlm.nih.gov/输入序列,BLAST根据序列查找目前的数据库中已有蛋白与输入序列的同源程度。
同源度越高,成功可能性越大。
分子置换法的原理,确定了待测晶体(B)的空间群后,利用同源的模型(A)设法找到B中分子在晶胞中的位置(x、y、z)和取向(a、b、g),从而得到B的结构模型,初始相位就可获得。
先旋转,后平移。
旋转,平移,旋转问题:
旋转函数,旋转函数定义为:
PA为晶体A的Patterson函数,U为晶体A的Patterson矢量所在的球形区域。
C为a、b、g三个角度所定义的旋转变换矩阵。
PB,R为晶体B的patterson函数经C变换后得到的函数。
如果旋转晶体,其Patterson函数也以同样的方式选转:
即矩阵C作用于Patterson函数P(u)得到旋转Patterson函数PR(u)。
旋转函数就是PA和PB,R在U空间的相关函数。
如果晶体A里的分子和晶体B里的分子类似,那么旋转到两个分子重叠时,旋转函数有极大值。
Rotationfunction,旋转函数,计算旋转函数注意的事项,低分辨的衍射数据通常不用,这部分数据对旋转不敏感,而且由于溶剂散射的影响,其精度可能较差。
高分辨的数据也不能用,这部分数据对旋转太敏感,误差也大。
合适的分辨率范围是310A。
有时需要尝试不同的分辨率范围。
积分区域:
通常选为球形,其半径通常等于或小于分子的直径。
有时也需要尝试。
模型选取:
易变性较强的氨基酸残基(通过同源蛋白氨基酸残基序列比较,可以确定残基的保守性和易变性)通常不要;
溶剂分子不要;
温度因子都选为一个合适的值;
有时需要人工构建一个P1晶胞以消除分子间原子矢量的影响。
平移函数,确定了旋转的角度abg后,把旋转后的模型分子在(待测)晶胞内作可能的平移,计算不同平移下F的相关因子(correlationcoefficient):
标准的线性相关因子(standardlinearcorrelationcoefficient)C为:
当模型分子与待测分子重合时,相关因子有极大值。
MR的例子,来源于拟南芥(A.thaliana)的乙酰羟酸合成酶AHAS(EC2.2.2.6,acetohydroxyacidsynthase,过去曾被称为ALS,现在则统称为AHAS)结构。
衍射数据取到3.0A。
模型用来源于酵母的AHAS结构。
这是一个二聚体,从PDB数据里提出一个单体作为模型,去掉水分子。
PDB数据库,ProteinDataBank(PDB)收集了目前解析出来的蛋白质结构;
/www.rcsb.org/pdbBLAST找到同源蛋白后,可以到PDB里下载结构。
同CCP4软件包进行分子置换法。
用CNS也可以。
注意:
由于目前解析生物大分子结构的软件有很多,各个软件的文件格式不同,因此格式转换很繁琐。
例如用HKL2000作数据处理得到的强度文件需要转换为二进制文件。
CCP4软件包里有很多程序就是转换用的。
解析结构也需要在不同软件之间反复切换使用。
第一步:
准备数据,原始数据是用HKL2000(DENZO/SCALEPACK)得到的SCA文件;
用CCP4转换成MTZ文件。
SCA文件记录的是衍射强度,转换为衍射振幅记录在MTZ文件中。
具体步骤
(1),数据:
atahas_94827.sca注意设置好工作目录:
CCP4中的选项Directories&
ProjectDir。
CCP4/DataReduction/ImportScaledData。
Jobtitle:
可以不填;
分子置换法不用反常衍射,所以不选Useanomalousdata。
具体步骤
(2),InProject:
输入sca文件(用Browse)。
OutProject自动生成mtz文件名。
可以改变文件的位置(FullpathProject/TEMPORARY)。
必须输入datasetname:
atahas。
输入Estimatednumberofresidualsintheasymmetricunit:
585。
总之,有颜色的地方都要填上,其他的可以不管。
Run!
文件
(1),用View按钮可以察看文件内容。
SCA文件:
1datanumber,usually1-985batchnumber,nomeaning178.468178.468184.94890.00090.000120.000p6422cell005717093.11706.4h,k,l,I006023413.82159.60063109.4917.8SCA文件纪录了衍射点的强度。
没有反常衍射,所以文件没有纪录I+,I-,只有I。
文件
(2),MTZ文件:
二进制文件。
有以下内容:
H,K,L,F_atahas,SIGF_atahas,IMEAN_atahas,SIGIMEAN_atahas,FreeR_flag。
这个文件还没有相位信息。
看看ViewFilesfromJob的内容。
第二步:
看看晶体里有什么?
溶剂含量,不对称单位中有几个分子,是否存在非晶体学对称性等。
决定下一步解析的策略。
具体步骤,MolecularReplacement/CellContentAnalysis输入mtz文件:
atahas_94827.mtz。
输入分子量(585x110=64350)。
RUN!
结果解释,Cellvolume:
5101535.000Forestimatedproteinmolecularweight64350Nmol/asymMatthewsCoeff%solvent16.681.223.362.5(比较可能)32.243.741.724.951.36.2,第三步:
找模型,MolecularReplacement/MolrepAutoMR自动化的分子置换法。
搜索模型:
同源结构,可能需要CNS转换一下从PDB下载的文件(CNS:
generate_easy)。
具体步骤,Molrep中输入:
mtz文件,pdb文件注意检查mtz文件中的对称群是否正确。
如果一个不对称单位中有1个以上的分子,需要做自旋转函数,判断是否存在非晶体学对称性,甚至整个晶体的点群可能要重新考虑。
输出文件为搜索得到的模型(pdb文件)。
很不幸,假设晶体的不对称单位含有2个分子搜索失败。
假设不对称单位含有1个分子搜索成功。
Molrep的解,旋转解Sol_RF1106.94-156.09176.1130.56145.90162.7584.378.99Sol_RF2101.98-166.34177.3719.97155.89172.6442.164.49Sol_RF335.5652.11163.5342.0370.27117.8041.324.40Sol_RF435.6447.83163.1337.4970.40121.8336.803.92Sol_RF577.1980.00125.4713.27120.1833.2836.203.86Sol_RF6135.42-178.61120.0140.4174.88217.6335.843.82Sol_RF776.9579.32121.0311.09115.9932.4435.373.77Sol_RF863.3472.32115.5717.7898.2553.1334.703.70Sol_RF937.40108.1738.9033.8423.34357.5034.463.67Sol_RF1014.2850.55147.5433.8327.40112.7333.483.57平移解Sol_TF_1130.56145.90162.750.6000.1560.40188.370.5540.444Sol_TF_1230.56145.90162.750.6000.1560.22245.600.6000.335Sol_TF_1330.56145.90162.750.5990.1560.20144.520.6010.332Sol_TF_1430.56145.90162.750.6000.1560.27443.940.6030.330Sol_TF_1530.56145.90162.750.6000.1560.26342.480.6050.327Sol_TF_1630.56145.90162.750.6000.1560.23741.320.6030.327Sol_TF_1730.56145.90162.750.6000.1560.39040.430.6070.326Sol_TF_1830.56145.90162.750.2670.4890.40138.500.6040.328Sol_TF_1930.56145.90162.750.6000.6560.40127.250.6180.296Sol_TF_11030.56145.90162.750.9290.8200.40321.960.6120.310,第四步:
刚体修正,Refmac5可以修正一些模型的bias。
得到一个初始的pdb文件。
里面包含了初始模型。
(当然模型里的分子不是待测蛋白,而是模型蛋白)。
输出的mtz文件包含了初始相位。
第五步:
消除模型bias,利用resolve的prime-and-search功能。
Resolve软件可以完成多个功能,其中消除模型bias的prime-and-search可以利用。
可以看到模型的误差R因子越来越小。
同晶差值傅立叶法和分子置换法都要求有一个类似的结构作为参考。
但是很多情况下找不到类似的结构(全新结构,denuovo)。
即使认为是有类似结构的条件下,利用这两种方法解析结构不一定能够成功。
这种情况下需要利用同晶置换法和反常散射法:
(间接)测量相位。
IsomorphousReplacement:
同晶置换法,假如能够在蛋白质晶体中加入一些重原子,而不引起晶体结构(或者蛋白质分子结构)的变化(近似,一般会有变化,但是变化很小),那么可以根据加入重金属后衍射强度的