ImageVerifierCode 换一换
格式:DOCX , 页数:112 ,大小:62.01KB ,
资源ID:24631633      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/24631633.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(蛋白质PDB文件说明.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

蛋白质PDB文件说明.docx

1、蛋白质PDB文件说明字符集合只是一些非控制型字符,象空格和结束符,出现在PDB文件记录中。也就是:abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ 1234567890 - = ; , . / ! # $ % & * ( ) _ + | : ? 空格和结束符。结束符根据系统而定,Unix用一行字符,而其他的系统可能就用一个回车来表示。特殊字符希腊字母就详细的拼写出来。比如:, , 原子用DOT表示。右箭头用-表示。左箭头用-表示。上标用两个等号表示开始和结束。比如:S2+下标用一个等号来表示开始和结束。比如:F=c=如果等号两边至少有一边

2、有一个空格,那么这个字符就是表示等号。比如:2 + 4 = 6逗号,冒号和括号用来表示文档中的分界苻,也就是下面几种中的一种:List SList Specification List Specification 如果逗号,冒号或者括号在任何一片文档中使用不是作为分界苻的话,那么肯定有字符被漏掉了。比如下边例子中第四行的:COMPND MOL_ID: 1;COMPND 2 MOLECULE: GLUTATHIONE SYNTHETASE;COMPND 3 CHAIN: NULL;COMPND 4 SYNONYM: GAMMA-L-GLUTAMYL-L-CYSTEINE:GLYCINE LIGA

3、SECOMPND 5 (ADP-FORMING);COMPND 6 EC: 6.3.2.3;COMPND 7 ENGINEERED: YESCOMPND MOL_ID: 1;COMPND 2 MOLECULE: S-ADENOSYLMETHIONINE SYNTHETASE;COMPND 3 CHAIN: A, B;COMPND 4 SYNONYM: MAT, ATP:L-METHIONINE S-ADENOSYLTRANSFERASE;COMPND 5 EC: 2.5.1.6;COMPND 6 ENGINEERED: YES;COMPND 7 BIOLOGICAL_UNIT: TETRAME

4、R;COMPND 8 OTHER_DETAILS: TETRAGONAL MODIFICATION数据类型-该部分该部分主要用来描述试验和记录中该大分子的一些基本信息,有以下几种记录:HEADER,OBSLTE,TITTITLE,CAVEAT,COMPND,SOURCE,KEYWDS,EXPDTA,AUTHOR,REVDAT,SPRSDE,JRNL和REMARK部分。以下来具体说明一下各个记录。记录类型-按照在记录中出现的频率区分:SINGLE一个文件中只出现一次.按字母顺序列出如下:记录类型 说明 CRYST1 晶胞参数 END 结束 HEADER 分子类,公布日期,ID号 MASTER 版

5、权拥有者 ORIGXn 直角PDB坐标 SCALEn 直角部分结晶学坐标 如果这些记录在一个记录中重复出现是错误的。SINGLE CONTINUED在记录中概念性的只出现一次,但信息内容可能超过了可利用列的数目.因次这些记录在后来的排列中会继续.按字母顺序列出如下: 记录类型 说明 AUTHOR 结构测定者 CAVEAT 可能的错误提示 COMPND 化合物名称 EXPDTA 测定结构所用的试验方法 KEYWDS 关键词 OBSLTE 注明该id号已改为新号 SOURCE 化合物来源SPRSDE 已撤消或更改的相关记录 TITLE 说明试验方法类型 MULTIPLE大部分记录类型多次出现,经常

6、出现在这些组中,组中的信息理论上并没有连接,但已呈现为列表的组成部分.这种记录类型中的许多习惯连载可能不仅仅制定记录还和其他记录相联.按字母顺序列出如下:记录类型 说明 ANISOU 温度因子 ATOM 标准基因的原子坐标 CISPEP 顺势残基 CONECT 有关记录 DBREF 其他序列库的有关记录 HELIX 螺旋 HET 非标准残基 HETSYM 非标准残基的同义字 HYDBND 氢键 LINK 残基间化学键 MODRES 对标准残基的修饰 MTRIXn 显示非晶相对称 REVDAT 修订日期及相关内容 SEQADV PDB和其它记录的出入 SEQRES 残基序列 SHEET 片层 S

7、IGATM 标准差 SIGUIJ 温度因子 SITE 特性位点 SLTBRG 盐桥 SSBOND 二硫键 TURN 转折 TVECT 转换因子 Multiple Continued在记录中概念性的出现多次,但信息内容可能超过了可利用列的数目.因次这些记录在后来的排列中会继续.按字母顺序列出如下:记录类型 说明 FORMUL 非标准残基化学式 HETATM 非标准集团原子坐标 HETNAM 非标准残基的化学名称 Grouping有三种记录类型用来聚合其他记录. 按字母顺序列出如下:记录类型 说明 ENDMDL 亚基结束 MODEL 多亚基时,示亚基号 TER 链末端 MODEL/ENDMDL 记

8、录包围着 ATOM, HETATM, SIGATM, ANISOU, SIGUIJ,和 TER 记录. TER 记录预示链的末端.Other其他记录类型有详细的内部结构.按字母顺序列出如下:记录类型 说明 JRNL 发表坐标集的文献 REMARK 注解记录的表示PDB数据库中的数据都应按照一定的规定来出现,强制记录类型必须出现在所有的记录中,当强制数据没有提供,记录名必须出现在记录中并以NULL表示当此条件存在时选择项表就变成强制记录类型。以下表格是对这两种类型的具体划分和描述:记录类型说明变为强制的条件HEADER强制OBSLTE可选个别记录中强制TITLE强制CAVEAT可选该记录中有错误

9、COMPND强制SOURCE强制KEYWDS强制EXPDA强制AUTHOR强制REVDAT强制SPRSDE可选在被替代的记录中JRNL可选出版物描述了该试验REMARK 1可选出版物描述了该试验REMARK 2强制REMARK 3强制REMARK N可选一定条件下强制,如记录在备注描述DBREF可选每个缩氨酸链的长度大于十个残基并且核酸记录存在于核算蛋白库中(NDB)SEQADV可选有序列冲突SEQRES可选ATOM记录存在MODRES可选有修饰存在HET可选有不标准的残基除了水分子HETNAM可选有不标准的残基除了水分子HETSYN可选FORMUL可选有不标准的残基或水HELIX可选SHEE

10、T可选TURN可选SSBOND可选有二硫键存在LINK可选HYDBND可选SLTBRG可选CISPEP可选SITE可选CRYST1强制ORIGX1 ORIGX2 ORIGX3强制SCALE1 SCALE2 SCALE3强制MTRIX1 MTRIX2 MTRIX3可选完全不对称单元非晶相对称TVECT可选MODEL可选记录中多于一个MODELATOM可选有标准的残基存在SIGATM可选ANISOU可选SIGUIJ可选TER可选有ATOM记录存在ENDMDL可选有MODEL存在CONNECT可选不标准的团存在MASTER强制END强制记录部分的划分Title大概描述HEADER, OBSLTE,

11、TITLE,CAVEAT, COMPND, SOURCE,KEYWDS, EXPDTA, AUTHOR,REVDAT, SPRSDE, JRNLRemark参考书目,最大分辨率,注解等REMARKs 1, 2, 3 and othersPrimary structure一级结构 氨基酸或核苷酸序列和PDB序列和其他序列库的有关记录DBREF, SEQADV, SEQRES,MODRESHeterogen不标准组的描述HET, HETNAM, HETSYN, FORMULSecondary structure二级结构HELIX, SHEET, TURNConnectivity annotatio

12、n化学元素连接SSBOND, LINK, HYDBND, SLTBRG,CISPEPMiscellaneous feature大分子的特征SITECrystallographic晶体细胞描述CRYST1Coordinate transformation坐标描述ORIGXn, SCALEn, MTRIXn, TVECTCoordinate原子坐标数据MODEL, ATOM, SIGATM,ANISOU, SIGUIJ, TER, HETATM, ENDMDLConnectivity化学键连接CONECTBookkeeping概要信息和结束标志MASTER, END对数据类型的说明数据类型描述Ac

13、har一个英文字母(A-Z,a-z)Atom原子名CharacterASCII码和空格Continuation如果一行描述不完用此表示序列号,占两个字符右对齐,第一个用空格Date占九个字符dd-mmm-yy, DD表日期,右对齐不足左补零;MMM表月份用常用的三个英文字母表示;YY表20世纪的一年,他们都必须是有效日期IDcode占四个字符,第一个是阿拉伯数字(0-9),余下的三个由希腊数字组成,字母必须是大写的。若第一个是阿拉伯数字零则对此蛋白质的描述中没有坐标数据Integer右对齐,不足的用空格填充的整型数据Token由一组没有空格的字符组成,结尾部分紧跟着冒号和空格List一个由逗号

14、分开的字符串Lstring字符串,任何空格都有意义必须保存LString(n)有N个字符的LstringReal(n,m)实型Record name记录的名字,由六个字符组成,左对齐,不足的用空格补充Residue name右对齐格式标准氨基酸或核苷酸中的一个,后有列表.不标准组分在HET中详细说明Slist由一些内容组成的字符串,有分号分开Specification由一些token记录组成的字符串,由冒号分开Specification list由Specifications组成的序列,由分号分开String由字符组成的序列,可能有些空格,但应该详细说明String(n)由N个字符组成Stri

15、ngSymOP由46个数字组成的整数,右对齐格式.详细资料在Appendix 1残基名字在PDB格式中出现的标准残基的名字:残基类型残基名字氨基酸ALA, ARG, ASN, ASP, CYS, GLN, GLU, GLY, HIS, ILE, LEU, LYS核酸A, C, G, T, U, I, +A, +C, +G, +T, +U, +I其他UNK(unknown)Appendix 4中有更多关于标准残基名和缩写的信息, Appendix 5中有他们的化学式和分子量.标题部分HEADER(分子类,公布日期、ID号)综述该记录包含三个方面的内容:蛋白质的种类,被该数据库接收的日期和唯一区分

16、该蛋白质的id CODE.记录格式列数据类型字段名称定义描述1 6Record nameHEADER11 50String(40)classification该蛋白质的分类51 59DatedepDate被数据库接收的日期63 66IDcodeidCode唯一标识某个蛋白细节改分类表示是左对齐的,并且由于分给字符位的限制,有时分类名太长,要用简写表示。在KEYWDS记录中存着改分类的全称。示例 1 2 3 4 5 6 71234567891234567891234567891234567890HEADER MUSCLE PROTEIN 02-JUN-93 1MYSHEADER HYDROLAS

17、E (CARBOXYLIC ESTER) 08-APR-93 2PHIHEADER COMPLEX (LECTIN/TRANSFERRIN) 07-JAN-94 1LGBOBSLTE (注明此ID号已改为新号) 综述该记录出现在已经被收回的蛋白质的描述中,可以作为一个标志。任何新的记录都能代替别回收的记录.这个版本允许多个新纪录代替现有记录.记录格式列数据类型字段名称定义描述1 6Record nameOBSLTE9 10Continuationcontinuation允许多重记录串联表示不同行的顺序号12 20DaterepDate被替代的日期22 25IDcodeidCode该记录的id

18、code32 35IDcoderIdCode替换的id code37 40IDcoderIdCode替换的id code42 45IDcoderIdCode替换的id code47 - 50IDcoderIdCode替换的id code52 - 55IDcoderIdCode替换的id code57 60IDcoderIdCode替换的id code62 65IDcoderIdCode替换的id code67 70IDcoderIdCode替换的id code细节只有第一个提交记录的人才有权利收回改蛋白质,所有回收的记录都有研究用途.示例 1 2 3 4 5 6 712345678912345

19、67891234567891234567890OBSLTE 31-JAN-94 1MBP 2MBPTITLE(说明实验方法类型) 综述该记录描述试验的题目或者对它的一些分析。该记录唯一区分一个蛋白质。记录格式列数据类型字段名称定义描述1 - 6Record nameTITLE 9 - 10Continuation顺序允许多重记录串联表示不同行的顺序号11 - 70String标题试验题目细节1. 描述记录内容和区别相似记录得程序或条件,使录入者有机会着重强调做这些特殊试验得根本目的. 2. TITLE可能包括得一些项目: -实验类型 -对突变的描述 -记录中只给出-碳原子. 示例 1 2 3

20、4 5 6 71234567891234567891234567891234567890TITLE RHIZOPUSPEPSIN COMPLEXED WITH REDUCED PEPTIDE INHIBITORTITLE BETA-GLUCOSYLTRANSFERASE, ALPHA CARBON COORDINATES ONLYCAVEAT(可能的错误提示) 综述警告在蛋白质记录中中出现的错误。记录格式列数据类型字段名称定义描述1 - 6Record nameCAVEAT9 - 10Continuationcontinuation允许多重记录串联表示不同行的顺序号12 - 15IDcodei

21、dCode蛋白质的ID code20 - 70Stringcomment警告的原因细节1. PDB在还未回收的错误记录中加此记录,用的比较保守只在外部评论后用. 2. PDB不能核实转化回晶胞时注意此记录,此时分子结构依然正确. 示例 1 2 3 4 5 6 71234567891234567891234567891234567890CAVEAT 1ABC THE CRYSTAL TRANSFORMATION IS IN ERROR BUT ISCAVEAT 2 1ABC UNCORRECTABLE AT THIS TIMECOMPND(化合物分子组成) 综述描述蛋白质的组成记录格式列数据类型

22、字段名称定义描述1 - 6Record nameCOMPND9 - 10Continuationcontinuation允许多重记录串联表示不同行的顺序号11 - 70Specification listcompound对分子成分的描述细节对蛋白质组成的描述又细分为如下:记号确切涵义描述MOL_ID每一成分的数目MOLECULE分子名CHAIN逗号分开链标识符,若空白用NULL表示FRAGMENT对结构域或具体部分的详细描述SYNONYMMOLECULE同义部分,逗号分开EC酶学委员会相关号码,不止一个时用逗号分开ENGINEERED分子通过重组产生或纯化学合成MUTATION自野生型突变的描

23、述BIOLOGICAL_UNIT完整功能单元描述OTHER_DETAILS增加的注释对MUTATION以下举例说明惯用的几种突变类型:突变类型描述形式简单替代Asn替代His 57只在C链中Asn替代His 57H57NChain C, H57AN插入突变His and Pro 插入Lys 48前INS(HP-K48)缺失突变A链和C链的Arg 141缺失,B链中的不缺失His 23到ARG 26缺失 DEL(23-26)只B链的His 23C和Arg 26缺失Chain A, C, DEL(R141)DEL(23-26)Chain B, DEL(H23C,R26)如有多于十种突变: - 所有

24、突变在SEQADV记录中列出 - 一些突变可能在COMPND的MUTATION中列出来强调录入者认为最重要的部分.示例 1 2 3 4 5 6 71234567891234567891234567891234567890COMPND MOL_ID: 1;COMPND 2 MOLECULE: HEMOGLOBIN;COMPND 3 CHAIN: A, B, C, D;COMPND 4 ENGINEERED: YES;COMPND 5 MUTATION: CHAIN B, D, V1A;COMPND 6 BIOLOGICAL_UNIT: HEMOGLOBIN EXISTS AS AN A1B1/A

25、2B2COMPND 7 TETRAMER;COMPND 8 OTHER_DETAILS: DEOXY FORMCOMPND MOL_ID: 1;COMPND 2 MOLECULE: COWPEA CHLOROTIC MOTTLE VIRUS;COMPND 3 CHAIN: A, B, C;COMPND 4 SYNONYM: CCMV;COMPND 5 MOL_ID: 2;COMPND 6 MOLECULE: RNA (5-(*AP*UP*AP*U)-3);COMPND 7 CHAIN: D, F;COMPND 8 ENGINEERED: YES;COMPND 9 MOL_ID: 3;COMPN

26、D 10 MOLECULE: RNA (5-(*AP*U)-3);COMPND 11 CHAIN: E;COMPND 12 ENGINEERED: YESCOMPND MOL_ID: 1;COMPND 2 MOLECULE: HEVAMINE A;COMPND 3 CHAIN: NULL;COMPND 4 EC: 3.2.1.14, 3.2.1.17;COMPND 5 OTHER_DETAILS: PLANT ENDOCHITINASE/LYSOZYMESOURCE(化合物来源) 综述用来详细描述记录中每个生物大分子的生物或化学来源。用习惯命名和系统命名共同描述.记录格式列数据类型字段名称定义描述1 - 6Record nameSOURCE9 - 10Con

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1