ImageVerifierCode 换一换
你正在下载:

bio.docx

[预览]
格式:DOCX , 页数:7 ,大小:27.54KB ,
资源ID:5171582      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/5171582.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(bio.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

bio.docx

1、biobiobio2010/06/28上午02:21什么是生物信息学?生物信息学是生物学和信息技术的结合,是现代科学的又一个分支学科,它利用计算机对大量生物数据进行分析处理.生物信息学把用于存储和搜索数据的数据库开发,与用于分析和确定大分子序列、结构、表达模式和生化途径等生物数据集之间的关系的统计工具和算法的开发结合在一起。DNA测序原理全自动的链终止反应(Sanger方法)P11 DNA测序是采用全自动的链终止反应完成的,这一技术通过加入限量的双脱氧核苷酸来产生有特定终止碱基的嵌套DNA片段。共有4种反应,每种代表DNA 4个碱基中的一个,每个碱基分别带有不同的荧光标记。DNA片段通过聚丙烯

2、酰胺凝胶电泳(PAGE)分离,当每个片段移动到凝胶的末端时可以通过扫描仪读取序列。DNA序列类型:基因组DNA cDNA重组DNA基因组测序策略散弹测序法克隆重叠群P13弗朗西斯克林斯-美国国家健康研究所人类基因组计划首席科学家【04级试卷考到】霰弹法测序(快速但空位较多)包括随机DNA片段的生成,通过大量片段测序来覆盖整个基因组;克隆重叠群测序(较慢但空位较少)包括亚克隆系统的产生及其测序。打散成片段-用推理方法亚克隆-系统测序完成序列2.蛋白质结构的确定(方法)X-ray衍射晶体学通过精确定向的蛋白质晶体的X射线衍射模式来确定蛋白质结构X射线因晶体中原子的电子密度和空间方向的不同而发生散射

3、,可用傅立叶变换的数学方法从衍射数据中重构电子密度图,以建立结构模型。核磁共振谱(NMR)用于确定溶液中的小蛋白质(小于25kDa)的结构,经常用于不容易形成结晶的蛋白质原理P18 ppt75;NMR是某些原子的一种属性,即在外加磁场范围内原子通过吸收电磁辐射可以在不同的磁状态间转换。收光谱的性质受原子类型及其周围化学性质影响,所以NMR spectroscopy可以区分不同的化学功能团。核磁共振谱也因空间上原子的接近而改变。NMR谱的分析可以重建原子的三维构型,产生一系列结构模型。这一技术只适合小的可溶性蛋白的分析。其他方法对于大的不容易结晶的蛋白质,用其他分析方法来推测结构,包括X射线纤维

4、衍射、电子显微镜和CD光谱文件格式常用核酸和蛋白序列格式:NBRF/PIR:.pir或.seq FASTA:.fasta GDE:.gde NBRF/PIR:P1;5HT1B_CAVPO(核酸N1)FASTA:5HT1B_CAVPO O08892 GDE:%5HT1B_CAVPO O08892比对序列文件可以用NBRF/PIR FASTA GDE来表示多序列比对格式除常用格式外还可用:MSF,PHYLIP(系统发育推断软件包),ALN(ClustalX的格式)数据库格式:多种用于显示和注释基因组数据的数据库工具,查看格式有Artemis,AceDB,Apollo,EnsEMB,LNCBI ma

5、p viewer和GldenPath,其中最通用的数据库格式是是AceDB数据库资源:初级数据库-GenBank,EMBL(欧洲分子生物学实验室核酸序列数据库),DDBJ(日本DNA数据库)SWISS-PROT,TrEMBL用于存储蛋白质序列的主要的初级数据库PROSITE,PRINTS,BLOCKS蛋白质家族和序列模式的二级数据库结构数据库的初级资源是PDB(蛋白质数据库),用PDB格式的平面文件(flat files)来维护,这类文件包含:正交的原子坐标值(X,Y,Z轴);注释、说明和实验细节。蛋白质和高级功能:多种数据库包括蛋白信息资源PIR,京都基因和基因组百科全书KEGG文献数据库:

6、Medline(已并入NCBI维护的文献资源库PubMed中-Entrez)辅助序列数据库dbEST-GenBank的分支,存放表达序列标签(EST)dbGSS-GenBank的分支,存放单遍基因组调查序列(GSS)dbSTS-GenBank的分支,存放序列标签位点(STS)唯一的基因组序列可用来作为物理标志HTG(高通量基因组)分支-存放未完成测序的基因组序列数据序列提交:序列-提交工具(WebIn、BankIt、Sequin)-www-NCBI,EMBL,DDBJ WebIn-EMBL BankIt-NCBI Sequin-NCBI单机版软件SWISS-PROT和TrEMBL SWISS-

7、PROT-收集了确认的蛋白质序列及与结构、功能和所属蛋白质家族有关的注释信息TrEMBL(翻译的EMBL)-翻译了初级核酸数据库中的编码序列。TrEMBL注释不如SWISS-PROT那样详细。序列相似性搜索-BLAST数据库查询基于文本的搜索-Entrez或SRS访问号生物数据检索(三个平台)Entrez-NCBI开发,基于WWW的数据检索工具可以用来搜索NCBI中集成的所有数据库包括GenBank,OMIM以及文献数据库MEDLINE;EntrezAll databases模式搜索,以文本是形式进行文本搜索:以单词或逻辑短语为关键词BDGET/LinkDB(P55)-日本京都大学和人类基因组

8、中心联合开发的集成数据检索系统。;它整合了20数据库并与KEGG相关联;三种搜索模式:bget,bfind,blink SRS-欧洲生物信息研究所开发,查询方式有两种:标准模式、扩展模式.可下载和安装在本地计算机上使用序列相似性搜索当序列拥有一个共同的祖先序列时,它们往往在序列、结构和生物学功能上具有相似性(原理)。如果能在数据库中找到功能和结构信息已知的相似序列,就可以作为预测新序列结构或功能的基础(作用)。依据相似性进行预测是生物信息学中强大而且广泛使用的方法,其根本依据是分子进化(依据)。流程:查询序列-通过BLAST FASTA等工具搜索-在数据库中找到相似序列-预测工具查询序列的结构

9、和功能信息序列相似性测量:序列相似度可用比对算法、序列一致性百分率或更复杂的方法得出的分值来量化。序列比对:是使相似度量化的第一步,用来区分偶然性的相似和真实的生物学关系比对结果:以变化(突变)、插入或缺失(空位)来显示序列之间的差异,这些差异可用进化术语说明。比对算法:动态规划算法可以计算两条序列之间的最佳联配。Smith-Waterman算法:局部相似性Needleman-Wunsch算法:全局相似性比对打分(联配分值)和空位罚分P64动态规划算法用简单的比对打分来测量相同匹配残基的比例或数目。得从比对打分中扣去空位罚分,以保证比对算法能得出没有太多的空位的结果,而具有生物学意义。可以计算

10、两条序列之间的最佳联配。当序列不是全长关联时局部比对是有效的空位罚分分为:PPT4 16页书P64固定罚分(常数罚分):与空位长度无关;比例罚分:与空位长度成比例;记作Bl-B是常数,l是空位长度NOTE:序列相似性测量-必须是在长的比对结果中找到的高比例一致,才可能反映真正的生物学或进化关系。对DNA序列来说,比对序列并使序列一致性百分率最大化是合乎情理的。但对蛋自序列而言,则应该更多地考虑组成序列的单体的属性。某些氨基酸之间的替代比其他氨基酸更频繁,所以,在蛋白序列比对算法中需要考虑这个因素。相似性和同源性:序列相似性-是序列比对过程中,描述检测序列和目标序列之间相同DNA碱基或氨基酸残基

11、所占比例的术语。任何序列之间均存在相似,但是仅当序列是从一个共同的祖先进化而来时,它们才是同源的。不同物种的两个同源基因有相同的功能,就称它们是垂直同源体。当同一或不同物种的两个基因有不同的功能,就把它们称为水平同源体。氨基酸替换矩阵P66(重点)为什么用氨基酸替换矩阵比对氨基酸序列进化改变了核苷酸序列,但编码蛋白质的序列的进化受到强烈的功能约束。要维持蛋白质结构和功能,所以编码蛋白质的序列的进化比基因组的大多数其他部分的进化更为缓慢。当进化确实出现在蛋白质序列中时,这些变化往往包括相近属性氨基酸见的替代。替换打分矩阵比对氨基酸序列可查找蛋白质序列间较远的亲缘关系。因此,序列比较总在蛋白水平上

12、进行而不在核苷酸水平上进行是因为蛋白质水平的序列比较有能力探测到较远的亲缘关系。替代记分矩阵:用来显示氨基酸替代的分值的矩阵。矩阵给进化中所有可能的氨基酸替换打分,分值越高,意味着替换的可能性越大。进行序列比对的动态规划算法可以采用从这些矩阵得到的分值来进行运算。Eg:BLOSUM62 and PAM250.Note:一致氨基酸比对的分值也有差异,这反映了氨基酸在天然蛋白序列中的出现频率的不同。两个相同的非常见氨基酸的比对(如W和W)要比两个相同的常见氨基酸的比对更有可能反映一个进化上有意义的比对。因此,相同的非常见氨基酸的比对具有更高的分值。PAM250:表示矩阵的进化距离是每100个残基有

13、250个氨基酸变化。PAM:认可的点突变PAMn:n值越小,表示进化距离越短。BLOSUM62:用于构造矩阵的blocks的最小序列一致性百分数至少为62%。更小数字的BLOSUM矩阵表示更长的进化距离(BLOSUM50所代表的进化距离要比BLOSUM62要长)。Note:BLOSUM矩阵通常比PAM好用。点阵图是实现序列相似性可视化并找到重复片段的一一个非常好的方法。数据库搜索:FASTA和BLAST P73 BLAST和FASTA都基于同样的假设,即高分值的比对结果可能含有短的一致或近似一致的序列片段BLAST:寻找打分比某一特定阈值(T)高且长度是W的单词-扩展个别单词匹配直到比对得分跌

14、落到一定值,产生大量HSPs(高分值片段对)-通过动态规划比对好全部序列高打分区域,得出最终比对结果及其分值。FASTA:寻找匹配一致且长度为kyup的单词-寻找含有高密度最初识别的单词匹配的无空位的序列比对,将其组装成高分值的有空位的序列比对-通过动态规划比对好全部序列高打分区域,得出最终比对结果及其分值。统计分值:p值:相似度记分是指获得至少与两条无关序列间的偶然相似性一样高的分值的概率。很低的p值对应于有意义的匹配E(期望)值:是至少与所识别的相似性记同样高分值的偶然事件的期望频率。两序列间相似度的低p值对应于大数据库搜索的高E值。假如E或p的阈值已经选定,则认为比阈值低的E或p值的序列

15、相似度是有意义的。通常我们把有意义的相似序列叫做击中项。敏感性是指以击中项的形式显示出来的真实生物学关系在数据库中的比例。特异性指击中项中具有真实生物学关系的击中项比例。数据库和查询序列可以是蛋白质或核苷酸序列。一般来说,如果使用编码蛋白质的核苷酸数据库和/或将查询序列翻译成蛋白质序列,搜索会更加敏感。4.序列过滤程序一些类型的序列相似要比其他类型难揭示进化关系。例如低组成复杂度区域间的相似,短的重复片段间的相似以及编码普通结构的蛋白序列(如卷曲螺旋)间的相似等。相似性搜索目的是找出同源蛋白序列或有相似功能的蛋白序列,非特异性序列相似会降低相似性搜索结果的质量SEG和DUST-可找到低复杂序列

16、,SEG主要用于蛋白和氨基酸序列,DUST用于核苷酸XNU-可发现短的周期性重复COILS-可预测蛋白质中潜在的卷曲螺旋结构什么是迭代搜索,为什么用迭代搜索对最初的查询序列进行BLAST搜索,然后将这次查找得到的每一击中项作为Blast搜索叠词迭代的查询序列.经过多次迭代课找到更多的疏远关系。PSI-BLAST是一种迭代的搜索方法,可以提高BLAST和FASTA的相似序列发现率。(对所有击中项形成的序列轮廓进行Blast搜索)每次迭代都发现一些中间序列,用来在接下去的迭代中寻找查询序列的更多疏远相关序列。PSI-BLAST常可以找到比BLAST结果多达两倍的进化关系。PSI-BLAST的潜在问

17、题:存在不相关序列对迭代结果的污染,这与蛋白质的结构域的结构有关。多序列比对:多序列比对包含的信息:比对本身,一致序列,保守残基和残基模式,序列轮廓,其他的序列家族的概率模型家族性蛋白质和核苷酸序列的内在关系可以用多序列比对来阐明。当所考察的序列不同时,保守的残基往往是维持稳定结构或生物学功能的关键残基。多序列比对可以揭示关于蛋白质结构和功能的许多线索。比对软件:ClustalW软件包(运用渐进比对)常用,速度快。以两序列比对来初步评价序列的相关性,并在这个基础上构建向导树;然后使用向导树逐步添加序列到比对中,从最密切相关的序列开始到距离最远的序列结束。渐进比对方法通常非常有效,但也存在一个问

18、题,即比对过程中早期产生的比对错误不能被矫正而是被冻结在比对结果中。生物化学知识有时能够提供正确的比对信息。当自动产生的比对结果不太理想时,就需要软件来人工编辑比对结果。渐进比对过程中常用到几种精练方法。例如在Clustal程序包中,1)空位罚分发生变化以使空位插入更有可能发生在亲水的环状区域;2)根据比对序列的相关程度可以采用不同的氨基酸替换打分矩阵。蛋白家族和模式数据库把序列分配到蛋白质家族中是预测蛋白质功能的一种非常有价值的方法。已开发出许多方法来代表蛋白质家族信息,这些方法存储在二级蛋白质家族数据库中。PROSITE-PROSITE数据库包含与蛋白质家族成员、特定蛋白功能及翻译后修饰有

19、关的序列模式。数据库是人工编排的,任何已知的假阳性或假阴性都会报道出来。P94在PROSITE中,特殊的符号,包括方括号(如LIVM)、波形括号(如FD)和x(n)用来表示模式中每个位点可供选择的残基。P94LIVM-L,I,V,M中某一个残基FD-该位点可被除L或T之外的任何残基占据x(n)-指两个任何种类的残基,不一定是同一种类H-丝氨酸蛋白酶家族的关键催化残基PROSITE模式的特点:1、它们长度比序列全长短得多;2、它们允许特定位置的替换。因此它们能够发现家族中的远亲关系,也能够帮助我们了解家族成员共有的结构或功能信息。PROSITE模式有很多缺点:首先,它们长度较短使得不相关序列中有

20、假阳性的存在;其次,虽然它们允许描述特定位置的变化,但无法计算该变化的概率。PRINTS和BLOCKS用来自序列最保守区域的多序列比对的无空位片段(blocks or motifs)来表示蛋白质家族。通过更多代表序列的信息,它们有可能比短PROSITE模式更为敏感。在BLOCKS中,多序列比对的无空位片段定义为blocks;在PRINTS中定义为motifs PRINTS和BLOCKS模式与PROSITE模式的区别这些数据库中的motifs要比PROSITE模式覆盖更大的序列区域。与PROSITE不同,序列中motifs的匹配通常要考虑氨基酸替换矩阵,因而对某一固定模式不要求严格的匹配。因此,

21、这种匹配更为敏感(可以找到更多远亲关系)和更加特异(更少的假阳性出现)。蛋白结构域家族结构域家族:许多蛋白质是由结构域以模块化的方式构建的。因此蛋白质家族的研究其实是对蛋白质结构域家族的研究。Prodom:是由自动方法产生的蛋白质结构域序列的数据库,这一数据库来自于蛋白质序列数据库。序列轮廓:又称为权重矩阵,它们表示完全的结构域序列,是一种描述蛋白结构域家族相关序列的方法。P99【看懂】系统发育学系统发育学的可靠性:系统发育分析的简单原理是两条序列见相似度越高,从一条序列变成另一条序列所需要的突变就越少,因而它们拥有共同祖先就越近。然而要注意到从这类分析得出的任何进化关系假定所比较的序列有时存

22、在不变的突变率并且没有差异的选择。这在实际中是很难达到的,没有方法能保证一棵系统发育树一定代表了真实进化途径。但有些方法能检测系统发育预测的可靠性:不同方法建树-得到同样的结果-可信;数据可重新取样-统计上的重要性构建系统发育树(方法)相似度和距离表:系统发育树可以从相似度表或距离表中构建出来。是一种显示进化关系的简单方法,物种由节点(nodes)表示,遗传路径由枝(links)来表示。三种建树方法距离矩阵法P110:通过执行所有可能得序列联配来决定最密切相关的序列并给予这些距离测量来构建系统发育树。即选择距离矩阵中两条最密切相关的类,再将它们聚类。重复此过程直到仅剩一个类。(距离矩阵法:单一

23、连接法、完全连接法、不加权的算术平均组对法、加权的算术平均组对法)最大简约法:P111建立在将一条序列转变成另一条序列所需突变的最少数量来对序列进行比较和聚类。最大似然法:P111计算序列中每个位置的一个给定序列变化的可能性,最可靠的树为总的可能性最大的那棵。似然法和简约法的不同是前者整合了一个序列变化的期望模型,该模型对任一残基转化成另一残基的概率加权。系统发育树算法的限制:不正确的序列联配、不能解释序列不同位置进化速率的变化、以及不能解释不同类中序列进化速率的不同。系统发育分析软件PAUP PHYLIP可进行上面三中方法分析。检测系统发育预测可靠性的方法:1、如果不同方法构建树能得出同样的

24、结果,这可很好证明该树是可信的。2、数据可以被重新取样,来检测它们统计上的重要性。大分子序列的选择研究关系密切的物种的进化关系,需要找到进化足够快的分子(如灵长类选用线粒体DNA),相反,如果我们想研究更多不同种类物种之间的进化关系,我们需要找到普遍存在的高度保守,突变很少的大分子序列(如rRNA)序列注释注释:是指从原始序列数据中获得有用的生物学信息。这主要是指在基因组.DNA中寻找基因和其他功能元件(结构注释),并给出这些序列的功能信息(功能注释)。P121用计算机查找基因用计算机来预测基因组DNA上基因的位置。这可以通过信号自动检测寻找保守的模体(motif)、内容自动检测(寻找序列背景

25、类似基因的区域)和同源性搜索(寻找与以前已发现的基因序列相匹配的区域)等方法的组合来完成。三种类型特征:信号Signals(如启动子,剪切供体和受体位点,起始和终止密码子,以及polyA尾位点。)内容Contents(如编码区、CpG岛(CpG island)等)同源性Homologies(如代表基因的表达序列标签(ESTs)序列等)ORF:一段较长(300bp)的位于起始密码子(ATG)和终止密码子(TGA,TAG or TAA)之间的有义密码子序列。在细菌基因组中,基因很少有内含子的中断。因此,检测基因的有效途径是对基因组序列进行六个可读框的翻译并识别长的可读框(ORF)。在任何可读框中存

26、在300bp或更长的未中断的编码序列是判断一个基因的重要依据结构生物信息学三种不同的蛋白结构类型:纤维蛋白(如胶原质);球状蛋白,它往往存在于如细胞质和细胞外液等水性溶剂中;内在膜蛋白,它存在于生物膜的脂质环境当中。球状蛋白中,线性氨基酸多聚体折叠成球状的紧凑形状从而形成一种三维结构。球状蛋白在水性溶剂中往往是可溶的,其折叠受疏水效应控制(形成球形原因),疏水效应使疏水氨基酸侧链朝向蛋白质的结构核心,远离溶剂。球状蛋白中的环的表面残基要比疏水核心中的残基进化更快。球状蛋白包含规则的二级结构的元件,如-螺旋(H)和-链(E or B)。P129 PPT10 7页-helices由每个氨基酸的主链

27、上C=O功能团和氨基酸沿着螺旋的四个残基上的H-N功能团之间的氢键来稳定。-strands由主链上的残基与多肽其他部分形成的链中的残基连接形成的。内在膜蛋白特征是生物信号和跨膜运输系统的关键元件。这些蛋白存在于生物脂质膜中,跨膜片段(常常但不总是螺旋)中的氨基酸往往是疏水的,与膜的脂质相容。而膜两侧存在于水性环境中的蛋白部分往往极性更高。内在膜蛋白中,进化最慢的是那些在跨膜结构域中的残基自然界通过组合独立的组件单元或通常具有较简单功能的结构域创造了具有复杂功能的蛋白质。蛋白质三维结构与其功能的关系蛋白质依赖于其三维结构的形状和关键功能域的性质来执行生物功能。蛋白质结构和功能的进化(关系)结构和

28、功能约束:进化接受蛋白质中氨基酸残基发生的对蛋白质结构稳定或蛋白功能来说中性或有利的变化。出于结构或功能的需要,残基可以被保留下来。当氨基酸残基能独特地实现特定的结构作用时,它们能被保留。这种情况常常出现在cysteine,glycine and proline.蛋白质结构分类的方法主要依据序列比较方法和结构比较方法多序列比对【04简答,名解】P137理解结构怎样进化有助于我们理解多序列比对。关键的结构和功能残基常常是保守的。插入和缺失主要出现在亲水的表面回环中,而不是规则的二级结构元件中。回环会发生很快的突变。二级结构元件中疏水核心残基的保守是普遍的,同样两性分子螺旋也有着其保守模式。比对结

29、果往往是由对应于二级结构元件的较保守残基和来自表面回环的不保守残基交替组成的。与两序列比对相比,多序列比对更富含进化保守关系的信息,因此通常能告诉我们更多的信息。整体蛋白质折叠的进化如果两条自然出现的蛋白质序列可以比对,并且80个以上的残基的比对显示出25%以上的相似度,那么它们将共有同样的基本结构。Sander and Schneiders rule:t(L)=290.15 L-0.562其中L指的是比对的长度,t指保证结构相似所需的一致度百分比阈值。结构的保留和功能的进化【看看有印象】蛋白质结构往往被保留,甚至由于进化使序列改变到不能被识别时结构仍被保留。功能却会发生变化。有许多蛋白质,其

30、序列和结构非常相似,但功能却不相同。当功能发生变化,关键的功能残基也变化了,多序列比对常常能清楚地显示出这一点。结构数据的获取、展示和分析P143【看清楚P147的三角形圆圈图知道代表什么,方向如何等04有考简答不过没译出来】获取数据的搜索引擎:SRS,NCBI,RSCB(专业)结构的可视化:常用的观察结构数据的程序:RasMol;TOPS(TOPS卡通图P147)结构和功能位点的分析:PDBSum SURFNET:PDBSum提供的信息包括二级结构、二硫键位置、配体结合位点、活性位点、关键残基、分子间相互作用图、折叠拓扑以及酶的EC号等信息。SURFNET:能够帮助确定蛋白表面潜在的功能位点

31、,特别是酶的活性位点。然后考虑这些位点的结构能揭示该新结构的何种可能功能。结构比对P150要在关系非常疏远的蛋白序列之间找到正确的、有生物学意义的比对时,结构信息能帮上忙,因为进化往往尽量少地改变结构。叠加相似结构的骨架以发现相同结构残基的过程被称为结构比对。结构相似性:结构比对方法通常会创建衡量结构相似度的尺度。最常见的衡量尺度是RMSD许多程序都用这个标准,它是指最佳结构重叠中比对残基的碳原子间位置的均方差结构比对软件:DALI结构相似性搜索站点:DALI,SSAP TOPS VAST RCSB已知三维结构的蛋白分类:CATH和SCOP折叠或拓扑(注意二级结构原件SSEs)同源体与相似体超

32、折叠【看看有印象】PPT10 49-51页书P155-157蛋白质结构预测【应该有大题会涉及】为什么要预测结构?结构预测是有意义的,因为通过实验来确定结构仍然要比通过实验确定序列慢得多。结构预测帮助我们理解蛋白质的功能和作用机制,对合理的药物设计也是很有意义的。Levinthal和Anfinsen的早期工作使得结构预测成了又一个极有发展潜力的科学领域。Anfinsen:证明了蛋白质可以自发地折叠成它们的天然结构,而不需要其他任何试剂的介入Levinthal:指出寻找正确结构的过程不能是随机搜索所有的可能性,因为这样将花费太长的时间。(理论基础)蛋白质结构在进化中要比蛋白质序列保守得多。蛋白质可

33、以自发地折叠成它们的天然结构,因此蛋白质的折叠在某种程度上就编码在氨基酸序列中。并且寻找蛋白正确结构的过程不能是随机搜索所有的可能性,探究蛋白质如何编码三级结构以及理解该结构如何折叠式个很有科学价值的问题。结构预测是指仅依据蛋白序列的信息来预测蛋白质每个原子在三维空间中的相对位置。(理论基础)可以是从零开始的,尝试计算并最小化自由能,或得出一个合适的近似最小值的方法也可以是基于一些已有知识的,尝试使用已知结构数据库中的信息来预测蛋白质结构。结构预测方法比较建模法,折叠识别法,二级结构预测法,从头预测法以及跨膜片段预测法比较建模预测结构过程【掌握大概过程,复习课有讲】书P161保守核心残基的定位-可

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1