1、以往的研究表明,蛋白表面的 loop 区可能为功能性抗体的识别位点, 特异性好,可及性强。本课题选用的 HPO、G-CSF、HSA 空间结构已明确,所以直接选择 loop 区或无规卷曲作为 B 细胞表位。举例:人 Pif1 基因编码至少两种蛋白亚型,分子量分别为 74kDa 和 80kDa,与酵母具有高度的同源性, 型和 型 Pif1 只有 C 末端不同 20,其余部分完全相同,并且二者的 C 末端在蛋白数据库中都是唯一的,选择 型和 型的 C 末端作为 B 细胞表位,既满足特异性的需要,也能区分亚型。GPAA1 是一种跨膜蛋白,原核表达非常困难,形成包涵体,且包涵体难以溶解和复性。对这一类型
2、的蛋白,非常适合选择其特有的 B 细胞表位免疫动物,来最终制备识别全蛋白质的抗体。 ABCpred 是基于人工神经网络模型的线性 B 细胞表位预测工具,该系统检验了源于 Bcipep 数据库的 700 个非冗余 B 细胞表位和源于 Swiss-Prot数据库的 700 个长度为 1020 个氨基酸的随机选择多肽,准确率近 66%。 Bepipred结合隐马尔科夫模型和亲水性参数评分预测线性 B 细胞表位, AROC 评分达到0.671。将两种预测方法得到的预测结果进行比较, 其共有的预测表位是真正 B 细胞表位的几率更大,如果能进一步结合蛋白质二级结构预测结果,就可以选出可信度更高的 B 细胞
3、表位。如何选择有效的 B 细胞表位是能否实现无完整蛋白质抗原条件下抗体制备的关键。2、对于 B 细胞表位的选择,对于已有空间结构信息的蛋白质抗原,直接选择蛋白分子表面的 loop 区或无规卷曲区域的小肽序列作为候选B 细胞表位;对于缺乏空间结构信息的蛋白质抗原,需要根据蛋白质抗原的特点具体分析。若蛋白质抗原C 末端的序列亲水性好,可以选择 C 末端的 610 个氨基酸的序列作为候选 B 细胞表位,并且最好该序列为该蛋白质所特有;也可采用B 细胞表位预测程序进行分析,选择不同程序预测的共有 B 细胞表位;对于同源性很高的家族蛋白,根据序列比对结果选择差异较大的区域,并且所选序列应该符合B 细胞表
4、位的特征。基于以上原则,本实验选择了 10 个蛋白的 14 个表位,并对其中的 12 个表位进行了验证。3、对于 B 细胞表位的选择,( 1)对于空间结构已知的蛋白质,直接选择蛋白分子表面的loop 区或无规卷曲区域的小肽序列。( 2)对于空间结构未知的蛋白质,可采用以下策略进行选择:A:若蛋白质 C 末端序列的亲水性好,可以选择 C 末端的 610 氨基酸的序列作为候选 B 细胞表位,最好该序列为该蛋白质所特有。 可采用 SIB BLASTNetwork Service( http:/www.expasy.ch/tools/blast/)的 BLAST 软件进行比对,数据库选择 homo s
5、apiens;B:采用 B 细胞表位预测程序 ABCpred 和 BepiPred 等进行表位预测, 选择不同程序预测的共有 B 细胞表位;C:对于同源性很高的蛋白质,首先根据序列比对结果选择差异较大的区段,并且所选序列应该符合 B 细胞表位的特征。4、二级结构预测 分别应用 EX-PASY 服务器 (http: /www. expasy. org/tools)上的GOR44、HNN (Hierarchical Neural Network meth-od) 、SOPMA 、nnPredictUniversityofCalifornia atSanFrancisco (UCSF)等方法。亲水性
6、、柔韧性、表面可能性和抗原表位预测 应用 DNAstar 软件的子程序Protean,采用 Hopp-Woods 和 Kyte-Doolittle 方案预测氨基酸的亲水性 5, 6, 采用Karplus-Schultz 和 Emini 方案预测柔韧性及表面可能性 7, 8,采用 Jameson-Wolf方案 9 和吴氏抗原指数法 10预测潜在的 B 细胞抗原表位。5、 对获取序列的生物信息学处理分析使用 DNASTAR 软件分析获取的序列 ,结合 NCBI 上的 BLAST 寻找最匹配的短序列。用全部和部分肽序列查询各国专利数据库 :http: /appft1. uspto. gov/neta
7、html/PTO/search-adv. ht/ /www. freepatentsonline. com /5194592. htm / /www. stcsm. gov. cn/resource/data/zhuanl.i asp#1使用蛋白质在线分析工具分析多肽的疏水性、 PI 值、稳定性 : /www. expasy. org/ /www. rcsb. org/pdb/cgi/explore. cg?i pdbId=1fi6 /www. rcsb. org/pdb/search/searchSequence. do /www. expasy. org/sitemap. html /ww
8、w. expasy. org/tools/#translate /www. expasy. org/tools/blast/常用数据库和预测工具:名称 网址 说明ABCpred http:/www.imtech.res.in/raghava/abcpred 人工神经网络线性 B 细胞表位预测工具AgAbDb http:/202.4 1.70.51:8080/agabdb2/ 抗原 -抗体共结晶结构的分子相互作用数据库AntiJen http:/www.jenner.ac.uk/AntiJen B 细胞表位定量结合数据库 Bcipep http:/www.imtech.res.in/raghav
9、a/bcipep/ B 细胞表位数据库Bepipred http:/www.cbs.dtu.dk/services/BepiPred 基于序列的线性表位预测工具CEP http:/bioinfo.ernet.in/cep.htm 基于结构的连续性和非连续性表位预测工具DiscoTope http:/www.cbs.dtu.dk/services/DiscoTope 基于序列 /结构的非连续性表位预测工具Epitome http:/www.rostlab.org/services/epitome 抗原 -抗体相互作用残基数据库 HIV database http:/www.hiv.lanl.go
10、v/content/immunology HIV 免疫表位数据库IEDB http:/www.immuneepitope.org T 细胞和 B 细胞表位数据库含阴性数据IEDB B-cell http:/www.immuneepitope.org/tools/bcell/iedb_input 基于序列的线性表位预测工具epitope tools6、B 细胞表位预测的方法及应用线性表位的预测方法B细胞表位的预测方法主要集中于线性表位,在二十世纪七、八十年代发展起来的大量的预测 B 细胞表位的算法都是基于蛋白质序列。这些算法包括:蛋白质的亲水性算法 (Hydrophilicity) :认为蛋白质
11、各氨基酸残基可分为亲水残基和疏水残基两类。在机体内,疏水性残基一般被埋在蛋白内部,而亲水性残基位于蛋白质表面,因此,蛋白的亲水部位与蛋白抗原表位有着密切的联系。 Hopp-Woods(Hoop TP etal.,1981)算法为最常用的。 可及性算法 (Accessibility) :常用的有 Janin 可及性参数,即指蛋白质抗原中氨基酸残基被溶剂分子接触的可能性 (Rudolph R et al.,1990)。它反映了蛋白质抗原各个氨基酸残基的分布情况。蛋白质可塑性算法 (Flexibility) :此算法认为蛋白质抗原构象的多肽链骨架具有一定程度的活动性,活动性强的氨基酸残基即可塑性大,
12、易形成抗原表位 (Karplus PA et al.,1985)。蛋白质二级结构预测算法 (Secondary structure):该算法认为蛋白质二级结构与蛋白质表位的分布关系密切。 螺旋、 折叠化学键键能比较高,形态固定,常处于蛋白质内部,难以与抗体嵌合,而 转角和无规则卷曲多处于蛋白质的表面,结构松散,易展示在蛋白质表面,有利于与抗体嵌合,成为抗原表位的可能性大 (来鲁华 ,1993)。蛋白质抗原性算法 (Antigenicity) :Welling(Welling GW.,1985) 通过对 20 个已研究得很透的蛋白质的69 个连续位点的 606 个氨基酸统计分析, 用各氨基酸残基
13、在已知 B 细胞表位中出现的百分率与其通常在蛋白质中出现的百分率比值的对数建立了抗原性刻度,并以此计算蛋白中各亚序列的抗原性。 这些方法的代表软件有 PEOPLE(Alix AJ et al.,1999) 、 PREDITOP(Pellequer JL et al.,1993)、BEPITOPE(Odorico M et al.,2003) 、Bcepred(SahaS et al.,2004)等。但是最近 Blythe 及 Flower(Blythe MJ et al.,2005) 对氨基酸的性质与线性表位的关系做了一个评估,结果表明基于氨基酸序列信息来预测线性表位,即使很好的结合了氨基酸的
14、各种性质,其预测结果仅略强于随机预测。近年来,一些应用隐形马尔可夫模型 (HMM) 、人工神经网络 (ANN) 、支持向量机算法 (SVM) 及其他技术的机器研究方法 (Ponomarenko JV et al.,2007)已经被引入来预测 B 细胞表位,取得了较好的结果。代表软件有 ABCpred(Saha S et al.,2006) 、 BepiPred(Larsen JEet al.,2006)、APP(Chen J et al.,2007)等。 ABCpred 采用人工神经网络来预测线性表位,从 Bcipep 和 SwissProt 数据库中提取非冗余的表位肽和非表位肽作为训练集,采用5-折交叉验证,预测敏感性约为 67%,特异性约为 64%。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1