发现生物大分子高亲和性配体的新方法.docx

上传人:b****5 文档编号:8010247 上传时间:2023-01-27 格式:DOCX 页数:16 大小:98.70KB
下载 相关 举报
发现生物大分子高亲和性配体的新方法.docx_第1页
第1页 / 共16页
发现生物大分子高亲和性配体的新方法.docx_第2页
第2页 / 共16页
发现生物大分子高亲和性配体的新方法.docx_第3页
第3页 / 共16页
发现生物大分子高亲和性配体的新方法.docx_第4页
第4页 / 共16页
发现生物大分子高亲和性配体的新方法.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

发现生物大分子高亲和性配体的新方法.docx

《发现生物大分子高亲和性配体的新方法.docx》由会员分享,可在线阅读,更多相关《发现生物大分子高亲和性配体的新方法.docx(16页珍藏版)》请在冰豆网上搜索。

发现生物大分子高亲和性配体的新方法.docx

发现生物大分子高亲和性配体的新方法

发现生物大分子高亲和性配体的新方法

——SAR-by-NMR

麻锦彪 吴厚铭*

  摘 要 由于许多药物通过和生物体内的大分子(如蛋白质和核酸)的选择性结合发挥效用,因此快速、有效地发现靶分子的高亲和性配体成为各种药物发现方法的首要目标。

在现代生物技术和NMR技术高度发展的基础上产生的一种发现生物大分子高亲和性配体的新方法——SAR-by-NMR,由于采用NMR技术可以综合多种药物设计方法的优势,能够在短时间内得到先导化合物,从而大大加快了药物发现的速度并能节省大量的费用。

本文介绍了SAR-by-NMR发现高亲和性配体的基本原理、特点及其在药物发现中的应用。

  关键词 高亲和性配体 蛋白质NMR结构 结构与活性关系 药物发现

ANewMethodtoDiscoverHigh-AffinityLigands

forBio-Macromolecules:

SAR-by-NMR

MaJinbiao WuHouming

(ShanghaiInstituteofOrganicChemistry,

ChineseAcademyofSciences,Shanghai200032,China)

AbstractAsmostdrugsworkwhentheyselectivelybindtobiologicaltargets(e.g.proteinsandnuclearacids),tofindhigh-affinityligandsforatargetmoleculefastandeffectuallybecomesthekeystepofvariousdrug-discoverymethods.Anewtechniquetodiscoverhigh-affinityligandsforbio-macromolecules,SAR-by-NMR,comesintobeingonthebasesofhighdevelopmentsofmodernbiologicalandNMRtechnologies,whichsignificantlyacceleratesthedrugdiscoveryandreducestheexpenses.Thismethodcombinestheadvantagesofmanydrug-designmethodsandrequiresonlyshorttimetogetleadcompoundsduetotheuseofNMRtechnologies.TheessentialprincipleofusingSAR-by-NMRtofindhigh-affinityligands,itsdistinguishingfeatures,andapplicationsindrugdiscoveryarereviewedinthispaper.

Keywordshigh-affinityligands;proteinNMRstructures;structure-activityrelationship(SAR);drugdiscovery

一、引 言

  新药的发现是一个极其困难并且需要投入大量时间和财力的过程。

据统计,现在运用传统的研究方法每产生一个可投入市场的新药的费用高达6亿美元,耗时约6至10年[1]。

要得到一个具有良好生物利用度(bio-availability)、代谢稳定性和低毒性的药物,首先是要寻找到和生物靶分子高度亲和性、选择性结合的分子,因为大多数药物都是通过和生物体内的大分子(如蛋白质)结合起作用的。

为了能快速地寻找到这样的分子(通常称为先导化合物,leadcompound),近20年来人们发展了许多方法。

这些方法基本上可以分成两大类:

合理性药物设计和非合理性药物设计。

  合理性药物设计是以了解生物大分子(如蛋白质)的三维结构及其相关的分子识别为基础的。

大量蛋白质的三维结构已由X射线晶体衍射技术和多维核磁共振(NMR)技术解析而得,为研究蛋白质-配体复合物的分子识别提供了有利条件,而且已经有一些药物设计成功的例子[2,3]。

然而,小分子配体和蛋白质进行分子识别形成复合物的过程并非象钥匙和锁的模型那样简单,而是一个双重诱导契合(double-inducedfit)的过程,即小分子和蛋白质都改变自身的构象以达到相互最佳匹配的结果(图1)。

在生成复合物的过程中,占据配体和蛋白质结合位点的一些溶剂分子(通常是水)被配体替代形成溶剂化复合物。

由于技术的限制,残留在配体和蛋白质之间的水分子的存在方式(如生成氢键)常常是难以预测的。

合理化设计面临的另外一个问题是生成复合物的自由能变化至今还没有可靠的计算方法[4]。

精确度在±3kcalmol-1的计算方法造成所预测的配体亲和性的误差可达2个数量级以上[3]。

因此,虽然了解蛋白质的三维结构在一定程度上对设计药物有所裨益,但即便得到可信的初步结果(如利用LUDI软件包)[2],至今还没有一个发表的先导化合物结构是完全用从头设计(denovodesign)的方法得到的[5]。

图1 蛋白质-配体双重诱导契合模型示意图

  近年来药学领域的一些代表人物认为合理性设计作用不大,而趋向于所谓“快速筛选”(high-throughoutscreening)的方法。

由于该方法无需知道蛋白质的三维结构,而是运用组合化学技术对含有数十万乃至数十亿个分子组成的化合物库进行同步合成、筛选,从而寻找到生物活性最高的化合物作为先导化合物进行结构测定和优化,因此又被称为非合理性药物设计[6]。

它的缺点是由于生物检测系统有限的灵敏度,只有活性非常高的分子才能从庞大的化合物库中被检测出来。

而且多种官能团的结构多样性问题以及酰胺和酯键限制药物的生物利用度的问题也需要进一步解决[7]。

  Abbott实验室的Fesik小组在过去的一年发表的工作使药物发现的研究有了一个飞跃。

他们通过NMR将上述合理性药物设计和非合理性药物设计(组合化学)巧妙地结合起来,产生了一种极为有效的发现药物靶分子高亲和性配体的方法,称为SAR-by-NMR[8,9]。

这种新方法结合了合理性设计中的配体设计和优化方法(如LUDI)和非合理性设计(如组合化学)的合理因素,大大地提高了先导化合物发现的速度和有效性。

  SAR-by-NMR的出现除了由于药物发现领域本身各种方法不断发展之外,也离不开相关领域的发展与成熟。

例如分子生物学的发展,通过基因工程和蛋白质工程可以得到大量经过重组的纯的蛋白质,而且可以对蛋白质进行稳定同位素标记,使蛋白质适于做NMR结构分析[10]。

多维核磁共振技术自身的不断成熟和发展,使其可以解析越来越大的蛋白质[11],尤其重要的是,由于蛋白质可以在接近生理环境的溶液中进行NMR结构测定,因此得到的配体和蛋白质相互作用结构信息更为直观、可靠。

这也是SAR-by-NMR成功的一个关键因素。

二、SAR-by-NMR的基本原理和特点

  用SAR-by-NMR的方法发现高亲和性配体一般需要5个基本步骤(图2)[8]:

第1步,从一个小分子化合物库中筛选出一个和15N标记的靶蛋白结合的小分子。

由于小分子和蛋白质结合后,会改变蛋白质结合位点的局部化学环境,因此通过二维15N-HSQC谱中15N或1H的化学位移的变化可以检测到结合作用。

同时配体和蛋白质的结合常数可以通过化学位移的变化和配体浓度的关系测得。

第2步,对第一个先导分子的类似物进行筛选,测定结合常数,通过结构与活性的关系对其进行优化。

第3步,用和第一步相同的方法筛选出与前一结合亚位点相邻的的亚位点结合的第二个小分子。

筛选时第一个先导分子可以存在于体系中,也可以不在。

第4步,与第二步类似,对第二个先导分子的类似物进行筛选,得到第二个优化的先导分子。

在选定两个先导分子片段之后,用多维NMR技术测定蛋白质和两个配体的复合物的完整三维空间结构,得到两个配体在靶蛋白上确切的结合位置及其空间取向。

第5步,基于上述三维结构设计恰当的连接桥将两个片段连接起来,使得到的分子和靶蛋白结合时保持各自独立时的结合位置及其空间取向,最终筛选得到一个高亲和性的配体。

可以看出,该方法的基本点是首先筛选结合于生物靶分子亚活性位点的低亲和性配体,然后通过优化和组装便得到所期望的高亲和性配体。

图2 SAR-by-NMR原理示意图

  SAR-by-NMR成功的关键在于使用了NMR实验方法来辨别小分子和靶蛋白的结合,能够很快地从小分子化合物库中发现结合于靶蛋白亚活性位点的低亲和性配体。

因为如果小分子和靶蛋白的结合比较弱,就需要在较高的浓度下进行测定。

因为基于15N编辑的NMR技术的筛选方法,只检测15N标记的蛋白质的酰胺信号,而不受体系中其它组分的干扰,因此测定的结合作用也就更为可靠。

相反,因为高浓度的化合物会产生大的背景信号从而干扰测定,许多传统的筛选方法(如荧光法或比色法)在测定结合较弱的配体时则常常不十分可靠。

NMR的另一优势是可以通过蛋白质特定酰胺信号的变化直接得到配体结合位点的结构信息。

这一点首先对辨别小分子是结合在靶蛋白的不同亚位点上非常重要,同时,通过比较结合在同一亚位点的小分子的结构,可以得到哪些官能团对结合有主要贡献的信息,然后通过结构与活性的关系对小分子进行优化。

这个方法的进一步的优点是可以直接研究“变构效应”(allostericeffect)[7],即第一个亚位点配体存在下进行筛选时可能发现那些只有在第一个配体存在下才能和靶蛋白的其他亚位点结合的配体(图3)。

图3 “变构效应”筛选

第二个配体(三角形)只有在另一个配体(椭圆形)存在的情况下才能和靶蛋白稳定地结合。

  获得两个经优化的分子片段后,Fesik等采取了“连接模式”的策略。

所谓“连接模式”,就是把亲和性比较弱的单个分子片段通过连接桥连接起来,这样得到的新的分子和靶蛋白结合时,将不仅仅是单个片段结合自由能的简单相加(式1)。

(1)

即除了片段A和B固有的结合自由能(ΔGA和ΔGB)之外,还额外得到了由于A和B连接导致的结合自由能(ΔGlink),此项常常可以理解为片段A和B连接起来后片段A和片段B同时与蛋白质结合的几率的变化,它主要可归结于熵变[12]。

其结果常常是亲和性为mM和μM数量级的小分子经连接可得到nM甚至pM数量级的先导化合物(图4)。

这个策略成功的关键还在于所设计的连接桥的长度[33]及其性质(如刚性[34]等)能否使ΔGlink达到最优[13]。

实际上“连接模式”在LUDI法中早有应用[2],和SAR-by-NMR不同的是在LUDI中完全是用从头设计的方法选择小分子片段并把它们连接起来,而在SAR-by-NMR中小分子片段是用NMR直接筛选得到的。

和传统的合理性设计相比,可以说,这是真正的合理性设计。

图4 连接模式”获得高亲和性配体的策略

按照自由能变化的原理(式1),通过NMR实验方法获得的和靶蛋白两个不同的亚位点(A和B)结合的低亲和性的两个分子片段(μM级和mM级)连接起来后得到的分子通常有高亲和性(nM级)。

  SAR-by-NMR和组合化学的相似之处是两者都须经过筛选大量化合物,都充分利用了有机化合物结构多样性的特点,从中获得高活性的先导化合物。

两者的差别在于:

组合化学是先制备由大量化合物组成的化合物库,然后对这些化合物库进行直接筛选;而SAR-by-NMR筛选的是未经“组合”(连接)的小分子化合物库,得到结合于靶蛋白亚活性位点的低亲和性配体,经优化后再“组装”成高亲和性的配体。

NMR技术作为筛选的工具,方法有多种[14-18]。

Fesik等选择了二维15N-HSQC的方法[19],因为15N标记的蛋白质的15N-HSQC谱中酰胺基的15N和1H的相关信号的分辨率较高,而且能在短时间内(10分钟左右)完成一次对浓度在0.3mM的15N标记的蛋白质的检测(Ross等最近报道一种新的类似的检测方法可在37秒内完成一次采样[20])。

以10个化合物为一组,使用自动样品交换器,每天可以筛选1000个化合物。

这样10天便可以筛选一万个左右化合物。

这个数目和组合化学中动辄数十万的化合物库相比,表面上看似乎相对小了一些,然而这一万个小分子只是将被连接起来的最终化合物的片段,如果再假设所设计的连接桥有10种,那么这一万个小分子片段实际代表了一个由10亿(10000×10000×10)个分子组成的化合物库(图5)。

真正合成并筛选如此巨大的化合物库需要耗费极大的财力和物力,由于SAR-by-NMR所筛选的大多数小分子及其类似物大多都有储备或商品供应,所以整个过程只需进行少量有目的的有机合成,从而节省了大量的财力和物力,尤其节省了可贵的时间,如Fesik等筛选溶基质素(stromelysin)的抑制剂只用了半年时间[21]。

图5 SAR-by-NMR和组合化学“砌块”方法的对比

在组合化学中,要合成所有分子片段和不同连接桥“组合”起来的分子〔(分子片段1)×(分子片段2)×(不同连接桥)〕。

而在SAR-by-NMR中,由于和蛋白结合的分子片段在连接之前先已被辨别出来,而且连接桥是基于结构信息选择的,所以只需进行少量的合成。

三、应用实例

  1.FK506结合蛋白(FKBP)的高亲和性配体的发现[8]

  FKBP是机体移植过程中免疫反应的重要抑制剂,当它与FK506结合之后,可以抑制calcineurin并阻断T细胞免疫反应。

Fesik等首先应用SAR-by-NMR寻找FKBP的非天然高亲和性配体。

  通过用15N标记的FKBP对Abbott实验室的化合物库进行NMR筛选,他们得到的第一个配体是三甲氧苯基2-哌啶酸衍生物1(图6)。

从1的结构可以看出,它与FK506的2-哌啶酸部分极为相似,而且FKBP酰胺化学位移的变化也表明它在FKBP上的结合位点由于FK506的2-哌啶酸部分的结合位点相同。

由于三甲氧苯基2-哌啶酸已经具有较高的亲和性(Kd=2.0μM),所以没有进一步优化。

图6 SAR-by-NMR法发现高亲和性FKBP配体

NMR筛选并优化获得两个亲和性较弱的小分子片段(1和7),通过解析结合位点的NMR三维结构使其能够迅速被优化并连接得到高亲和性的配体(19-228nM)。

  饱和量的1存在的条件下,在相邻的结合位点上Fesik等筛选到第二个配体——N-苯甲酰胺衍生物2,但2的亲和性只有0.8mM。

为了对2进行优化,他们用NMR测定了一系列2的类似物(储备或购得)及其与FKBP的结合常数,并由其结构与活性关系分析得到一系列N-苯甲酰胺衍生物与FKBP结合的最佳结构要求。

例如,芳香环和酰胺键对结合都很重要。

而从芳香环上的取代基来看,苯甲酰基环上对位取代的羟基R1(4)对结合是重要的,苯胺基环上的邻位取代羟基R2(3)对结合并不起作用,R3(5)和R4(6)则对结合起一定作用。

经过简单合成,他们得到了亲和性较高的经优化的第二个配体7(Kd=100μM)。

  通过对1,7和FKBP三元复合物的NMR三维溶液结构的研究,Fesik等发现1的甲基酯和7的苯甲酰基环上的羟基在空间上接近。

在此基础上,他们设计连接桥,使其恰好跨越两个片段的距离,并且不和蛋白质形成空间冲突。

由此他们合成了由三条长度不同的连接桥将1的2-哌啶酸部分和7的苯甲酰基环上的羟基连接起来的4个化合物8—11。

同时,将7的苯甲酰基环上羟基的邻位和1的2-哌啶酸部分连接起来合成12,用以检验其它连接方式的效果。

这些化合物和FKBP结合的亲和性由荧光法测定。

值得指出的是,它们的Kd值都在nM数量级。

  为了检验连接起来的化合物和FKBP的结合位点和未连接时的是否相同,Fesik等又进一步比较了FKBP-12复合物与1、7和FKBP三元复合物的NMR结构中的分子间NOE效应。

他们发现1和12中的2-哌啶酸部分和三甲氧基部分在FKBP上有相同的结合位点,并和蛋白发生疏水相互作用。

同时7和12的N-苯甲酰苯胺部分虽然也有相似的结合位点,但7中的苯甲酰基环与Glu53、Ile56和Arg57之间的几个NOE效应在12和FKBP之间检测不到。

这说明由于连接桥的存在造成这个基团的位置有了小的偏移(约1至2)。

  整个SAR-by-NMR过程非常快速有效。

两个小分子片段的确定和优化在2个月内便可完成。

最终只需合成几个连接起来的化合物,而且全部都有nM数量级的高亲和性,其中最好的一个达19nM。

  2.溶基质素的非肽抑制剂的发现[21]

  溶基质素是基质金属蛋白酶(matrixmetalloproteinase,MMP)家族中的一种。

这种酶的过量表达或调节异常往往和某种病理状态有关,如风湿病和肿瘤转移。

已发现几种按底物专一性设计的多肽类抑制剂,但其中大多数的生物利用度很差。

而已发现的几种天然非肽化合物(如pycnidione和tetracycline的衍生物)也只有中等的抑制活性。

Fesik等应用SAR-by-NMR的方法来发现溶基质素的有效的非肽抑制剂。

  他们首先选择乙酰氧肟酸(CH3CONHOH)作为第一个配体。

因为像溶基质素这样的水解酶,筛选时首先需要一个小分子来抑制它的自溶性降解(autolyticdegradation)。

这个小分子必须有足够大的溶解度来饱和蛋白质,而且分子不能太大以至覆盖蛋白质上相邻的位点。

由于许多已知的MMP抑制剂含有异羟肟酸根,而且乙酰氧肟酸的溶解度较大(>500mM),所以就选择了乙酰氧肟酸。

虽然这个化合物和蛋白的结合能力较弱(Kd=17mM),但它在浓度>100mM时便可以有效地抑制溶基质素的自溶降解。

  在已知溶基质素三维空间结构的基础上,Fesik等选择第二个配体时充分考虑了其结构特点:

在蛋白S1′结合位点上大的疏水性氨基酸残基侧链可能有底物专一性。

为得到和这个亚位点结合的配体,他们直接筛选了一系列疏水化合物(包括联二苯及其类似物),并得到其结构与活性的关系(表1)。

例如,对位的氰基取代可以使配体的亲和性增加约10倍。

为进一步揭示这类分子的结构与活性的关系,又合成了33个类似的化合物,它们都是在联苯的邻位和/或对位有不同的官能团取代。

经筛选发现两个最有效的配体(13和14)。

通过测定三元复合物的NMR三维溶液结构,设计连接桥将两个分子片段连接起来,得到一系列化合物,并测定生物活性(表2)。

其中最有效的两个抑制剂的IC50达25nM和15nM。

表1 联二苯类似物和溶基质素结合的解离常数

 

Kd/mM

 

Kd/mM

0.28

1.6

>10

0.02

>10

0.16

>10

0.25

0.17

0.48

表2 连接起来的联二苯化合物的抑制性

R1

R2

n

IC*50/μM

H

H

1

3.9

H

H

2

0.31

H

H

3

110

H

H

4

100

H

CN

1

0.26

H

CN

2

0.025

H

CN

3

3.4

H

CN

4

3.5

CH2CN

H

2

0.015

CH2CN

H

3

1.9

CH2CN

H

4

3.5

  *IC50为半数抑制浓度

  SAR-by-NMR的整个过程(图7),包括小分子片段的筛选、优化并连接,只用了不到6个月的时间,而且得到两个非常有效的抑制剂(IC50=25和15nM)。

而用传统的方法,例如酶抑制法从115000个化合物中筛选出的非肽抑制剂中,没有一个IC50优于10μM的。

图7 SAR-by-NMR发现溶基质素抑制剂示意图

  3.人类乳头状病毒(HPV)E2蛋白的抑制剂的发现[22]

  乳头状病毒(papillomavirus)是一类小的DNA肿瘤病毒,它表达得到的蛋白是一种DNA结合蛋白E2。

E2蛋白和E1蛋白一起调节几种病毒的转录和复制。

已经发现,从人类乳头状病毒-E2蛋白的DNA结合区域(DNA-bindingdomain,DBD)截取的多肽片段可以阻断E2蛋白的二聚,从而抑制其活性。

此外,被E2蛋白识别的寡聚核苷酸片段可以和相应的DNA竞争,抑制病毒细胞的生长。

因此,E2蛋白被作为抗人类乳头状病毒的药物的靶蛋白。

  通过二维15N-HSQC谱筛选小分子化合物库后,Fesik等发现了在E2蛋白上两个不同位点结合较弱的三个化合物(表3)。

由于化合物17和E2蛋白二聚体的β-折叠桶附近结合,而不影响E2蛋白的二聚,也不影响E2/DNA的结合,所以他们在后面的工作只对15和16进一步优化而不再考虑17。

表3 用SAR-by-NMR发现的E2蛋白的最初配体

化合物

Kd/mM

结合位点

对DNA结合的抑制

2.5

DNA识别螺旋

+

1.9

DNA识别螺旋

+

0.6

β-折叠桶

-

  为从最少的分子获得最丰富的结构与活性的关系的信息,在进行联苯甲酸的优化时,Fesik等用Topliss法综合考虑疏水性(π)、电性(σ)和空间等因素,设计一系列衍生物,最终筛选获得活性最高的化合物3′,5′-二氯代化合物18(Kd=0.06mM,IC50=0.15mM)。

对二苯醚进行优化时,则首先筛选几个购得的化合物,它们的区别只是二苯醚和羧基之间的连接桥长度不同(表4)。

经SAR分析,连接桥的缩短会降低配体的亲和性。

因此他们合成了化合物23和24,测试分析结果表明含反-反-丁二烯的较为刚性的连接桥的化合物24亲和性较高(Kd=0.35nM,IC50=75μM)。

表4 二苯醚化合物和E2蛋白的结合

化合物

Kd/mM

9.1

>10

>10

2.3

0.85

0.35

  NMR溶液结构表明,E2蛋白和联二苯或二苯醚的衍生物有相同的结合位点。

Fesik等通过分析它们的结构与活性的关系,认为如果将它们各自的特点(联二苯中的二氯取代和二苯醚中的丁二烯连接桥)组合起来,将会增加配体的亲和性(图8)。

果然,他们合成的新化合物25显示出最高的生物活性(IC50=10μM)。

而用E2-DNA结合实验进行高速筛选100000多个化合物,没有获得活性优于10μM的抑制剂。

图8 用SRA-by-NMR发现E2蛋白抑制剂示意图

四、结论与展望

  由上述三个应用的例子,已显示出SAR-by-NMR在发现高亲和性配体(或药物先导化合物)方面巨大的潜力。

尤其是该方法能够节省大量的时间和费用及其在药物设计方面的有效性是其它方法所不及的。

虽然SAR-by-NMR还有一些限制,例如由于它需要知道靶蛋白确切的NMR三维结构,所以除了必须提供足够量的15N标记的靶蛋白(>200mg)用以筛选和结构测定之外,还受到NMR技术本身解析蛋白质三维结构的能力的限制。

应用稳定同位素(包括15N和/或13C和/或2H)标记技术,现有的多维NMR技术能够测定的蛋白分子量极限约为30kDa左右[23]。

但是随着现代生物技术的飞速发展,对各种蛋白质的表达已经基本成为常规操作[10],其中大多数可以进行有效的稳定同位素标记;而且许多药物的靶蛋白的分子量不超过30kDa,即使分子量较大的蛋白,多数是由若干个结构独立的单元-结构域(domain)组成的[24,25],而药物仅仅作用于其中一个结构域,这个结构域的分子量通常也在30kDa以下

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1