在大肠杆菌中高效表达外源蛋白.docx
《在大肠杆菌中高效表达外源蛋白.docx》由会员分享,可在线阅读,更多相关《在大肠杆菌中高效表达外源蛋白.docx(45页珍藏版)》请在冰豆网上搜索。
在大肠杆菌中高效表达外源蛋白
在大肠杆菌中高效表达外源蛋白的策略
本世纪60至70年代对大肠杆菌的研究使之成为自然界中最普遍为人们所认识的生物体。
大肠杆菌具有两个显著特征:
操作简单和能在廉价的培养基中高密度培养,它的这些特征加上十多年外源基因表达的经验使其在大多数科研应用中成为高效表达异源蛋白最常用的原核表达系统。
尽管大肠杆菌有众多的优点,但并非每一种基因都能在其中有效表达。
这归因于每种基因都有其独特的结构、mRNA的稳定性和翻译效率、蛋白质折叠的难易程度、宿主细胞蛋白酶对蛋白质的降解、外源基因和在密码子利用上的主要差别以及蛋白质对宿主的潜在毒性等等。
但知识的大量积累还是有助于为表达方面某些特定的困难提供一般的解决方法。
大肠杆菌作为表达系统的主要障碍包括:
不能象真核蛋白那样进行翻译后修饰、缺乏将蛋白质有效释放到培养基中的分泌机制和充分形成二硫键的能力。
另一方面,许多真核蛋白在非糖基化的形式下能保留其生物学活性,因而也就可以用大肠杆菌来表达。
如何实现外源基因在原核细胞中的有效表达,自60年代以来,对影响外源基因在其表达体系中表达效率的各个因素作了大量实验研究,并有多篇归纳性综述发表[1,2,3]。
国内针对外源基因在原核细胞中高效表达的关键因素,构建了高效表达载体[4],并在此基础上成功表达了一系列细胞因子的基因[5,6,7]。
我们在分析了国内外有关在原核系统中表达蛋白的实验资料的基础上,对在大肠杆菌中高效表达外源蛋白的策略所涉及的内容进行全面的总结,以期有助于我国在这方面的研究。
1.有效表达载体的构型
构建表达质粒需要多种元件,需要仔细考虑它们的组合,以保证最高水平的蛋白质合成。
表达载体的基本结构[8]。
启动子(以杂和的tac启动子为例)位于核糖体结合位点(RBS)上游10-100bp处,由调节基因(R)控制,调节基因可以是载体自身携带,也可以整合到宿主染色体上。
的启动子由位于转录起始位点上游约35bp的六核苷酸序列(-35区)和一短序列隔开的另一六核苷酸序列(-10区)组成[9,10,11]。
有许多启动子可用于在中的基因表达,包括来源于革兰氏阳性菌和噬菌体的启动子。
理想的启动子具有以下特性:
作用强;可以严格调控;容易转导入其他以便筛选大量的用于生产蛋白的菌株,而且对其诱导是简便和廉价的[12]。
在启动子下游是RBS,其跨度约为54个核苷酸,两端限定在-35(±2)和mRNA编码序列的+19到+22之间[13]。
Shine-Dalgarno(SD)位点[14,15]在翻译起始阶段与16SrRNA的3’端相互作用[16]。
SD与起始密码子间的距离约为5-13bp[17],而且此区的序列在mRNA转录物中应避免出现二级结构,否则将会降低翻译起始的效率[18]。
在RBS的5’和3’端均为A丰富区[19]。
转录终止子位于编码序列的下游,作为转录终止的信号[20]和组成发卡结构的保护性元件,阻止核酸外切酶对mRNA的降解,从而延长mRNA的半衰期[21]。
版权所有
除了上述对基因表达的效率有直接影响的元件以外,载体还含有抗生素抗性基因,以方便质粒的筛选和传代。
氨苄青霉素是最常用的抗性标记。
但在生产人用治疗性蛋白时,最好选择其他抗性标记(如Tet)以避免可能发生的过敏反应[22]。
质粒的拷贝数由复制起点决定。
在特殊情况下,选用失控复制子能够获得大量的质粒拷贝数和较高产量的质粒编码蛋白[23,24]。
但在另外一些情况下,选用超过pBR322的高拷贝质粒似乎并没有好处。
而且已有资料表明,增加质粒的拷贝数降低中胰酶的产量,在高拷贝质粒中,强启动子的存在严重影响了细胞的活性[25,26]。
转录水平调控
1.启动子
能在中发挥作用的启动子很多。
这些启动子必须具有适合高水平蛋白质合成的某些特性。
首先启动子的作用要强,待表达基因的产物要占或超过菌体总蛋白的的10-30%;第二,它必须表现最低水平的基础转录活性。
若要求大量的基因表达,最好选用高密度培养细胞和表现最低活性的可诱导和非抑制启动子。
如果所表达的蛋白具有毒性或限制宿主细胞的生长,选用可抑制的启动子则至关重要[27,28]。
例如,轮状病毒的VP7蛋白能有效地杀死细胞,因此必须在严格控制的条件下表达[29]。
但在某些情况下,启动子的严格性并不合理,因为即使最小量的基因产物也能由于其毒性而杀死细胞。
如能灭活核糖体或破坏膜渗透压的分子对细胞来说是致死性的[30]。
对宿主的毒性并不仅限于外源基因,某种自身蛋白的过量表达也能造成同样的结果。
如编码外膜磷脂蛋白的traT基因[31]。
另外,不完全抑制的表达系统会造成质粒的不稳定,细胞生长速度的下降和重组蛋白产量的降低[32,33]。
Lanzer和Bujard曾对常用的lac启动子-操纵子系统进行了广泛的研究,证明操纵子放在启动子序列的不同位置会造成70倍差异的抑制。
将17bp的操纵子置于-10和-35六聚体区之间所形成的抑制比将其放在-35区的上游或-10区的下游要高50-70倍[34]。
启动子的第三个特性是其简便和廉价的可诱导性。
大量生产蛋白质最常用的启动子是热诱导(λPL)和化学诱导(trp)启动子。
异丙基硫代-β-D-半乳糖苷(IPTG)诱导的杂交启动子tac[35]或trc[36]都是强启动子,在基础研究中应用很广。
但在大量生产人用治疗性蛋白时用IPTG做诱导剂是不可取的,因为IPTG具有毒性而且价格昂贵[37]。
IPTG的这些不足至今仍限制tac或trc强启动子在大量生产人用治疗性蛋白中的应用。
编码热敏lac阻遏蛋白[38]的突变lacI(Ts)基因的出现使得目前能够对这些启动子进行热诱导[39,40]。
另外,还出现了一些新型载体,它们允许在30℃对trc启动子进行严紧调节。
最近还报道了两种不同的lac阻遏蛋白突变体,能够同时允许热诱导和IPTG诱导[41,42]。
尽管野生型lacI基因也能热诱导,但不能对其进行严紧型调节,且不能用于lacIq菌株,因为温度的变化不能遏制由lac阻遏蛋白的过量表达所造成的严紧性抑制[43]。
因此,该系统只能用用于生产对宿主菌无害的一些蛋白。
冷反应启动子尽管不象其他启动子那样得到广泛的研究,但已经被证明能在低温条件下进行有效的基因表达。
噬菌体λPL启动子的活性在20℃时最高,随着温度的升高,其活性逐渐降低[44]。
PL启动子的冷反应由整合宿主因子,一种与DNA结合的序列特异性多功能蛋白来正调控[45,46]。
主要冷应激基因cspA启动子同样也被证明在低温具有活性[47]。
对cspA和PL启动子进行分子剖析,鉴定了在较低温度下参与增强转录的特异性DNA区域。
从而开发了一系列在20℃低温具有高活性的PL衍生启动子[48]。
选用冷反应启动子的基本原理是在15-20℃的条件下,蛋白质的折叠速度只受到轻微的影响,而作为生物化学反应,转录和翻译的速度将被充分降低。
这就为蛋白质折叠、产生有活性的蛋白和避免非活性蛋白聚合体即包涵体的形成提供了充足的时间,而目的蛋白的最终产量并未减少。
最近新报道的一些启动子具有诸多诱人之处,为选择新的高效表达系统提供了方便。
如非常强的pH启动子[49,50],重组蛋白的产量可达总蛋白的40-50%[51]。
但表达的水平会因不同的基因而有差异。
因为蛋白质的合成不仅依赖于启动子的强弱,而且有赖于转录的效率。
人们通常只考虑启动子的核心区域,即-10和-35六核苷酸区和一15-19bp的间隔序列。
但有人提出核心序列以外的元件也能刺激启动子的活性[52]。
许多研究也已证明,核心启动子上游的序列能够在体内提高转录起始的效率[53,54,55]。
Gourse等证明,位于rRNA启动子rrnBP1-35区上游的DNA序列即UP元件,能够在体内和体外提高转录效率30倍[56]。
UP元件是作为一个独立的启动子组件发挥作用的,因为将其融合到其他启动子如lacUV5中也能刺激转录[57,58]。
UP元件与其他启动子融合所表现的这种转录增强子效应,使其有望通用于高效表达系统。
尽管已经证明rRNA启动子P1、P2的超强能力[59],但它们仍未被用于进行高水平表达,其主要原因是难以对其进行调控。
rRNA的体内合成从属于细胞增殖速度的控制。
在细胞快速增殖期,P1和P2是活化的,当细胞处于生长的静息期,则P1、P2被负调节。
因此,rRNA启动子在前诱导期将持续活化。
在体内快速增殖的细胞中,P2的活性很弱,而且可诱导性差,但若与P1分开,P2启动子的活性明显升高(达到P1的70%),且对应激反应敏感。
这表明在天然的串联体中,P2是部分关闭的[60]。
Brosius和Holy[61]将lac操纵子序列插入到rrnBrRNAP2启动子的下游,在带有lacIq基因的菌株中成功地抑制了P2的活性。
转录活性是以氯霉素乙酰转移酶的产生和RNA的表达为标准的。
然而,P2构建体的活性只相当于tac启动子活性的1/2,而且当rrnBP1启动子被置于P2启动子下游时,不能完全抑制转录。
有人试图利用反转启动子的方向来严格调控rRNA启动子。
将rRNA启动子克隆于目的基因的上游,但转录方向相反。
利用λ整合位点和可调控的λ整合酶来实现启动子的反转,从而达到进行诱导的目的,而且,在高度活化的启动子上游有一强转录终止子将避免在前诱导期可能出现的载体的不稳定性。
2.转录终止子
在原核生物中,转录终止有两种不同的机制。
一种是依赖六聚体蛋白rho的rho依赖性转录终止,rho蛋白能使新生RNA转录本从模板解离。
另一种是rho非依赖性转录终止,它特异性依赖于模板上编码的信号,即在新生RNA中形成发卡结构的一回文序列区,和位于该回文序列下游4-9bp处的dA、dT富含区[62,63]。
虽然转录终止子在表达质粒的构建过程中常被忽略,但有效的转录终止子是表达载体必不可少的元件,因为它们具有极其重要的作用。
贯穿启动子的转录将抑制启动子的功能,造成所谓的启动子封堵[64]。
这种效应可以通过在编码序列下游的适当位置放置一转录终止子,阻止转录贯穿别的启动子来避免。
同样地,在启动目的基因的启动子上游放置一转录终止子,将最大限度地减小背景转录[65]。
另有资料证明,由强启动子启动的转录会使转录通读到复制区,造成控制质粒拷贝数的ROP蛋白的过量表达,从而导致质粒的不稳定[66]。
另外,转录终止增强mRNA的稳定性[67],从而提高蛋白质的表达水平。
如果来源于rrBrRNA操纵子的两个转录终止子T1和T2串联,则效果更好[68]。
但其他的许多转录终止子通常情况下都是十分有效的。
3.转录抗终止子
细菌中许多参与氨基酸生物合成的操纵子在其第一个结构基因的5’端含有转录衰减子。
衰减子由特定操纵子的氨基酸产物调节。
这样关联的带电荷tRNA的存在就会在核糖体剪切之后引导初始转录本中二级结构的形成。
如果没有关联的带电荷tRNA,则会形成抗终止子结构,从而抑制终止子中发卡结构的形成和转录的终止[69]。
抗终止元件能使RNA多聚酶越过核糖体RNA操纵子中的rho依赖性终止子即boxA[70,71]。
转录抗终止是有一个极其复杂的过程,其中包含许多已知和未知因子。
有关这方面的知识已有详尽的综述。
在此我们主要讨论抗终止元件在中表达外源基因的应用。
原核表达秘笈之宿主菌株选择指南
在原核蛋白表达过程中,选择构建一个合适原核表达体系需要综合考虑3大因素:
表达载体、宿主菌株、表达诱导条件,以获得最满意的表达效果。
事实上,在平时的实验中,最容易被忽视的就是宿主菌的选择——多数人会直接选择自己实验室曾经用过的表达菌株,或者是载体配套的菌株,而不去追究原因——即使表达结果不佳,大多在表达条件和载体上找原因,也不会考究菌株的选择是否适合。
作为原核表达的宿主,对外源基因的表达会产生一定的影响,是勿庸置疑的。
每一个宿主细胞都像一个微观的小工厂,按照细胞固有的程序完成“你给它们安排的生产任务”——因为很难亲眼观察微观世界中表达是如何进行的,当出现问题时,我们需要经验判断问题所在。
宿主细胞对原核表达可能会产生哪些影响呢?
知其然还要知其所以然。
比如,菌株内源的蛋白酶过多,可能会造成外源表达产物的不稳定,所以一些蛋白酶缺陷型菌株往往成为理想的起始表达菌株。
堪称经典的BL21系列就是lon和ompT蛋白酶缺陷型,也是我们非常熟悉的表达菌株。
大名鼎鼎的BL21(DE3)融源菌则是添加T7聚合酶基因,为T7表达系统而设计。
真核细胞偏爱的密码子和原核系统有不同,因此,在用原核系统表达真核基因的时候,真核基因中的一些密码子对于原核细胞来说可能是稀有密码子,从而导致表达效率和表达水平很低。
改造基因是比较麻烦的做法,Rosetta2系列就是更好的选择——这种携带pRARE2质粒的BL21衍生菌,补充大肠杆菌缺乏的七种(AUA,AGG,AGA,CUA,CCC,GGA及CGG)稀有密码子对应的tRNA,提高外源基因、尤其是真核基因在原核系统中的表达水平。
(已经携带有氯霉素抗性质粒)
当要表达的蛋白质需要形成二硫键以形成正确的折叠时,可以选择K–12衍生菌Origami2系列,thioredoxinreductase(trxB)和glutathionereductase(gor)两条主要还原途径双突变菌株,显著提高细胞质中二硫键形成几率,促进蛋白可溶性及活性表达。
(卡那霉素敏感)
Rosetta-gami™2则是综合上述两类菌株的优点,既补充7种稀有密码子,又能够促进二硫键的形成,帮助表达需要借助二硫键形成正确折叠构象的真核蛋白。
(卡那霉素敏感)
OrigamiB是衍生自lacZY突变的BL21菌株,这个突变能根据IPTG的浓度精确调节表达产物,使得表达产物量呈现IPTG浓度依赖性。
(四环素敏感)
在决定试用这些名字古怪的菌株时,有几个小Tips要注意的,一个是不同菌株有时已经携带某个质粒或者已经具有某种抗生素抗性,要注意自己的表达质粒是否能与之兼容。
比如Rosetta2已经携带有氯霉素抗性质粒,不能再用氯霉素筛选等等。
重组质粒和菌株的保存建议
在实验室里保存重组菌株的时候,为了挑菌和传代方便,我们常用LB平板保存在4℃冰箱中,需要提质粒和表达接种的时候,就直接从平板上挑菌,但是这种方法对于重组质粒的稳定性不利,容易出现质粒丢失、表达水平不稳定、菌株退化乃至发生污染等情况。
我们建议:
1、长期存放菌株和pET重组子应该存在甘油-70℃保种。
但是要注意高浓度甘油(>10%)会导致质粒不稳定。
请尽量保持甘油浓度8%。
(15%浓度的甘油保种液和新鲜菌液1:
1就行)
2、重组质粒不宜长期保存于表达菌株(带DE3的大肠杆菌)中,请尽量使用带有recAendA突变的克隆菌株(比如C600,DH5a)进行质粒抽提和保存质粒。
表达型的菌株提质粒经常会有质量不高或者背景的问题。
特别是大量抽提。
(生物通改编)
其实不仅仅是表达,建库克隆都会涉及菌株的不同要求,推荐看看以下文章:
克隆/建库专用超级高效感受态细胞。
感受态不是目的,菌株的背景才是关键。
PCR引物设计及软件使用技巧
自从1985年KarnyMullis发明了聚合酶链式反应以来,PCR技术已成为分子生物学研究中使用最多、最广泛的手段之一[1],而引物设计是PCR技术中至关重要的一环。
使用不合适的PCR引物容易导致实验失败:
表现为扩增出目的带之外的多条带(如形成引物二聚体带),不出带或出带很弱,等等。
现在PCR引物设计大都通过计算机软件进行。
可以直接提交模板序列到特定网页,得
到设计好的引物,也可以在本地计算机上运行引物设计专业软件。
一般来说,专门进行PCR引物设计的专业软件功能更为强大,但使用起来却不太容易。
本文将就引物设计原则及软件使用问题进行探讨。
(1)引物设计的原则
引物设计有3条基本原则:
首先引物与模板的序列要紧密互补,其次引物与引物之间避免形成稳定的二聚体或发夹结构,再次引物不能在模板的非目的位点引发DNA聚合反应(即错配)。
具体实现这3条基本原则需要考虑到诸多因素,如引物长度(primerlength),产物长度(productlength),序列Tm值(meltingtemperature),引物与模板形成双链的内部稳定性(internalstability,用?
G值反映),形成引物二聚体(primerdimer)及发夹结构(duplexformationandhairpin)的能值,在错配位点(falseprimingsite)的引发效率,引物及产物的GC含量(composition),等等。
必要时还需对引物进行修饰,如增加限制性内切酶位点,引进突变等。
根据有关参考资料和笔者在实践中的总结,引物设计应注意如下要点:
1.引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于TaqDNA聚合酶进行反应[2]。
2.引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导错配。
引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加[2]。
3.引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。
不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A[3][4]。
另外,引物二聚体或发夹结构也可能导致PCR反应失败。
5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物[2]。
4.引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。
上下游引物的GC含量不能相差太大[2][5]。
5.引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。
Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(thenearestneighbormethod)[6][7]。
6.?
G值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。
应当选用3’端?
G值较低(绝对值不超过9),而5’端和中间?
G值相对较高的引物。
引物的3’端的?
G值过高,容易在错配位点形成双链结构并引发DNA聚合反应[6]。
7.引物二聚体及发夹结构的能值过高(超过mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行[8]。
8.对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。
值得一提的是,各种模板的引物设计难度不一。
有的模板本身条件比较困难,例如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;在用作克隆目的的PCR因为产物序列相对固定,引物设计的选择自由度较低。
在这种情况只能退而求其次,尽量去满足条件。
(2)引物的自动搜索和评价分析
软件的引物设计功能主要体现在两个方面:
首先是引物分析评价功能,该功能只有少数商业版软件能够做到,其中以“Oligo6”最优秀;其次是引物的自动搜索功能,各种软件在这方面的侧重点不同,因此自动搜索的结果也不尽相同。
据笔者的经验,自动搜索功能以“PremierPrimer”为最强且方便使用,“Oligo6”其次,其他软件如“VectorNTISuit”、“Dnasis”、“Omiga”和“Dnastar”都带有引物自动搜索功能,但搜索结果不是十分理想。
要想得到效果很好的引物,在自动搜索的基础上还要辅以人工分析。
笔者认为引物设计软件的最佳搭配是“Oligo”和“Premier”软件合并使用,以“Premier”进行自动搜索,“Oligo”进行分析评价,如此可快速设计出成功率很高的引物。
(3)PrimerPremier的使用技巧简介
1.功能
“Premier”的主要功能分四大块,其中有三种功能比较常用,即引物设计()、限制性内切酶位点分析()和DNA基元(motif)查找()。
“Premier”还具有同源性分析功能(),但并非其特长,在此略过。
此外,该软件还有一些特殊功能,其中最重要的是设计简并引物,另外还有序列“朗读”、DNA与蛋白序列的互换()、语音提示键盘输入()等等。
有时需要根据一段氨基酸序列反推到DNA来设计引物,由于大多数氨基酸(20种常见结构氨基酸中的18种)的遗传密码不只一种,因此,由氨基酸序列反推DNA序列时,会遇到部分碱基的不确定性。
这样设计并合成的引物实际上是多个序列的混和物,它们的序列组成大部分相同,但在某些位点有所变化,称之为简并引物。
遗传密码规则因物种或细胞亚结构的不同而异,比如在线粒体内的遗传密码与细胞核是不一样的。
“Premier”可以针对模板DNA的来源以相应的遗传密码规则转换DNA和氨基酸序列。
软件共给出八种生物亚结构的不同遗传密码规则供用户选择,有纤毛虫大核(CiliateMacronuclear)、无脊椎动物线粒体(InvertebrateMitochondrion)、支原体(Mycoplasma)、植物线粒体(PlantMitochondrion)、原生动物线粒体(ProtozoanMitochondrion)、一般标准(Standard)、脊椎动物线粒体(VertebrateMitochondrion)和酵母线粒体(YeastMitochondrion)。
2.使用步骤及技巧
“Premier”软件启动界面如下:
其主要功能在主界面上一目了然(按钮功能如上述)。
限制性酶切点分析及基元查找功能比较简单,点击该功能按钮后,选择相应的限制性内切酶或基元(如-10序列,-35序列等),按确定即可。
常见的限制性内切酶和基元一般都可以找到。
你还可以编辑或者添加新限制性内切酶或基元。
进行引物设计时,点击按钮,界面如下:
进一步点击按钮,出现“searchcriteria”窗口,有多种参数可以调整。
搜索目的(SeachFor)有三种选项,PCR引物(PCRPrimers),测序引物(SequencingPrimers),杂交探针(HybridizationProbes)。
搜索类型(SearchType)可选择分别或同时查找上、下游引物(Sense/Anti-sensePrimer,或Both),或者成对查找(Pairs),或者分别以适合上、下游引物为主(CompatiblewithSense/Anti-sensePrimer)。
另外还可改变选择区域(SearchRanges),引物长度(PrimerLength),选择方式(SearchMode),参数选择(SearchParameters)等等。
使用者可根据自己的需要设定各项参数。
如果没有特殊要求,建议使用默认设置。
然后按,随之出现的SearchProgress窗口中显示SearchCompleted时,再按,这时搜索结果以表格的形式出现,有三种显示方式,上游引物(Sense),下游引物(Anti-sense),成对显示(Pairs)。
默认显示为成对方式,并按优劣次序(Rating)排列,满分为100,即各指标基本都能达标(如下图)。
点击其中一对引物,如第1#引物,并把上述窗口挪开或退出,显示“PeimerPremier”主窗口,如图所示:
该图分三部分,最上面是图示PCR模板及产物位置,中间是所选的上下游引物的一些性质,最下面是四种重要指标的分析,包括发夹结构(Hairpin),二聚体(Dimer),错误引发情况(FalsePriming),及上下游引物之间二聚体形成情况(CrossDimer)。
当所分析