引物设计.docx
《引物设计.docx》由会员分享,可在线阅读,更多相关《引物设计.docx(13页珍藏版)》请在冰豆网上搜索。
引物设计
酶
寡核苷酸序列
切割率%
2hr
20hr
AccI
GGTCGACC
CGGTCGACCG
CCGGTCGACCGG
0
0
0
0
0
0
AflIII
CACATGTG
CCACATGTGG
CCCACATGTGGG
0
>90
>90
0
>90
>90
AscI
GGCGCGCC
AGGCGCGCCT
TTGGCGCGCCAA
>90
>90
>90
>90
>90
>90
AvaI
CCCCGGGG
CCCCCGGGGG
TCCCCCGGGGGA
50
>90
>90
>90
>90
>90
酶
寡核苷酸序列
切割率%
2hr
20hr
BamHI
CGGATCCG
CGGGATCCCG
CGCGGATCCGCG
10
>90
>90
25
>90
>90
BglII
CAGATCTG
GAAGATCTTC
GGAAGATCTTCC
0
75
25
0
>90
>90
BssHII
GGCGCGCC
AGGCGCGCCT
TTGGCGCGCCAA
0
0
50
0
0
>90
BstEII
GGGT(A/T)ACCC
0
10
BstXI
AACTGCAGAACCAATGCATTGG
AAAACTGCAGCCAATGCATTGGAA
CTGCAGAACCAATGCATTGGATGCAT
0
25
25
0
50
>90
酶
寡核苷酸序列
切割率%
2hr
20hr
ClaI
CATCGATG
GATCGATC
CCATCGATGG
CCCATCGATGGG
0
0
>90
50
0
0
>90
50
EcoRI
GGAATTCC
CGGAATTCCG
CCGGAATTCCGG
>90
>90
>90
>90
>90
>90
HaeIII
GGGGCCCC
AGCGGCCGCT
TTGCGGCCGCAA
>90
>90
>90
>90
>90
>90
HindIII
CAAGCTTG
CCAAGCTTGG
CCCAAGCTTGGG
0
0
10
0
0
75
KpnI
GGGTACCC
GGGGTACCCC
CGGGGTACCCCG
0
>90
>90
0
>90
>90
酶
寡核苷酸序列
切割率%
2hr
20hr
MluI
GACGCGTC
CGACGCGTCG
0
25
0
50
NcoI
CCCATGGG
CATGCCATGGCATG
0
50
0
75
NdeI
CCATATGG
CCCATATGGG
CGCCATATGGCG
GGGTTTCATATGAAACCC
GGAATTCCATATGGAATTCC
GGGAATTCCATATGGAATTCCC
0
0
0
0
75
75
0
0
0
0
>90
>90
NheI
GGCTAGCC
CGGCTAGCCG
CTAGCTAGCTAG
0
10
10
0
25
50
酶
寡核苷酸序列
切割率%
2hr
20hr
NotI
TTGCGGCCGCAA
ATTTGCGGCCGCTTTA
AAATATGCGGCCGCTATAAA
ATAAGAATGCGGCCGCTAAACTAT
AAGGAAAAAAGCGGCCGCAAAAGGAAAA
0
10
10
25
25
0
10
10
90
>90
NsiI
TGCATGCATGCA
CCAATGCATTGGTTCTGCAGTT
10
>90
>90
>90
PacI
TTAATTAA
GTTAATTAAC
CCTTAATTAAGG
0
0
0
0
25
>90
PmeI
GTTTAAAC
GGTTTAAACC
GGGTTTAAACCC
AGCTTTGTTTAAACGGCGCGCCGG
0
0
0
75
0
25
50
>90
PstI
GCTGCAGC
TGCACTGCAGTGCA
AACTGCAGAACCAATGCATTGG
AAAACTGCAGCCAATGCATTGGAA
CTGCAGAACCAATGCATTGGATGCAT
0
10
>90
>90
0
0
10
>90
>90
0
酶
寡核苷酸序列
切割率%
2hr
20hr
PvuI
CCGATCGG
ATCGATCGAT
TCGCGATCGCGA
0
10
0
0
25
10
SacI
CGAGCTCG
10
10
SacII
GCCGCGGC
TCCCCGCGGGGA
0
50
0
>90
SalI
GTCGACGTCAAAAGGCCATAGCGGCCGC
GCGTCGACGTCTTGGCCATAGCGGCCGCGG
ACGCGTCGACGTCGGCCATAGCGGCCGCGGAA
0
10
10
0
50
75
ScaI
GAGTACTC
AAAAGTACTTTT
10
75
25
75
SmaI
CCCGGG
CCCCGGGG
CCCCCGGGGG
TCCCCCGGGGGA
0
0
10
>90
10
10
50
>90
SpeI
GACTAGTC
GGACTAGTCC
CGGACTAGTCCG
CTAGACTAGTCTAG
10
10
0
0
>90
>90
50
50
酶
寡核苷酸序列
切割率%
2hr
20hr
SphI
GGCATGCC
CATGCATGCATG
ACATGCATGCATGT
0
0
10
0
25
50
StuI
AAGGCCTT
GAAGGCCTTC
AAAAGGCCTTTT
>90
>90
>90
>90
>90
>90
XbaI
CTCTAGAG
GCTCTAGAGC
TGCTCTAGAGCA
CTAGTCTAGACTAG
0
>90
75
75
0
>90
>90
>90
XhoI
CCTCGAGG
CCCTCGAGGG
CCGCTCGAGCGG
0
10
10
0
25
75
XmaI
CCCCGGGG
CCCCCGGGGG
CCCCCCGGGGGG
TCCCCCCGGGGGGA
0
25
50
>90
0
75
>90
>90
终止密码:
UAG,UAA,UGA是终止密码子。
起始密码子:
AUG(甲硫氨酸),GUG(缬氨酸)
设计的目的是在两个目标间取得平衡:
扩增特异性和扩增效率。
引物分析软件将试图通过使用每一引物设计变化的预定值在这两个目标间取得平衡。
设计引用有一些需要注意的基本原理:
①引物长度
一般引物长度为18~30碱基。
总的说来,决定引物退火温度(Tm值)最重要的因素就是引物的长度。
有以下公式可以用于粗略计算引物的退火温度。
在引物长度小于20bp时:
[4(G+C)+2(A+T)]-5℃
在引物长度大于20bp时:
62.3℃+0.41℃(%G-C)-500/length-5℃
另外有许多软件也可以对退火温度进行计算,其计算原理会各有不同,因此有时计算出的数值可能会有少量差距。
为了优化PCR反应,使用确保退火温度不低于54℃的最短的引物可获得最好的效率和特异性。
总的说来,每增加一个核苷酸引物特异性提高4倍,这样,大多数应用的最短引物长度为18个核苷酸。
引物长度的上限并不很重要,主要与反应效率有关。
由于熵的原因,引物越长,它退火结合到靶DNA上形成供DNA聚合酶结合的稳定双链模板的速率越小。
②GC含量
一般引物序列中G+C含量一般为40%~60%,一对引物的GC含量和Tm值应该协调。
若是引物存在严重的GC倾向或AT倾向则可以在引物5’端加适量的A、T或G、C尾巴。
③退火温度
退火温度需要比解链温度低5℃,如果引物碱基数较少,可以适当提高退火温度,这样可以使PCR的特异性增加;如果碱基数较多,那么可以适当减低退火温度,是DNA双链结合。
一对引物的退火温度相差4℃~6℃不会影响PCR的产率,但是理想情况下一对引物的退火温度是一样的,可以在55℃~75℃间变化。
④避免扩增模板的二级结构区域
选择扩增片段时最好避开模板的二级结构区域。
用有关计算机软件可以预测估计目的片段的稳定二级结构,有助于选择模板。
实验表明,待扩区域自由能(△G)小于58.6lkJ/mol时,扩增往往不能成功。
若不能避开这一区域时,用7-deaza-2’-脱氧GTP取代dGTP对扩增的成功是有帮助的。
⑤与靶DNA的错配
当被扩增的靶DNA序列较大的时候,一个引物就有可能与靶DNA的多个地方结合,造成结果中有多个条带出现。
这个时候有必要先使用BLAST软件进行检测,网址:
http:
//www.ncbi.nlm.nih.gov/BLAST/。
选择Aligntwosequences(bl2seq),如下图。
BLAST的使用方法也十分简单,如下图所示。
将引物序列粘贴到1区,将靶DNA序列粘贴到2区,这两者可以互换的,并且BLAST会计算互补、反义链等多种可能,所以不需要用户注意两条链是否都是有义链。
如果知道序列在数据库中的GI号也可以直接输入GI号,这样就不用粘贴一大段的序列了。
最后在3处点击Align就可以查看引物在靶DNA中是否有多个同源位点了。
可是使用BLAST还是有其不方便的地方。
因为它一次只能比较两条序列,那么一对引物就需要分开进行比对。
如果存在错配,还需要自己计算由于错配形成的片段长度有多大。
在下一篇中将介绍一个软件,可以直接将靶DNA和引物输入对产物片段进行预测。
⑥引物末端
引物3’端是延伸开始的地方,因此要防止错配就从这里开始。
3’端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。
3′端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3′端不能发生错配。
如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。
⑦引物的二级结构
引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构,这种二级结构会因空间位阻而影响引物与模板的复性结合。
若用人工判断,引物自身连续互补碱基不能大于3bp。
两引物之间不应该存在互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。
一般情况下,一对引物间不应多于4个连续碱基的同源性或互补性。
⑧为了下一步操作而产生的不完全匹配
5’端对扩增特异性影响不大,因此,可以被修饰而不影响扩增的特异性。
引物5′端修饰包括:
加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。
额外的碱基或多或少会影响扩增的效率,还加大引物二聚体形成的几率,但是为了下一步的操作就要作出适当的“牺牲”。
很多时候PCR只是初步克隆,之后我们还需要将目的片段亚克隆到各种载体上,那么就需要在PCR这个步骤为下一步的操作设计额外的碱基。
以下总结一些为了亚克隆所要设计的序列。
a添加限制性内切酶酶切位点
添加酶切位点是将PCR产物进行亚克隆使用得最多的手段。
一般酶切位点是六个碱基,另外在酶切位点的5’端还需要加2~3个保护碱基。
但是不同的酶需要的保护碱基数目是不相同的,例如:
SalⅠ不需要保护碱基,EcoRⅤ需要1个,NotⅠ需要2个,HindⅢ3个。
其中,在原核表达设计引物时还有一些小技巧,大家可以参考:
《原核表达之实验前的分析》。
里面一些规则是所有表达都通用的。
有一种做法是在进行PCR反应的同时进行酶切,这样就需要注意一些内切酶在PCR反应中的酶切反应率,见附录。
不过这种方法虽然方便但并不推荐。
有时候,就是把PCR产物回收后酶切再与载体连接效果都不尽理想,同步进行会使出现问题的原因变得更加复杂。
一旦出现问题,分析起来更麻烦。
bLIC添加尾巴
LIC的全称是Ligation-Independentcloning,它是Navogen公司专门为其部分的pET载体而发明的一种克隆方法。
用LIC法制备的pET载体有不互补的12–15碱基单链粘端,与目的插入片段上相应粘端互补。
扩增目的插入片段的引物5'序列要与LIC载体互补。
T4DNA聚合酶的3'→5'外切活性经短时间即可在插入片段上形成单链粘端。
由于只能由制备好的插入片段和载体互相退火形成产物,这种方法非常快速高效,而且为定向克隆。
c定向TA克隆添加尾巴
在T载体刚出的时候大家都拍手称赞,真是方便,哪个小子脑子这么聪明想出来的。
但是后来人们发现TA克隆无法将片段定向克隆到载体中,所以后来Invitrogen推出了可以定向克隆的载体,它的一端含有四个突出的碱基GTGG。
因此在PCR引物设计时也要相应的加上与之互补的序列,这样片段就可以“有方向”了。
dIn-Fusion克隆方法
这项技术是Clontech还属于BD的时候推出的,2004年在生物通可着实风光了一把,不但当选年度创新试剂还被大家投票为最受大家欢迎的试剂。
此技术就其步骤来说是及其方便的,不需连接酶,不需长时间的反应。
只要在设计引物的时候引入一段线性化载体两端的序列,然后将PCR产物和线性化的载体加入到含有BSA的In-Fusion酶溶液中,在室温下放置半个小时就可以进行转化了。
这种方法特别适合大批量的转化。
这里顺便提一下如果有什么技术给大家留下深刻影响,欢迎大家发email推荐给生物通。
说不定你的推荐可以让它成为年度之星呢。
如果要加入额外的碱基总是或多或少会影响到整个PCR反应,比如在加入NotⅠ的酶切位点后整个引物的退火温度就会直线上升(它识别的是8个碱基,且全为GC),这样使另外一个引物的设计变得十分困难,因为一对引物间退火温度相差不宜太远。
因此上面提到许多设计原则在实际应用中往往难以做到都符合。
在碰到这些情况的时候,我们只能秉着“实践是检验真理的唯一标准”这一原则,要试一试才能知道能否行得通了。
(生物通谢菲)
1atgttgtggaaaataaccgataatgtcaagtacgaagaggactgcgaggatcgccacgac
61gggagcagcaatgggaatccgcgggtcccccacctctcctccgccgggcagcacctctac
121agccccgcgccacccctctcccacactggagtcgccgaatatcagccgccaccctacttt
181cccccaccctaccagcagctggcctactcccagtcggccgacccctactcgcatctgggg
241gaagcgtacgccgccgccatcaaccccctgcaccagccggcgcccacaggcagccagcag
301caggcctggcccggccgccagagccaggagggagcggggctgccctcgcaccacgggcgc
361ccggccggcctactgccccacctctccgggctggaggcgggcgcggtgagcgcccgcagg
421gatgcctaccgccgctccgacctgctgctgccccacgcacacgccctggatgccgcgggc
481ctggccgagaacctggggctccacgacatgcctcaccagatggacgaggtgcagaatgtc
541gacgaccagcacctgttgctgcacgatcagacagtcattcgcaaaggtcccatttccatg
601accaagaaccctctgaacctcccctgtcagaaggagctggtgggggccgtaatgaacccc
661actgaggtcttctgctcagtccctggaagattgtcgctcctcagctctacgtctaaatac
721aaagtgacagtggctgaagtacagaggcgactgtccccacctgaatgcttaaatgcctcg
781ttactgggaggtgttctcagaagagccaaatcgaaaaatggaggccggtccttgcgggag
841aagttggacaagattgggttgaatcttccggccgggaggcggaaagccgctcatgtgact
901ctcctgacatccttagtagaaggtgaagctgttcatttggctagggactttgcctatgtc
961tgtgaagccgaatttcctagtaaaccagtggcagaatatttaaccagacctcatcttgga
1021ggacgaaatgagatggcagctaggaagaacatgctattggcggcccagcaactgtgtaaa
1081gaattcacagaacttctcagccaagaccggacaccccatgggaccagcaggctcgcccca
1141gtcttggagacgaacatacagaactgcttgtctcatttcagcctgattacccacgggttt
1201ggcagccaggccatctgtgccgcggtgtctgccctgcagaactacatcaaagaagccctg
1261attgtcatagacaaatcctacatgaaccctggagaccagagtccagctgattctaacaaa
1321accctggagaaaatggagaaacacaggaaataa