1、测序测序一 为什么要测序?生命是由基因组(genome)决定的。每个生物都具有基因组,携带着构成和维持该生物体生命形式所必需的所有生物信息。绝大部分基因组,是由DNA组成,DNA则是由A、T、C、G四种脱氧核苷酸组成,生物的遗传信息就储存于DNA的核苷酸序列中,生物界物种的多样性即寓于DNA分子四种核苷酸千变万化的不同排列之中。对于分子生物学、细胞生物学、基因工程来说,基因组序列都是至关重要的。即使最初许多基因的功能未知,一个描述基因组中每个基因序列的目录还是很有价值的。这个目录中不仅包括每一个基因编码区的序列,并且还包括这些基因的调控序列。因此,基因组序列就为全面了解细胞的分子活动打开了一条
2、通道,同时也指出了这些活动的调控方式。基因目录也有助于重要基因的分离和利用,包括那些遗传疾病相关的人类基因、或那些其蛋白产物有工业价值的细菌基因。人类基因组计划于1990年正式启动。其核心内容是构建DNA序列图,即分析人类基因组DNA分子的基本成分碱基的排列顺序,绘制成序列图。测定DNA上核苷酸排列顺序的问题曾经是一个较为困难的问题。但随着分子生物学的发展,现在测定DNA的序列已成为分子生物学实验室的一种常规方法。二 测序的方法目前应用的两种快速序列测定技术是Sanger等(1977)提出的链终止法及Maxam和Gilbert(1977)提出的化学降解法。虽然其原理大相径庭,但这两种方法都是同
3、样生成互相独立的若干组带放射性标记的寡核苷酸,每组寡核苷酸都有固定的起点,但却随机终止于特定的一种或者多种残基上。由于DNA上的每一个碱基出现在可变终止端的机会均等,因此上述每一组产物都是一些寡核苷酸混合物,这些寡核苷酸的长度由某一种特定碱基在原DNA全片段上的位置所决定。然后在可以区分长度仅差一个核苷酸的不同DNA分子的条件下,对各组寡核苷酸进行电泳分析,只要把几组寡核苷酸加样于测序凝胶中若干个相邻的泳道之上,即可从凝胶的放射自影片上直接读出DNA上的核苷酸顺序。两种方法开始都很受欢迎,但是链终止法近年来成为主要的测序方法。特别是在基因组测序中。这一方面是因为化学降解法中的化学试剂是有毒的,
4、但主要原因是链终止法更容易自动化。基因组计划包括大量的测序反应,手工测序将花费很多年的时间,因此要在可接受的时间内完成测序计划,就必须有自动测序方法。1 化学降解法2 链终止法测序中的凝胶电泳聚丙烯酰胺凝胶电泳测序应用的聚丙烯酰胺凝胶电泳,可用于分离长度只差一个核苷酸的DNA分子。链终止法测序需要单链DNA分子为模板链终止反应中的模板应为待测序的单链DNA分子。有多种方法可以得到单链DNA:1可以把DNA克隆到质粒载体中。2 DNA可以克隆到M13载体中。链终止法测序中的DNA聚合酶用于DNA测序的酶必需符合三个标准:1 高延伸性2 只有极少或根本不具备53外切核酸酶活性3 只有极少或根本不具
5、备35外切核酸酶活性引物决定模板DNA测序范围热循环测序代替传统测序荧光标记引物是自动读序的基础传统DNA测序法质的飞跃焦磷酸测序三 全基因组序列的拼接如何将链终止法测到的大量短DNA序列拼接成可能几十兆碱基长的染色体序列?有三种方法可以解决这个问题:鸟枪法,克隆重叠群法和定向鸟枪法。由于后两种方法要借助遗传或物理图谱,所以这里只介绍鸟枪法。鸟枪法的优缺点优点:能相对较快的测定小基因组的序列,并且不需要遗传或物理图谱。缺点:不连续的序列可能因为重复单位而被错误的连接在一起。TaKaRa公司鸟枪法测序的操作方法1 用限制酶切下目的片段的大片段Insert DNA,并用Agarose凝胶电泳进行回
6、收。2 对回收的大片段DNA用物理方法(如超声波等)进行切断处理,然后用T4 DNA Polymerase对小片段进行末端平滑化。3 进行Agarose电泳,切胶回收1kbp2kbp的小段DNA。然后用BcaBest DNA Polymerase在DNA的3端加上一个A碱基。4 把加上A-tail的DNA片段连入T-Vector中,然后转化,挑选克隆。5 对阳性克隆(含1kbp2kbp Insert)进行DNA测序。6 对数据进行编辑,最后连成一条大片段的DNA序列。四 测序常见问题分析Q-1 序列中出现N值A-1通常有以下几种情况将造成测序结果中N值较多: 1 在序列的起始端有时会有一些N值
7、。该种情况主要是有未去除的染料单体造成的干扰峰。该干扰峰和正常序列峰重叠在一起,有时机器将无法正确判断出为何碱基。有时,在序列的起始端的小片段容易丢失,导致起始区信号过低,机器有时也无法正确判读。有的PCR引物用于测序时,有时会产生引物二聚体,对测序的起始区造成干扰。2 在序列的3端容易产生N值。一个测序反应一般可以读出800bp以上的碱基,但是,只有550bp以前的碱基是可靠的,理想条件下,多至700bp的碱基都是可以用的。一般在650bp以后的序列,由于测序胶的分辨率问题,会有许多碱基分不开,就会产生N值,这种情况下产生的N值是无法避免的。3 测序模板本身含有杂和序列,该种情况主要发生在P
8、CR产物直接测序上。由于PCR产物本身有突变或含有等位基因,就会造成在某些位置上有重叠峰,产生N值。可以很容易判断该种情况,那就是整个测序信号都非常好,只有在个别位置有明显的重叠峰,视杂和度不同N值可能有多有少。通过将PCR产物克隆后进行测序,可以解决该种情况的N值问题。4 由于模板质量问题或测序不好,所得的序列结果较差,也会产生许多N值。Q-2 峰型整齐,在某一点前后突然变乱:A-2 PolyT特殊结构 上图是一个质粒测序样品,用T7通用引物进行测序,从图中可以看出,在约285bp的polyT结构后,序列明显变乱。主要原因是在polyT结构后,测序酶容易在模板上滑动,导致polyT结构后的峰
9、型变得杂乱。此类样品通过对其反向互补序列进行测序,一般可以得到好的结果。移码突变双模板的存在上图是一个质粒测序样品,用M13+通用引物进行测序,从图中可以看出,该序列在290bp后序列明显有两套峰存在。造成该现象的原因可能有如下几条: 序列发生缺失突变插入外援片段的载体和未插入外援片段的载体同时存在PCR产物用T载体进行克隆时,PCR片段可以以两个方向克隆进T载体所挑克隆不纯两个大小相近的PCR产物同时存在,无法纯化分开解决的办法:对于质粒模板,重新挑选克隆,或从另一段进行测序对于PCR模板,用另一端引物进行测序,或克隆后进行测序Q-3信号迅速衰减 A-3CTT重复结构 如上图,在大约260碱
10、基后出现了一个严重的CTT重复结构,导致信号迅速衰减,很难得到跨过该区后的信息。该种情况下,只能从另一端进行测序,一般来说,AAG重复结构不会太影响测序。也可以对片段进行亚克隆,使每个片段大小不大于200bp,然后再进行测序。不过,该方法要麻烦很多。GC特殊结构区 上图是一个质粒模板用M13+通用引物进行测序的结果,序列中存在一个GC特殊结构区,在该区域后,信号迅速减弱。上图的下半部分是对测序反应进行优化后的测序结果,在GC特殊结构后,测序信号得到一定程度的改善,但是离一般的测序结果还是相差甚远。针对该类型的模板,一般应从反向进行测序,然后在该特殊结构区附近将两个方向的测序结果拼接起来,得到完
11、整的序列。Q-4 对测序引物的要求有哪些?A-4 对测序引物的一般要求:1)特异性与测序模板结合,不能有多于4个碱基以上的错配 现象;2)不能含有混合碱基;3)长度17-25碱基;4)纯度高,最好PAGE纯化;5)用H2O溶解,不要用TE溶解。Q-5 为什么测序引物必须特异地与DNA模板结合?A-5 测序引物与待测样品DNA分子只能有一个结合位点是测序成功的前提。如果测序引物在DNA模板分子上有不只一个的结合位点,将造成测序反应过程中引物链在几个结合位点处同时扩增,从而得到链长相同而组成不相同的终止链,测序电泳时收集到重叠峰或乱峰,无法读取序列。Q-6 为什么测序引物3端以后有30-50碱基无
12、法读到?A-6 全自动荧光测序方法由于使用标记了大荧光染料的ddNTP,一些未反应完的ddNTP底物会连同测序反应产物一并被沉淀,在测序电泳时会干扰测序信号,导致这部分碱基无法读清。一般会在分析结果时切掉这部分无意义的数据。通常这也是载体的序列。所以选取测序引物时要使引物3端离开要求测序的起始位置50碱基以上比较合适。而对于PCR产物测序就不可避免使得测序引物区域附近无法读到数据。Q-7 怎样选择(设计)测序用引物?A-7 长度在1525个碱基左右,一般选择20个碱基(根据GC含量作适当调整),3端尽量选择G或C碱基(但不绝对),以增加与模板的结合能力。Tm温度应选择5070左右。GC含量应选
13、择在50%左右,尽量避开A、T、G、C的连续结构。避开引物自身形成发夹结构或引物二聚体结构等复杂结构。保证引物和模板100%配对,特别是3端的几个碱基一定要100%配对。同时必须严格保证引物和模板之间只能有一个结合位点。Q-8 PCR片段直接测序和PCR片段经克隆后测序的结果有何区别?A-8 众所周知,PCR扩增过程中会出现很多错配现象,但不可能所有的错配都发生在同一位置。PCR片段直接测序时,其结果是PCR片段众多分子的混合物的结果。如果在某一个点上出现了几十次错配现象,但大多数分子(或许是几十万个分子)在这个点上应该还是正确的,在测序时,错配现象也就反映不出来了。因此,PCR片段直接测序的结果反映的是PCR用模板最原始的结果。而PCR片段经克隆后测序是测定了某一个分子的DNA序列。在几十个循环的PCR扩增过程中,很难保证某一个分子的任何点都不发生错配。因此,PCR片段经克隆后的测序结果,往往存在着一些错配的序列,和PCR片段直接测序的结果相比有些碱基会有所不同。这种错配现象的多少取决于PCR扩增时使用的DNA聚合酶的保真性能。要减少PCR扩增过程中的错配现象,在PCR反应时,应选用保真性能高的DNA聚合酶。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1