1、参照序列而被采用,已成为生命科学转化为实际应用的基础,并继续对研究基因型-表现型的关系发挥着重要作用。从迄今为止发表的(和未发表的)文献报道来看,要对人类复杂疾病进深入的有医疗意义的探讨,非常有必要去获得其他类型的个人基因组数据,如,特定组织mRNA表达概况,mRNA测序,基因调控区域的个性化分析,表观遗传调控的概况,以高质量和大范围的染色体图谱分析来归类重要的染色体删缺,插入和重排等等。为成百上千的单个个人,把他们各自的完整基因组学数据与他们完整复杂的病史对应起来,将带我们进入个体化医学的时代。大规模测序中心正完成新一代的测序仪器的转型,联合基因组研究所(the Joint Genome I
2、nstitute, JGI)已经淘汰了所有的桑格测序仪。而另一方面,除非小型的第二代测序仪能在清楚读出每个碱基上的成本和测序读长 上胜过毛细管电泳测序系统,毛细管测序系统仍将会大量应用于特定区域测序,如定量基因表达,生物标志物鉴定和生物学途径分析等专向性研究。第二代测序关于下一代是什么,或更确切的说,第二代测序技术是什么,已有几篇综述出现了。我们提议,将第二代技术定义为:是同步化三磷酸核苷酸的洗脱方法和同步化的光学检测方法的结合。但这种定义不是很严格。因为有几种算作是第三代测序的实时合成测序的方法,也依赖于光学检测。如太平洋生物科学公司(Pacific Biosciences)的单DNA聚合酶
3、测序法就是突出例子。第二代测序技术靠的是连接测序,或者合成测序,包括焦磷酸测序和可逆性的链终止法。由罗氏(Roche),以鲁米那(Illumina), 赫利克斯(Helicos)和生命技术公司(Life Technologies)以商业化提供的仪器,以短的连续性的片段序列和测序阅读长度的形式,每周输出数十亿碱基对(Gbp)的DNA序列。 对这种基于合成测序,也就是由一种DNA聚合酶或连接酶主导化学过程的第二代测序方法,关于它们所面临的挑战和它们这些酶学方法的优势,另有一篇综述已做了详细的介绍。表1. 第一代和第二代测序技术第X代公司平台名称测序方法检测方法大约读长(碱基数)优点相对局限性一AB
4、I/生命技术公司3130xL-3730xL桑格-毛细管电泳测序法荧光/光学600-1000高读长,准确度一次性达标率高,能很好处理重复序列和多聚序列通量低;样品制备成本高,使之难以做大量的平行测序贝克曼GeXP遗传分析系统高读长,准确度一次性达标率高,能很好处理重复序列和多聚序列; 易小型化单个样品的制备成本相对较高二罗氏/454基因组测序仪FLX系统焦磷酸测序法光学230-400在第二代中最高读长;比第一代的测序通量大样品制备较难;难于处理重复和同种碱基多聚区域;试剂冲洗带来错误累积;仪器昂贵以鲁米那HiSeq2000/miSeq可逆链终止物和合成测序法2x150很高测序通量仪器昂贵;用于数
5、据删节和分析的费用很高ABI/SOLiD5500xlSOLiD系统连接测序法25-35很高测序通量;在广为接受的几种第二代平台中,所要拼接出人类基因组的试剂成本最低测序运行时间长;读长短,造成成本高,数据分析困难和基因组拼接困难;赫利克斯Heliscope单分子合成测序法25-30高通量;在第二代中属于单分子性质的测序技术读长短,推高了测序成本,降低了基因组拼接的质量;仪器非常昂贵第二代测序成本在过去的几年里,主导第二代测序仪市场的几家公司,纷纷依靠已知的参照基因组(通过第一代桑格测序方法完成的人类基因组),以更好更经济的第二代测序方法生产出了拼接好的人类全基因组序列。同当年以ABI公司的桑格
6、毛细管电泳测序仪产生出克莱格.文特尔(J.Craig Venter)的基因组序列草图所花的成本相比, 由罗氏(Roche)的454基因组测序仪FLX,以鲁米那(Illumina)的基因组分析仪,和赫利克斯(Helicos)的Heliscope测序仪得到原始数据所花成本,大体上分别下降了1个, 2个和3个数量级。不过,在这些报道中,只是计入了耗材和试剂成本。这些新的大规模平行测序仪需要大量的在仪器设备上投资, 因为许多这样的高通量仪器价格都在每台50-100万美元之间。而操作这些仪器和进行信息学分析以拼接序列的人力花费也应计入总的测序成本。到本文发表之前,以鲁米那公司的仪器在第二代测序市场占据6
7、0%的份额,居于领先地位。而在剩余市场部分中,生命技术公司的Solid系统和罗氏各自分得近19%。以鲁米那公司的全基因组测序服务,每测一个全基因组费用为19500美元,比起2008年要测定一个人的全基因组所花的试剂的成本250000美元(或者是每个测好的碱基0.02美分)已经少得多,而比1996年的成本更是少了几个数量级,因为当时的第一代测序成本为每个碱基一美元。为减少成本,采用可逆末端终止物的合成测序法的以鲁米那公司,最近新推出了较小的,较便宜的Miseq测序平台,承诺可以在27个小时内以150的测序阅读长度来产出超过1GB(10亿个碱基)的数据。这种更袖珍而多功能的测序仪是专门为应对毛细管
8、电泳测序在普通实验中的应用而设计的,如克隆鉴定,扩增序列测序,小基因组测序等。另一款规模较大的是,生命技术公司的5500xl系列仪器,以连接测序的方法,每七天能总共测出300亿碱基的序列。台式测序仪的市场里还有Ion Torrent,是生命技术公司的一个分部,正在开发第三代技术,最近刚上市了一款个人基因仪器(Personal Gene Machine)和Ion Express触摸式模板制备系统(Ion Express One Touch template preparation system)。 而罗氏的454是以焦磷酸测序法,以荧光酶标记的微粒来检测单个碱基的延伸, 像是对1996年同步地对
9、DNA四种碱基测序方法的优化。这种发出光线的焦磷酸测序法,不需要用多个荧光团,也不需要激光或昂贵的光学滤片,大大降低了仪器的成本。罗氏的454GLXFlex Titanium系列,一台价值50万美元的仪器,每天可以生产高质量的4-6亿个碱基校读数据。其新的目标是要达到超过800碱基校读的测序读长。价值10万美元的454 GS Junior小型测序仪,于2009年推出市场,也是以台式仪的小型研究项目为目标,能在10个小时内以400碱基的读长完成35Mb(35兆碱基)的数据。台式新一代技术的发展,力求大大降低成本和仪器体积和简化测序过程,并持续提高测序能力,测序读长和精确度,从而在台式测序的市场上
10、对第一代桑格毛细管测序构成直接挑战(毛细管测序的最后生存空间)。为了显示全基因组测序的真实成本,美国国立人类基因组学研究所(National Human Genome Institute, NIGRI)把从他们的测序中心得到的测序成本数据进行了编辑整理,以便准确地估计出测定一个人类全基因组序列的全部成本。他们的计算中计入了人力花费,测序仪的3年折旧费,数据处理花费和样品准备过程的花费。图1显示了自2001年人类基因组最初草图发表后,每测序一套相当于人类单倍体基因组所花费的相应成本。在2008年所见的测序成本急降正是由第一代桑格毛细管测序向安装于各个测序中心的第二代测序平台转变的结果(如454,
11、Illumina,SOLiD). 第二代测序技术产生出彼此重叠不高的相邻测序阅读片段,需要进行较高深度测序后再做序列拼接。 不过,它们的高数据产出量降低了耗材成本和测序运行的次数。技术研发的成本和数据分析的成本常常从测序总成本计算中本忽略了。通常,这些成本比建立起第二代,第三代测序技术高得多。例如,图1中的由第二代测序技术而来的数据(2008年之后)是重测序工作的结果, 其中,参照基因组被用于指导序列拼接过程。假如从头测序只以桑格毛细管电泳方法来进行,那么在此阶段,要评估只靠第二代或第三代测序技术来进行一个人类基因组的测序或从头拼接的操作可行性和相关成本,实际上是很困难的。显而易见的是,现在最
12、大的成本障碍在于那些用于精确排列的光学检测系统和下游的数据分析所需的复杂硬件系统。第三代测序技术以将人类基因组测序的成本降到1000美元以下为终极目标,美国国立健康研究院/美国国立人类基因组学研究所(NIH/NIGRI)资助了几个小组以改进第二代测序技术或研发其他的测序方法,包括扫描隧道电子显微镜(Scanning Tunneling Electron Microscope, TEM),荧光共振能量转换(FluorescenceResonanceEnergyTransfer,FRET),单分子检测(Single-moleculeDetection)和 蛋白质纳米孔(Protein Nonopo
13、res)的应用。有两种处于领先地位的第三代测序技术(太平洋生物科学公司和全基因组学公司)仍然依赖于荧光活动的光学检测,但其目的在于提高测序速度和数据产出量(见表格2)。 在另一方面,Ion Torrents 技术公司应用了电子敏感场效应晶体管(Ion-sensitive Field Effect Transitor, ISFETs),以摒弃测序过程中对光学检测的依赖。而牛津纳米孔公司(Oxford Nanopore)的纳米孔技术也是致力于取消光学设施和无需进行DNA扩增,他们以检测跨越纳米孔的导电性变化来进行测序。由霍尔康分子和ZS遗传学公司(Halcyon Molecular and ZS Genetics)所使用的纳米光学扫描隧道电子显微镜技术需要价值百万美元的设备,迄今为止,他们的数据产出量仍然有限,但很有可能阅读出长达数千碱基的相邻DNA片段。还有,一些仍然基于光学检测的测序方法也还在研发之中,将可以做到前所未有的长距离基因定位,这对于将个人基因组和癌症基因组进行精确拼接是非常必要的。 现在,我们来详细审视第二代和第三代测序技术,介绍每一种技术的长处和缺点。图1. 测定一个人的全基因组序列所需的
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1