单分子测序助力医学研究.docx
《单分子测序助力医学研究.docx》由会员分享,可在线阅读,更多相关《单分子测序助力医学研究.docx(7页珍藏版)》请在冰豆网上搜索。
单分子测序助力医学研究
单分子测序助力脆性X综合征的研究[创新技巧]
美国加州大学戴维斯分校(UCDavis)医学院及PacificBiosciences公司的研究人员利用单分子实时测序技术,对脆性X综合征的关键基因FMR1中的CGG片段扩增进行了测序。
他们在第15届脆性X和早发性认知缺损国际研讨会上公布了他们的研究成果。
脆性X综合征(又称Martin-Bell综合征)是一种遗传性综合征。
它导致一系列特征性症状,包括生理、智力、情绪、以及行为上的异常。
症状的轻重各有不同。
该疾病伴随着X染色体上一段三核苷酸序列(CGG)的扩增。
这种扩增导致了一种称为FMR1的蛋白质无法在病人体内表达,而该蛋白质是神经正常发育所必需的。
脆性X智力低下(FMR1)基因位于X染色体上,其5’非翻译区(5’UTR)包含了CGG三核苷酸的重复序列。
大部分人的CGG片段重复5-44次。
CGG片段的扩增与认知力和生殖功能受损相关。
如果一个人含有45-54个重复序列,则被认为是“灰色地带”,而55-200个重复序列被称为前突变,200个以上重复序列则被称为全突变。
生物通
中度CGG重复序列扩增(55-200个CGG重复)可导致脆性X相关性震颤/共济失调综合征(FXTAS),一种以意向性震颤、步态共济失调和其他症状为特征的迟发性神经变性疾病1。
而高度CGG重复序列扩增(>200个CGG重复)可引起转录沉默和FMR1编码蛋白(FMRP)的功能丧失,从而导致脆性X染色体综合征1。
由于目前的测序方法都依赖于大量相同拷贝的读取,因而大量扩增的CGG重复(>100)只能生成不连贯的信号(图1)。
这阻碍了研究人员获得单碱基分辨率的测序数据。
图1:
随着重复扩增数量的增多,生成大量相同的拷贝变得越来越困难。
这阻碍了对大部分疾病范围(>100次重复)内重复扩增序列的准确测序。
于是,研究人员利用PacificBiosciences公司的单分子实时(SMRT)测序技术,试图从大量扩增的CGG重复序列中产生高质量的测序数据(图2)。
他们首先利用PCR从人类基因组DNA中扩增出带不同CGG重复的FMR1序列,制备出待测文库。
随后加上发夹测序接头,生成闭合的环状测序模板。
之后利用PacificBiosciencesRS对样品进行测序。
最后采用BLASR算法将长读取装配成环状共有序列(CCS),而目标序列的覆盖度至少为3倍。
结果表明,环状共有序列的读取产生了生理相关范围的重复扩增。
而对长的重复等位基因的测序能力似乎仅受读长限制。
原始读长超过10kb,使得环状共有序列覆盖了超过750个CGG重复片段。
图3:
一段CGG重复片段范围内的环状共有序列读取图。
接近155个重复的峰是SMRTcell被动上样偏向(passiveloadingbias)与较小插入片段优势的综合结果。
示例:
环状共有序列读取包含372个CGG重复。
研究人员认为,通过这种方法,如今能够以单碱基分辨率完整鉴定所有与疾病相关的等位基因,从而有利于疾病的准确诊断。
参考文献
1.Oostra,B.A.andR.Willemsen,FMR1:
agenewiththreefaces.BiochimBiophysActa,2009.1790(6):
p.467-77.
2.Eid,J.,etal.,Real-timeDNAsequencingfromsinglepolymerasemolecules.Science,2009.323(5910):
p.133-8.
Cell:
单分子测序揭示惊人的基因组重排
科学家们发现,生活在池塘里的单细胞生物Oxytrichatrifallax有一种非凡的能力,它们能在交配时将DNA打碎并快速重排这些片段。
这项研究发表在上一期的Cell杂志上。
Oxytricha的基因重排是一个非常精密的过程,“这是大自然早期一种的复杂化尝试,”文章的资深作者,Princeton大学教授LauraLandweber说。
从实用性的角度看,人们可以将Oxytricha当成模式生物,研究高等动物的染色体重排。
在癌症早期,染色体会经历混乱的重排事件,而Oxytricha可以一步步地展现这一过程。
这项研究中的Oxytricha基因组是通过PacBio单分子测序完成的,PacificBiosciences公司开发的这一技术可以实现超长的测序读取。
Landweber介绍道,Oxytricha与其它微生物截然不同,Oxytricha细胞大约是人类细胞的十倍大,而且拥有两个细胞核。
体细胞核含有5%的遗传信息,有转录活性,负责调节细胞的内部活动。
而生殖系细胞核保存着要传递给下一代的全部遗传信息,没有转录活性。
研究显示,Oxytricha在发育过程中,能通过大规模的程序化DNA重排,将生殖系细胞核转变为体细胞核。
事实上,Oxytricha交配只是为了交换DNA。
在营养充足的时候,Oxytricha主要采取无性繁殖,不断地有新细胞出芽。
在营养匮乏的时候,两个Oxytricha发生融合并分享遗传信息(交配),拆散并重排生殖系细胞核的基因和DNA,共同构建拥有一套新染色体的体细胞核。
这一过程能让Oxytricha焕发青春活力,也提高了遗传物质的多样性,Landweber说。
在Oxytricha的交配过程中,生殖系细胞核选出大约225,000个小DNA片段,来构建新染色体。
Landweber实验室之前的工作表明(2012年的一篇Cell文章和2008年的一篇Nature文章),上一代Oxytricha的数百万非编码RNA引导着上述过程,它们以正确的顺序标记和分选DNA片段。
此外,Oxytricha庞大的基因组也令人印象深刻,Landweber说。
2013年她的团队发现,这种生物的体细胞核含有大约16,000染色体,这些染色体大多只含有一个基因。
Oxytricha的独特遗传学机制为DNA提供了很好的保护,有利于将强健的遗传物质传递下去。
正因如此,这种生物才能够广泛分布在世界各地。
推荐原文:
TheArchitectureofaScrambledGenomeRevealsMassiveLevelsofGenomicRearrangementduringDevelopment
PacbioRSII测序平台
一,原理
1.用4种荧光分别标记4种dNTP
2.在测序芯片的底部做出许多用与入射光波长相应的小孔,特定的孔径保证了入射光在小孔中只以走很短的矩离。
只够照到正好与酶在相互作用的荧光dNTP底物
3.把聚合酶锚定在测序芯片的底部
4.让DNA链与酶结合,进行测序
5.测序时,荧光dNTP与酶+DNA模板型成复合物,短暂结合
6.荧光dNTP被激光照射,发出荧光,荧光被检测到
7.酶反应过程,一方面使链延伸,同时使dNTP上的荧光基团脱落
8.聚合反应持续进行,测序同时持继进行
二,优点:
1. 测长很长,主力的测长可以达到8kb,见下图
2. 可以直接测出碱基修饰,当聚合酶遇到模板上甲基化的A、C等碱基时,聚合的速度明显变慢,并且光谱特征发生改变。
这使直接测甲基化变得很容易,见下图:
3. 对GC含量的偏向性小,可以轻松读到高GC的区段,下图中的紫色曲线就是PacBio的覆盖度。
从本质上说,是因为建库中没有PCR过程,所以也就没有因为PCR而引入的GCbias
4. 测序速度快,上机时,1秒钟测3个碱基。
3个小时可以完成一个run。
上机前的建库,1天完成,与Illumina或IonTorrent的建库时间基本持平。
所以,整体上,1天建库,1天上机,1天数据分析,3天可以走完一个完整流程
三,应用:
1,动植物复杂基因组测序
(1)杂合基因组:
杂合基因组主要指杂合率高于0.5%的二倍体基因组,如大部分水产类和昆虫等;
(2)高重复基因组:
主要指重复序列比例高于50%的二倍体基因组,大部分林木;
(3)超大基因组:
基因组大小大于3G,甚至是10G以上的物种,如两栖类,部分林木;
(4)多倍体基因组:
如四倍体、六倍体植物等。
2,真菌基因组完成图
(1)适用于所有真菌菌株;
(2)尤其适合超高GC/超低GC真菌;
(3)其它用传统方法测序比较困难真菌;
(4)真菌基因组草图或精细图补洞。
3,细菌基因组完成图
(1)普通细菌快速完成图构建;
(2)尤其适合超高GC/超低GC细菌;
(3)其它用传统方法测序比较困难细菌菌株
通过采用第三代测序技术,直接进行细菌基因组的完成图绘制。
4,BAC克隆完成图
通过PacBioRS平台进行单分子实时测序,可以快速得到超长读长。
再加大测序深度,PacBio序列可以产生非常均一覆盖度,在大部分目标区域内,可以接近100%的覆盖度。
这种方式对于有超高GC含量、超低碱基复杂度等BAC克隆非常具有优势。
根据PacBio公司提供的Poster,由1PacificBiosciences公司和UniversityofWashington,Seattle对人类基因组一个约1.6Mb的片段,总共8个BAC克隆进行了PacBio测序,对比了Illmina测序,总体上得到了非常好的效果。
5,从头组装(DENovoAssembly)
PacBioRS平台是目前唯一能完成完整基因组组装,结构测定和基因分型的微生物测序平台。
该平台可以用PacBio数据独立完成微生物基因组的完整拼接,也可以将PacBio长读长数据和二代测序短读长数据进行混合拼接完成基因组。
6,甲基化检定
SMRT技术采用的是对DNA聚合酶的工作状态进行实时监测的方法。
DNA聚合酶催化荧光标记的核苷酸掺入到互补的核酸链中。
核苷酸的掺入被检测成荧光脉冲,依据其颜色鉴定出核苷酸。
当聚合酶切断连接在核苷酸末端的荧光基团时,脉冲终止。
荧光脉冲的到达时间和持续时间产生了关于聚合酶动力学的信息,从而允许直接检测DNA模板链中的修饰核苷酸,包括N6-甲基腺嘌呤、5-甲基胞嘧啶和5-羟甲基胞嘧啶【1】。
【1】参考资料: