转录组学研究进展精修订.docx
《转录组学研究进展精修订.docx》由会员分享,可在线阅读,更多相关《转录组学研究进展精修订.docx(7页珍藏版)》请在冰豆网上搜索。
转录组学研究进展精修订
集团标准化工作小组#Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#
转录组学研究进展
转录组研究前沿
随着转录组学,蛋白组学,代谢组学等组学的不断涌现,生物学研究已经跨入后基因组时代,转录组学作为一个率先发展起来的技术开始在生物学前沿研究中得到了广泛的应用。
广义转录组(Transcriptome)系指从一种细胞或者组织的基因组所转录出来的RNA的总和,包括编码蛋白质的mRNA和各种非编码RNA(rRNA,tRNA,snoRNA,snRNA,microRNA和其他非编码RNA等)。
狭义转录组系指所有参与翻译蛋白质的mRNA总和。
转录组研究历史:
自从上世纪90年代中期以来,随着微阵列技术被用于大规模的基因表达水平研究,转录组学作为一门新技术开始在生物学前沿研究中展露头脚并逐渐成为生命科学研究的热点。
原因如下:
1)蛋白质组研究需要更多的转录组研究的信息:
因为单一的蛋白质组数据不足以清楚地鉴定基因的功能,因此蛋白质组的数据需要转录组的研究结果加以印证。
2)非编码RNA研究的不断发展,使得转录组研究的范围不断扩大和深化。
3)随着新一代高通量测序技术运用到转录组研究之中,转录组研究中提供的数据量呈现爆炸式的扩增,极大拓宽了转录组研究解决科学问题的范围。
目前进行转录组研究的技术主要包括如下三种:
1)基于杂交技术的微阵列技术;2)基于Sanger测序法的SAGE(serialanalysisofgeneexpression)和MPSS(massivelyparallelsignaturesequencing);3)基于新一代高通量测序技术的转录组测序。
各种转录组研究技术的特点如下:
基于杂交技术的DNA芯片技术只适用于检测已知序列,却无法捕获新的mRNA。
细胞中mRNA的表达丰度不尽相同,通常细胞中约有不到100种的高丰度mRNA,其总量占总mRNA一半左右,另一半mRNA由种类繁多的低丰度mRNA组成。
因此由于杂交技术灵敏度有限,对于低丰度的mRNA,微阵列技术难以检测,也无法捕获到目的基因mRNA表达水平的微小变化。
SAGE是以Sanger测序为基础用来分析基因群体表达状态的一项技术。
SAGE技术首先是提取实验样品中RNA并反转录成cDNA,随后用锚定酶(Anchoringenzyme)切割双链cDNA,接着将切割的cDNA片段与不同的接头连接,通过标签酶酶切处理并获得得到SAGE标签,然后PCR扩增连接SAGE标签形成的标签二聚体,最后通过锚定酶切除接头序列,以形成标签二聚体的多聚体并对其测序(关于SAGE方法细致的介绍请参考网站)。
SAGE可以在组织和细胞中定量分析相关基因表达水平。
在差异表达谱的研究中,SAGE可以获得完整的转录组学图谱以及发现新的基因并鉴定其功能、作用机制和通路等。
MPSS是SAGE的改进版,MPSS技术首先是提取实验样品RNA并反转录为cDNA,接着将获得的cDNA克隆至具有各种adaptor的载体库中,并PCR扩增克隆至载体库中的不同cDNA片段,然后在T4DNA聚合酶和dGTP的作用下将PCR产物转换为单链文库,最后通过杂交将其结合在带有Anti-adaptor的微载体上进行测序。
MPSS技术对于功能基因组研究非常有效,能在短时间内捕获细胞或组织内全部基因的表达特征。
MPSS技术对于鉴定致病基因并揭示该基因在疾病中的作用机制等发挥了重要作用。
自从2005年上市以来,第二代测序技术对基因组学的研究产生了巨大的影响并被广泛运用到了基因组测序工作之中。
转录组测序也被称为全转录组鸟枪法测序(WholeTranscriptomeShotgunSequencing,WTSS),以下简称RNA-seq。
众所周知,真核生物的基因由三类RNA聚合酶转录:
RNA聚合酶I和III负责其种类稀少,功能重要的看家非编码RNA基因的转录,包括rRNA,tRNA,snoRNA,snRNA等;而RNA聚合酶II负责蛋白质编码基因和调控非编码RNA的转录,其转录产在加工过程中均会加上3'端多聚腺苷尾。
RNA-seq是对用多聚胸腺嘧啶进行亲和纯化的RNA聚合酶II转录产生的成熟mRNA和ncRNA进行高通量测序。
所获得的海量数据经过专业的生物信息学分析,既可以还原出一种细胞内基因表达的种种特征。
如果对不同种类的细胞进行并行的RNA-seq及生物信息学分析,即可以获得多种基因表达调控的重要信息。
第二代高通量测序技术赋予了RNA-seq超强的覆盖度和灵敏性,可以检出许多不曾被预测到的由可变剪接或可变3'多聚腺苷化位点选择导致的mRNAisoforms,以及新的ncRNA和antisenseRNA(反义RNA)。
它在研究真核生物的基因表达调控,癌症等疾病的发生机制和新治疗方案确定,遗传育种等方面具有不可估量的潜力,是后基因组时代改变人们的生命认知和生活质量的一股强劲力量。
短短几年,该技术已经被广泛用于解析人类基因组可变剪接,以及从酵母到拟南芥到人的基因表达中的重要科学问题。
下表是几种转录组研究所用技术的比较:
转录组所用技术
转录组前沿研究简介:
随着高通量测序技术的迅猛发展,转录组研究从以前的微阵列技术,SAGE及MPSS技术的低通量模式切换至RNA-seq的高通量模式。
作为蛋白质组研究的基础,RNA-seq可以识别比蛋白组高一两个数量级的基因,从而帮助科学家构建完整的基因表达谱以及蛋白质相互作用网络。
RNA-seq对于真核生物的基因表达调控,癌症等疾病的发生机制和新治疗方案确定,遗传育种等方面的研究具有不可估量的潜力。
以下是关于转录组前沿研究的一些介绍:
1)单细胞转录组分析
随着高通量测序技术的不断成熟,转录组高通量测序技术在功能基因组学的研究中发挥了非常重要的作用。
很多研究表明相同的细胞类型中的基因表达水平也常常显示异质性,对于单个细胞来说,转录组的随机变异性可能决定了细胞的最终命运,因此不同的细胞具有不同的转录组表型,所以从理论上讲,转录组分析应该以单细胞为研究模型,科学家应用单细胞RNA-seq技术即可获得单细胞的转录组信息。
2009年SuraliAzim和LaoKaiqin领导的课题组描述了一种单细胞转录组测序技术如下图:
(Tangetal.2009NatMethods.6:
377-82)
作者通过对单个小鼠卵裂球细胞的RNA-Seq数据进行分析,分析发现至少5个测序所获得的reads比微阵列技术多出75%(5270)的表达基因,并鉴定了1753个崭新的剪切位点。
除此以外,单细胞的RNA-seq结果表明了在相同的卵裂球或卵母细胞中,至少有8-19%的基因存在两个以上的转录异构体,该现象清楚表明了在胚胎发育过程中单细胞转录组的复杂性。
最后,通过对单个Dicer1-/-和Ago2-/-卵母细胞的转录组测序,相对野生型来说,Dicer1-/-和Ago2-/-卵母细胞分别发现1696和1553个基因异常上调,1571和1121个基因异常下调,而619基因是相同的。
这种单细胞RNA-Seq技术检测将大大提高我们对单个细胞在哺乳动物发育中转录复杂性的理解。
2)转录组测序确定RNA结构
非编码RNA对于基因表达的调控机制的研究成为近年来的热门研究领域,而RNA的结构是RNA行使其功能的基础,所以测定RNA的结构对于理解RNA功能意义重大。
传统的测定RNA二级结构的方法是用化学试剂或RNA酶切割RNA然后通过测序胶进行分析。
这种方法的工作量巨大而且对于技术要求很高。
2010年12月份美国加州大学圣克鲁兹分校霍华德·休斯医学研究院SofieSalama教授所领导的课题组描述了一种通过转录组高通量测序方法测定RNA结构的方法(Fragmentationsequencing,FragSeq),该方法发表在《自然—方法学》。
(Underwoodetal.2010.NatMethods.7:
995-1001)
该方法利用核酸酶P1只切割单链RNA的特性对小鼠RNA进行片段化,片段化RNA的大小在20–100nt之间,然后在片段的5’和3’端分别加上测序接头,再进行逆转录和PCR扩增,最后构建FragSeq文库并对其进行高通量测序。
同时作者通过生物信息学分析大量的高通量测序结果,并辅以实验数据成功测定了小鼠的非编码RNA的二级结构。
3)转录组测序在疾病中的应用
转录组测序(RNA-seq)是最近发展起来的利用高通量测序技术进行转录组分析的一种技术,可全面快速地获得特定细胞或组织在某一状态下的几乎所有的成熟mRNA和ncRNA。
相对于传统的基因芯片技术,RNA-seq技术不需要针对已知序列设计探针,即可检测细胞或组织的整体转录水平。
RNA-seq技术具有更灵敏的数字化信号更高的通量以及更广泛的检测范围。
在疾病的机制研究以及疾病治疗领域,转录组测序作为一个有力的工具已经被广泛使用。
2010年7月,密歇根大学ArulMChinnaiyan实验室分析了15例前列腺癌样本的转录组测序结果,研究发现其中有两例前列腺癌样本的ETS基因没有发生融合,进一步的研究表明存在于Raf信号途径中的BRAF和RAF1基因会发生融合现象,作者同时利用q-PCR和FISH技术验证了上述现象的存在。
除此以外,作者通过对大批不同的癌症样本进行荧光原位杂交实验,并精确统计了BRAF和RAF1基因的重排频率,统计结果表明了各种癌症样本如胃癌,肝癌,黑色素瘤和前列腺癌的研究结果具有高度的一致性。
此项成果证明了RAF信号途径在一系列癌症如前列腺癌、胃癌和黑色素瘤发病过程中起到了非常重要的角色,同时研究成果也表明了RAF信号途径中的融合基因有潜力成为抗肿瘤治疗与抗肿瘤药物筛选的靶标。
参考文献:
BrennerS,JohnsonM,BridghamJ,GoldaG,LloydDH,JohnsonD,LuoSJ,McCurdyS,FoyM,EwanM,RothR,GeorgeD,EletrS,AlbrechtG,VermaasE,WilliamsSR,MoonK,BurchamT,PallasM,DuBridgeRB,KirchnerJ,FearonK,MaoJ,CorcoranK.Geneexpressionanalysisbymassivelyparallelsignaturesequencing(MPSS)onmicrobeadarrays.NatBiotechnol,2000,18(6):
630–634.
LockhartDJ,WinzelerEA.Genomics,geneexpressionandDNAarrays.Nature,2000,405(6788):
827–836.
Palanisamyetal.2010.RearrangementsoftheRAFkinasepathwayinprostatecancer,gastriccancerandmelanoma.NatureMedicine.16:
793-798.
ShendureJ,JiH.Next-generationDNAsequencing.NatBiotechnol,2008,26(10):
1135–1145.
Tangetal.2009.mRNA-Seqwhole-transcriptomeanalysisofasinglecell.NatMethods.6:
377-82.
Underwoodetal.2010.FragSeq:
transcriptome-wideRNAstructureprobingusinghigh-throughputsequencing.NatMethods.7:
995-1001.
VelculescuVE,ZhangL,VogelsteinB,KinzlerKW.Serialanalysisofgeneexpression.
Science,1995,270(5235):
484–487.
WangZ,GersteinM,SnyderM.RNA-Seq:
arevolutionarytoolfortranscriptomics.NatRevGenet,2009,10
(1):
57–63.
[Lasteditedby西瓜on2011-11-23at11:
09]
Keywords: