转录组学主要技术及其应用研究.docx

上传人:b****8 文档编号:30381667 上传时间:2023-08-14 格式:DOCX 页数:15 大小:31.28KB
下载 相关 举报
转录组学主要技术及其应用研究.docx_第1页
第1页 / 共15页
转录组学主要技术及其应用研究.docx_第2页
第2页 / 共15页
转录组学主要技术及其应用研究.docx_第3页
第3页 / 共15页
转录组学主要技术及其应用研究.docx_第4页
第4页 / 共15页
转录组学主要技术及其应用研究.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

转录组学主要技术及其应用研究.docx

《转录组学主要技术及其应用研究.docx》由会员分享,可在线阅读,更多相关《转录组学主要技术及其应用研究.docx(15页珍藏版)》请在冰豆网上搜索。

转录组学主要技术及其应用研究.docx

转录组学主要技术及其应用研究

 

转录组学主要技术

及其应用研究

 

******

专业:

微生物学

年级:

2013

学号:

*******

 

二零一四年六月十五日

转录学主要技术及其应用研究

摘要:

转录组(transcriptome)是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的集合。

转录组学研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。

目前,转录组学研究技术主要包括两种:

基于杂交技术的微阵列技术(microarray)和基于测序技术的转录组测序技术,包括表达序列标签技术(ExpressionSequenceTagsTechnology,EST)、基因表达系列分析技术(Serialanalysisofgeneexpression,SAGE)、大规模平行测序技术(Massivelyparallelsignaturesequencing,MPSS)、以及RNA测序技术(RNAsequencing,RNA-seq)。

文章主要介绍了以上转录组学主要研究技术的原理、技术特点及其应用,并就这些技术面临的挑战和未来发展前景进行了讨论,为其今后的研究与应用提供参考。

关键词:

转录组学;微阵列技术;转录组测序技术;应用

Studyonthemaintechnologiesoftranscriptomicsandtheirapplication

Abstract:

Thetranscriptomeisthecompletesetoftranscriptsforcertaintypeofcellsortissuesinaspecificdevelopmentalstageorphysiologicalcondition.Transcriptomeanalysiscanprovideacomprehensiveunderstandingofmolecularmechanismsinvolvedinspecificbiologicalprocessesanddiseasesfromtheinformationongenestructureandfunction.Currently, transcriptomicstechnologymainlyincludesmicroarry-basedonhybridizationtechnologyandtranscriptomesequencing-basedonsequencingtechnology,involvingExpressionsequencetagstechnology,Serialanalysisofgeneexpression,MassivelyparallelsignaturesequencingandRNAsequencing.Thedetailedprinciples,technicalcharacteristicsandapplicationsofthemaintranscriptomicstechnologiesarereviewedhere,andthechallengesandapplicationpotentialsofthesetechnologiesinthefuturearealsodiscussed.Thiswillpresenttheusefulinformationforotherresearchers.

Keywords:

transcriptomics;microarray;transcriptomesequencing;application

随着后基因组时代的到来,转录组学、蛋白质组学、代谢组学等各种组学技术相继出现,其中转

录组学是率先发展起来以及应用最广泛的技术[1]。

1转录组和转录组学

转录组概念是最先由Veclalesuc和Kinzler等人于1997年提出[2]。

转录组(transcriptome)广义上是指某个组织或细胞在特定生长阶段或生长条件所转录出来的RNA总和,包括编码蛋白质的mRNA和各种非编码RNA,如rRNA、tRNA、snoRNA、snRNA、microRNA及其他非编码RNA等。

但狭义上通常仅以mRNA为研究对象。

由转录组的定义可见,其包含了特定的时间和空间限定,这与基因组的概念不同。

因此,同一组织或细胞在不同生长条件、生长阶段,其转录组是不同的。

通过遗传学中心法则我们可以知道,遗传信息的传递是以信使RNA(mRNA)为“桥梁”,从DNA传递到蛋白质。

由此可见,转录组的研究不仅可以解释细胞或组织的基因组的功能元件,揭示分子成分,还可以用来认识生物学进程和疾病发生机制[3,4]。

转录组学(transcriptomics)是功能基因组学(FunctionalGenomics)研究的重要组成部分,是一门在整体水平上研究细胞中所有基因转录及转录调控规律的学科[5,6]。

随着人类基因组计划HGP(HumanGenomeProject)的完成,科学家也逐渐认识到对基因结构序列的研究仅仅是基因组学研究的一部分,并不能揭示所有的生命奥秘,所以接下来需要解决的问题是:

研究这些基因序列的功能、参与的生命过程、表达调控方式,以及这些基因在不同的时空条件下的表达差异等。

这些问题都需要功能基因组学技术来解决,而转录组学技术是功能基因组学研究的重要组成部分。

对基因及其转录表达产物功能研究的功能基因组学,将为疾病控制和新药开发、作物和畜禽品种的改良提供新思路,为人类解决健康问题、食物问题、能源问题和环境问题提供新方法。

2转录组学研究的方法

在早期,由于测序价格昂贵、基因序列数目有限,转录组学研究者只能进行极少数特定基因的结构功能分析和表达研究。

最近十几年,分子生物学技术的快速发展使高通量分析成为可能,这为真正意义上的转录组学的研究奠定了基础。

这些高通量研究方法主要可以分为两类:

一类是基于杂交的方法,主要是指微阵列技术(Microarray);一类是基于测序的方法,这类方法包括表达序列标签技术(ExpressionSequenceTagsTechnology,EST)、基因表达系列分析技术(Serialanalysisofgeneexpression,SAGE)、大规模平行测序技术(Massivelyparallelsignaturesequencing,MPSS)、RNA测序技术(RNAsequencing,RNA-seq)。

其中,Microarray和EST技术是较早发展起来的先驱技术,SAGE、MPSS和RNA-seq是高通量测序条件下的转录组学研究方法转录组学研究有助于了解特定生命过程中相关基因的整体表达情况,进而从转录水平初步揭示该生命过程的代谢网络及其调控机理。

2.1微阵列技术(Microarry)

微阵列技术是分子生物学领域具有里程碑式意义的重大突破,它可以同时测量不同样本中成千上万个基因在不同环境和不同状态下的表达水平。

基因表达数据是基于DNA微阵列技术而产生的反映基因转录产物mRNA丰度值的一组数据。

数据中蕴含着丰富的基因活动信息,通过对这些数据中所隐含的基因活动信息进行分析,就可以解答一些生物学领域的问题。

如基因的表达在不同环境中有哪些差异,基因的表达在特定条件下有哪些变化,基因之间有哪些相关性,以及在不同条件下基因的活动受到哪些影响等等[7]。

2.1.1原理和方法

DNA微阵列基本制作原理为大规模集成电路所控制的机器人在尼龙膜或硅片固相支持物表面,有规律地合成成千上万个代表不同基因的寡核苷酸“探针”,或液相合成探针后由阵列器(arrayer)或机器人点样于固相支持物表面。

这些“探针”可与用放射标记物32P或荧光物如荧光素、丽丝胺等标记的目的材中的DNA或cDNA互补核酸序列相结合,通过放射自显影或激光共聚焦显微镜扫描后,对杂交结果进行计算机软件处理分析,获得杂交信号的强度及分布模式图,以此反映目的材料中有关基因表达强弱的表达谱。

该技术仍以基因连锁、连锁不平衡、限制性长度多态性、可变串联重复序列及单核苷酸多态性标记等基因定位方法为基础,采用分子杂交等多种技术方法为手段,进行遗传作图,对不同材料中的多个基因表达模式进行平行对比分析,是一种高产出的、新的基因分析方法。

以尼龙膜为固相支持物的DNA微阵列和以硅片为固相支持物的DNA芯片,二者在原理上相同,仅在支持物及检测手段等方面略有不同。

在微阵列里最大的一类DNAmicroarray根据探针分子的构成又可以分为cDNA微阵列和寡核苷酸微阵列。

(1)cDNA微阵列

cDNA微阵列是指对各种生物随机克隆和随机测序所得的cDNA片段进行归类,并把每一类cDNA片段的代表克隆(代表一个独立基因)经过体外扩增,得到大小和序列不同的片段分别经过纯化后,利用机械手高速将它们高密度有序地点样固定在玻片硅晶片或尼龙膜上,从而制备成cDNA微阵列,以此对各基因的表达情况进行同步分析。

它的特点是造价低、适用面广、研制周期短、灵活性高。

而缺点是点阵密度相对比较低。

同时,cDNA微阵列由于基因长短不一,导致溶解温度Tm各异,众多的基因在同一张芯片上杂交,使得杂交条件很难同一,这样也使得其分辨能力受到限制。

(2)寡核苷酸微阵列

寡核苷酸微阵列的主要原理与cDNA微阵列类似,主要是通过碱基互补配对原则进行杂交,来检测对应片断是否存在、存在量的多少。

它与cDNA芯片的本质差别在于寡核苷酸的探针片断相对较短(一般是20-70nt的寡聚核苷酸序列)。

寡聚核苷酸微阵列的探针经过优化,长度基本一致,并且Tm也相差不大,所以相比较cDNA微阵列它具有以下优点:

1.无需扩增,防止扩增失败影响实验;2.减少非特异性杂交,能够有效的区分同源序列的基因;3.杂交温度均一,提高了杂交效率;4.减少了微阵列片上探针的二级结构。

上述特点使得寡核苷酸微阵列的应用日益广泛。

但是当寡核苷酸序列较短时,单一的序列不足以代表整个基因,所以又需要用多段序列,从而提高了制作成本。

2.1.2应用

(1)表达差异的研究

1995年Schena等用了48个PCR扩增的cDNA探针点制的微阵列片分析了野生型和转基因的拟南芥中基因表达差异,并与Northernblot作了比较。

发现Microarray能够很好的检测到基因表达水平上的差异,并且能够在同一张玻片上使用不同的荧光染料同步进行差异比较。

近年来,研究多集中于突变型与野生型、环境胁迫与正常生长型、激素处理与未处理或者不同组织器官之间的比较。

Ma等[8]利用寡核苷酸微阵列研究了玉米3个雄性不育突变体和可育植株花药4个发育阶段的基因表达情况,检测到了近9200个正反义转录本。

通过比较每个突变体与其可育花药的基因表达差异,筛选到了一大批可能与花药分化相关的重要转录因子和调控因子。

Schena等[9]用人外周血淋巴细胞的cDNA文库构建一个代表1046个基因的cDNA微阵列,来检测体外培养的T细胞对热休克反应后不同基因表达的差异。

发现有5个基因在处理后存在非常明显的高表达,11个基因中度表达增加和6个基因表达明显抑制。

(2)寻找可能致病基因或疾病相关基因

Moch等利用肿瘤微阵列芯片(5184个cDNA片段)发现了肾细胞癌的肿瘤标志物基因,并与正常细胞进行比较。

在532份标本中检测到与胞浆纤维表达有关的一类基因阳性率为51%-61%,命名为vimentin。

追踪观察,有Vimentin表达的患者,预后极差。

Moch等利用肿瘤微阵列芯片(5184个cDNA片段)发现了肾细胞癌的肿瘤标志物基因,并与正常细胞进行比较。

在532份标本中检测到与胞浆纤维表达有关的一类基因阳性率为51%-61%,命名为vimentin。

(3)基因点突变及多态性检测

现用于治疗AIDS的药物主要是病毒逆转录酶RT和蛋白酶PRO的抑制剂,但在用药3~12月后常出现耐药,其原因是rt、pro基因产生一个或多个点突变,rt基因四个常见突变位点是Asp67→Asn、Lys70→Arg、Thr215→Phe/Tyr和Lys219→Gln,四个位点均突变较单一位点突变后对药物的耐受能力成百倍增加[10]。

如将这些基因突变部位的全部序列构建为DNA芯片,则可快速地检测待测病人是一个还是多个基因突变,这对指导治疗和预后而具有十分重要的意义。

Lee等[11]用含有135000个探针的DNA微阵列分析了人线粒体基因组DNA多态性变化。

该组探针互补于人线粒体基因组全长16.6kb,将之与不同个体来源的基因组DNA杂交,发现人线粒体基因组存在16493位T→C突变,16223位C→T等多位点突变的DNA多态性特征。

2.1.3不足和展望

DNA微阵列或芯片几乎可用于所有核酸杂交技术的各个方面,而在同时比较各组织或同一组织

在不同状态下上成千上万个基因的表达状况、DNA序列分析等方面具有更大的优越性[12].有人誉赞“微阵列技术铺平了通往21世纪的医学之路”[13],相信在不久的将来,DNA芯片或微阵列技术将会广泛应用于基础及临床医学各个方面,而发挥出巨大的经济、社会效益。

随着微阵列技术的广泛应用,其内在缺陷也日益暴露出来,成为其发展的瓶颈。

第一,技术水平还需要不断提高。

非特异性杂交是微阵列技术的亟待解决的问题,目前,对于这个问题,在实验中一般采用提高杂交温度的方法,减少非特异性序列间的相互影响。

然而在提高杂交温度的同时,又很可能造成微阵列灵敏性的降低,使一些应该能够检测到的基因表达状况得不到准确的反映,研究者只能在其中寻找平衡;第二,不同时间不同地点不同平台的微阵列结果难于比较。

操作者本身造成的实验误差不可避免,还有样品DNA在取样上的误差,此外,由于实验仪器和操作平台的差别,包括不同实验地点的差别,也导致了相同样本检测到的表达基因相差很大[14];第三,数据处理难度大。

由于微阵列往往集成了成千上万个基因信息,而且微阵列信号中往往掺杂了大量的背景噪音,最终大量的微阵列数据,如何与生物体内在的因素相结合,所以,微阵列技术中最大的挑战来源于数据的处理和数据的挖掘。

2.2表达序列标签技术(EST)

基因表达序列标签(expressedSequencetags,ESTs)为长约200-800bp的cDNA部分序列。

最早利用EST技术是1991年Adms用人脑组织cDNA得到的EST进行的,当时人类基因组计划刚刚开始,一些科学家就主张cDNA测序应该先于基因组测序进行,原因是基因组的编码区代表了基因组绝大部分信息,而且是对我们直接有用的,而编码区长度只有总基因组长度的3%因此可以用最低的代价、最短的时间获取最多最有用的信息。

有了EST的方法之后,人们可以用比cDNA测序更低的费用而得到等量的信息,因此EST技术已成为目前发现新基因的强有力的信息工具。

2.2.1原理和方法

一个典型的真核生物mRNA分子由5’-UTR(5’端转录非翻译区)、ORF(开放阅读框架)、3’-UTR(3’端转录非翻译区)和poly(A)四部分组成,其cDNA具有对应的结构。

对于任何一个基因,其5’-UTR和3’-UTR都是特定的,即每条cDNA的5’端或3’端的有限序列可特异性地代表生物体某种组织在特定的时空条件下的一个表达基因。

来自某一组织的足够数量的ESTs可代表某种组织中基因的表达情况[1]。

EST的数目可以反映某个基因的表达情况,一个基因的拷贝数越多,其表达越丰富,测得的相应EST就越多。

所以,通过对生物体EST的分析可以获得生物体内基因的表达情况和表达丰度。

要获得生物体EST信息,通常应先构建其某个代表性组织的cDNA文库,然后从中随机挑取大量克隆,根据载体的通用引物进行测序,一般可以得到其5’或3’端的200-500bp的碱基序列,然后将测得的EST序列与网上已有的EST数据库进行比较,根据同源性大小,可以初步鉴定出哪些EST代表已知基因,哪些EST代表未知基因,并可以对生物体基因的表达丰度进行分析。

以EST分析基因表达丰度的原理是这样的:

基因x的高水平表达将导致高水平的mRNAx合成,而与mRNAx相对应的cDNA在cDNA文库中的含量也会很丰富。

所以,在对cDNA文库中的大量克隆进行随机测序后,统计与基因x的mRNA相对应的EST数目,就可估计原先mRNA群体中的mRNAx的丰度。

而且,以与mRNAx相对应的EST数目除以所得到的EST总数,就可得到mRNAx绝对丰度的估计值。

White等人称这种以cDNA测序来估计基因表达水平的方法为“电子Northern”(electronicNorthern)或“数字Northern”(digitalNorthern)。

EST构建的技术路线为:

提取样品的总RNA或带有polyA的mRNA→构建cDNA文库,随机挑取大量克隆进行→EST测序→对测得的EST序列进行组装、拼接→对网上己有的EST数据库进行同源性比较→确定EST代表的是己知基因还是未知基因→对基因进行定位、结构、功能检测分析。

2.2.2应用

(1)基因组物理图谱的绘制

通过已知的EST序列设计引物对基因组BAC文库进行PCR能产生扩增条带的那个克隆就是EST在染色体上的位置,这个EST就可以被定位在几号染色体上,进而亚定位至染色体的某个区段。

另外也可以用EST序列提供的探针与基因组BAC文库杂交,同样能将某个已知EST在染色体上定位和亚定位。

EST与STS(特定序列位点)在基因组作图上有相同的作用,而且EST位点还直接与一个表达的基因位置相对应。

(2)基因的电子克隆

电子克隆技术是以算法为核心,以计算机和互联网为工具,利用现有的表达序列标签(EST)和生物信息数据库,对其中大量EST进行分类、整合、组装,直接获得大片段或cDNA全长的方法。

由于EST序列是全世界很多实验室随机产生的,所以属于同起来,通过ESTassembly程序在EST库中搜索与之高度重叠的EST,并将它们组装成一致序列(consensussequence),再用它检索数据库并逐次放宽匹配条件,重复组装以获得尽可能长的或全长cDNA序列。

电子克隆技术的出现,可充分利用现有的信息资源,别是利用其它模式生物的EST信息,快速发现有用基因。

但该技术也有局限,如果参数限制条件太低,很可能会得到错误结果;而参数条件限制太高,就可能没有结果。

对于所拼接出来的基因还需要从生物学意义上进行分离和鉴定。

(3)分离鉴定新基因

对某一特异组织或某一生长发育阶段的cDNA文库进行随机的部分测序,得到大量EST,将这些EST作查询项在dbEST中进行同源查找,同时将由EST推出的氨基酸序列作为查询项在PIR中查找类似物,很就可以识别这些基因到底是什么基因;对于那些在以上数据库中没有找到类似物的EST,再把它们置于6个ORF下,翻译出推定的氨基酸序列,将可能的氨基酸序列作为查询项,在PIR数据库中查找类似物,果有类似物,就认为这个EST代表着这个蛋白的基因。

对于通过EST数据库和PIR数据库已识别的EST,还可以通过探针杂交从cDNA文库中分离我们所感兴趣的那个全长cDNA克隆。

对于那些在dbEST和PIR数据库中都没有类似物的EST,就可能是完全新的基因,需要进一步识别和研究它。

(4)通过EST寻找SSR和SNP分子标记

从EST数据库中筛选SSR和SNP的主要优点在于,这样筛选出来的SSR和SNP分子标记直接与基因的编码区相对应,即得到的往往是基因相关标记(gene-associatedmarkers);另外,从EST中筛选SSR和SNP比从基因组中筛选费用要小得多。

筛选的大致步骤为:

EST重叠群的组装;通过对大量重复的EST进行序列比较,识别出候选SSR或SNP;对候选SSR或SNP进行确认。

总之,通过对大量EST数据的归纳整理是寻找SSR和SNP以构建高密度遗传图谱的最经济的方法。

除了以上用途外,EST还在基因结构分析(内含子、外显子识别)、基因表达及重组蛋白表达的分析中具有重要作用。

(5)RNAi技术的研究

结合GATEWAY技术和基因转化技术用于突变体库建立的RNAi技术,开发出了pHellsgate系列载体,将该技术与cDNA文库构建技术和大规模EST测序技术相结合,使得大规模基因的敲除成为了可能。

RNAi指外源性双链RNA(dsRNA)能抑制细胞内与其序列同源的基因的表达。

在进化上,这可能是生物调控基因表达及抵御病毒侵染或转座子诱导DNA突变的一种共生有的生理机制。

该技术最大的优点就是可以获得大规模的缺失突变体,为基因功能的研究提供了很好的研究工具,同时EST作为序列标签,可以很好地实现表型相关的基因克隆。

2.2.3不足和展望

EST技术己成为一种强有力的工具,帮助人们揭示基因组所包含的信息,使基因组研究进入一个新的阶段。

随着“后基因组”时代的到来,生物信息学在基因功能研究中发挥着越来越重要的作用。

而EST数据处理和分析是生物信息学分析的核心任务之一,它为新基因的克隆和功能分析提供了新的出发点。

EST数据库为新基因的发现和基因表达研究提供了大量的信息和分析材料,也为DNA分子标记的开发奠定了基础。

但是,目前EST研究还存在许多问题。

第一,大量EST序列信息整理的问题。

随着EST数据的不断增加,利用生物信息学方法建立高通量、自动化的EST数据分析平台,己成为EST研究急需解决的问题之一;第二,EST文库中基因表达丰度的问题。

植物基因组极其庞大,某一特定组织在特定时期的基因表达频率各不相同。

在获取有用的、新的EST方面效率较低,人力物力浪费严重;第三,就世界范围来讲,如何避免不同研究机构对同一物种进行重复测序,协调好科学家之间的分工,加快植物EST计划的进程,也是一个需要解决的问题。

2.3新一代高通量测序技术

2.3.1原理和方法

(1)基因表达系列分析技术(SAGE)

SAGE技术是由Velculescu等人[15]在1995提出,是一种可以定量并同时分析大量转录本的方法。

1998年,Powell[16]利用生物素标记的PCR引物合成生物素标记的接头,并利用链霉抗生物素蛋白磁珠绑定接头,这就有效地去除了一些多余的接头,从而提高了SAGE技术分析的效率。

SAGE技术大致理论依据有两点:

第一,来自cDNA特定位置的一段9-13bp的序列能够包含有足够的信息作为确认唯一一种转录物的SAGE标签(9个碱基能够分辨49个不同转录物);第二,将来自不同cDNA的SAGE标签集于同一个克隆中进行测序,就可以获得连续的短序列SAGE标签,而这些SAGE标签可以显示对应的基因的表达情况。

SAGE技术的主要技术路线:

1)将提取的总RNA,通过生物素标记的oligo(dT)引物合成cDNA,用锚定酶(一般为4碱基的限制性内切酶)酶切,利用链霉抗生物素蛋白磁珠收集酶切后cDNA片段的3’部分。

2)将收集的cDNA片段分为两等份,分别加上含有标签酶(一种Ⅱ类限制酶,在距离识别位点大概20碱基处酶切DNA双链)识别位点的接头A和B。

3)将连有接头A或B的cDNA短片段分别用标签酶酶切,再将两份样品混合,以连接形成双标签,这样就可以用与接头A、B互补的引物扩增。

4)用锚定酶酶切PCR富集的产物,得到双标签片段,将10-50个标签序列置于一个克隆中进行测序。

5)对得到的标签数据进行处理。

为了适应不同

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 表格类模板

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1