植物基因组学的的研究报告进展.docx

上传人:b****5 文档编号:29069977 上传时间:2023-07-20 格式:DOCX 页数:13 大小:30.30KB
下载 相关 举报
植物基因组学的的研究报告进展.docx_第1页
第1页 / 共13页
植物基因组学的的研究报告进展.docx_第2页
第2页 / 共13页
植物基因组学的的研究报告进展.docx_第3页
第3页 / 共13页
植物基因组学的的研究报告进展.docx_第4页
第4页 / 共13页
植物基因组学的的研究报告进展.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

植物基因组学的的研究报告进展.docx

《植物基因组学的的研究报告进展.docx》由会员分享,可在线阅读,更多相关《植物基因组学的的研究报告进展.docx(13页珍藏版)》请在冰豆网上搜索。

植物基因组学的的研究报告进展.docx

植物基因组学的的研究报告进展

基因组学课程论文

 

题目:

植物基因组学的的研究进展

XX:

秦冉

学号:

11316040

 

植物基因组学的的研究进展

摘要:

随着模式植物——拟南芥和水稻基因组测序的完成,近年来关于植物基因组学的研究越来越多。

本文主要对拟南芥、水稻2种重要的模式植物在结构基因组学、比较基因组学、功能基因组学等领域的研究进展以及研究所使用的技术方法进行简单介绍。

关键词:

植物;基因组学;研究进展

Therecentprogressinplantgenomicsresearch

Abstract:

Withthepletionofgenomesequencingofthemodelplant--Arabidopsisandrice,moreandmoreresearchesonplantgenomicsemergeinrecentyears.Theresearchprogressofthe2importantmodelplant--Arabidopsisandriceinstructuralgenomics,parativegenomics,functionalgenomicsandtechnologymethodsusedinthisresearch areintroducedbrieflyinthispaper.

Keywords:

plant;genomics;researchadvances

前言

基因组是1924年提出用于描述生物的全部基因和染色体组成的概念。

1986年由美国科学家ThomasRoderick提出的基因组学是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学。

自从1990年人类基因组计划实施以来,基因组学发生了翻天覆地的变化,已发展成了一门生命科学的前沿和热点领域。

而植物基因组研究与其他真核生物和人类基因组研究有很大的不同。

首先,不同植物的基因组大小即使在亲缘关系非常近的种类之间差别也很大;其次,很多植物是异源多倍体,即便是二倍体植物中有些种类也存在较为广泛的体细胞内多倍化(endopolyploidy)现象[1]。

基因组研究主要包括三个层次:

①结构基因组学,以全序列测序为目标,构建高分辨率的以染色体重组交换为基础的遗传图谱和以DNA的核苷酸序列为基础的物理图谱。

②功能基因组学,即“后基因组计划”,是结构基因组研究的延伸,利用结构基因组提供的遗传信息,利用表达序列标签,建立以转录图谱为基础的功能图谱(基因组表达图谱),系统研究基因的功能,植物功能基因组学是当前植物学最前沿的领域之一。

③蛋白质组学,是功能基因组学的深入,因为基因的功能最终将以蛋白质的形式体现。

近来,以水稻(Oryzasativa)和拟南芥(Arabadopsisthaliana)为代表的植物基因组研究取得了很大进展,如植物分子连锁遗传图谱的构建,在此基础上,已经在植物基因组的组织结构和基因组进化等方面得到了有重要价值的结论;植物基因组物理作图和序列测定的研究集中于拟南芥和水稻上;植物比较基因组作图证实在许多近缘植物甚至整个植物界的部分染色体区段或整个基因组中都存在着广泛的基因共线性,使得我们可以利用同源性对各种植物的基因组结构进行研究、分析和利用。

本文主要对拟南芥、水稻2种重要的模式植物在结构基因组学、功能基因组学、比较基因组学等研究领域的研究进展进行归纳总结。

1拟南芥基因组学的研究

1.1拟南芥结构基因组学研究

美国自1990年启动“植物基因组学”计划,2000年底公布了模式植物拟南芥的全部序列。

通过分析基因组序列能够获得基因结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。

Bevan[2]对拟南芥第四染色体上1.9Mb的片段进行了全序列测定.结果发现:

平均每4.8Kb就有一个基因存在;54%的基因与GenBank中的基因具有同源性;约20%的基因在该染色体片段上以基因家族的形式存在;该染色体片段上共发现五种重复序列成分,约占所测序列的19%左右:

分别为:

非编码区中的重复序列、逆转座子成分、叶绿体DNA片段、散布重复的基因家族成员和串联重复的基因家族成员。

高等植物中,拟南芥的基因组最小且具有很少的重复DNA序列,快速复性序列仅占整个基因组的10%左右.两种相关的串联重复序列(180bp和500bp)都定位于拟南芥染色体的中心粒异染区.另一类串联重复序列(160bp)定位于染色体的中部.第四种高度重复序列是端粒序列.在拟南芥的1号染色体中心粒区的一个串联重复中发现了一个退化的端粒序列,紧接该序列是一个在遗传作图时有五个位点的重复单元,rDNA的重复单位大小约为10Kb,约占整个核基因组的8%左右。

5SrRNA的编码基因是以497bp为重复单位的串联重复序列,约占基因组的0.7%[3]。

在拟南芥中还鉴定出了类似逆转座子的成分)Ta1和其相关家族以及转座因子Tat1和Tag1,它们都相对具有较低的拷贝数。

在拟南芥的突变体中已经鉴定出了多个遗传标记位点,包括RFLP、PAPD、SSR等标记。

已经发展了两套重组近交系作图群体,利用这些作图群体,已经构建了高密度的拟南芥分子标记遗传连锁图谱。

拟南芥物理作图利用粘粒载体,YAC(YeastArtificialChromosome)载体进行,已经完成了拟南芥高密度物理图谱的构建。

在拟南芥中已利用图位克隆的方法克隆了许多基因[4-5]。

1.2拟南芥功能基因组学研究

2001年开始,美国全面启动2010年计划,目标是到2010年确定拟南芥中所有基因的功能。

中国国家自然科学基金委员会已于2001年快速启动“拟南芥全部转录调控因子蛋白组学研究”重大国际合作研究项目,2004年3月,研究取得了重要进展:

共克隆了44个拟南芥转录调控因子家族中的1282个基因,获得了拟南芥所有已知和预测的1864个转录因子的序列,利用cDNA(互补DNA)微阵列芯片,检测了拟南芥幼苗的转录因子在光调控下的表达,所有表达的基因占整个转录因子的84%,并通过蛋白质表达实验验证已克隆的拟南芥转录调控因子融合基因中85%以上有一定量的蛋白质表达。

与基因组的全序列测定同时进行的拟南芥表达序列标签(expressedsequencetags)计划也已取得巨大进展。

据www.Arabidopsis.org发布的信息表明,至2002年中期拟南芥的ESTs标记数已达174625个。

EST计划的不足在于随机测序难以得到那些低丰度表达的基因和在特殊环境条件下(如生物胁迫或非生物胁迫)诱导表达的基因。

为了弥补不足,进行基因组全序列测定。

通过分析基因组序列能够获得基因结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。

拟南芥基因组全序列测定的完成对整个植物科学具有重要的意义,例如:

可以用于比较分析真核生物中的转录调节因子。

拟南芥中约有超过5%的序列编码1500多种转录调节因子,其中45%是植物特有的。

拟南芥中属于所有真核生物共有的转录调节因子,在其保守的DNA结合结构域上并不完全与其它真核生物相同,大多数以其特异的线型组合排列。

2水稻基因组学的研究

2.1遗传图谱

水稻是已知的单子叶植物中基因组最小的植物之一,基因组大小为450Mb,共有12条染色体。

自1988年MeCoueh等[6]利用IR34583(籼)×BuluDalam(爪哇)的F2群体构建了第一X水稻分子连锁图谱(含135RFLP标记)以来,高密度的图谱相继产生。

近年来,随着分子遗传学的迅速发展,国际水稻基因组测序计划(InternationalRiceGenomeSequencingProject,IRGSP)成员国以Nipponbare、Kasalath、IR64和Azucena等水稻品种为材料,构建了10个饱和的遗传图谱并与表型的标记进行了整合,以创造新的遗传资源。

1998年,Harushima等[7]构建了一X高密度水稻遗传连锁图,包含2275个遗传标记,覆盖水稻基因组1521.6cM。

2001年RiceGenomeProgram(RGP)公布了包含3267个RFLP分子标记的水稻分子连锁图。

还利用次级三体和终级三体(telotrisomics)将经典遗传图和分子遗传图中的着丝粒位置确定,修正了分子图谱的方向,把RFLP标记定位到特定的染色体臂上;Wu等[8]构建了水稻第11和第12染色体短臂末端重复基因组区域的图谱,重复基因组区域大小是2.5Mb,表明水稻也存在大染色体片段的重复区域。

上述遗传图谱在基因定位、物理图谱的构建和基因测序中发挥了或即将发挥巨大作用。

2.2物理图谱

由于遗传图的精确性较低、分辨率有限,而物理图是对遗传图的进一步深化,并能直接应用于图位克隆技术分离目的基因[9-10]。

1998年,Umehara等[11]构建了水稻第一X物理图谱,共筛选到5701个YAC,其中2117个单一YAC分配到12条染色体上,跨度216Mb,覆盖水稻基因组的50%。

接着日本水稻基因组计划(RGP)开始将YAC重叠群(contig)分解成粘粒(cosmid)DNA克隆,构建更精细的物理图谱。

2001年,RGP还构建了一个覆盖270Mb(全基因组的63%的YAC文库的物理图,由6934个YAC组成,插入片段平均长度为350kb。

由于YAC克隆不太稳定、插入DNA难以分离、转化效率低等原因,美国Clemson大学基因组研究(ClemsonUniversityGenomicsInstitute,CUGI)又建成了两个BAC库,一个是由37000个Hindm酶切的BAC文库,插入片段平均长度为128.5kb;另一个是有56000个克隆的EcoR工BAC库,插入片段平均大小为120kb,两者覆盖水稻基因组的26倍。

2001年,RGP为了克服YAC克隆的局限性,又以PAC为载体构建了水稻Nipponbare基因组文库,此文库由72000个Sau3AI酶切克隆组成,平均插入片段长120kb,覆盖水稻基因组的16倍。

,国际水稻基因组测序计划(IRGSP)已于2002年12月宣布,利用克隆连克隆(逐步克隆)测定法(clonebyclonesequencing),提前3年完成了水稻12条染色体的碱基测序工作。

日本在其中发挥着主导作用,并最先以99.99%的精度完成了最长的第1条染色体的测序工作。

另外,中国12家单位,于1998年至2001年利用全基因组霰弹法(whole-genomeshotgunsequencing,WGS),构建了籼稻93—11基因组工作框架图和低覆盖率的培矮64S草图,并最先向全世界公布了水稻93—11全基因组框架图。

随后,美国先正达(Syngenta)公司也完成了日本晴基因组工作框架图的测序。

两个框架图同时发表在2002年4月的《Science》第296期第79~99页,它们都是对IRGSP的补充。

水稻基因组框架图和全长序列的精确测定虽已基本完成,但片段之间或重叠群之间仍存在一些缺口或空隙(gap),如籼、粳两个亚种的基因组工作框架图分别覆盖了水稻全基因组的95.29%和93%,碱基准确率约99%。

当前基于物理图精确测序的图谱研究表明[12-13],水稻“日本晴”全基因组己获得372.1Mb的高质量精确序列,余下的5%分布于12条染色体上的38个间隙(gaps)、10个着丝粒和10个端粒处;水稻全基因组预测有56278个基因位点,因为6498个基因位点编码10432个转录本,所以总转录本为66710;如果去除15236个转座因子相关的蛋白编码基因后,共有41042个基因位点编码非转座因子相关的蛋白,平均9.4kb含一个基因,其中约29%的基因成族出现,约71%与拟南芥基因(Arabidopsis,28000-29000个基因)享有同源性(反过来,约90%的拟南芥基因与水稻基因享有同源性)。

31439个基因位点已经得到ESTs序列、全长cDNA序列、Tiling芯片检测、大规模平行测序(massivelyparallelsig.Naturesequencing,MPSS)检测的RNA转录水平上的确认,8226个基因位点的编码蛋白序列与功能已知的蛋白质序列相同或相似,另有13632个基因位点的编码蛋白含有已知的功能域。

3功能基因组的研究方法

3.1芯片技术

芯片技术主要是有利于科学家在一次实验中检测了成千上万个基因表达水平的变化,或者更广泛地识别染色体上转录活性区域及甲基化等特殊区域[14]。

这个技术是现代生物信息井喷时代的一个重要的检测手段。

通过比较两X不同芯片的结果,就能在全基因组水平上调查各个基因的变化及其程度,这样有助于我们发现突变体中不同处理之间或者处理前后以及不同发育阶段中那些特异基因发生变化,从中寻找重要功能基因。

基因芯片的设计,都是依据已知的水稻表达序列(如EST、全长cDNA等数据库)以及IRGSP预测的水稻基因序列进行的。

因此,这些基因芯片在检测未知的水稻表达序列上能力欠缺,由此产生了水稻全基因组或染色体的tiling(覆瓦式)芯片。

tiling芯片是针对分析全基因组所有转录活性区域的DNA微阵列,根据各条染色体已知的序列,扩增一个个相互重叠的片段[15]或者每隔十或十几个碱基合成一段寡核苷酸探针,这样一步步覆盖整个水稻基因组或染色体[16]。

一般tiling芯片由一个可操作的数目(如几十X芯片)组成,为了提高芯片的杂交质量还要求在设计的寡核苷酸探针中剔除一些高度重复区域内的探针。

3.2大规模平行测序技术和基因表达系统分析方法

除了基因芯片采用杂交手段检测全基因组表达水平变化外,水稻基因表达的大规模分析平台里还有两个以测序为基础的检测方法:

大规模平行测序技术(massivelyparallelsignaturesequencingMPSS)[17]和基因表达的系统分析(serialanalysisofgeneexpression,SAGE)[18]。

两者检测的理论基础都是一个长度20bp左右的寡核苷酸序列足以作为特定基因的识别标签.这些识别标签在表达文库中出现的频率能很好地代表特定基因体内的表达丰度。

最近一篇文章报道了利用MPSS技术建立的整个基因组的水稻表达图谱[17],该研究从22个水稻mRNA文库中检测了46971553个短序列识别标签,验证和识别了大量已知的和未知的转录本。

还从3个小RNA文库中检测了2953855个短序列识别标签,是目前最深入地挖掘作物中小RNA的研究工作。

20~24bp的小RNAs,包括microRNAs(简称miRNA)和shortinterferingRNAs(简称siRNAs),两者都能通过序列互补与靶基因的mRNA结合并降解靶mRNA,使靶基因沉默。

siRNAs还能通过DNA的甲基化或组蛋白的修饰引起靶基因的转录沉默。

小RNA的研究是当今生物领域的热点之一,被公认为广泛地控制植物的各生长发育,以及生理代谢途径包括环境胁迫响应途径。

MPSS技术是高度自动化的价格昂贵的检测技术,目前只掌握在少数几家实验室。

由于没有芯片杂交的背景噪音,不能采用信号与背景比值的阈值来剔除假阳性,MPSS技术分析中小部分短序列识别标签的真伪难辨,但是与tiling等基因芯片相比,大大提高了对极低表达丰度的转录活性位点的检出。

3.3表达序列标签

表达序列标签(ExpressedSequenceTag,EST)是从cDNA文库中随机挑取的克隆进行测序所获得的部分cDNA的5′或3′端序列,一般长为300-500bp左右,建立这些序列的数据库即为EST文库。

基因表达的差异分析,可以通过计算某一基因片段在EST文库中出现的频率的多少来确定。

EST不仅为植物基因组遗传图谱的构建提供了大量的分子标记,而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息,此外,EST计划还为基因的鉴定提供了候选基因(candidates),是鉴定和发现表达基因的最快途径。

EST计划的不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下诱导表达的基因。

3.4蛋白质组技术

由于基因芯片技术只能反映从基因组到RNA的转录水平上的表达情况,而从RNA到蛋白质须经过许多中间环节的影响,因此仅凭基因芯片技术我们还不能最终掌握生物功能具体执行者—蛋白质的整体表达状况。

蛋白质组是指基因组表达的全部蛋白质及其存在方式,蛋白质组学旨在阐明生物体全部蛋白质的表达模式及功能模式,其内容包括鉴定蛋白质的表达、存在方式(修饰形式)、结构、功能和相互作用等,利用蛋白组研究植物功能基因组可以得到以下3方面信息:

从基因序列预测的基因产物的翻译情况;基因产物的相对浓度;基因产物翻译后的修饰程度。

蛋白质组学将基因表达的数据与植物代谢和植物表型的问题紧密连在一起,既可以用于研究植物生理机制,又可以用于研究未知功能的蛋白质[19]。

蛋白质组学研究技术和方法很多,并不断发展和出现新的技术。

发展可替代或补充双向凝胶电泳的新方法已成为蛋白质组研究技术最主要的策略,目前二维色谱(2D-LC)、二维毛细管电泳(2D-CE)、液相色谱-毛细管电泳(LCCE)等新型分离技术都有补充和取代双向凝胶电泳之势。

另一种策略则是以质谱技术为核心,开发质谱鸟枪法(Shot-gun)、毛细管电泳-质谱联用(CE-MS)等新策略直接鉴定全蛋白质组混合酶解产物。

随着对大规模蛋白质相互作用研究的重视,发展高通量和高精度的蛋白质相互作用检测技术也被科学家所关注。

3.5正向遗传学与反向遗传学

传统的遗传学即正向遗传学(forwardgenetics)分离基因的方法,是首先研究突变体中某一已知突变性状的表现以及其遗传行为(如突变性状在后代中的传递规律、核质基因的判断、控制突变性状的基因数目等等),然后对主效基因进行染色体上的定位及精细定位,接着对定位区域内的候选基因筛选并且验证其功能,最后分离出控制突变性状的基因。

这种方法被称为图位克隆法。

反向遗传学(reversegenetics)是相对正向遗传学而言。

是在功能基因序列发生已知突变后的基础上,对这些突变基因进行分析,研究该基因突变后在生物体内的功能作用即表型变化。

在具备了水稻T-DNA、外源转座子以及内源逆转录转座子Tosl7插入突变群体和其它全基因组上已知序列突变的资源库后,水稻功能基因组学的研究正逐步由正向遗传学(突变—基因)向反向遗传学(基因—突变)发展。

在水稻T-DNA或Tosl7插入突变体库应用中,多个实验室报道只有较低的频率观察到突变性状与插入标签存在连锁,部分原是在构建插入突变群体的组织培养过程中,产生了大量的非T-DNA或Tosl7等已知序列插入造成的突变体。

这些现象使得先从突变体库筛选特定突变性状,再判断已知插入序列位点的基因与突变性状的连锁关系,最后分离出基因的传统正向遗传学方法困难不小。

反向遗传学研究水稻基因的功能,既可以通过对插入突变库构建插入序列的旁邻序列FSTs数据库,也可以对突变库分组后进行筛选特定区域的序列突变的单株[20]。

大规模的突变体的构建一方砸对反向遗传学研究带来极大的便利,另一方面这些大量突变体种子的储存、繁殖和分发则是极大的不便。

加上对转基因植株种植的政策管理,也给种子的繁殖和分发形成一定的阻碍。

另外,水稻中部分功能基因的冗余在一定程度上也给反向遗传学研究方法造成了一些困难,虽然增强或过量表达基因的方法能够弥补一些不足。

4比较基因组学的研究方法

比较基因组学研究方法有两大支柱,即比较作图和比较生物信息学。

基本方法是先用相同的一套cDNA探针对不同物种进行作图,然后用生物信息学方法进行分析。

现在发展成为DNA序列来比较基因组的方法,尽管这对研究大多数种总基因组间的宏观共线(macrosynteny)不太适用,但对研究部分区段的微观共线性(microcolinearity或microsynteny)还是有效的。

美国康乃尔大学曾确定了一套探针,在过去的几年中向50多个研究单位进行了发放[21]。

使用同一套探针,可以确定关系较远的基因组间的同源区域,也可比较不同实验室的作图结果。

这套探针包括152个cDNA(67个来自水稻、63个来自燕麦、21个来自大麦、1个来自小麦)。

这些cDNA满足了以下要求:

①在Southern分析中能与大多数禾谷类作物(水稻、小麦、大麦、燕麦、玉米、高粱和甘蔗)基因组杂交;②在水稻中为单拷贝或低拷贝;③基因组覆盖面大。

这些探针的5′和3′端均已测序,序列已送到GenBank(序号为AA231638—AA231938)。

其中78%的DNA序列编码的蛋白质序列与已知基因的蛋白质序列有相似性。

 在禾谷类作物的比较基因组学研究中,水稻常常也被当作模式植物,因为水稻上已有非常密集的分子标记及其他标记,基因组小。

研究发现,其它基因组的连锁群包含有与水稻连锁群同源的区段,只是伴有复杂的重排而已。

同等重要的是比较生物信息学,因为要把不同基因组当作一个整体遗传系统分析和处理还必须开发相应的算法和软件。

美国开发出了一个交互显示软件以确定和显示不同种间的保守连锁区段(http:

//probe.nalusda.gov:

8300),另一个互联也提供了水稻基因组的比较图谱(http:

//genome.cornell.edu/rice/quickqueries)。

该软件综合了水稻、玉米、燕麦和小麦的比较图谱资料,用户可以利用软件提供的一些方法研究进化关系、基因组结构及发现新基因。

但比较生物信息学还需要进一步发展已适应更高层次的研究需要。

对跨种、跨属、跨界的基因组比较对我们了解基因及基因组的结构、基因结构与功能的关系及DNA变化如何导致生物多样性等有十分重要的意义。

从比较遗传图谱上可发现,RLB10C插入到RLB5中即小麦族第1组染色体和燕麦染色体A,也可能是禾本科中所有Pooideae亚科的种所共有的。

与此类似,在Panicoideae亚科的种的基因组中,则是RLB9插入RLB7,RLB10插入到RLB3。

由于RLB10在Pooideae和Panicoideae两个亚科中均能见到,可以推测水稻基因组是最原始的

[22]。

以前曾假定染色体重排是随机发生的,因此可以作为确定进化时间表的依据,现在从比较基因组学的研究结果看这个假定存在一定问题。

例如,普通小麦的D染色体组与水稻基因组的共线性有11个断点[23],二者的染色体基数分别为7和12;小麦和黑麦的基因组共线性有11个断点[24],小麦和小伞山羊草的基因组共线性有12个断点[22],它们的染色体基数均为7;小麦D染色体组与大麦基因组的共线性则没有断点。

说明这些物种的形成时间显然与共线性的断点没有直接关系。

但是,用比较基因组学方法可以从某种程度上判断基因组结构形成的时间早晚。

例如,在玉米中DNA片段常常重复,它们可能是多倍体发生的结果,即在早期曾是四倍体,其发生应在玉米从甘蔗[25]和高粱[26]分开之后,因为后两者的基因组没有这么多重复现象。

参考文献

[1]GalbraithDW,HarkinsKR,MaddoxJR,etal.RapidFlowCytometricAnalysisoftheCellCycleinIntactPlant

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1