在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx

上传人:b****7 文档编号:9841696 上传时间:2023-02-07 格式:DOCX 页数:22 大小:814.36KB
下载 相关 举报
在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx_第1页
第1页 / 共22页
在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx_第2页
第2页 / 共22页
在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx_第3页
第3页 / 共22页
在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx_第4页
第4页 / 共22页
在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx

《在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx》由会员分享,可在线阅读,更多相关《在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx(22页珍藏版)》请在冰豆网上搜索。

在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异.docx

在异源多倍体作物物种中识别和描述和解释核苷酸序列的变异

10级生物技术

(二)班

 

在异源多倍体作物物种中

识别、描述和解释核苷酸序列的变异

 

姓名:

杨双

学院:

生命科学学院

学号:

1008240235

教师:

高立宏

植物生物技术杂志(2012)10,pp.125–138

评论文章

在异源多倍体作物物种中识别、描述和解释核苷酸序列的变异

SukhjiwanKaur1,MichaelG.Francki2,3andJohnW.Forster1,3,4,5,*

1初级产业部门,生物科学研究部,维多利亚农业生物科学中心,拉筹伯大学的研究和开发园区,本多拉,维多利亚,澳大利亚

2澳大利亚西部的食品和农业部,南珀斯,华盛顿,和国家农业生物技术中心,默多克大学,默多克,华盛顿,澳大利亚

3分子植物育种合作研究中心,本多拉,维多利亚,澳大利亚

4乳制品期货合作研究中心,本多拉,维多利亚,澳大利亚

5拉筹伯大学,本多拉,维多利亚,澳大利亚

摘要

2011年4月8日收到;

2011年6月5日修正;

2011年6月12日接受。

*通信(Tel+61-3-9032-7054;

传真+61-3-9032-7158;

电子邮件:

john.forster@dpi.vic.gov.au)

对一个种类的理解和核苷酸序列变异的程度是发现和鉴定单核苷酸多态性(SNP)所需要的程序,它提供最通用的一类分子遗传标记。

大多数高等植物物种是多倍体,且具有异源多倍性,因为混合物种形成之间有密切相关的类群,这是很常见的。

突变的变异,两者之间都可能出现等位基因之间(同源)序列的单个亚基因组和种内同源序列之间的亚基因组,除了旁系同源变异之间的重复基因复制。

在异源多倍体中单核苷酸多态性验证的成功取决于序列变异类的分化。

许多生物因素影响辨别的可行性,包括基因家族复杂性的程度,或远交近交繁殖习性,以及二倍体物种起源相关的知识。

此外,高通量DNA测序的发展和相关的计算分析为异源多倍体的遗传分析提供了通用的解决方法。

这些问题探索了在有一定经验的背景下的一系列的异源多倍体物种,如粮食(小麦和油菜),牧草(牧场豆类及草),和园艺(草莓)作物。

随着单核苷酸多态性的发现,在常规基因分型的应用程序中提出了挑战异源多倍体。

特定亚基因组的设计基于要么SNP策略的检测通过有针对性的测定同源序列聚合酶链反应(PCR)放大,或检测到在核苷酸变异剂量中被描述的增量式改变。

关键词:

单核苷酸多态性,同源性,小麦,油料,草料植物,草莓,基因分型。

简介

虽然在植物物种中多重序列多态性检测已用于遗传分析,可单核苷酸多态性(SNP)提供了理想的基因分型系统。

单核苷酸多态性是最基本和最丰富的基因组序列变异的形式和适用高度多路复用的自动化分析(Rafalski,2002a)。

基于SNP候选基因的基因分型,或特定区域发现的在遗传映射和分子标记辅助选择特定的农艺位点已经支持当前的应用程序。

不过,高密度地图建设,全基因组关联研究(Rafalski,2002b)和基因组选择(Meuwissenetal.,2001)需要大规模单核苷酸多态性的发现活动提供全基因组覆盖率。

在实践中,这种办法只能用于实施少数经济重要的物种,但这种情况正在迅速改变。

由于第二代测序技术的快速发展(Metzker,2010),从而使单核苷酸多态性发现率更快。

方法的发现和预测单核苷酸多态性变种的验证已被优化为近亲繁殖和远缘杂交二倍体植物物种(Coganetal.,2006;Chagne´etal.,2007;Edwardsetal.,2007)。

然而,大量重要的农作物是异源多倍体,序列亚基因组之间的变异与等位基因亚基因组的变异存在差异。

在异源多倍体作物更高水平的基因组中存在复杂性,因此对于单核苷酸多态性的预测构成了重大的额外的挑战。

了解许多至关重要的生物因素是解决这一复杂度的关键。

同时,进步序列生成技术和相关的计算方法为异源多倍体的遗传分析提供了通用的解决方案。

本文综述了这些因素和方法,以及其影响到目前为止在几个代表性物种的效率和随后的SNP检测发现。

植物物种中的多倍体

多倍体物种包含染色体补充过量的变异(单倍体)或双(二倍体)状态特点的许多有机体。

有两种条件的多倍体。

同源多倍体通常被认为是由于在减数分裂前期同源染色体分离失败。

我,无论是在单个分类单元,或在F1杂交种间相关的物种具有相同的基因组,导致重叠同源染色体(ThompsonandLumaret,1992)。

另一方面,异源多倍体的结果是种间杂交或相关的物种有类似的但不完全相同的染色体(同源)。

大多数的异源多倍体类群拥有控制机制,防止减数分裂配对时同源染色体之间连接到二倍体遗传机制(RileyandChapman,1958;Sears,1976;Jenczewskietal.,2003)。

多倍体是极为常见的植物系,这也是C.70%活的被子植物物种的原因(Lewis,1980;LeitchandBennett,1997)。

此外,许多物种[如苹果(MalusdomesticaBork.)和玉米(ZeamaysL.)]展示了古代多倍体(古人类)的血统,但在相对近期的演变染色体融合导致高度重复的当代二倍体基因组(Gaut,2001;EvansandCampbell,2002)。

高水平基因组的基因重复,观察到所有被子植物谱系符合多个全基因组重复的事件,其次是选择性基因损失和新功能(AdamsandWendel,2005)。

当代多倍体植物物种包括同源四倍体如土豆(SolanumtuberosumL.),苜蓿(MedicagosativaL.)和木薯(ManihotesculentaCrantz),以及各级异源多倍体如:

硬小麦(TriticumdurumDesf.),棉花(GossypiumhirsutumL.),油菜(BrassicanapusL.),白三叶草(TrifoliumrepensL.),烟草(NicotianatabacumL.)和花生(ArachishypogaeaL.)(allallotetraploid:

4·);面包小麦(TriticumaestivumL.),燕麦(Ave-nasativaL.),高羊茅(FestucaarundinaceaSchreb.syn.Loli-umarundinaceum)和猕猴桃(ActinidiadeliciosaC.F.LiangandA.R.Ferguson)(allallohexaploid:

6·);和甜品草莓(Fragaria·ananassaDuch.)(异源8倍体:

8·)。

在更高水平的多倍体中已观察到的各种非物种[例如,在高羊茅属长达十二倍体(12·)],而甘蔗(甘蔗属)和来自美国的根子是一个复杂的种间杂交异基因型(D’hontetal.,1996)。

单核苷酸序列变异的类别

单核苷酸多态性发现的基本过程涉及DNA区域的测序,先是对比基因型,之后通过序列比对和解释(Edwardsetal.,2007)。

对于二倍体和同源多倍体,发现效率的主要影响因素是辨别旁系同源序列,以及增加采样深度来保证恢复所有的等位基因变异。

对于异源多倍体,这个过程是复杂的,如图1所示为最小(四倍体)的条件。

同源单核苷酸序列变异(即单核苷酸多态性),要么每个亚基因组,或相应的二倍体组之间产生相同的成对的染色体。

同源序列变异(HSVs)被定义为在基因之间产生相应的核苷酸坐标,这是亚基因组之间的重复(Somersetal.,2003)。

在当代单基因组中旁系同源序列变异(PSVs),基因之间产生重复,这已背离共存一个共同祖先序列(Fredmanetal.,2004)。

严格地讲,HSVs代表的一个子集的所有可能的PSVs,但有足够的不同进行单独的分类。

PSV通常定义为内部发生的基因组或个人子基因组[指定PSV1型(psv1)在图1]。

然而,PSV也可能被预测在异源多倍体子基因组之间互补的重复基因[指定PSV2型(图1psv2)]。

最后,通过类比HSVs和PSVs,同源序列变异(OSVs)可能是在相关二倍体类群中相应的基因预测,或异源多倍体物种和相关的当代二倍体属之间的预测。

这些简化的关系,是子基因组和二倍体组细胞对称模式基因组进化之间的。

在实践中,在个人血统重复基因差异造成的损失和选择性基因的损失可能引起推断序列关系。

一般来说,不同类别的频率预计会提高,从SNP到HSV再到PSV。

不过,过程,如基因转换可能会有潜在的同质化的非同源序列,和核苷酸序列变异偏差估计(Wendel,2000)。

图一

在异源多倍体影响序列变异辨别的生物效率因素

内部基因组高度的重复

以二倍体和同源多倍体作为观察,高度的重复序列导致复杂的基因家族的结构将会给各种辨别序列变异的类别造成后续问题,以及提供额外的非线性演化序列事件的机会。

不过,在异源多倍体中存在的两个1型和2PSVs可能产生更高层次的复杂性的序列比较。

基因类容易产生中度或高度复制数量,如组蛋白,查尔酮合成酶((Itoetal.,1997;Shimizuetal.,1999;Goto-Yamamotoetal.,2002)和叶绿素a/b结合蛋白(Mackernessetal.,1998;Hofmannetal.,1999)将受到这种预测的影响。

古代的内部基因组的重复事件也影响比较的过程,这样,最近生成模拟对预计在进化时间上将显示比那些发生在较远的较低PSV频率。

生殖繁殖习性

异源多倍体物种部分或全部可能是近亲繁殖(野生)或远系繁殖(异花受精),或显示兼性行为。

单核苷酸多态性的发现通过(纯)基因型序列完全自交之间的比较是相对简单的,因为根据定义,任何内部基因组序列变异必须是HSVs或PSVs。

在远交群(杂合的繁殖)基因型中,单核苷酸多态性,是目前在基因型内部之间的缺失,并可能同时潜在混乱的HSVs和PSVs。

许多兼远缘杂交种可以进行有限的近亲繁殖减少衍生基因型杂合子。

然而,类似的方法与专远缘杂交导致非常高的近交衰退与不孕。

人工纯合基因型例如加倍单倍体(DHs)也可能产生远缘杂交,以及使用激素的组织培养技术(Tuvessonetal.,2007)。

然而,对于许多物种,这种方法在技术上也不是可行的。

起源关系

不同的异源多倍体物种关于亲缘关系显示着知识水平的高变异,现代子基因组和基因组的现存二倍体分类之间是最密切相关的假定起源。

这些信息可以帮助核苷酸变异的辨别,通过比较派生的异源多倍体序列单体型与那些来自二倍体的对等集合的能力,可以允许选择性的减少同源成分。

此外,OSV(和因此比较有效性)的将影响古老的多倍体化物种。

例如异源四倍体棉花(Gossypi-um)物种(AADD)。

又如G.hirsutumL.andG.barbadenseL.是从1500000年前的亚基因组捐助者的最密切相关的当代类群G.arboretumL.andG.herbaceumL.(A)andG.raimondiiUlbr.(D)中出现的(Senchinaetal.,2003)。

在这种情况下,长期的进化分离的分歧谱系可能限制属的比较数据。

与此相反,异源六倍体小麦的原产地人类史前表明,起源比较对于分配子基因组-特殊变种将会是非常有效的。

在异源多倍体中单核苷酸多态性发现的技术和计算工具

代序列资源

异源多倍体遗传分析的形式,双脱氧核苷酸链终止(Sanger)序列技术的一些适当应用。

例如,分子系统发生学研究(e.g.Handetal.,2010b)往往是基于数据测序的一小部分基因,这些基因来自于双方的核和细胞器基因组。

单核苷酸多态性鉴定以一个特定的候选基因为发展单一特征部位标志物,也适用于低通量测序技术。

然而,能力不足的桑格测序产生大量的序列数据集,以合理的成本限制其适用性。

相关序列生成技术一般将运行在第二代平台,对于每个模板样本它能够产生>106。

这些方法包括在罗氏GSFLX平台上大规模进行焦磷酸测序(Marguliesetal.,2005),二核苷酸连接-破裂的反复反应如ABISOLiD系统(),和在照明下荧光标记的终止固相测序的序列()GALL系统。

每个平台的能力和效率,随着实现发展第三代测序技术,已经全面鉴定了(DeschampsandCampbell,2010)单核苷酸多态性发现范围内的植物基因组的不同规模和复杂性。

异源多倍体类群的核酸序列资源的目标可能是来自采样或者转录或整个基因组。

特异性基因种群基因序列获得表达序列标签(ESTs)是一种有效的方法,尤其是这些大型,复杂的基因组。

不过,非同源序列之间的辨别在序列路线涉及ESTs预计将比基因组序列更具挑战性。

后者提供了一个容量,不仅确定转录(和因此高度保守的)区域,但也有内含子和非转录的序列,不太可能受到选择性压力。

这种基因组序列数集可以通过技术如汇集多重聚合酶链反应扩增,或各种复杂性复位的方法如高C0t选择(Petersonetal.,2002)和甲基过滤(Whitelawetal.,2003),但是整个基因组测序的增长将越来越直接产生(WGS)。

计算方法分析

基于上述考虑从一个异源多倍体给定一个候选数据集,第一个明显的计算步骤是试图消除旁系同源序列的比较。

如前面所描述,相对古代进化事件,内部基因组的高度重复,将影响这项任务可行性的程度。

一个可行的方法是利用信息相关的模式物种,提供一个单基因簇集排序的旁序同源物通过BLAST对齐,假定祖先基因变异之前目标物种和相关模型的分离。

近年在进化过程中更多的重复就不容易理解,但这种自然的比较可以提供启发式规则,这是基于核苷酸多样性的价值和已知的同源对(如作为发病率高的第三密码子碱基变异),可能被用来告知新比较。

在这个鉴别中,对于物种的描述,禾本科与模型[水稻,Brachypodiumdistachyon(L.)P.Beauv.],十字花科[拟南芥(属),豆科],蒺藜苜蓿(百脉根属)和蔷薇科(桃属沙米,野草莓属)物种的比较将是适当的。

主要计算过滤器识别和消除假定旁序同源物预计将产生一个组合同源和同源序列。

适当的软件方案可用于生成多序列比对,根据先前得到随后分析。

序列数据比对算法的发展来自二—一代平台近年已经鉴定(LiandHomer,2010)。

在运行方面,初步质量过滤是被用来去除接头或终端序列,产生的第二代技术经常容易出错。

大多数现有的方案提供参数设置范围的深度报道,序列读质量,大片长度,相似百分率,和预期的多态性率区分真正等位基因的差异和测序错误或调整为同一序列。

例如包括Polybayes3.0多态性的发现工具,(http:

//genome.wustl.edu/tools/software/polybayes.cgi);PYROBASE,454序列,称为质量测定工具(http:

//bioinformatics.bc.edu/marthlab/pyrobayes);Mosaik,一个下一代的序列比对工具(http:

//bioinformatics.bc.edu/marthlab/Mosaik);GigaBayes多态性发现工具(http:

//bioinformatics.bc.edu/marthlab/GigaBayes);CAP3DNA序列汇编;PaCEDNA序列汇编;EagleView序列比对的鉴定(http:

//bioinformatics.bc.edu/marthlab/EagleView);CONSED序列比对的鉴定(http:

//bozeman.mbt.washington.edu/consed/consed.html)和Sequencherver.4.10()。

在低线性的条件下严格使用适当的定位参数,如较低的临界值即最低匹配率和最小重叠,会导致同源和同源序列的合并。

在序列产生一个完全纯合基因型的事件中,单体型辨别应该是微不足道的,因为所有观察到的序列变异必须被定义为HSVs。

在实践中,在近亲繁殖内的剩余杂合度和在远缘繁殖中高度的等位变异的影响经常会比较复杂的,尽管列入内含子序列,表示基因组DNA衍生资源,可立即识别子基因组-特殊单倍型。

在没有这样的鉴别功能,两个子策略可以被假定设想。

在这种情况下,对于等效脱氧核糖核酸序列起源类群良好的特点是可以利用的,单倍型的评论将受到亚基因组的决议。

用于多倍水平x,[(×⁄2))1]的起源比较将被要求完成重叠的分解。

例如,一个异源四倍体(4x),需要的数据来自于一个单一起源,但一个异源8倍体(8x),三个分类的比较是很有必要的。

这些计算方法所描述的影响,后来分别在辨别白三叶草和草莓中得到应用。

在没有足够的信息来支持起源比较的方法,一个方法在逐步增加了严格的标准的基础上,HSVs比单核苷酸多态性,将需要利用相对高的频率。

结果这种方法在图2中显示了一个假设的远缘杂交异源四倍体的类群,其在严格的水平上增加(最小匹配率)75%到95%是能够解决两个密切相关的子基因组之间的关系。

这种方法,虽然不是理想的想法,也可产生启发式规则,但随后的单核苷酸多态性验证的研究能够计算每种类型序列变异的平均发病率。

对于高HSV物种的单纯疱疹病毒(可能与显性的进化分离亚基因组捐助者有关系),但低等单核苷酸多态性多样性,只有中等水平的紧缩可能是必要的重叠分解。

与此相反,一个组合的等位基因多样性和相对较低的分散子基因组,特别是如果HSVs和单核苷酸多态性往往是一致的,将决定使用在更精细的辨别基础上的不同严格的条件。

在异源多倍体作物中单核苷酸多态性发现的价值

多倍体小麦

多倍体小麦是自然的近亲繁殖,大量的基因组基本的大小和基因的高度重复的特点是禾本科家庭。

进化起源于二倍体起源细胞,这是很好理解的,揭示两步过程。

首先,TriticumurartuTumanianexGandilyan(A亚基因组供体)与AeqilopsspeltoidesTausch的研究(B亚基因组供体)产生四倍体小麦属(基因组组成=AABB;2n=4x=28),其中是起源当代硬粒小麦。

二,T.turdidumhybridizedwithAe.tauschiiCoss.(D亚基因组供体),导致现代演进六倍体小麦异源六倍体(基因组组成=AABBDD;2n=6x=42)(Kihara,1944;McFaddenandSears,1946;Sarkar,1956;DvorakandZhong,1990;Dvoraketal.,1993)。

现代多倍体与二倍体起源序列的比较,因此影响HSVs和单核苷酸多态性之间的有效繁殖品种或品系。

面包小麦拥有超过1000000ESTs的汇集,从至少42个基因库中获得不同的发展阶段的植物,源于不同的生物和非生物重要条件(近年的评论,见Francki,2010)。

这些序列可通过GenBank发表在公共领域(http:

//ncbi.nlm.nih.gov/),和提供了一个广泛的对于资源的收集为开发基因表达部分的单核苷酸多态性的发现。

数据库挖掘已结合生物信息学分析,使小麦EST序列重叠,允许序列变异辨别(Somersetal.,2003;Rustgietal.,2009)。

在小麦中一个BLASTN过程对于同源性ESTs假设比较,辨别三个子基因组之间的HSVs鉴定.

图二

图三

单核苷酸多态性品种的总结是在图3。

此外起源比较,具有独特的六倍体小麦的一套非整倍体基因型例如缺对染色体四倍生物性等(Sears,1954)允许一步转让多态基因同源染色体。

潜在的HSVs可能因此被分配到特定的染色体,通过子基因组-特殊聚合酶链反应检测的发展。

子片段重叠群进一步分析含有来自不同小麦品种的ESTs起源导致鉴定品种特异性单核苷酸多态性,并结合使用与子基因组-特殊序列变异(根据单纯疱疹病毒的多样性)可用于发展基因特异性双等位基因遗传标记(图2)。

在小麦基因组中单纯疱疹病毒的发病率基于EST-起源数据可以从1至24个基点(Somersetal.,2003)到1至136个基点(Rustgietal.,2009),而基因特异性单核苷酸多态性频率可以改变1至274基点(Rustgietal.,2009)和1至540个基点(Somersetal.,2003)。

差异之间的研究可能反映了EST不同的样本大小。

此外,单纯疱疹病毒和单核苷酸多态性的频率可能会有所不同在不同地区的小麦基因组。

特别是,同源基因与同源序列变异的基因座可能表明多样化选择的结果对于植物适应性状,而较低水平的变异预计在突变影响中可能是有害的。

利用随机选择的ESTs从基因组数据库提供了一个坚实的基础对于单核苷酸多态性的发现和遗传标记的发展,同时具有潜在的高密度基因组范围。

然而,有针对性的办法来发展功能相关的标记是首选,在某些情况下,在一个特定的轨迹中以饱和特定地区的小麦基因组,或确定候选基因控制性状的变化。

许多研究都侧重于发展单核苷酸多态性标记对于特定相关基因有具体特点非常重要的小麦改良。

例如包括脱水反应元件结合蛋白(DREB)基因参与非生物应激性(Weietal.,2009);淀粉生物合成的基因,包括葡萄糖磷酸化酶(Agp-l),蔗糖转运蛋白(SUT),糯(Wx)和淀粉合成酶I(SSI),导致可衡量的变化在粮食产量上(Blakeetal.,2004);低分子量的麦谷基因蛋白亚基(LMW-GS)维生素b3和维生素D3,与粮食品质特点的关联(Zhaoetal.,2007);和氢番茄红素合成酶(psy1)基因参与叶黄素积累和控制面粉颜色变化对于小麦品种的改进(Crawfordetal.,2011)。

单核苷酸多态性的鉴定给特定基因提供了基础在相关基因功能增量的具体性状变异上。

然而,全基因组单核苷酸多态性分布的分析将大大提高大型的作物改良,努力找出所有位点控制多个性状。

目前的努力是对面包小麦基因组的所有序列(http:

//www.wheat-genome.org/)最终将支持单核苷酸多态性发现系统的活动区,但是目前来看,替代战略是很被需要的。

比较基因组学提供了机会在此基础上注明了基因来自于一个全部基因组参考序列,与禾本科物种关系密切如水稻(OryzasativaL.)或BrachpodiumdistachyonL.,接着是翻译识别小麦的正交位点(这个评价,见Francki和Appels,2007)。

SNP发现的聚合酶链反应引物设计可以执行基因序列模板从模型的物种中,特别是通过针对区域内和外显子的附近的内含子剪接路口,这常常是保守的系统发育发展。

这种保护已在蔗糖和乳糖转移的水稻的基因,小麦和多年生黑麦草(Franckietal.,2006)和钠离子转运小麦的基因,水稻和拟南芥(Mullanetal.,2007)中证明。

小麦内含特征序列的测序是一个具有吸引力的选择,因为核苷酸多样性的存在一般比外显子的高。

一套全面的被保护的直系集(COS)序列的谷类基因组学的发展(Quaraishietal.,2009)对于这样的活动是提供支持的。

比较方法明智的使用,与内部特征序列相一致下也提供一个方法来辨别比较重复基因,和PSV检测。

最近的一项研究(Youetal.,2009)制定了一个网络界面生物信息学工具(Conservedprimers2.0)启用比对小麦的ESTs和模式物种基因组序列之间的比较来分析外显子内含子–端口并为保护引物设计建立了参数

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1