草案的甜橙基因组.docx

上传人:b****3 文档编号:24872299 上传时间:2023-06-02 格式:DOCX 页数:23 大小:1.13MB
下载 相关 举报
草案的甜橙基因组.docx_第1页
第1页 / 共23页
草案的甜橙基因组.docx_第2页
第2页 / 共23页
草案的甜橙基因组.docx_第3页
第3页 / 共23页
草案的甜橙基因组.docx_第4页
第4页 / 共23页
草案的甜橙基因组.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

草案的甜橙基因组.docx

《草案的甜橙基因组.docx》由会员分享,可在线阅读,更多相关《草案的甜橙基因组.docx(23页珍藏版)》请在冰豆网上搜索。

草案的甜橙基因组.docx

草案的甜橙基因组

草案的甜橙基因组(类)

 

文摘

 

桔子是一种很重要的营养来源,人类健康和具有巨大的经济价值。

在这里,我们提出一个综合分析基因组草案的甜橙(类)。

装配序列覆盖87.3%的估计橙色基因组,这是相对紧凑,20%是由重复的元素。

我们预测29445个蛋白编码基因,其中一半是杂合���状态。

与其他两个柑橘类物种的测序和比较分析七个柑橘的基因组,我们目前的证据表明,甜橙起源于一个回交柚子和普通话之间的混合。

集中在维生素C代谢相关基因分析表明,GalUR,编码galacturonate途径的限速酶,在橙果显著调节,这个基因家族的最近的扩张可能会提供一个基因组的基础。

这个草案基因组代表一个宝贵的资源对于理解和改善在未来许多重要的柑橘类特征。

left

1.

图1

2.

图2

3.

1.

图1

2.

图2

3.

图3

4.

图4

5.

 

介绍

柑橘是一个大属,包括几个主要栽培品种,包括c.喹酮(甜橙),试(橘子和普通话),柠檬(柠檬),茅(柚子)和柑橘paradisi(葡萄柚)。

2009年,全球种植面积是900万公顷,柑橘产量1.223亿吨(粮农组织统计,见url),这是排名最高的在所有的水果作物。

1090万吨(价值 $93亿)柑橘产品的交易在2009年,甜橙占大约60%的柑橘生产新鲜水果和果汁加工消费(粮农组织统计,见url)。

此外,柑橘类水果和果汁是人类的主要来源,维生素C、人类营养的一个重要组成部分。

柑橘类水果也有一些独特的植物特性,如珠心的embryony(珠心细胞可以发育成单性生殖的胚胎基因完全相同的母亲植物)。

因此,体细胞胚胎的生长比合子的胚胎更大力的种子,种苗本质上是克隆母体的父母。

这样citrus-unique特点阻碍了柑橘遗传和育种研究改进1,2。

完整的基因组序列将提供有价值的遗传资源为提高柑橘作物。

柑橘被认为是原产于东南亚3,4,5,种植的水果作物发生在至少4000年前3,6。

甜橙的遗传起源并不清楚,虽然有一些猜测,甜橙可能来自一些原始的柑橘类物种的种间杂交7,8。

柑橘也无患子目的顺序,一个妹妹MalvidaeBrassicales秩序,使其有价值的比较基因组学研究的模式植物拟南芥。

我们旨在序列的基因组瓦伦西亚甜橙(c.sinensis简历。

瓦伦西亚),其中一个最重要的全球甜橙品种培育和种植主要为橙汁生产。

普通甜橙二倍体,估计九对染色体基因组的大小~367Mb9。

降低测序基因组的复杂性,我们获得了双单倍体(dihaploid)来自瓦伦西亚甜橙的花药培养10。

我们首先生成的全基因组鸟枪paired-end-tag读取从dihaploid基因组DNA序列,建立了一个新创作为柑橘参考基因组组装;然后我们产生鸟枪测序读从父母的二倍体DNA和单倍体的参考基因组的序列映射到瓦伦西亚甜橙获得完整的基因组信息。

此外,我们进行了全面的转录组测序分析四个代表组织使用猎枪RNA序列(RNA-Seq)来捕获所有转录序列和paired-end-tagRNA序列(RNA-PET)划分的5′和3′末端的成绩单。

DNA和RNA序列数据的基础上,我们橙色基因组的基因特征内容,杂合性和演化特性。

基因组和转录组分析提出研究收益率甜橙的起源的新见解和维生素C的基因基础代谢和提供丰富的资源为柑橘育种和遗传改良的遗传信息。

结果

基因组测序和组装

dihaploidDNA的甜橙(补充图17.85亿),我们生成高质量paired-end-tag测序读(2×100个基点)从不同的DNA片段大小(~300个基点,2kb,10kb和20kb)使用Illumina公司GAII编曲,碱基对覆盖率和代表214倍214倍的物理覆盖估计柑桔基因组(补充表1)。

顺序读取被SOAPdenovo组装11和歌剧12,导致16890年组装序列重叠群(obasanjo49.89kb)和4811支架(obasanjo1.69Mb)(表1)。

总叠连群序列长度(320.5Mb)涵盖了估计甜橙基因组的87.3%,超过135年80%的基因组组装支架大于713kb和8.2Mb。

评估柑桔基因组组装的准确性,我们评估质量支架的BAC克隆分析,对准既定的柑橘遗传连锁图和细胞遗传学分析.

表1:

统计的甜橙基因组草案

基因组大小的估计

367MB

染色体数目(2n)

18

总装配重叠群的大小

320.5Mb

多的重叠群(>500个基点)

16890年

最大重叠群

323.34kb

obasanjo长度(重叠群)

49.89kb

支架(>500个基点)

4811年

组装支架的总大小

301.02Mb

obasanjo长度(支架)

1.69MB

最长的脚手架

8.16MB

GC含量

34.06%

数量的基因模型

29445/44387

意味着记录长度

1817个基点

意思是编码序列长度

1255个基点

意思是外显子的长度

312个基点

意味着基因内区长度

359个基点

数量的预测microrna基因

227年

转位因子的总大小

61.7Mb

 

甜橙的BAC克隆库曾被构造和特点13,估计尺寸范围的BAC克隆插入120kb。

我们选择个人BAC-end毛细管测序克隆。

BAC-end735双的序列读取两端的一对映射在同一叠连群,的平均距离是125875±26788个基点(班)。

这是与此前估计的BAC克隆的长度一致13,表明重叠群装配的正确性。

进一步评估的准确性在当地组装,我们分析了七个完整BAC序列的甜橙基因库并锚定在甜橙遗传图谱。

这些BAC序列之间的对齐和柑桔基因组装配显示整体的身份97.6%(补充图2和补充表2)。

在一起,BAC克隆测序分析验证装配是高质量的。

然后我们问的组装基因组序列建立了甜橙遗传连锁图14。

我们绘制了支架-768标记与已知序列的基因连锁集团,和160年固定支架(每个>10kb),占239Mb的柑桔基因组组装(补充表3)。

此外,83年支架,占大多数的固定支架的长度(178.7Mb,或75%的总固定支架)是在匹配定位在遗传图谱(补充注意),这表明高锚定遗传标记之间的对齐一致和序列支架。

对齐方式不一致可能反映了技术的准确性,如标记密度不足、基因分���错误或测序基因组之间的个体差异(瓦伦西亚甜橙)和遗传图谱,是基于三个三个甜橙品种之间穿过14。

瓦伦西亚橙色是已知染色体重组相对于破旧的甜的橘子15。

结合组装基因组序列和遗传连锁集团,我们构建了pseudomolecules为每个9染色体,命令他们在遗传的基础上长度(图1).

图1:

对齐的基因组序列组装的遗传图谱蛾。

组装支架(蓝色,239Mb或组装基因组序列的75%)被锚定在9个联系组(LG1-LG9、黄色)与相应的遗传标记(黑酒吧)。

pseudochromosome数据分配的基础上估计的长度遗传连锁群14.

然后我们拍了一些细胞学标记,包括两种核糖体基因(45s和5s)和串联重复序列(107个基点),鱼分析进一步验证组装柑桔基因组序列的一致。

细胞学上标记染色体显示初步一致性genomicallypseudochromosomes定义(补充表4)。

例如,pseudochromosomes1和8,轴承45年代地区近端位置,对应两个b染色体,一个脆弱的网站(补充图3);pseudochromosome6,映射包含45支架和5s核糖体DNA序列在远端区域,对应于d类型染色体脆性位点;和染色体7包含大量的副本107-bp串联重复序列在两个远端位置,它对应于c型染色体(补充图3)。

总的来说,我们的细胞学实验提供染色体sequence-matched证据1、6、7和8。

其它染色体所需额外的细胞学证据。

+*-+基因组特征

大多数植物基因组与转座因子高度重复的地区特色和独特的基因编码区域。

我们分析了柑橘在这两个方面揭示基因组基因的基本结构和功能特性。

转座的元素是主要组件的植物基因组和基因组进化的重要贡献者。

然而,很少有以前在柑橘转座的元素。

橙色的基因转位因子分析,我们首先构建一个自定义数字转座因子库使用从头开始,同源性,基于结构转座因子预测工具,然后这个数据集应用于柑橘参考基因组注释。

这种分析识别了61.7Mb的装配序列重叠群,占20.5%的c(基因组的补充表5)。

这种级别的重复是拟南芥的类似16和大米17,这表明甜橙相对紧凑的基因组。

类我长末端重复反转位子活动占据超过89%的转座的元素,包括198年Copia家庭和前者130年吉普赛家庭。

类似于其他紧凑如拟南芥基因组18和大米19,每一个家庭的完整元素小于250成员,而超过90%的长末端重复逆转录转座子家庭只包含一个五个完整的元素。

插入时间估计表明,80%以上的完整元素放大在过去的200万年里,和10%比50000年更年轻(补充表6)。

相比之下,二类DNA转座子转座因子只有~11%组成的,类似于苹果20和木瓜21基因组。

在二类DNA转座子,微型inverted-repeat转位因子(螨)占据了67%的序列。

值得注意��是,我们发现了一个新型的螨虫,名叫MiM(螨插入微卫星),在柑桔基因组(补充表5).

注释的柑桔基因组蛋白质编码基因,我们使用一个全面的战略,结合从头开始基因预测,蛋白质同源性搜索和实验支持(est,RNA-Seq和RNA-PET)(补充图4)。

我们使用四个从头开始基因发现程序(Fgenesh、GeneIDGenscan和GlimmerHMM)repeat-masked基因组序列。

此外,我们收集了917610蛋白质从UniProt数据库22和958121年柑橘EST读从基因库和生成9.646亿RNA-Seq读从四个柑橘组织(愈伤组织、叶、花和果实)(补充表1)。

总的来说,我们鉴定了29445个蛋白编码基因座(基因模型)与44387年成绩单(图2和补充表7),23421个基因在9个pseudochromosomes分配模型。

1817个基点的基因记录的平均长度,平均编码序列的大小1255个基点,平均5.8每个基因外显子。

RNA-Seq和EST数据显示,有26%的基因模型(7640基因位点)编码的两个或两个以上的成绩单亚型(补充图5)。

总体来看,85%的基因模型包含多个外显子(补充图5b),和99%的预测编码序列和80%的接头连接网站RNA-Seq支持的数据(图2b和补充表7),显示精度高的基因注释在橙色的基因组中。

我们评估和纠正所有基因预测模型使用RNA-PET测序数据(互补RNA-Seq数据)标定基因边界(补充图6)。

我们生成大约1亿RNA-PETs从四个组织(愈伤组织、叶、花和果实),用它们对地图、集群和基因组的注释(补充表1),确认70%的5′和3′边界的基因转录(图2c和补充表8)。

值得注意的是,我们发现967744年的成绩单公认的基因模型完全的基础上结合RNA-Seq和RNA-PET数据(补充表9和补充图7),代表一个潜在的新和citrus-specific基因集合。

此外,我们发现了一个181核糖体RNA,451转移核糖核酸,39个小核仁的RNA在柑橘类和104个小核RNA基因组(补充注意)。

我们还发现了40守恒的微RNA(microRNA)有227个成员的家庭在橙色基因组的基础上,以前的小核糖核酸测序数据23 (补充表10),大多数的microrna基因是均匀分布在整个基因组,与几个小集群(补充图8).

图2:

基因组特征。

(一)圆形图描绘的九个甜橙基因组景观pseudochromosomes(Chr1~Chr9规模Mb)。

每个轨道的外延上市是正确的。

RPKM,每千碱基读取每百万映射读取外显子模型。

(b)基因模型预测实验数据支持。

离开时,箱线图RNA-Seq读取对齐的基因特性。

顶部和底部的盒子显示上、下四分位数,分别。

中间的红酒吧代表中间,红点表示每个特性的平均值。

cd、编码序列。

的权利,维恩图预测RNA拼接连接支持的各种证据(美国东部时间,蛋白质和RNA-Seq数据)。

括号里的数字是每个类别接头连接的数量。

(c)基因模型边界的界定RNA-PET数据。

直方图的情节RNA-PET数据与一致的基因模型的5′(假定的转录起始站点,TSS)和3′(假定的保利(A)网站,PAS)边界。

一)圆形图描绘的九个甜橙基因组景观pseudochromosomes(Chr1~Chr9规模Mb)。

每个轨道的外延上市是正确的。

RPKM,每千碱基读取每百万映射读取外显子模型。

(b)基因模型预测实验数据支持。

离开时,箱线图RNA-Seq读取对齐的基因特性。

顶部和底部的盒子显示上、下四分位数,分别。

中间的红酒吧代表中间,红点表示每个特性的平均值。

cd、编码序列。

的权利,维恩图预测RNA拼接连接支持的各种证据(美国东部时间,蛋白质和RNA-Seq数据)。

括号里的数字是每个类别接头连接的数量。

(c)基因模型边界的界定RNA-PET数据。

直方图的情节RNA-PET数据与一致的基因模型的5′(假定的转录起始站点,TSS)和3′(假定的保利(A)网站,PAS)边界。

为了更好地理解citrus-specific生物学,我们确定citrus-specific基因。

我们进行比较分析的橙色对21个其他植物基因组和筛选EST和肽序列的公共数据库(补充注意)。

橙色基因组的29445个蛋白编码基因,23804被分成14348基因家族,1691个基因在特定于柑橘类(补充图9)。

大多数(96%)的citrus-specific基因是“假设”和未知函数。

58岁的带注释的基因,占蛋白质域是锌指转录因子域和nucleotide-binding-siteleucine-rich-repeat(NBS-LRR)领域,其中包含潜在的抗病基因(补充表11).

杂合性和混合甜橙的起源

杂合性是一种常见的功能在大多数真核生物,在作物具有重要的生物功能。

尽管柑橘树通常视为高度杂合的特征2在整个基因组的杂合性还不清楚。

提供的单倍体和二倍体基因组测序基因组数据(补充表12)对我们全面评估甜橙的杂合性。

从二倍体基因组测序数据,我们发现106万个snp和176953小插入/删除(indels)。

超过80%的单核苷酸多态性和九pseudochromosomesindels停靠。

整体多态密度是3.6个和0.6indelskb基因组(补充表13)。

大约三分之一的snp是位于基因的区域(补充表14),16843个基因位点(72%)至少包含一个SNP(补充图10)。

考虑0.52%的错误率检测单核苷酸多态性(补充注意),我们建立了一个严格的标准的5个或5个以上每个基因单核苷酸多态性可靠地调用变异等位基因;使用这一标准,12297个基因位点(53%)被认为港变异等位基因(补充表15)。

这个观察��明,特别是在基因位点杂合性率高。

来验证这一观点,我们检测了307简单重复序列(SSR)标记dihaploid和父母的二倍体的甜橙和确定了155(50%)SSR位点杂合的状态(图3和补充表16),这是类似于发现的蛋白质编码基因位点的杂合性率SNP分析。

此外,染色体核型分析显示,618父母二倍体染色体没有明确的对应,而染色体很容易分成9个双dihaploid线(图3b),进一步支持观察,甜橙的二倍体基因组高度杂合的。

图3:

杂合性和混合甜橙的起源。

(一)甜橙基因组的杂合性率。

纯合子的基因的杂合的国家地区被发现使用从父母的二倍体基因组SNP数据;重复区域被比较评估SSR标记在二倍体和dihaploid模式。

顶级饼图中的数字表明基因数量和饼图底部的SSR标记的数量。

(b)的染色体核型dihaploid(左)和父母二倍体(右)。

每个核的18个染色体(装备)很容易发现dihaploid线分成九个配对,而六个二倍体细胞核的染色体没有明确,表明高杂合度二倍体状态。

细胞学类型的染色体是传统命名为男朋友,B,C,Df,根据4D和F′6-diamidino-2-phenylindole(蓝色)和色霉素A3(黄色)条带区域,以及脆弱的网站(圆),如前所述41 (补充图3)。

(c)基因分型结果SSR标记的两个柚子品种(P1和P2),甜橙(因此)和两个普通话品种(M1��M2)。

共享307年的307个SSR标记,柚子,橘子和普通话(中间),55是柚子遗传(左)和147年普通话世袭(右)。

一个标志显示orange-specific模式和被排除在这一分析。

(d)的遗传起源甜橙dihaploid基因组由高密度SNP标记的柚子和普通话。

OP,起源模式(柚子起源在黄色,普通话起源在橙色和灰色待定);SC���序列组装支架,LG,连锁群的地图。

Pseudochromosome1所示为例,和其他染色体所示补充图11。

(e)的模型甜橙。

与柚子(PP)作为母本交叉与普通话(MM)的种间杂交杂交与普通话(毫米)和古代甜橙。

∙全尺寸图像(344KB)

∙以前的

∙数据/表索引

∙下一个

我们因此研究甜橙的推测杂种起源柚子(c.茅)和普通话(c.试)7,8,这是柑橘类的两个原始的物种。

衡量可能的遗传贡献甜橙柚子和普通话,我们调查甜橙的基因型,两个柚子品种和两个普通话使用甜orange-derived品种SSR标记和识别202多态标记,其中55个柚子遗传和147年普通话遗传(图3c和补充表16)。

值得注意的是,数字pummelo-hereditary标记和mandarin-hereditary标记(分别为55-147)很适合1:

3比例(χ2=0.54<χ20.95(2-1)=3.84),表明一个有趣的甜橙之间遗传关系,柚子和普通话。

全面验证甜橙的基因组组成推断从SSR标记,我们扩展我们的分析使用高密度SNP制造商。

为此,我们生成的全基���组鸟枪短序列读取三个柚子品种和三个普通话品种,每个超过30倍覆盖的柑桔基因组(补充表12);然后,我们绘制了单倍体橙色参考基因组序列,确定了475450个snp共同在三个个人柚子和308837个snp共同在三个别官员(补充表17)。

使用100kb基因组窗口,我们计算了SNP密度对柚子的偏好或普通话,然后确定遗传起源(补充注意),它允许我们指定39.7Mb的甜橙基因组从普通话,柚子和118.2Mb基因组约适合1:

3的比例的贡献从柚子和普通话(图3d和补充图11),与SSR分析结果一致。

的基础上的杂合性率高(50%)、柚子和普通话的1:

3比例的证据表明,叶绿体基因输入和甜橙可能是来自柚子7 (补充图12),我们假设甜橙起源于一种间杂交柚子为母本和普通话为父本,后跟一个回交和男性的普通话(甜橙=(柚子×普通话)×普通话)(图3e).

基因组进化

描述和注释的柑桔基因组为我们进一步研究提供了基本特征的进化历史甜的橘子。

大多数植物物种已经通过全基因组重复(WGD)在进化过程中24。

paralogous基因家族积累的规模和频率在每个基因组作为记录这样的进化过程。

组合的柑橘类基因组序列的基础上23421个基因模型位于九pseudochromosomes确认1296paralogous基因组(图4)。

平均同义替换率(Ks)复制基因(Ks=1.27)表明一个古老WGD发生在柑橘类(图4b和补充图13)。

此外,我们分析了intergenome之间的共线性橙色和可可25,拟南芥16,苹果20、草莓26和葡萄27日基因组,发现橙色直系同源基因syntenic块对这些基因组(补充表18)。

一对一的同源关系主要orange-to-cacao,orange-to-grapeorange-to-strawberry比较,表明没有最近wgd除了共享古老的三倍,称为 γ事件,由所有核心双共享24。

相比之下,我们发现一个大约一到两个同源关系orange-to-apple比较和1:

4的关系orange-to-Arabidopsis比较,支持一个额外的一个,最近两轮WGD发生在苹果和拟南芥,分别为(图4摄氏度和补充图。

14)。

此外,跨物种的基础上同线性块边界,我们估计至少49染色体易位和融合的事件发生在9个柑橘染色体进化染色体的提议paleohexaploid祖先共同eudicot基因组测序28日。

值得注意的柑橘pseudochromosome4只有一个染色体翻译和融合事件,而其他pseudochromosomes接受多个(3-12)interchromosome融合在其进化历史(补充图。

15).

图4:

甜橙基因组的进化分析。

(a)的示意图表示主要的染色体间的关系在1294年paralogous基因群体在甜橙基因组中。

Syntenic块来自七个祖先protochromosomesA1,A4,A7,A10,A13,A16A19(ref。

28日颜色编码表示。

(b)分布的同义替换率(Ks)同源基因群体intrachromosome和interchromosome比较。

基因重复分析相比,苹果、拟南芥和可可表明没有最近wgd发生在甜橙基因组。

(c)的示意图表示syntenic甜橙9号染色体的关系和相应的染色体在拟南芥,可可,马吕斯×龄,草莓属vesca和葡萄。

Syntenic地区来自七个祖先protochromosomes颜色编码的。

是59Syntenic块甜橙染色体9和拟南芥染色体,22例(37%)显示主要对应四个拟南芥块,10到三个街区,24-两块,3块,在79Syntenic块甜橙染色体9和苹果之间的染色体,48例(61%)显示主要对应两个拟南芥块,20到三个街区,6-四块,2块。

因此,这些百分比的基础上,1:

4和一到两个关系被确定最可能的orange-to-Arabidopsis和orange-to-apple比较,分别。

(d)柑橘发展史的基础上,103年单份基因在拟南芥之间共享,可可,杨树、葡萄、苹果、草莓、木瓜和蓖麻核基因组数据。

米娅,百万年前。

∙全尺寸图像(388KB)

∙以前的

∙数据/表索引

∙下一个

这个系统发育分析的全基因组序列还提供了全面的信息。

我们应用最大似然法对公司系统发生的分析使用103共享单份核基因从橙色,拟南芥16,可可25,杨树29日、葡萄27日,苹果20、草莓26、木瓜21和蓖麻30 (图4d和补充注意)。

系统发育树显示,柑橘是过去接近可可,拟南芥和木瓜,尽管它是古代在Malvidae相比,和估计背离锦葵目8500万年前。

因此,我们的分析提供了新的信息系统学的柑橘和其他植物物种的基础上公司数据。

基因参与柑橘类的水果特别生物学

柑橘类的水果生物学是一个有趣的话题不仅因为柑橘类水果对人类是重要的营养来源,还因为它们涉及独特的代谢途径。

这种柑橘参考基因组框架提供了一个全面的基因组基因帮助解决生物学柑橘类的水果。

一个清晰的策略是确定在水果组织特异表达基因。

我们RNA-Seq数据来源于愈伤组织相比,叶,花和水果和确定了2697(9.2%)基因显著调节(P<0.01),水果(补充表19)。

调节基因的基因本体分析柑橘类水果表明氧化还原酶基因,氧化还原和维生素绑定占绝对优势(补充表20).

果实成熟是一个重要的生物功能和具有巨大的经济价值。

基因在番茄成熟已经被充分研究过31日。

16个番茄成熟的基因,我们发现只有3(ETR3(也称为天然橡胶),MADS-RIN和BP0353(也称为PHYF)差异表达在橙色水果,而大多数(13)不(补充表21),可能反映了两种不同的成熟机制的存在对更年期(番茄)和nonclimacteric(橙色)水果。

MADS-RIN,尤其是转录因子之前证明是必要的正常发展和成熟的西红柿32(更年期)和草莓33(nonclimacteric)高度调节橙色水果(补充表21),提供进一步支持这一概念,MADS-RIN可能作为key-ripening调节器具有广泛影响更年期和nonclimacteric水果成熟。

我们

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 调解书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1