转录组分析11苍蝇幼虫.docx

上传人:b****4 文档编号:3012711 上传时间:2022-11-17 格式:DOCX 页数:8 大小:22.25KB
下载 相关 举报
转录组分析11苍蝇幼虫.docx_第1页
第1页 / 共8页
转录组分析11苍蝇幼虫.docx_第2页
第2页 / 共8页
转录组分析11苍蝇幼虫.docx_第3页
第3页 / 共8页
转录组分析11苍蝇幼虫.docx_第4页
第4页 / 共8页
转录组分析11苍蝇幼虫.docx_第5页
第5页 / 共8页
点击查看更多>>
下载资源
资源描述

转录组分析11苍蝇幼虫.docx

《转录组分析11苍蝇幼虫.docx》由会员分享,可在线阅读,更多相关《转录组分析11苍蝇幼虫.docx(8页珍藏版)》请在冰豆网上搜索。

转录组分析11苍蝇幼虫.docx

转录组分析11苍蝇幼虫

使用大规模并行焦磷酸测序进行家蝇幼虫的转录组分析(Musca类)

摘要:

我们应用罗氏454-FLX平台进行大规模并行焦磷酸测序来生成家蝇的大量est序列,以此来研究家蝇幼虫的转录组和鉴定其特有的序列。

结果我们获得了平均可读长度为373bp的总数为249,555的ESTs序列。

其中有13,206个重叠区和20,556个单序列。

使用SwissprotandNr数据库的BlastX搜索引擎,我们可以鉴定4,814个重叠区和8,166个单序列的特有序列。

随后,被注释的序列被用来作分析,搜索结果显示了大部分查询序列被被归于一定的基因本体论术语。

此外,功能分类和途径分配被KEGG来展示,总共2,164个特有序列被映射到184KEGG途径。

作为第一次关于家蝇大规模RNA测序的尝试,这个通用的转录组图片可以建立一个关于功能基因组进一步搜索的基本资源库。

介绍

Musca类(双:

Muscidae),俗称苍蝇的,是一种主要国内、医疗和兽医害虫,能引起发炎、污染食品,是许多病源微生物体的载体。

苍蝇的生活周期很短但高产,生活周期大约为18天,在此期间,雌性将产2,000枚卵。

它们以任意的有机物质为生,包括正在分解的物质并通过食品污染将大量疾病传播给人类。

超过100种与苍蝇有关的病原体可以对人类和动物致病。

尽管其作为动物生理学和生物化学尤其是关于内分泌,滞育,繁殖,反抗压力和免疫方面是杰出的模型,但目前没有关于家蝇的基因组计划,此基因组资源受限。

许多实验室已经进行了EST计划,例如减法杂交,已经有约900个家蝇的ESTs序列可以从NCBI免费获得。

转录组或est序列对于非模式生物来说是一条获得功能基因水平数据的行之有效的方法。

对于整个基因组测序Est序列是很有效地转换,因为主要的真核生物的基因组大部分是是非编码的DNA,并且est序列缺乏内含子和内基因序列。

Ests因此有丰富的功能信息并且适合于已知或预测功能。

在基因注释和发现,比较基因组学,分子标记的拓展以及人口基因组研究的相关的遗传变异与自适应的特点方面,Est的序列的大量选择已被证明是无价的。

尽管如此,至今,传统实验室关于est的发展包括基因克隆和cDNA文库建设费时费力,大部分实验室注重桑格测序法的加强。

近年来,通过罗氏454平台进行的大规模并行焦磷酸测序已经成为决定性的有效地高通量测序法。

这种新技术应用于基因组和转录组研究基因的发现。

最近的研究显示对于以前没有的基因资源454的组装是非常成功的。

如此大规模的生成序列数据将行使功能分析,这在以前是被限制在模式有机体的,此技术被快速的应用在重要的生态分类单元。

这里,我们用cDNA的焦磷酸测序来描述家蝇的转录组。

材料与方法

苍蝇的保存和感染实验

家蝇被用在此实验是来自于中科院动物所的何凤琴女士的贡献。

家蝇幼虫在下述的培养基中培养:

麦麸(55克),热激酵母(3g),牛奶(150毫升),和抗真菌药物治疗对羟基苯甲酸甲酯(0.35克),培养到成蛹期。

脱蛹后,成蝇用水,糖,奶粉喂养。

苍蝇被保存在25℃光照黑暗各12小时周期的环境。

我们用三龄幼体做脓毒的感染实验。

脓毒症感染是由针注射到幼虫的腹部,注射以前把针浸入浓缩的大肠杆菌、金黄色葡萄球菌里。

在RNA提取前苍蝇应该在25℃环境下在新鲜培养基上保存12个小时。

RNA纯化,逆转录和454测序

数据分析454次序原始数据生成序列是pre-processed从454年消除低复杂度、低质量的很

短期(\100个基点的序列,以及适配器和底漆利用seqclean序列和露西的节目。

人类的然后装配序列被利用Cap3程序默认的偏好。

所有的独特的序列(contigs和单身者)注解的基础对蛋白质序列,在SwissprotNCBInonredundant(Nr)蛋白数据库与相似BlastX[30%和evalue\1e-5。

检查的范围序列,进行比较独特的序列这些转录文本12果蝇在果蝇禽畜的利用爆炸计划。

(走)基因本体论得到诠释基于序列相似。

文本进行了分类到14个主要生物过程的基因本体论范畴。

如果文本标注了不止一个这是去范畴分裂同样在他们中间。

与对齐的结果,对于爆破数据库,我们绘制出来ID的GI的NCBI柯(KEGGOrthology)身份证。

然后我们映射到所有的柯KEGG途径和入侵检测系统(ids)184年获得途径总图像。

结果

454测序和装配

这四分之一运行生产了249555读和平均序列的长度373碱基对(标准差=119.45),范围=40-904岁)。

读的,超过88.58%的火势得到控制200碱基对,而50.92%拥有超过400的基地。

这粒度分布的读图1显示的是一个。

在削减适配器序列和消除短序列少于100的基地,236224年仍然为阅读装配与平均长度为380基地。

一共有0.236223Mb的高(总部)序列数据被产生用于CAP3总成。

装配过程的13206contigs产生,而20556仍然是读单身者。

平均长度和contigs单身者分别是605和354个基点。

contigs的长度从102年到4470个基点的多样,单身者射击

从100年至610个基点。

大多数contigs(93.25%)是在一个范围250-1250个基点的长。

contigs长度的分布图1显示的是b。

序列的统计分析装配顺序表1给出了。

只有8contigs

大于3k和108contigs是由吗300多读,最大的4470基点4823年代表序列(表2)。

检查独特的序列的报道,他们进行了比较这些转录文本在果蝇爆炸。

使用总数量的成绩单各果蝇中发现的果蝇射击从9871年到21950年。

大约50.0%(dmelanogaster)句意:

pseudoobscura)79.2%的人是coveraged成绩单以独特的序列通过m.的类爆炸搜索的影响(表3)。

注释独特的序列

所有通过独特的序列序列在Swissprot蛋白质序列数据库和橡胶利用BlastXNCBI算法。

当E-value截止建立在0,共有4814和8166的独特之处利用这些序列被诠释两个数据库,占总数的24.19%和14.26独一无二的吗序列。

虽然我们选了一个相当高的鼓舞E-value约束(E\1e-5),最高的E-values最多打非常低。

总共4856个患者(95.3%)的独特序列相似性与分享重要匹配序列(EB1e-10),其余228例(4.7%)软弱的相似之处,分享匹配的序列(1e-10\EB1e-5)。

E值分布的注释说明基于Swissprot独特的序列数据库显示在图2。

基因本体论分析

(走)基因本体论进行了分析利用8166个独特注解Blast2GO序列程序。

1908年、2972年和3763个独特序列成功地分配到生物过程(BP),细胞组件(CC)及分子功能(MF)去范畴,分别。

去恢复的范畴总结分析了Blast2GO所占的比例在每一个独特的序列注释去二级类别(图3)。

四类站在生物过程:

代谢过程(37.28%)、细胞过程(35.92%)、生物调节(10.39%)和定位(9.48%)。

类分子功能独特的序列居住在被束缚(46.20%)、催化吗活动(36.33%)和转运体的活动(5.74%)。

细胞间隔<苍蝇的独特之处序列被over-represented细胞(50.49%)、细胞器

(23.23%)、大分子复杂(16.36%)和membrane-enclosed腔(4.04%)的类别。

概述类的功能去诠释的独特之处序列图3中显示。

基于功能分类KEGG分析

功能分类和路径分配进行

《京都议定书》全书的基因和基因组

(KEGG)。

第一、二年独特的序列进行了比较

使用BlastX:

与一个E-value\1e-5对橡胶

数据库。

这些独特的序列,8166人(24.17%)

significantmatcheswith数据库序列。

在这些人中,

有2164个独特序列酶委员会(EC)

编号是184KEGG路径映射到总数。

KEGG途径,也为代表的苍蝇

独特的序列杭丁顿氏症,氧化磷酸化的速率,

核糖体(和癌症通路。

topmatches的

路径映射的苍蝇独特的序列进行了总结

在表4。

有趣的是,一些独特的基因

指定的几个途径,如Toll-like受体信号传导

通路,主要免疫系统不全症,个别霍乱弧菌

感染、致病性大肠杆菌感染,自然杀手

细胞介导的细胞毒性,幽门螺杆菌感染与上皮细胞信号传导

幽门螺杆菌感染,等等。

这些结果表明

强大的优势高通量的测序

识别基因在代谢途径。

讨论

苍蝇是航空公司的100家恶性疾病

造成严重后果的人类和动物的健康。

缺乏知识的基本分子生物学

物种控制制约人类进步

疾病传播。

大规模RNA序列

这房子飞幼虫的提供重要过

新奇的目标网站发现房子飞控制,

了解房子飞免疫反应,迅速

说明对杀虫剂的抗药性的基因,和理解

众多方面的基本生物学

害虫。

因此,转录组分析

Musca类可以应用更广泛的

不同的研究项目。

本研究旨在评价

作为一个模特,Musca类动物在该地区的先天的

免疫学。

我们pyrosequencingEST文库开发

包含33762成绩单一定会重新开始

使用房子的兴趣苍蝇为模型。

我们开始

分析,超过236224的优质读

获得,然后组合成33762个独特

序列。

估计序列的覆盖面,所有的都喜欢。

独特的序列进行对照,用果蝇

爆炸。

结果表明,覆盖范围从50.0

到79.2%。

大约98.86%的m.的独特的序列类

在果蝇受了。

在33763个独特的序列,只有4814

(14.26%)成功的注解Swissprot数据库

使用BlastX程序。

虽然性价比高

注释是得到进入数据库Nr(24.19%),

只有一点额外的有用的信息,取得了很好的原因

许多主题的得分最高的序列

长度较短。

这低水平的序列相似性匹配

也注意到crassipalpisSarcophaga(23)

这可能是由于缺乏特定的序列

飞物种密切相关的数据库。

这表明

在高遗传多样性双。

很难

利用未经独特的序列

包含了许多有用的遗传信息。

即使

*5000地肯定是独特的序列

整个transcriptome不到,我们获得了很多

序列的兴趣。

因为我们组免疫学和压力特别感兴趣的生物,我们挑选的

出几十个基因,也应该扮演一个角色

免疫和抗性,如蛋白,

galectin,lectizyme,toll-like受体,NF-kappa-B抑制剂

仙人掌,NF-kappa-Binhibitor-interactingras-like蛋白质,

argonaute,transferrins,ferritins,cathepsins、碱性的

磷酸酶、beta-galactosidase、丝氨酸蛋白酶,有味,

stress-associated内质网蛋白质、stressinduced-

磷酸化蛋白、缺氧上调蛋白质,

活性氧调制器,等等。

几乎所有的

免疫基因被认定是在Musca类也有对应的

在果蝇,如defensins,attacins,cecropins,这被称为diptericins

重要的免疫的影响因素对耐药的革兰氏阳性

革兰氏阴性细菌[24]。

有趣的是,脂多糖------

诱导肿瘤坏死意义的因素

(LITAF)》,已发现在果蝇细胞株

在苍蝇挑战(米糠)和Eiger脂,

唯一的TNF的家庭成员中发现melanogaster>,

是细菌感染Musca期间产生的吗

幼虫(数据未显示)。

在果蝇,两个重要的模式识别受体,

揭示protein-SA(PGRP-SA)和识别

protein-LC揭示识别(PGRP-LC)

感觉微生物感染人数的上游的路子

(活性主要由真菌和革兰阳性细菌)

免疫缺陷(Imd)途径(活性主要通过

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1