1、转录组测序转录组测序转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括mRNA和非编码RNA。转录组研究是基因功能及结构研究的基础和出发点,通过新一代高通量测序,能够全面快速地获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息。高通量转录组测序技术,无需了解物种基因信息,能够对任意物种进行转录组分析,并接测定每个转录本的片段序列,精确到单核苷酸的分辨率;动态达6个数量级,能够同时鉴定和定量稀有转录本和正常转录本,以及检测基因家族中相似基因和可变剪接造成的不同转录本的表达;被广泛的应用于转录本结构研究(基因边界鉴定、可变剪切研究等),转录本变异研究(如
2、基因融合、编码区SNP研究),非编码区域功能研究(Non-coding RNA研究、microRNA前体研究等),基因表达水平研究以及全新转录本发现。转录组测序的优势1 单次转录组测序实验即可提供全面的转录组信息2 转录组测序无需预先知道任何序列信息3 转录组测序提高了动态检测范围和灵敏度4 转录组测序可提供转录本中序列变异信息技术流程: 数据分析:有参考基因组的转录组分析1、测序数据质量评估 我们将测序得到的所有序列与目前常见物种进行大规模随机blast,检测可能的样品污染。 同时,我们对测序得到的序列进行深度和覆盖度的计算以评价序列质量。 2、Reads比对到基因组 我们将测序结果与参考基
3、因组进行比对, 比对的reads 中mismatch 的数目可以根据客户需要进行分析, 并挑选出unique map的所有reads用于后续peak的分析。同时进行reads的基因定位,用于后续分析。 3、Reads在基因组上的分布 4、新转录本的寻找 在每个样本中,都有一部分mapping不上已注释基因, 但是能mapping上基因组上的reads,通过提取这些reads比对在基因组上的序列,利用同源预测或者denevo预测,从而预测一些新的转录本。 5、检测反义链转录本并注释 我们通过对符合转录本标准的reads进行大规模比对,挑选出潜在的反义链转录本。并对检测的反义链转录本进行功能注释。
4、 6、转录本定量 对RNA-Seq结果中的基因进行基因定量,定量方法采用 reads per kilobase of exon per million mapped sequence reads (RPKM)反映表达量。 7、差异基因Annotation, Synonyms及ID转换 对挑选出的差异基因进行功能注释和绝大部分数据库的ID转换,并附上每个差异基因对应的大部分别名。 8、可变剪切预测 我们使用已发表的权威算法进行可变剪切的预测分析。9、聚类分析 9.1 层次聚类 对样品进行聚类:为了全面的直观的展示样品之间的关系及差异情况,将表达基因做聚类分析(见下图)。我们分别对上调基因和下调基
5、因以及所有差异基因进行聚类分析,从而更严格和准确的评价样品重复质量。图片中,每一行代表一个基因,每一列代表一个组织,红色代表基因表达量较高,绿色代表基因表达量较低。 对基因进行聚类:方法类似对样品进行聚类。 对样品基因进行双向聚类:将上述两种方法综合在一起。 差异基因聚类9.2 K-Means聚类(表达模式聚类) 为了对各个时期的表达模式进行全面的了解,进行表达模式聚类。下图是某组表达模式图:10、基因的COG/KOG功能分类 对基因功能进行COG(Cluster of Orthologous Groups of proteins) 或KOG(Eukaryotic Orthologous Gr
6、oups of proteins)分类,通过COG分类可以对变化基因所调节的功能有直观和感性的认识,从而了解待研究因子对于生物功能的影响,并对后续生物学实验的进行提供指导作用。以下是某三个时期芯片的COG分类表格和柱状图。 COG分析结果简表 COG分析柱状图11、Gene Ontology分析 将上调和下调以及所有差异基因共三类分别进行GO分析,统计每个GO term中所包括的差异基因个数,并用统计检验的方法计算每个GO term中差异基因富集的显著性。根据P-value大小判断差异基因中具有显著性意义的GO term。下表是简单的示例:Gene Ontology分析结果简表 数据表格中包括
7、以下内容等: GOID:GO term 的ID号; Ontology:GO term属于cellular_component、molecular_function或biological_process中的某一类; Term:GO term的名称; LogOddsRatio:GO term对于全基因组的富集程度;P Value:GO term的p值,p值越小,GO term显著性越高; 将差异基因相关的所有GO term间关系用网络图展示,可以清楚的了解各基因之间的相互层次关系和生物学功能。分析“biological process”、“cellular component”和“molecula
8、r function”三类的关系网络图。下图是某组差异基因的cellular component的GO网格图12、Pathway分析 结合KEGG pathway等数据库,将上调和下调及所有差异基因进行Pathway显著性分析。分析每个Pathway中所包含的差异基因个数,用统计检验的方法计算出反映Pathway中差异基因分布富集显著性的P-value,根据P-value大小判断差异基因在生物通路中富集程度。下图是某实例结果(P-value小于0.01):13、Genes network分析(可选) 我们通过对各个时期重要的差异基因进行基于Expriments,Database和Text mi
9、ning等多种信息进行蛋白互作网络的构建。下图是某个示例:14、差异基因上游序列的motif分析 (可选) 针对特定转录因子的实验,可对差异基因进行转录因子结合位点的motif分析,从而推测差异基因中有哪些基因可能直接受该转录因子调节。最后结果会用统计学方法进行检验。15、差异基因的共表达网络的建立(可选) 共表达网络是一个成熟的对高通量数据进行共表达调控网络构建的方法。对差异基因进行共表达网络构建,可以清楚的查看基因之间可能存在的互作关系并为后续实验提供指导。以下是共表达网络图的一些示例。差异基因表达值之间的Pearson相关系数,颜色深浅表示相关性高低 差异基因的共表达网络16、疾病预测模
10、型的建立(可选) 通过对疾病正常组和对照组进行分析,挑选出贡献率最高的几个差异基因作为分类器,特征差异基因数目的确定通过Nearest Shrunken Centroids方法。最终利用SVM,ANN等机器学习方法训练模型并构建感知器进行疾病的预测。特征差异基因数目的确定注:部分分析结果采用已发表文献中的图片替代,针对具体项目,分析结果与其类似。转录组测序的应用1非编码区域功能研究:Non-coding RNA研究、microRNA前体研究等2转录本结构研究:UTR鉴定、Intron边界鉴定、可变剪切研究、Start codon鉴定等3基因转录水平研究4全新转录区域研究和低丰度mRNA的寻找送
11、样要求样品总量不低于15ug1样品纯度要求:total RNA OD值应在1.8-2.2之间;电泳检测28S:18S至少大于1.5。2 样品浓度:total RNA浓度不低于400ng/ul;。3 请提供total RNA样品具体浓度、体积、制备时间、溶剂名称及物种来源。请同时附上QC数据,包括电泳胶图、分光光度或Nanodrop仪器检测数据。如需进行多次样品制备,需要提供多次样品制备所需样品。送植物组织的要求:大田或野外获取的材料,取材后需用DEPC-H2O冲洗干净材料表面的灰尘及泥土,吸干,并将样品分割成100mg左右的小块放入1.5ml或者2.0ml的RNase-free的EP管中并加入
12、RNA later一类的RNA组织保存试剂推荐使用ABI公司的试剂,并请严格按照使用说明进行操作。具有自然屏障防止扩散的植物如蜡表皮的叶组织可能需要先破坏其屏障,以允许RNAlater进入组织),液氮速冻后用封口膜封口,再将EP管放置于50ml离心管中或密封性好的小塑料袋中,以大体积干冰运输,且要保证我方在收到样品开箱检验时干冰不能挥发完全;如是组培试管苗则请活体送样。送动物组织的要求:活体取材后的组织需用RNase-free的0.9生理盐水中漂洗样品,以去除血渍和污物,并剔除结缔组织和脂肪组织等非研究所需的组织类型,吸干,并将样品分割成50mg左右的小块(组织块越小,保存效果越好),放入1.
13、5ml或者2.0ml的RNase-free的EP管中并加入RNA later一类的RNA组织保存试剂,液氮速冻后用封口膜封口,再将EP管放置于50ml离心管中或密封性好的小塑料袋中,以大体积干冰运输,且要保证我方在收到样品开箱检验时干冰不能挥发完全。报价1G/1.5万,如果数据量大于5G,可以打八折的优惠,数据量更大,优惠更多。成功案例1.Luo H, Li Y, Sun C, Wu Q, Song J, Sun Y, Steinmetz A, Shilin Chen. Comparison of 454-ESTs from Huperzia serrata and Phlegmariurus
14、 carinatus reveals putative genes involved in lycopodium alkaloid biosynthesis and developmental regulation. BMC Plant Biol. 2010,10(1):209.2.Sun C, Li Y, Wu Q, Luo HM, Sun YZ, Song JY, Lui E, Chen Shilin. De novo sequencing and analysis of the American ginseng root transcriptome using a GS FLX Titanium platform to discover putative genes involved in ginsenoside biosynthesis. BMC Genomics , 2010,11:262.3.李滢 , 孙超 , 罗红梅 , 李西文 , 牛云云 , 陈士林. 基于高通量测序454 GS FLX的丹参转录组学研究. 药学学报 . 2010, 45(4).我们在与客户签订合同时,不要求署名权,所有的实验资料的知识产权都归客户所有。因为许多客户的文章仍在整理中,特整理出一小部分仅供参考。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1