分子生物学研究法基因功能研究技术文档格式.docx

上传人:b****3 文档编号:15090110 上传时间:2022-10-27 格式:DOCX 页数:20 大小:707.77KB
下载 相关 举报
分子生物学研究法基因功能研究技术文档格式.docx_第1页
第1页 / 共20页
分子生物学研究法基因功能研究技术文档格式.docx_第2页
第2页 / 共20页
分子生物学研究法基因功能研究技术文档格式.docx_第3页
第3页 / 共20页
分子生物学研究法基因功能研究技术文档格式.docx_第4页
第4页 / 共20页
分子生物学研究法基因功能研究技术文档格式.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

分子生物学研究法基因功能研究技术文档格式.docx

《分子生物学研究法基因功能研究技术文档格式.docx》由会员分享,可在线阅读,更多相关《分子生物学研究法基因功能研究技术文档格式.docx(20页珍藏版)》请在冰豆网上搜索。

分子生物学研究法基因功能研究技术文档格式.docx

基于传统的Sanger测序法对转录组进行研究的方法主要包括:

表达序列标签(expressedsequencetag,EST)测序技术,基因表达系列分析技术(serialanalysisofexpression,SAGE)。

EST测序数据是目前数量最多,涉及物种最广的转录组数据,但测序读长较短(每个转录本测定400bp-500bp),测序通量小,测序成本较高,而且无法通过测序同时得到基因表达丰度的信息。

有人使用SAGE测序法,将不同转录本3’端第一个CATG位点下游14bp长的短标签序列来标识相应的转录本。

由于标签序列较短,可以将多个标签串联测序,使SAGE法相对于EST测序在通量上大大提高。

但过短的序列标签使得序列唯一性降低,即使改进过的LongSAGE用21bp标签测序,仍然有约一半的标签无法被准确注释到基因组上。

高通量测序技术(high-throughputsequencing),又名二代测序(second-generationsequencing)或深度测序(deepsequencing),可以一次性测序几十万甚至几百万条序列,是传统测序技术的一次革命。

主要有Roche公司研发的454测序平台和Illumina公司的Solexa测序平台(表6-1)。

表6-1454和Illumina高通量测序平台比较

454

Illumina

读取长度(bp)

约700

50-150

单次测序数据量

700Mb

600Gb

测序周期

23小时

7-14天

测序成本

较高

虽然都是基于“边合成边测序(sequencingbysynthesis,SBS)”,但是454和Illumina的实现方法有很大的不同。

454系统采用焦磷酸测序(pyrosequencing)原理,如图6-1a所示,在DNA聚合酶的作用下,按照T、A、C、G顺序加入的单个dNTP与模板的下一个碱基配对,同时释放一个分子的焦磷酸(PPi),在ATP硫酸化酶的作用下,PPi和腺苷酰硫酸(adenosine-5’-phosphosulfate,APS)结合形成ATP,在萤光素酶的催化下,ATP和萤光素结合形成氧化萤光素,产生可见光,被CCD捕捉。

而Illumina系统(图6-1b)采用带有萤光标记的dNTP,其3’羟基末端带有可被化学切割的部分,每个循环反应只允许掺入一个碱基,由激光扫描反应板表面,读出这一轮反应新加的萤光信号,从而判定碱基种类。

之后,经过化学切割恢复3’端粘性,进行下一轮聚合反应。

从上述描述中不难看出,随着反应的进行,已有萤光信号会使新的荧光难以准确分辨,因此该方法的测序读长较短,测序错误主要是碱基替换。

而454则由于缺少终止反应的元件,相同碱基的连续掺入常会带来“插入-缺失”类型的测序错误。

利用高通量测序技术对转录组进行测序分析,对测序得到的大量原始读长(reads)进行过滤、组装及生物信息学分析的过程被称为RNA-Seq。

对于有参考基因组序列的物种,需要根据参考序列进行组装(referenceassembly),对于没有参考序列的,需要进行从头组装(denovoassembly),利用大量读长之间重叠覆盖和成对读长(pair-endreads)的相对位置关系,组装得到尽可能完整的转录本,并以单位长度转录本上覆盖的读长数目(readsperkilo-basegenepermillionbases,RPKM)作为衡量基因表达水平的标准(图6-2)。

在实际组装过程中,图中红色标示区域覆盖度过低,且读长缺乏相对位置信息的区域,其可信度较低,应当剔除,保留两侧序列。

现以棉花转录组学数据为例,简单分析不同组织或纤维不同发育时期基因表达情况(表6-2)。

Illumina平台测序得到26.86Gb数据,经过从头组装总共获得了42,773条非重复序列,平均长度1,054碱基。

每个不同组织中分别有23,265至26,427个独立转录本。

转录组数据不但能用来分析不同组织中独立转录本数量,还被用于分析特定转录本在某个组织中的表达强度(表6-3)。

RNA-Seq还可以用于转录本结构、转录本SNP检测、非编码区功能鉴定以及挖掘低丰度转录本等研究。

表6-2陆地棉6个组织的RNA-Seq数据分析

组织样品

读长数

碱基数

Q201(%)

N50

独立基因

总数

长度(nt)

开花后0天胚珠

47907298

3593047350

98.22

827

26427

778

开花后5天胚珠

53022210

3976665750

97.86

842

23520

786

48049786

3603733950

97.99

823

23265

775

54191238

4064342850

97.51

820

25280

776

79438254

7149442860

91.68

23905

753

49713024

4474172160

91.46

782

24088

746

总计

332321810

26861404920

1306

42773

1054

1Q20,测序准确率达到99%。

表6-3棉花组织特异性转录因子表达强度分析

序列标识

基因

RPKM

Unigene58528

MYB-L

81.86

0.16

Unigene85367

FAR1

0.40

65.51

Unigene58563

B3

56.02

0.00

Unigene29146

HD-ZIP

0.00

44.49

Unigene58582

53.66

0.29

Unigene51008

HB

0.24

43.60

Unigene58458

Dof

45.54

Unigene18073

MIKC

0.13

36.74

Unigene55872

41.56

Unigene64521

MYB

0.15

31.71

Unigene51911

bHLH

36.64

0.19

Unigene58698

0.09

24.01

Unigene58446

NAC

28.40

0.37

Unigene62109

0.04

18.45

Unigene57837

20.27

Unigene52681

bZIP

0.20

17.62

Unigene58640

S1Fa-L

20.25

0.68

Unigene64531

G2-L

0.34

16.92

Unigene55579

15.71

0.13

Unigene64486

14.49

转录组组装过程中,同一个非重复序列上复盖有来自根、茎等不同组织的读长,不同读长数目通过归一化转变为RPKM值,进而筛选得到组织特异表达的转录因子。

6.1.2RNA的选择性剪接技术

RNA的选择性剪接是指用不同的剪接方式(选择不同的剪接位点组合)从一个mRNA前体产生不同的mRNA剪接异构体的过程。

一般将选择性剪切分为如下几类:

平衡剪切、5’选择性剪切、3’选择性剪切、外显子遗漏型剪切及相互排斥性剪切(图6-3)。

一般用RT-PCR的方法研究一个基因是否存在选择性剪切。

首先以cDNA两端特异引物或来自不同外显子的引物序列在不同组织来源的RNA样品中进行扩增,观察PCR产物大小是否存在差异。

一旦发现差异,即可通过序列分析来判断这种差异是否来自于选择性剪切。

图6-4为拟南芥中发现的有选择性剪切的5个转录调控因子基因的物理图谱。

选择性剪接使一个基因翻译为多种蛋白质序列,是基因表达多样性的重要表现形式。

分析人类基因组数据发现,有60%的基因在表达过程中可通过选择性剪切产生各种形式的mRNA。

最新的研究表明,果蝇的Dscam基因最多可能够产生38,016种不同形式的剪切体(图6-5)。

由于选择性剪切与细胞生理、发育调节以及肿瘤的发生、转移等有密切关系,阐明基因的选择性剪切机制是了解动植物个体发育和基因功能的重要环节。

因此,发现新的可变剪切异构体,确定每个异构体的独特功能和生物学意义并阐明其调节机制,是功能基因组时代的一个重要特征。

6.1.3原位杂交技术

原位杂交(InSituHybridization,ISH)是用标记的核酸探针,经放射自显影或非放射检测体系,在组织、细胞、间期核及染色体上对核酸进行定位和相对定量研究的一种手段,通常分为RNA原位杂交和染色体原位杂交两大类。

RNA原位杂交用放射性或非放射性(如地高辛、生物素等)标记的特异性探针与被固定的组织切片反应,若细胞中存在与探针互补的mRNA分子,两者杂交产生双链RNA,就可通过检测放射性标记或经酶促免疫显色,对该基因的表达产物在细胞水平上做出定性定量分析(图6-6)。

荧光原位杂交(fluorescenceinsituhybridization,FISH)技术首先对寡核苷酸探针做特殊的修饰和标记,然后用原位杂交法与靶染色体或DNA上特定的序列结合,再通过与荧光素分子相耦联的单克隆抗体来确定该DNA序列在染色体上的位置(图6-7)。

FISH技术不需要放射性同位素,实验周期短,检测灵敏度高,若用经

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 图表模板

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1