基因组工程学里的三大利器ZFN TALENCRISPR.docx

上传人:b****5 文档编号:6412986 上传时间:2023-01-06 格式:DOCX 页数:14 大小:231.55KB
下载 相关 举报
基因组工程学里的三大利器ZFN TALENCRISPR.docx_第1页
第1页 / 共14页
基因组工程学里的三大利器ZFN TALENCRISPR.docx_第2页
第2页 / 共14页
基因组工程学里的三大利器ZFN TALENCRISPR.docx_第3页
第3页 / 共14页
基因组工程学里的三大利器ZFN TALENCRISPR.docx_第4页
第4页 / 共14页
基因组工程学里的三大利器ZFN TALENCRISPR.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

基因组工程学里的三大利器ZFN TALENCRISPR.docx

《基因组工程学里的三大利器ZFN TALENCRISPR.docx》由会员分享,可在线阅读,更多相关《基因组工程学里的三大利器ZFN TALENCRISPR.docx(14页珍藏版)》请在冰豆网上搜索。

基因组工程学里的三大利器ZFN TALENCRISPR.docx

基因组工程学里的三大利器ZFNTALENCRISPR

基因组工程学里的三大利器——ZFN、TALEN和CRISPR/Cas

作者:

 来源:

lifeomics 发布者:

亦云 日期:

2013-09-04 

锌指核酸酶(Zinc-finger nucleases, ZFN)和转录激活因子样效应因子核酸酶(transcription activator-like effector nucleases, TALEN)这两种新型的核酸酶重新定义了传统生物学研究的界限和范畴。

这两种核酸酶都是嵌合体,都是由经过设计的、序列特异性的DNA结合元件(programmable, sequence-specific DNA-binding modules)和非特异性的DNA切割结构域结合而成的。

ZFN和TALEN都可以对DNA进行 各种遗传修饰,这两种核酸酶的作用机制都是先对DNA双链分子进行切割,形成DNA双链断裂切口(DNA double-strand break),然后激活细胞内的非同源末端连接修复 机制(nonhomologous end joining,这是一种非保真的、容易出现遗传突变的修复机制),或者同源重组修复机制(homology-directed repair,这是一种高保真的修复机 制,不容易出现突变),利用细胞自身的修复机制对DNA进行遗传学修饰。

接下来, 我们就将为读者介绍这种新型的、序列特异性的核酸酶,看看它们在遗传分析和遗传 改造工作中都能发挥哪些功用。

此外,我们还会重点介绍ZFN和TALEN在临床治疗方面的潜力,以及这些核酸酶,与包括最新出现的RNA介导的、基于成簇的规律间隔的 短回文重复序列和Cas蛋白的DNA核酸内切酶(clustered regulatory interspaced short palindromic repeat (CRISPR)/Cas-based RNA-guided DNA endonucleases)在内的 其它核酸酶在未来的发展潜力。

 

了解基因功能的传统方法和现代方法 

随着全基因组测序技术(whole-genome sequencing)的不断发展和完善,以及大型基因组注释项目(genome annotation projects)的实施,科研人员们已经开始跃跃欲试,想要将基因组研究的成果尽早地运用到基础科学研究的各个领域,以及个性化医疗(personalized medicine)工作当中。

不过海量的基因组信息也给科研人员们出了一个不小的难题,那就是该如何将这些枯燥的数据转换成有意义的基因组功能,或者与临床相关的信息呢?

解决这个问题的核心就在于尽快开发出一种高效率的、可靠的方法,来帮助科研人员研究基因型(genotype)对表型(phenotype)的影响作用。

利用同源重组机制(homologous recombination)对基因进行定向失活(Targeted gene inactivation)就是这样一种好方法,可以帮助科研人员明确基因的功能。

不过在实际工作中使用这种方法也会受到好几个因素,比如存在效率太低、费时费力、而且有可能导致突变等的限制。

而 RNAi(详见名词解释)等基因靶向敲除技术则为科学家们提供了一种快捷、廉价而且可以开展高通量研究的新方法。

不过RNAi这种基因敲除技术的敲除效果还不够彻底,每次试验以及每个实验室的试验结果都会有差异,另外还存在不可预知的脱靶情况(off-target effect),所以只能够用于需要暂时抑制基因功能的试验当中。

这些研究手段的种种不足都严重限制了科学家们在探索基因型和表型关系的科研道路上前进的步伐,也妨碍了RNAi技术的实际应用。

 

近十年来出现了一种新的研究手段,可以帮助科研人员对各种细胞和各种生物体内的几乎任意基因进行人工操作。

这种新技术就是我们常说的“基因组编辑技术(genome editing)”,而前面介绍过的由序列特异性的DNA结合结构域与非特异性的DNA切割结构域组合而成的人工核酸酶就是这种基因组编辑技术的重要组成部分。

这些嵌合式的核酸酶能够以极高的效率、极高的精确度对基因组进行人工修饰,其机制就是我们前面介绍过的切割DNA产生DSB,然后利用NHEJ或HDR等 DSB修复机制完成我们所需要的各种人工修饰。

由于科研人员们对锌指蛋白和TALE蛋白等蛋白的DNA结合结构域的设计能力越来越强,所以这种基因组编辑技术的应用范围也一再地被拓展。

这些既简单又灵活的核酸酶在遗传工程学领域里发挥了极大的作用,其重要性也在与日俱增,已经站到了遗传工程工作的最前线。

下面我们将介绍几个最近在位点特异性核酸酶技术(site-specific nuclease technologies)领域取得的最新研究成果,我们也将就这项新技术在基因组靶向工程学(targeted genome engineering)领域的应用,以及在对真核细胞和模式生物的分析工作中的应用价值展开探讨。

我们还将介绍这种位点特异性核酸酶技术在临床治疗方面的应用潜力,以及未来的发展趋势,比如RNA介导的、基于成簇的规律间隔的短回文重复序列和 Cas蛋白的DNA核酸内切酶未来的发展和应用前景等。

 

名词解释:

 

CRISPR/Cas (CRISPR associated) systems:

 CRISPR/Cas系统(CRISPR相关系统), CRISPR(clustered regulatory interspaced short palindromic repeat)即成簇的、规律间隔的短回文重复序列,是基因组中一个含有多个短重复序列的位点,这种位点在细菌和古细菌(archaea)胞内起到了一种获得性免疫(acquired immunity)的作用。

CRISPR系统主要依赖crRNA和tracrRNA来对外源DNA进行序列特异性降解。

目前已经发现了3种CRISPR/Cas系统,其中在2型系统(type II systems)中依赖的是Cas9蛋白。

在RNA的介导下,Cas9蛋白能够对crRNA–tracrRNA识别的靶序列进行切割。

 

crRNA:

CRISPR RNA能够与tracrRNA配对,形成双链RNA结构,这种双链RNA分子能够介导Cas9核酸内切酶对与双链RNA分子互补结合的DNA序列进行切割。

 

DSB:

ZFN、TALEN以及CRISPR/Cas9系统对 DNA双链进行切割之后就会形成DNA双链断裂缺口(double-strand breaks),即DSB。

 

HDR:

同源重组修复,DSB出现之后,细胞会启动这种修复机制,以同源链为模板,对DSB进行修复。

由于这种修复作用是以同源链为模板,而且还有位点特异性的核酸酶(site-specific nuclease)参与,所以其保真度非常高。

利用HDR可以插入一个或者多个基因,也可以进行单碱基替换。

 

NHEJ:

非同源末端连接修复机制是另外一种DSB修复机制,通过这种修复可以将断裂的DSB末端直接连接起来。

由于在这种修复过程中不会用到同源模板链,所以在断裂处容易出现小的插入或者缺失突变,常常会导致移码突变,使基因的功能遭到破坏。

 

PAM:

前间区序列邻近基序(protospacer adjacent motif),这是一种见于crRNA分子的短核苷酸基序,可以被Cas9蛋白特异性识别并切割。

 

RNAi:

RNA干扰技术,是一种利用RNA分子抑制或者敲除基因表达的技术。

从更广义的角度来说,RNA干扰技术是细胞对外源RNA分子的天然抑制机制,是细胞的一种自我保护行为。

 

TALEN:

转录激活因子样效应因子核酸酶主要由 Fok I内切酶结构域和TALE蛋白的DNA结合结构域组合而成。

TALE蛋白含有多个33-35个氨基酸组成的重复肽段,而每一个肽段都能够识别一个碱基。

与ZFN一样,TALEN也能使DNA靶序列断裂,形成DSB,进而激活DNA损伤修复机制,对基因组进行定点改造。

 

tracrRNA:

反式激活嵌合RNA(trans-activating chimeric RNA),这是一种非编码RNA,能够促进 crRNA的形成,也是Cas9蛋白发挥RNA介导的DNA切割作用必不可少的辅助因子。

 

ZFN:

锌指核酸酶是由FokI限制性核酸内切酶当中的非特异性的DNA切割结构域和锌指蛋白(zinc-finger protein)组合而成的。

ZFN二聚体(dimers)能够促使DNA断裂形成DSB,进而诱发DSB修复机制。

锌指结构域的靶向功能使ZFN能够对基因组中的特定位点进行定向改造。

 

ZFNickases:

锌指切口酶(zinc-finger nickases)也是ZFN,不过是在其中两个FokI限制性核酸内切酶结构域当中的一个结构域发生了失活突变的ZFN。

锌指切口酶只能够形成DNA单链断裂(single-strand DNA break),所以只能激活同源重组修复机制,不能激活NHEJ修复机制。

 

定制的DNA结合结构域 

ZFN和TALEN极强的“适应性”源自我们可以对这些核酸酶里的DNA结合结构域进行个性化的定制,使其能够特异性地识别各种DNA序列。

这些DNA结合结构域能够与背景知识框1里介绍过的各种效应元件(effector domain),比如转录活化因子、转录抑制因子、重组酶(recombinase)、转座酶(transposases)、DNA和组蛋白甲基转移酶(methyltransferases)以及组蛋白乙酰基转移酶(acetyltransferases)等搭配,来对基因组进行各种改造,比如对基因组的结构或者基因组的功能进行改造等。

由此可以看出,其中最关键的因素就是各种核酸酶对DNA结合的特异性和亲和力。

下面,我们将重点介绍几个比较成功的,组装这些DNA结合结构域的方法和技术。

 

Cys2–His2锌指蛋白 

Cys2–His2锌指结构域是在真核生物中最常见的一种DNA结合基序,在人类基因组中也是编码频次排名第2的蛋白结构域。

一个锌指大约由30个氨基酸组成,形成了一种保守的ββɑ结构(图1A)。

在锌指ɑ螺旋结构表面的那几个氨基酸能够与DNA大沟上的3个碱基结合,不过这种结合的选择性会有所差异。

由于锌指蛋白具有这种分子结构,所以非常适于打造个性化的DNA结合蛋白。

在锌指蛋白特异性识别DNA序列的应用当中,最关键的工作就是设计出人造的、非天然的组合,比如含有3种以上的锌指蛋白DNA识别结构域的蛋白。

高度保守的链接序列(linker sequence)的出现使这种设计成为了可能,因为有了这种链接序列,我们就可以设计出能够识别9~18个碱基长度的DNA序列。

在一段 680亿个碱基组成的DNA序列里,18个碱基组成的序列就足以成为一段特异性的序列,所以如果能够设计出含有3种以上的锌指蛋白DNA识别结构域的蛋白,那么就意味着科学家们能够利用锌指蛋白识别出人类基因组里的任意一段DNA序列。

虽然这种理论在最开始还存在一定的争议,但是后来发现,如果要识别复杂基因组中某一段特定序列的DNA片段,这种设计策略的确是最佳的方案。

 

基于前期开展的论证研究(proof-ofprinciple)成果,科研人员们又开发出了好 几种新的构建锌指蛋白的策略和方法,这些 锌指蛋白在DNA结合的特异性方面都有其独 到之处。

模块化组装(modular assembly) 策略就是其中的一种,这种策略就是以预先 选择好的锌指蛋白模块文库(这种预选的文 库是通过对多个大型文库进行筛选,或者人 工设计出来的)为基础,从中挑选出合适的 模块组装出所需要的锌指蛋白。

由于目前开 发的锌指结构域几乎已经可以识别所有64 种三联核苷酸组合(密码子),所以我们完 全可以将这些锌指模块串联起来,识别特定 的DNA序列。

另外,也可以使用基于选择的 策略(selection-based approach),比如 寡聚体化序列设计策略(oligomerized pool engineering,OPEN)就可以从任意的文库 (这些文库会考虑相邻锌指之间与序列有关的 相互作用)中选择出新的锌指结构域。

还有 人将前面介绍的这些方法结合起来开发出了 新的策略,比如先预先选择出与序列有关的 (context-dependency)锌指模块,然后将 这些模块组合在一起形成更长的锌指组合。

多 年以来,锌指蛋白技术一直都是打造位点特 异性的DNA结合蛋白或酶的唯一方法。

目前 已经有商业化的人工锌指可供选择,比如美 国的Sangamo Biosciences(Richmond, CA, USA)公司就已经和美国Sigma–Aldrich(St. Louis, MO, USA)公司合作,开发出了一套 名为CompoZr的锌指蛋白构建系统,免去了 科研人员自己构建锌指蛋白以及后续的验证工 作。

目前已经有数千个锌指蛋白可供我们选 择。

可以毫不夸张地说,锌指蛋白技术可以以 任意序列为靶标。

 

背景知识1:

核酸酶之外的其它工具酶:

 重组酶、转座酶及转录因子 

位点特异性的核酸酶(Site-specific nucleases)是目前被研究得最透彻,也是应用范 围最广的一种遗传修饰工具酶,主要应用于细胞和模式生物的遗传改造工作。

不过这种酶 也有其局限性。

比如,位点特异性的核酸酶的脱靶效应(off-target effect)就会对细胞产生 毒性,更麻烦的是我们很难预测是否会出现脱靶效应,也几乎无法系统地监测细胞内出现 的脱靶效应,所以科学家们也陆续开发出了其它几种新型的基因组改造工具。

此外,由于这 些核酸酶还需要依赖细胞自身的NHEJ及同源重组修复机制来完成遗传改造工作,所以这种 技术也只能应用于某几种具备这些修复机制的细胞。

为了解决上述问题,科学家们决定另辟 蹊径,将锌指蛋白和TALE蛋白与核酸酶之外的其它几种酶结合,开发出了新的遗传改造工 具,比如位点特异性的重组酶、转座酶等。

这些酶可以使细胞基因组DNA发生整合、切除或 者倒位等改变。

因为这些酶能够自动完成对DNA的切割和连接操作,因此核酸酶脱靶导致 的“毒性”DSB不太可能在细胞内累积,也就不会对细胞造成太大的伤害。

另外,重组酶和 转座酶更利于在基因组内的特定位点插入新的基因,所以能够更有目的地监测是否出现了脱 靶效应。

而且重组和转座机制是不依赖于细胞自身的DSB修复机制的。

所以这些工具酶几乎 可以应用于任何细胞,也可以在任何细胞周期内使用。

我们还可以通过定向进化(directed evolution)的方式来提高这些工具酶的催化效率。

不过要使这些重组酶和转座酶的可用性达 到核酸酶的水平,还需要对它们进行更进一步的改进和优化,进一步提高酶的活性和在使用 方面的灵活性。

尤其是在所结合的重组酶的催化活性结构域中还保留有部分的序列特异性, 所以还需要对它们进行更进一步的改造,使其能够特异性地与我们所瞄准的靶标序列结合。

 虽然转座酶与锌指等序列特异性结合蛋白融合之后表现出了极高的特异性,但还是会表现出 比较明显的脱靶现象,所以也需要对这类蛋白进行更进一步的优化。

最后再来介绍一下人工 合成的锌指转录因子和TALE转录因子,这类蛋白能够特异性地影响基因的表达,这也起到了 一种基因组定向修饰的作用。

综上所述,位点特异性的重组酶、转座酶及转录因子是除了位 点特异性的核酸酶之外的一大类灵活、好用的基因组修饰工具,是对位点特异性的核酸酶的良好补充。

 

TALE核酸酶 

最近又发现了另外一种简单的DNA识别模块,那就是TALE核酸酶中的DNA识别模块,这无疑又给科学家们提供了另外一个平台,方便他们设计出更多的DNA结合蛋白。

 TALE蛋白是一种源自植物致病菌——黄单包杆菌(Xanthomonas)的天然蛋白,其中也含有DNA结合结构域(图1B)。

TALE蛋白中的DNA结合结构域是由一连串33~35个氨基酸组成的重复结构域组成的,其中每一个结构域都能够识别一对碱基。

TALE核酸酶的DNA结合特异性主要由两个高度可变的氨基酸决定,科学家们将这两个关键的氨基酸称作重复可变双氨基酸残基位点(repeat-variable di-residues, RVD)。

与锌指结构域一样,这种TALE重复模块也能够串联起来,识别一长串的DNA序列。

不过与锌指蛋白不同的是,针对基因组中的某个位点,在连接 TALE蛋白的DNA识别模块时,接头没有太多的改造空间。

经过前人对锌指蛋白开展的近 20年的科研工作,科学家们已经发现了大量的效应因子结构域(effector domain),比如核酸酶(nuclease)结构域、转录激活因子(transcriptional activator)结构域、位点特异性的重组酶(site-specific recombinase)结构域等,这些效应因子结构域都可以与 TALE蛋白DNA序列识别结构域搭配,对基因组中的目标位点进行各种遗传修饰。

虽然 TALE蛋白DNA序列识别结构域能够识别单个碱基对的特性要比锌指蛋白的3碱基识别更富灵活性,在设计的时候可变性更强,但是克隆这么一大段TALE蛋白DNA序列识别结构域的重复编码序列也是一个不小的挑战。

为了解决这个问题,科学家们也想出了不少的办法,现在就已经有好几种方案能够让科研人员快速地组装出任意搭配的TALE蛋白 DNA序列识别结构域。

金门分子克隆技术(‘Golden Gate’molecular cloning)就是其中的一种解决方案,这是一种高通量的固态组装技术(solid-phase assembly),而且是一种不需要进行连接的克隆技术(ligation-independent cloning techniques)。

有多个使用了各种组装策略的大规模的、系统性研究项目表明,TALE重复识别模块可以组装在一起,识别任何DNA序列。

根据文献的报道,TALE蛋白在识别DNA序列方面存在的唯一限制就是它所识别的位点必须以T开始。

最近有项研究指出,已经有人构建了一个 TALEN文库,能够靶向结合18740个人类编码基因,这说明构建TALEN蛋白并不是那么困难。

这项“浩大的”工程不仅能够促进科研人员利用核酸酶开展更多的研究,同时也有利于鼓励大家开展类似的、更大规模的工作。

目前也出现了商业化的人工TALE文库,比如法国巴黎的Cellectis Bioresearch公司、美国的Transposagen Biopharmaceuticals公司(Lexington, KY, USA)和生命科技公司(Life Technologies, Grand Island,NY, USA)都提供这类服务。

 

 

图1锌指蛋白(zinc-finger)和转录活化因子样效应蛋白(transcription activator-like effector, TALE)的结构。

(A)人工设计的锌指蛋白与靶标DNA分子(图中灰色所示)形成的复合结构(PDB ID:

 2I13)。

每一个锌指结构都由大约30个氨基酸组成,形成了一个ββɑ样结构,如放大图所示。

位于锌指结构域表面的氨基酸残基(即 1、 2、 3、6号氨基酸)能够与DNA接触,如图中的棒状结构所示。

因此,每一个锌指结构域都能够与 DNA大沟侧的3至4个碱基接触。

保守的半胱氨酸残基侧链和组氨酸残基侧链能够与紫色的锌离子结合。

(B)锌指核酸酶二聚体与 DNA结合示意图。

锌指核酸酶的靶序列含有两个锌指蛋白结合位点,不过这两个位点之间还有一段5~7bp的间隔序列,锌指核酸酶里的Fok I酶切结构域就能够切割这段间隔序列。

当然,我们也可以设计出只能够识别左侧或者右侧结合位点的锌指蛋白。

(C)TALE蛋白与DNA分子结合形成的复合体(PDB ID:

 3UGM)。

每一个TALE结构域都是由33~35个碱基组成的序列反复重复形成的,每一个33~35个碱基组成的序列都能够依靠序列里两个高度可变的氨基酸残基(即重复可变双残基RVD,放大图中的棒状结构所示)识别1个碱基对。

(D) TALE核酸酶二聚体与DNA形成的复合物的结构示意图。

TALEN的靶序列也含有两个TALE结合位点,其中也有一段12~20bp长的间隔序列,而且也能够设计出只能与其中一个结合位点结合的 TALE。

图中列举了4种RVD组合。

 

利用位点特异性的核酸酶进行基因组编辑(Genomeediting)操作 

一直以来,科研人员在进行基因定向抑要依靠的都是同源重组技术(homologous 制、替代或者额外插入等遗传学操作时主recombination),不过这种方法对哺乳动物细胞和模式生物进行遗传改造时的效率非常低,这就极大地限制了这类遗传操作的开展。

后来科学家们发现,当细胞内出现DSB之后,同源重组的效率会上调好几个数量级,再加上后来发现的定向核酸酶,就极大地提高了利用同源重组技术进行遗传改造操作的工作效率。

科学家们同时在细胞内转入位点特异性的核酸酶和携带有位点特异性同源序列(locus-specific homology arm)的外源质粒,这样就能够以极高的效率在细胞基因组特定的位点转入一个或者多个转基因序列

(图 2A)。

我们也可以通过这种方法,转入一段不超过50bp的线性外源同源序列或者单链的 DNA寡核苷酸链,在细胞基因组内的特定位点引入替换突变、缺失突变或者插入突变。

这项技术具有非常重要的意义,因为位置的效应(positional effect)在这里已经不再那么重要了(可是在以前,位置效应会让很多遗传学分析变得非常复杂),可以对天然的、复杂染色体环境下的基因组结构与其功能之间的关系进行研究。

位点特异性的核酸酶除了能够提高同源重组的效率之外,还能够以很快的速度构建null表型(null phenotype)的细胞系和模式生物。

这些核酸酶产生DSB之后如果启动了NHEJ修复机制,那么就会在DSB位点处引入小段的缺失突变或者是插入突变,使基因发生移码,从而起到敲除基因功能的作用(图 2B)。

这些位点特异性的核酸酶还能够引入大段的染色体缺失突变,使染色体发生大段的倒位(inversion)和转位(translocation)。

总而言之,借助细胞的NHEJ修复机制,通过这些核酸酶对外源DNA片段和内源染色体位点的定向切割,我们可以实现大片段的(最大可以达到14kb)转基因操作。

这些方法能够帮助科研人员更好地研究基因的功能,还可以通过改变基因来模拟已知的或者是尚未确定的基因型,构建病理模型等。

这类技术当中已经有很多被应用到了胚胎干细胞、iPS细胞等祖细胞(progenitor cell type)的研究工作当中(表1),这样就可以开发出更多遗传背景下的细胞、乃至组织等模型。

我们还可以用这类技术对非编码DNA(比如调控序列)的作用进行研究,有助于发现与目的基因有关的未知调控序列。

 

 

图2使用位点特异性核酸酶进行基因组编辑操作时可能出现的几种情况。

核酸酶切割DNA形成DSB之后细胞可能会借助同源重组修复途径,或者是NHEJ修复途径对DSB进行修复。

(A)在缺乏外源质粒DNA模版的情况下,细胞会通过NHEJ机制进行修复,在基因组中形成小型的插入或者缺失突变。

在存在双链寡聚核苷酸分子,或者在细胞内存在线性的质粒片段时,可以通过NHEJ机制在基因组中插入大段的DNA序列,最长可以插入14kb的序列。

同时形成两种DSB之后会形成缺失、倒位或者倒位的序列转位等突变。

(B)在存在同源序列的外源模版的情况下,细胞会通过同源重组修复机制修复DSB,在基因组内插入1个或者多个转基因,或者对基因组中的错误基因进行修复。

 

表1 使用ZFN、TALEN和CRISPR/Cas对人及模式生物进行基因组修饰的案例 

遗传修饰类型

修饰物种

修饰基因

使用

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1