基因工程原理讲义基因的现代概念.docx
《基因工程原理讲义基因的现代概念.docx》由会员分享,可在线阅读,更多相关《基因工程原理讲义基因的现代概念.docx(27页珍藏版)》请在冰豆网上搜索。
基因工程原理讲义基因的现代概念
第二讲基因的现代概念
中国科学院遗传与发育生物学研究所
2017年8月
一、移动基因
1.概述
2.插入序列
(1)插入序列的发现
(2)原核生物转位因子的类型
(3)插入序列
3.转位子
(1)转位子概念
(2)转位子类别
4.转位作用机理
(1)转位作用概念
(2)转位作用类型
(3)转位作用分子机理
*1.复制型转位
*2.非复制型转位
*3.保存型转位
二、断裂基因
1.断裂基因概念
(1)定义
(2)表达程序
(3)若干概念
2.间隔子位置的测定
(1)实验步骤
(2)异源双链体分子定义
3.mRNA初级转录本的剪辑
(1)两步机理
(2)mRNA差异剪辑
三、重叠基因
1.重叠基因定义
2.重叠基因的发现
3.原核生物重叠基因类型
(1)第一种类型
(2)第二种类型
(3)第三种类型
4.真核生物重叠基因的类型
(1)间隔子式重叠基因
(2)嵌套基因
5.重叠基因的分布
6.重叠基因的意义
四、假基因
1.假基因的定义
2.假基因的拷贝数
3.假基因的类型
(1)重复的假基因
(2)加工的假基因
(3)加工的假基因的起源问题
五、重复序列与重复基因
1.基因家族与基因簇的概念(差异)
(1)基因家族
(2)基因簇
2.重复序列(基因)
3.重复基因的特点
4.基因拷贝数与其表达量之间的关系
基因的现代概念
一、移动基因
1.概述
*1.移动基因(movablegenes),又叫做转位因子(transposableelement)。
它可以在染色体基因组上移动,甚至在不同染色体分子之间跃迁,所以有时也称之为跳跃基因(jumpinggenes)。
*2.移动基因最早是由美国冷春港(ColdSpringHaborLaboratory)的女科学家——诺贝尔奖金获得者——B.McClintock于上一世纪40年代,其母校康奈尔大学遗传学系在研究玉米时发现的,当时叫做“控制因子”(controllingelements),或称为激活-解离因子(Activator-Dissociationelement,简称Ac/Ds因子。
*3.玉米中移动基因功能:
a.这些控制因子可以插入到玉米染色体的靶子位点上,并抑制与之邻近的其它染色体基因的表达活性;
b.控制因子在染色体上没有固定的位置,似乎可以沿着染色体分子移动;
c.控制因子在插入染色体之后的适当时间内又可以重新被删除焉,此时原先潜伏基因(dormantgene)的功能也往往得到恢复;
d.由于控制因子本身不稳定,因此与之相关的基因也呈现出不稳定状态与高突变率的特性;
*4.McClintock工作初期遭遇,与1983年荣获Nobel生物医学奖,获奖后的心态等简介。
获Nobel奖后她在给冷春港定量生物学室实验室主任的信中说:
请不要打扰我,仍然给我做我想做的工作。
2.插入序列
(1)插入序列的发现
在60年代末期,J.A.Shapiro在研究大肠杆菌高效突变——即可影响一系列功能的突变——时发现,这是由于一种大片段DNA的插入作用造成的,并称这种DNA片段为插入序列(insertionsequences,IS)。
随后的研究发现,除了E.coli之外,在其它的格兰氏阴性和格兰氏阳性细菌中也都广泛地存在着转位因子。
(2)原核生物转位因子的类型:
a.插入序列(insertionsequence,IS)
原核生物的转位因子,其分子量小于2000bp的一般叫做插入序列。
b.转位子(transposon,Tn)
有时又叫做转座子(中文译名的差别),系指分子量大于2000bp的转位子。
c.噬菌体型转位子
例如Mu和D108等噬菌体,均属于第三种类型的转位子。
移动基因Movablegenes
转位因子Transposibleelements
跳跃基因Jumpinggenes
控制因子Controllingelements
激活-解离因子Activator-Dissociationelements
插入序列(IS)Insertionsequence
转位子(Tn)Transposon
(3)插入序列
插入序列又叫IS因子,它是在细菌中首先发现的最简单的一类转位因子。
其共同特征是:
图2-1转位子的形体图
(a)简单的转位子,也叫做插入序列,它具有一个控制转位作用的转位酶基因,并往往被反向重复序列,即所谓的IR序列所包围。
(b)复合的转位子Tn1681,它具有两个插入序列(IS1)和一个热稳定的大肠杆菌素1编码基因。
①在它们的末端具有一段反向重复序列(但其长度不一定相等,例如IS10转位因子的左边IR序列是17bp,右边是22bp);
②当IS因子插入到靶位点之后,便会在其两端的外侧产生一段短的同向重复序列;
③IS因子一般只编码一种参与转位子作用的转位酶(transposase),它能够识别反向重复序列,并催化转位因子发生删除作用,从染色体上游离出来。
图2-2IS因子转位作用形成同向重复序列的原理
(a)具有IS因子插入靶子位点的一段DNA分子;
(b)在靶子位点形成交错的缺口;
(c)IS因子同缺口位置的单链末端连接;
(d)在靶子位点出现的裂口被补齐并封闭,形成短小的同向重复序列序列。
④IS因子能够四处活动,几乎可以插入到大肠杆菌染色体的各个位置上;也可以插入到质粒和某些噬菌体基因组上;甚至可以插入到同一个基因的不同位点上;
⑤IS因子的插入作用可以正向也可以反向整合到基因组上。
我们特称IS因子的这种移动方式为转位作用(transposition)。
转位作用
表2-1若干种大肠杆菌IS因子的基本参数
名称
分子大小
(bp)
反向重复序列
(bp)
靶子位点的同向
重复序列(bp)
靶子位点选择
IS1
768
23
9
随机
IS2
1327
41
5
热点
IS4
1428
18
11或12
AAAN20TTT
IS5
1195
16
4
热点
IS10R
1329
22
9
NGCTNGCN
IS50R
1531
9
9
热点
IS903
1057
18
9
未知
3.转位子(transposon)
(1)转位子概念
转位子又叫转位因子(transposableelement)或转座子,其英文定义:
AsegmentofDNAthatcanmovefromonepositioninthegenometoanother.
TransposonisaDNAsequenceabletoreplicateandinsertonecopyatanewlocationinthegenome.
转位子(transposon)是在许多细菌中发现的另一类移动单元,它是由几个基因组成的特定的DNA片段,而且往往带有抗菌素抗性基因。
例如氨苄青霉素转位子就是其中一例。
(2)转位子类别
根据结构特征,转位子可以分为复合系和Tn3系两种不同的类别:
a.复合转位子(Complextransposone)
复合转位子是由2个同样的IS因子连接在抗菌素抗性片段的两侧构成的。
复合转位子很容易携带着抗菌素抗性基因从细菌染色体转移到质粒或噬菌体基因组上。
当发生这种情况时,转位子就会迅速地传播到其它细菌中去,这类转位作用是自然界中发生细菌抗药性的主要原因。
b.Tn3转位子
Tn3转位子结构比较复杂,长度约为5000bp,末端有一对38bp的IR序列,但不含有IS因子序列,每个Tn3均由3个基因组成:
①AmpR基因编码-内酰氨酶,提供氨苄青霉素的抗性。
2TnpA基因编码1种长度为1015氨基酸的转位酶:
它作用于转位子末端产生双键切割,使转位子从给体分子上删除下来;并在靶子位点作交错切割,使转位子插入进去。
3TnpR基因编码一种185个氨基酸的蛋白质。
其功能有二:
抑制TnpA基因合成活性;促进中间分解区又称中央解离位点res(resolutionsite)发生位点特异的切割;
表2-2若干种大肠杆菌复合转位子的基本参数
名称
分子大小(bp)
遗传记号
末端组件
组件取向
组件关系
Tn903
3100
KanR
IS903
反向
同样
Tn9
2500
CanR
IS1
同向
可能同样
Tn10
9300
TerR
IS10R
IS10L
反向
2.5%差异
Tn5
5700
KanR
IS50R
IS50L
反向
1bp差异
4.转位作用机理
(1)转位作用概念
*1.转位作用定义:
Themovementofageneorsetofgenesfromonesiteinthegenometoanother.
移动基因的分子本质是一段能够插入到寄主基因组新位点的特异的DNA序列结构。
*2.转位作用特点:
a.是一种与recA基因无关的新的重组类型,其唯一结果是转位因子的转动;
recAgene=重组作用基因
b.转位因子插入位点是一段与之没有同源关系的核苷酸序列;
c.转位过程涉及到DNA复制;
*3.转位作用步骤:
第一步,在靶DNA上造成交错的断裂;
第二步,转位子连接到靶DNA的突出的(延伸的)单链末端;
第三步,连接留下的缺口(gap)的补齐与封闭
(2)转位作用类型
科学工作者对转位作用的机理认识经历了由肯定——否定——再肯定的反复过程,由表入深的过程,逐步深化的过程:
*早期的研究工作认为转位子可以从一个位点转移或移位到另一个位点,故将此过程称为转位作用。
*随后发现这种命名是错误的,因为在转位过程中,转位因子的一个拷贝仍留在原来的位点上,同时在新的位点出现第二个拷贝。
因此转位与重组不同,转位过程必须进行DNA复制。
进一步说,这种重组的唯一可能的后果是转位因子的移动。
*最近(B.Lewin,1994)根据最新研究进展表明,事实上转位作用有如下三种不同的类型:
a.保存型转位(Conservativetransposition)
b.复制型转位(Replicativetransposition)
c.非复制型转位(Nonreplicativetransposition)
有些转位子仅能按照其中的一种机理发生转位,而有些转位子则可按照两种机现进行转位,例如IS1和IS903就可按复制型和非复制型两种机理转位,而噬菌体Mu则可按任何一种机理转位。
图2-3由交错切割形成的正向重复的靶DNA序列包翼在转位子的两侧,其延伸的末端同转位子连接。
(A)在靶子位点发生交错切割;(B)转位子同单链末端连接;(C)补齐和封闭靶子位点的裂口。
(From.B.LewinP.1006)
(3)转位作用的分子机理
A.复制型转位
在复制型转位过程中,转位子发生复制,因此被转移的实体是一份原本的转位子。
其中一份拷贝仍保留在原来的位置,而另一份拷贝则插入到基因组的新位点。
因此,这种类型的转位作用是通过增加转位子的拷贝数得以实现的。
Tn3转位子的转位作用便属于此种类型。
*1.复制型转位的酶催活性
复制型转位过程中涉及两种酶催活性,下面以Tn3转位子为例予以说明。
图2-4复制型转位产生的一个转位子拷贝插入到一个受体位点上。
给体位点保持不变。
因此,复制转位的结果是给体与受体各具有一个转位子拷贝。
图2-5非复制型转位中,转位子以一个物理实体从给体位点转移并插入到一个受体位点。
这样转移的结果使给体位点断裂,若不被修复,就将基因组造成致死效应。
a.Tn3转位子编码的转位酶(Transposase)——作用于转位子的末端,产生双链切割,使转位子从给体分子上删除下去;并在靶子位点作交错切割,使转位子插入进去。
转位酶由tnpA基因编码
b.Tn3转位子编码的另一种酶是解离酶(Resolvase)——此种酶具有如下两重功能:
①作为阻抑物,抑制TnpA基因表达。
②解离酶功能,促使共合体结构中两个以同向重复形式存在的转位子之间发生位点特异的重组。
解离酶由tnpR基因编码
cointegrate共同体
图2-6TnA转位子具有一对末端反向重复序列(IR),一个中央位置的res位点和3个基因。
Res:
siteofresolution,即解离位点。
tnpA基因编码产物是一种转位酶,它同长度为38bp的末端反向重复序列中的一段约25bp的序列结合。
我们相信转位酶可①识别转位子的末端,而且同样能够在供转位子插入的②靶DNA位点造成(形成)交错的具5bp延伸序列的断裂。
tnpR基因编码产物是一种具有双功能的蛋白质。
它一方面可以起到阻抑物的作用,抑制tnpA基因和自身基因(tnpR)的表达活性;另一方面又可起到解离酶的功能作用(resolvase,解离酶)。
*解离酶的功用是促进中央分解区发生位点特异的切割作用。
DNA-protein复合物的footprinting试验证明,TnpR解离酶是结合在res分解区,如图2-6所示,解离酶在分解区(res)中有3个各长30-40bp的结合位点,它们是彼此独立地同解离酶发生结合作用。
这3个结合位点共有一段二重对称(dyadsymmetry)的同源保守序列。
所谓二重对称:
系指旋转180°后产生相同结构的对称体,它是用来描述双螺旋DNA分子中含有回文对称的区域。
这种区域旋转180°后得到相同的碱基序列。
tnpR基因的突变导致转位频率上升,其原因是TnpR蛋白质抑制了tnpA和tnpR两个基因的转录活性。
因此,TnpR蛋白质的失活作用就会使TnpA蛋白质的合成活性上升,从而最终导致转位频率的增加。
这意味着:
TnpA转位酶是转位作用的一种限制因子。
这一点无疑是很有用处的。
res分解区(或叫解离位点)的功能鉴定:
应用顺式作用缺失(cis-actingdeletion)法,证明当res区缺失时,转位作用便被完全阻断了,并导致共合体的累积。
在res缺失的情况下,解离反应可以被以RecA介导的一般重组所取代,但其效果必定的低效的。
*2.复制型转位反应阶段:
复制型转位过程(图2-7)包括如下两个阶段:
a.第一阶段,含有转位子的一个复制子(replicon)同没有转位子的另一个复制子融合起来,这种由复制子融合而成的结构叫做共合体(cointegrate)。
在这样形成的共合体中含有两份相同的转位子的拷贝,它们按同向重复的方式排列并彼此结合成一体。
何谓复制子(Replicon):
所谓复制子乃是含有一个复制起始位点的基因组中的DNA复制单位(RepliconisaunitofthegenomeinwhichDNAisreplicated;containsanoriginforinitiationofreplication.)例如细菌染色体、病毒基因组、质粒基因组等,其DNA能够进行自主复制的遗传单元,均称为复制子,每一个复制子都含有一个启动复制的起点。
真核细胞、染色体内的“复制子”称为复制单位。
b.第二阶段,两个拷贝的转位子之间发生同源重组,能够再生(regenerate)出原来的给体复制子,并释放出一个靶复制子(targetreplican)。
此种靶复制子已经获得了一个转位子,其两侧由寄主靶序列的短同向重复序列包围。
解离:
这种通过两个拷贝的转位子之间的重组形成一个原给体复制子和一个靶复制子的反应叫做解离(resolution),它是由解离酶催化的。
解离反应释放出两个各含有1份同样转位子拷贝的复制子个体(图2-7)。
*3.共合体结构的形成
我们以Mu噬菌体为例说明共合体结构(cointegratestructure)形成的过程:
图2-7转位作用能把一个给体复制子与一个受体复制子融合成一个共合体。
解离作用释放出两个复制子,它们各含有一份转位子拷贝。
Mu转位酶(transposase),是一种能够识别末端的位点特异的核酸酶,它从转位子两端单链切割给体分子;
同时转位酶在受体分子的靶位点作交错的单链切割形成5个碱基的单链延伸末端。
↓
给体分子与受体分子在缺口部位连接:
转位子序列的每一端都与靶子位点上的一条单链延伸末端连接,形成一种交叉结构(crossoverstructure)它含有一对转位子。
↓
图2-8Mu噬菌体的转位作用产生出一种交叉结构,它经过复制转变成一个共合体。
(A)缺口形成。
单链切割在转位子和靶位点形成交错末端。
(B)交叉结构形成。
转位子缺口末端与靶位点缺口末端连接。
(C)共合体。
一个分子的共合体具有两个拷贝的转位子。
(D)共合体分子拉长,表明转位子是位于复制子间的接合部。
↓
交叉结构在每一个交错末端(staggeredends)都具有一个单链区。
这些单链区是一种假复制叉(pseudoreplicationforks),供作DNA合成的模板。
(使用这种延伸末端作引物进行复制,意味着必定会发生链的极性断裂在此位点产生一个3-OH末端)。
如果从两个复制叉继续进行复制,就将会通过转位子按两链分开形式进行复制,并终止在该链的末端。
(FromLewinP.1011)(此种复制可能是由寄主编码的功能完成的),此时,交叉结构便变成为一种共合体(cointegrate)——在其上的两个复制子之间的交接处有两个同向重复排列的转位子。
何谓共合体(cointegrate)?
共合体是指由一个具一个转位子的复制子同另一个不具转位子的复制子融合而成的结构,在共合体的两个复制子结合部位具一对同向复制排列的转位子拷贝。
B.非复制型转位
在非复制转位(nonreplicativetransposition)中,转位子是以一种物理实体(physicalentity)直接从基因组的一个位点转移到另一个位点,并因此得以保存。
非复制转位按两种不同的机理进行。
*1.以Mu噬菌体为例,它的非复制转位是通过给体DNA与靶DNA之间的连接作用实现的。
IS因子、复合转位子Tn10和Tn5均按此种机理转位(见图1-3),它涉及转位子在转移过程从给体DNA删除下来。
此种转位机理仅涉及转位酶
非复制型转位过程中删除下来的转位子,插入到靶子位点上,而在给体位点(donorsite)留下空位。
那么在非复制转位之后,给体分子将会发生什么变化呢?
有两种可能性:
①一种可能性是此种给体DNA因此被破坏掉。
由于细菌染色体具有一个以上的拷贝(多拷贝),因此它是能够忍受此种破坏的。
②另一种可能性是,寄主的修复体系能够识别这种双链断裂,并予以修复(repairsestems)。
*2.非复制转位的另一种机理特称为保存型转位(Conservativetransposition)(见下节)
C.保存型转位
正如上节我们已经提到的,保存型转位是属于另一种类型的非复制型转位。
Tn10转位子就是按此种机理进行转位的。
当发生保存型转位时,在转位子编码的转位酶作用下,转位子的末端发生双链切割后便从给体DNA分子上删除下来,而后也是在转位酶的作用下,靶子位点发生交错的切割,以使转位子插入进去(图2-9)。
图2-9保存型转位。
与噬菌体的整合与删除作用相比,在按保存型机理进行的转位子转位过程中不丧失任何核苷酸键。
在保存型转位过程所涉及到的一系列事件中,每一个核苷酸键(nucleotidebond)都被保存下来。
这个过程同噬菌体的整合过程(integration)的机理是十分类似的。
就连所涉及的转位酶也与整合酶(integrase)有亲缘关系。
表2-3复制型转位与非复制型转位的比较
复制型转位
非复制型转位
发生复制
不发生复制
形成共合体
不形成共合体
给体中保留转位子
给体中不留转位子
形成交叉结构
形成交叉结构
二、断裂基因
1.断裂基因概念
(1)定义
真核蛋白质编码基因的序列结构分析发现,在它们的核苷酸序列中间插入有与氨基酸编码无关的DNA间隔区,使一个基因分隔成不连续的若干区段。
我们称这种编码序列不连续的间断基因为断裂基因(splitgene)。
(2)表达程序
断裂基因DNA
转录,帽的形成
polyA尾巴的加入(tailing)
初级转录物——核内不均一RNA
(hnRNA),即前体mRNA
发生删除与拚接
成熟的mRNA
从细胞核进入细胞质
蛋白质多肽链
(3)若干概念
*1.间隔子
在mRNA成熟加工过程中,其转录物被剪除掉的DNA部分叫间隔序列(interveningsequence)。
或间隔子(introns)…间隔子
*2.表达子
被保留下来的DNA部分叫编码序列(codingsequence)或表达子(exons)……………………………………………表达子
*3.RNA剪辑
这种间隔子的删除和表达子的连接形成最后成熟mRNA的过程叫做RNA剪辑(RNAsplicing)………………RNA剪辑
2.间隔子位置的测定
应用S1核酸酶作图法,可以测出在断裂基因中的间隔子的位置。
(1)实验步骤
提取细胞总RNA
同含有一个间隔子的克隆的DNA片段进行核酸杂交
形成异源双链体分子(hetroduplex)
基因的间隔子序列由于没有相应的转录序列,而无法同mRNA分子杂交,因此形成单链的环状结构(DNA-RNA杂种分子)。
用S1核酸酶处理,使单链的DNA环状结构被降解成单核苷酸,于是DNA片段被分解成两个片段。
凝胶电泳,测定这两个片段的分子量大小。
间隔子位置推算(参见《基因工程原理》第3章有关内容)
(2)异源双链体分子定义
同一条双链DNA分子中的两条链分别来自两种不同的个体,如一种是野生型的一种是突变型的,因此在这样的双链DNA分子结构中,有一些甚至是大量的碱基是不能配对的,而形成单链的环状结构。
3.mRNA初级转录本的剪辑
(1)两步机理(two-stopmechanism)剪辑法
绝大多数真核生物基因的mRNA前体(pre-mRNA),有时也叫做核内不均一RNA(hnRNA)(heterogeneonsnuclearRNA),都含有许多间隔子,它们需要在mRNA穿过核膜进入细胞质进行转译之前,通过一种叫做两步机理的剪辑作用而被删除掉。
*1.剪辑体(spliceosome):
这是发生mRNA剪辑作用的一种特殊的高分子量的颗粒。
它含有:
pre-mRNA
高密度的核内小核糖核蛋白(smallnuclearribonucleoprotein,snRNP)颗粒
各种剪辑因子
第一步,在剪辑位点(splicesite)发生切割反应
第二步,涉及3剪辑位点的切割及表达子的连接。
*2.剪辑位点
真核细胞mRNA的5及3的剪辑位点的保守序列。
几乎所有的间隔子序列都是以G-U开始,用A-G结束的。
根据对许多表达子-间隔子边界序列的分析,已经得出了5末端和3末端的优选的保守的核苷酸序列,除了A-G之外,紧挨3剪辑位点上游序列的其它核苷酸,对于进行精确的剪辑作用,同样也是十分重要的。
在间隔子的两端总是具有5GU