分子生物学完整版.docx
《分子生物学完整版.docx》由会员分享,可在线阅读,更多相关《分子生物学完整版.docx(74页珍藏版)》请在冰豆网上搜索。
分子生物学完整版
分子生物学
TheComingofWisdomWithTime
Thoughleavesaremany,therootisone
Throughallthelyingdaysofmyyouth
Iswayedmyleavesandflowersinthesun;
NowImaywitherintothetruth.
----WilliamButlerYeats(1916)
*绪论
进化论与细胞学说结合---现代生物学
1859,《物种起源》--CharlesDarwin
“物竞天择,适者生存”
物种发生变异
将生物学归于自然科学的行列
19世纪中叶,细胞学说
动植物的基本单元是细胞
细胞成为生物学研究的首要对象
分子生物学在遗传学和生物化学的基础上诞生和发展
1857-1864,GregorMendel
奥地利的修道士,1865发表《植物杂交实验》,1884去世,到1900年他的理论才被重新发现。
遗传学的奠基人,对性状遗传产生了理性认识。
1910-1915,T.H.Morgan创立了遗传的染色体理论
以果蝇为材料。
发现了遗传性状的连锁定律。
将代表某一特定性状的基因,同某一特定的染色体联系起来。
对核酸的化学研究
1869年,瑞典的F.Miescher提取了细胞核中的中复合物,不溶于稀酸,可溶于稀碱,含磷的酸性物质,但由于在技术上未能进一步提纯,受到嘲讽,而最终放弃。
核酸的化学研究在这之后的50年停滞,直到Avery的研究才有了突破。
1885—1900年间,Kossel、Johnew、Levine证实核酸最简单的单体结构是碱基-核糖-磷酸构成的核苷酸,有四种类型的碱基AT(U)CG。
1929年又确定了核酸有两种,一种是脱氧核糖核酸(DNA),另一种是核糖核酸(RNA)。
1928年,Griffith肺炎双球菌的转化
英国人,为揭示DNA是遗传物质奠定了基础
第一个以令人信服的实验证明---基因的化学本质是DNA
1935--1944年,OswaldAvery以肺炎链球菌为材料证明,DNA分子是遗传信息的载体。
诱导肺炎球菌类型转化的物质
的化学特性研究
<实验医学杂志>1944
1952年,Hershey和Chase噬菌体感染实验获1969年诺贝尔奖
1956年,A.Gierer和G.Schraman发现烟草花叶病毒(tobaccomosaicvirus,TMV),其遗传物质是RNA。
1957年,美国的HeinzFraenkel-Conrat和B.Singre用重建实验证实了这一结论。
分子生物学的概念
广义:
研究核酸、蛋白质等所有生物大分子的结构、功能及其相互作用的规律,从分子水平上揭示生命现象的本质及生物学规律的科学。
狭义:
基因分子生物学/核酸分子生物学。
在分子水平上研究基因的结构和功能。
主要研究基因的复制、转录、表达和调节控制等过程。
*遗传物质的分子本质
朊病毒
1982年加州大学StanleyB.Prusiner提出这种病由蛋白质侵染颗粒proteinaceousinfectiousparticle(朊病毒)造成的;1991年Science提出唯蛋白学说,1997年获诺贝尔奖),
核酸病毒的繁殖一向是核酸作为遗传物质的重要证据,而朊病毒是不含核酸的蛋白质
病原体
朊病毒蛋白颗粒进入宿主细胞的“自我复制”繁殖,表明生物大分子的构型也是一种
可以传递的信息。
实验证明朊病毒的繁殖是将自身PrPsc的分子结构信息通过与正常膜蛋白PrPc的结
合,在分子伴侣的辅助下,传递给PrPc并将其转化为PrPsc
信息大分子的构型也是一种信息
DNA双螺旋二级结构的多态性
B型:
正常生理条件,或92%相对湿度,一圈10个碱基,大沟宽,小沟窄。
B-DNA是细胞内DNA的主要存在形式。
A型:
75%相对湿度或低温,一圈11个碱基,相对B型来说,大沟窄而深,小沟宽而浅。
RNA局部双螺旋区均呈A构象,RNA-DNA杂交分子呈A构象。
Z型:
左手螺旋,结构比B型细,只有一个沟槽。
Z型构象与基因的表达调控有关。
a.增色效应(hyperchromicshift)
双链DNA缓慢加热,其溶液对紫外光的吸收值增加,该现象称~。
DNA溶液(50mg/ml)在260nm的吸光值:
双链DNAA260=1.00
单链DNAA260=1.37
自由碱基A260=1.6
b.熔链温度(meltingtemperature,Tm)
DNA加热变性时,其紫外吸收光密度值达到最大值的一半时的温度,称熔链温度。
c.影响Tm的因素-破坏DNA双螺旋的条件:
DNA的均一性(Tm范围)
DNA的GC含量(Tm=0.41xX%+69.3)
溶液的pH
溶液的离子强度(离子强度高,Tm高)中和磷酸骨架的负电性。
有机溶剂:
尿素、甲酰胺、甲醇、甲醛(使Tm下降)
一切减弱氢键,碱基堆积力的因素均将使Tm值降低
影响复性速度的因素
aDNA分子的复杂性(复杂性高,复性慢)
表示核酸分子非重复碱基对的数目。
bDNA浓度(浓度高,复性快)
cDNA片段的大小(片段越大,复性慢)
d温度的影响Tm-25℃(60-65℃)
e溶液的离子强度消除polydNt间的静电斥力
C0t值:
复性单链DNA起始浓度和经过的复性时间的乘积。
C0t曲线:
当DNA初始浓度、温度、离子强度、DNA片段大小确定后,以C/C0对logC0t作图,得C0t曲线。
C0t1/2:
复性程度达到一半时的C0t值。
从C0t曲线上可以求得C0t1/2。
C0t1/2直接反应DNA顺序的复杂性。
COt1/2有什么用处?
(1)通过COt1/2值可测原核生物基因组的大小;
已知大肠杆菌的基因组为4.2x106bp,COt1/2=9M.Sec
COt1/2(任何基因组DNA)/9M.sec
=任何基因组大小/4.2X106bp
(2)原核生物基因组大小不同,复性曲线也不同;
(3)可用以区分真核生物和原核生物基因组。
*基因,基因组和基因组学
转座因子:
基因组上不必借助于同源序列就可以移动的DNA片段,它们可以直接从基因组内的一个位点移到另一个位点。
需要转座酶的帮助
Pseudogenes假基因:
核苷酸序列与相应的正常功能基因基本相同,但不能合成出功能蛋白,这些失活的基因称为假基因。
C值(C-value):
一个单倍体基因组的DNA的总量,通常称为该物种的C值(大C值)。
小c值:
编码结构基因DNA的核苷酸数.
拿每一类生物中的最小基因组做比较,每类生物的最小基因组的大小基本上对应于生物在进化上所出地位的高低,进化地位高,形态结构复杂程度高的一类生物,其最小的基因组也较大。
C值矛盾:
生物形态学的复杂性与C值大小不一致,。
1与预期的编码蛋白质的基因数量相比,基因组DNA的含量过多.
2一些物种之间的复杂性变化范围并不大,但C值却有很大的变化.
N值矛盾:
生物体的复杂性与基因数之间并不总是正相关。
K值矛盾:
生物体的复杂性与染色体数之间并不总是正相关。
心脏叶瓶尔小草染色体数1260
重叠基因
1977年Sanger首先发现重叠基因
他对单链环状的噬菌体FX174进行了测序。
5386Nt11基因,3个转录单位,由3个启动子(pA,pB,pD)启动。
FX174含有的5386Nt最多能编码1795个氨基酸,若每个氨基酸的平均分子量为110,则总的蛋白质分子量为197,000Da,但实际蛋白质总分子量却为262,000D。
将全部DNA顺序和蛋白质的氨基酸顺序进行比较,发现了重叠基因。
重叠基因:
指调控具有独立性但部分使用共同基因序列的基因。
基因间共同使用部分空间,但编码产物可以互不相关。
(不同阅读框,不同的编码链)。
提高遗传物质的使用效率,仅在少数原核生物中发现。
断裂基因
R环的发现:
1977年,冷泉港学术年会,Berget和Roerts小组发现,在腺病毒(adenovirus)复制期间,位于感染细胞核中病毒RNA转录本的前体,由于移去了一至数个中间片段而缩短变成分子量较小的mRNA分子,它们转移到细胞质中成为合成蛋白质的模板。
内含子(intron)在初始转录产物hnRNA加工产生成熟的mRNA时,被切除的非编码序列。
外显子(exon)在成熟的mRNA或蛋白质中存在的序列。
高度重复序列(上万到数百万次)(highlyrepeatedsequence)
在基因组中重复~106-107次,简单的高度重复序列:
长度<10bp
复杂的高度重复序列:
长度>100bp
一般不分散,串联成簇排列在异染色质,特别是在着丝粒和端粒附近
缺乏转录必需的启动子,一般不转录
简单的高度重复序列卫星DNA(satelliteDNA)
CsCl密度梯度离心时,出现在覆盖一定浮力密度范围的宽带(主带)的附近,呈一条或几条小带
均是高度重复序列,串联排列
以大的基因簇(100-3000kb)位于异染色质中(着丝粒),不转录
富含A/T,浮力密度小
*小卫星序列(minisatellite)
以小基因簇的形式,重复单位串联排列,小的基因簇(在100bp-10kb之间),
有两种形式,一种为端粒DNA,一种为高度可变的小卫星DNA(variablenumberoftandemrepeats,VNTR序列,可变数目串联重复)位于亚端粒区域,
重复的拷贝数在个体间的差异很大(VNTRlociandDNAfingerprints)
*微卫星序列(microsatellitesequence)
更小的基因簇(<200bp),重复单位小于10bp
均匀分布于常染色质上
个体间差异大,高度的多态性,呈共显性遗传,侧翼序列非常保守
*DNAFingerprinting
由于小卫星和微卫星的重复次数在不同个体中高度可变,这种特定的重复次数就成为某一特定个体的特征。
DNAfingerprinting可以用来鉴定个人与其家族的亲缘关系。
应用:
法医学鉴定遗骸识别亲子鉴定物种进化及起源的应用疾病诊断及癌症研究
"DNA指纹"这个名称的由来:
1984年英国莱斯特大学的遗传学家Jefferys及其合作者首次将分离的人源小卫星DNA用作基因探针,同人体核DNA的酶切片段杂交,获得了由多个位点上的等位基因组成的长度不等的杂交带图纹,这种图纹极少有两个人完全相同,故称为“DNA指纹”,意思是它同人的指纹一样是每个人所特有的。
DNA指纹的图像在X光胶片中呈一系列条纹,很像商品上的条形码。
中度重复序列(几十到几千次)
中度重复序列(10-数10万)包括:
编码序列和非编码序列
编码序列:
rRNA基因、组蛋白基因
非编码序列:
逆转录转座子,包括短散布元件SINES(shortinterspersedelement)(150-300bp)和长散布元件LINE(longinterspersedelement)(5-6kb),重复上千次。
分散在基因组中,许多中度重复序列与单拷贝序列和低度重复序列相间排列。
非编码的中度重复序列,在进化中起着重要的作用。
SINE--Alu家族
DR
DR
IR
IR
AGCT
Alusite
人类基因组中存在最广泛的中度重复序列,平均长度约300bp,拷贝数30~50万,均匀地散布在整个基因组中。
低度重复序列(2-10次)每一种在基因组中的重复次数为2~10,多为编码蛋白质的基因
某些重复序列的核苷酸顺序不完全相同
单拷贝序列(singlecopysequence)
在基因组中只存在一个拷贝,复性最慢。
编码真核生物绝大部分蛋白,表达具有时空特异性。
基因家族(genefamily):
一组功能类似、结构具有同源性的基因。
细胞器基因组
1950s,为了解释某些表型特殊的遗传方式,提出了²extra-chromosomalgenes²。
1960s早期(1962年〕,RisandPlant通过电镜首次证明叶绿体中含有DNA,用DNA酶处理,超薄切片的2.5~3.0mm的纤丝消失,进一步在电镜下观察到环状DNA分子。
几乎所有的真核生物有线粒体基因组;所有的光合真核生物含有叶绿体基因组;一般来讲,细胞器基因组DNA呈环状,也有线状(一些真核微生物酵母等的线粒体基因组都呈线状;有的环状和线状并存,叶绿体中还有小环DNA分子存在.
存在复杂的RNA加工反应,包括切割,顺式-,反式-剪接,RNA的编辑和降解。
在线粒体中,RNA编辑改变DNA密码子的程度在3%-15%。
叶绿体基因组(chroloplastDNA,ctDNA)
线粒体基因组(mitochondriaDNA,mtDNA)
料
1、DNA的生物合成
1、酶学基础
A超螺旋构象变化及与解链有关的酶和蛋白
a.拓扑异构酶II型(引入负超螺旋)
Ⅱ型酶(TopoisomeraseII)由ATP的水解提供能量,在DNA的双链上产生切口,
使另外一条双链DNA得以穿过。
原核:
gyrase(促旋酶Gyrase)利用ATP水解提供能量,向DNA分子引入负超
螺旋,从而抵消DNA复制中产生的正超螺旋。
真核:
TopoⅡ
*TopoisomeraseI:
在DNA的一股链上产生一个切
口,使另一条链得以穿越。
b.解链酶helicase(打开DNA双链)
催化DNA双螺旋解链,具有解链的极性和移位酶活性。
原核:
DnaB(5’®3’)六聚体ATPase
Rep(3’®5’)单体,UvrD
真核:
与pold共纯化因子(5’®3’)
与pole共纯化因子(3’®5’)
c.单链DNA结合蛋白(保持单链状态)
原核:
单链结合蛋白SSB(singlestrandbindingprotein)
真核:
复制蛋白ARPA/复制因子ARF-A
B引发酶(primase)作用:
合成RNA引物
E.coli:
DnaG基因编码,是一种特殊的RNA聚合酶,其引发活性依赖于
DnaB(解链酶)蛋白。
真核生物:
pola的p49p58亚基具有引发酶的活性。
CDNA聚合酶(DNApolymerase)
主要用于复制的DNA聚合酶:
原核:
DNA聚合酶
III
真核:
pol(RNA引物的合成)
pol/polε(DNA的复制)
PCNA(滑动钳)
RFC(钳载复合物)
原核a.DNA聚合酶I
大片段(klenow片段):
5’®3’聚合酶活性(中等)
3’®5’外切酶活性(校对)
小片段:
5’®3’外切酶活性(切RNA引物)
主要生物学功能:
除去RNA引物时,后滞链的修
复;DNA损伤的修复。
应用:
缺口翻译
DNA聚合酶I不是DNA复制的主要聚合酶
*1969年,PaulaDelucia和JohnCairns分离得到的
E.coli突变菌株polA-,其DNApol的活性只有正
常菌株的1%,但是仍然可以正常分裂。
DNApolI的聚合反应速度为103base/min,原
核生物实际的复制速度为105base/min。
DNApolI的进行性(processivity)不高。
b.DNA聚合酶II
5’®3’聚合酶活性;
3’®5’外切酶活性
生物学功能:
与DNA聚合酶I类似,可能在DNA损伤修复中起作用。
c.DNA聚合酶III
多亚基组成,5’®3’聚合酶活性(1000Nt/s),3’®5’外切酶活性
主要生物学功能:
DNA复制所必需
1核心酶:
包含主要的酶活性
2钳载复合物
3滑动钳:
提高酶持续合成的能力
processivity50Kb
τ亚基二聚化
合成速度:
体内1000nt/s
体外700nt/s
聚合酶III的校对功能
1碱基错配,polIII停顿。
2错配碱基移动到外切酶活性中心,被
切除。
3继续DNA合成
DNA聚合酶Ⅲ的组装
后随链的合成需要β滑动钳周期性的装配和解体
真核生物DNA聚合酶:
四种细胞核DNA聚合酶
:
无3’®5’外切酶活性,引物酶
pola是真核生物DNA复制的主要酶类,主要负责RNA引物的合成。
由4种亚基构成,p180、p70、p49、p58、P180具有DNA聚合酶的活性,p49、p58具有引物酶(primase)的活性。
pola的持续合成能力较差,合成40nt的RNA-iDNA后就从DNA模板上脱离。
且没有校正功能。
:
无3’®5’外切酶活性
d:
有3’®5’外切酶活性,后随链合成
pold是真核生物DNA复制的主要酶类,主要负责后随链的合成。
pold的持续合成能力强,且具有3’®5’外切酶活性(即校正功能)。
PCNA(proliferatingcellnuclearantigen增殖细胞核抗原)可以促进pold的持续合成活性,相当于原核polⅢ的β亚基。
(processivityfactor)PCNA相当于原核polⅢ的β亚基。
RFC:
复制因子C,相当于γ复合物。
特异结合于引物-模板复合物,再与PCNA结合,最后结合polδ.
:
有3’®5’外切酶活性,前导链合成
polε前导链/pold后随链是真核生物DNA复制的主要酶类,主要负责DNA的合成以及DNA的切除修复。
polε的持续合成能力强,且具有3’®5’外切酶活性(即校正功能)。
polε的活性不依赖于PCNA。
一种线粒体DNA聚合酶:
有3’®5’外切酶活性
真核DNA聚合酶均无5’®3’外切酶的活性,由FEN1(flapendonuclease,以前简称
MF1)和RNaseH完成引物的切除.
D核酸酶(nucleases)作用:
切除RNA引物
核酸外切酶exonuclease—末端降解
核酸内切酶exdonuclease—内部切割,序列特异
1、E.coli:
DNA聚合酶I/RNaseH
2、真核生物:
FEN1(flapendonuclease,以前简称MF1)和RNaseH1
EDNA连接酶(DNAligase)作用:
连接相邻核苷酸
大肠杆菌DNA连接酶:
NAD
真核DNA连接酶:
ATP
哺乳动物中至少有四个,其中I是涉及后滞链的修复的基本酶。
T4DNA连接酶:
ATP
DNA-DNA:
单链切口、双链粘性末端、平头双链
RNA-RNA连接
*细菌和真核复制体的成分比较
细菌
真核
拓扑异构酶
DNAgyrase
topoII
解链酶
DnaB
多个
单链结合
SSB
RF-A
复制多聚酶
polIII全酶
pol/ε
进行性因子
亚基
PCNA
引发酶/引物酶
DnaG
pol的两个亚基p48p58
引物去除
RNaseH和polI
FEN1和RNaseH
后滞链修复
polI和DNA连接酶
pol/和DNA连接酶
Rf.高级分子生物学要义,p367表26.10
2、DNA复制的详细机制
原核1、复制的起始
a复制的起点和方向
E.coli复制起始点在DNA分子特定的位点,整个染色体只有一个复制起始点
OriC,复制是双方向进行的。
E.coli复制起始点有特殊的序列特征。
复制起始包
括:
对Oric的识别,引发体的形成。
大肠杆菌复制起始点:
OriC长度:
245bp
重复序列:
a.9bp序列:
-TTATNCANA五个拷贝,
为DnaA蛋白结合位点。
b.13bp序列:
-GATCTNTTNTTTT-,
三个拷贝,富含AT。
b引发
DnaA结合于oriC中的9bp重复序列,并
促使3个13bp的重复序列发生解旋,HU蛋白和整合宿主因子IHF起帮助作用。
DnaA引导DnaB-DnaC复合物进入解链区,并由DnaB(解链酶)继续解链。
DnaC的功能是将DnaB运送到复制模板。
3、
链的延伸(拉管模型)
PolⅢ同时催化前导链、后滞链合成。
前导链先于后滞链合成一个片段(落后)。
后滞链模板折返180度,使两条新生链都是5’-3’的方向。
聚合酶与DNA发生反复性的解离与结合:
当后滞链完成一个冈崎片段的合成,即与PolⅢ分开。
同时,前移的引物酶已合成新的RNA引物,后滞链模板再次折返180度,进行下一个冈崎片段的合成。
Trombonemodel
4、链的终止
终止区(terminusregion,ter):
有6个Ter
位点,富含GT。
终止区结合蛋白(Tus):
反解链酶,抑制
DnaB的解链。
复制叉在终止区相遇后,复制停止,复制体解聚。
子代双链DNA分子在拓扑异构酶IV的作用下分开。
*Segregation子链分开
TopoisomeraseIV拓扑异构酶
XerCD位点特异性重组酶
*环状DNA复制的几种方式
q复制(E.coli)
=Cairns复制(1963)
=大肠杆菌双链环状DNA
=双向复制
滚环复制(噬菌体phage)D环复制(细胞器ctmt)
真核:
线性DNA的复制
材料:
酵母,SV40病毒a.核小体障碍b.复制速率低,冈崎片段短c.多复制起点,双向复制d.复制发生S期,在一个细胞周期只进行一次e.端粒DNA的复制(线性DNA的末端复制)
a复制的起点和方向
多复制起点,双向复制:
真核的复制起点到两边的复制终点称为一个复制子(replicon)
或一个复制单位(replicationunite).
复制起点利用的时机由其所处的染色质结构和DNA序列决定。
酵母中有自主复制序列
ARSs(autonomouslyreplicatingsequence)
核心序列11bp,AT-rich
b、引发
1polα-引发酶在复制叉上先合成8-12个bp的RNA引物。
2利用DNA聚合酶活性将RNA引物继续延伸---initiatorDNA,RFC立即与之结合。
3RFC促进PCNA的结合,继而polδ结合,持续合成DNA。
--DNA聚合酶α/δ的转换,polα离开模板。
C、链的延伸
PCNA促进polδ持续合成DNA。
(包括前导链和后滞链)
FEN1/MF1和RNaseH切除RNA引物。
*端粒DNA的复制(线性DNA的末端复制)
半不连续复制机制不能完成真核线性染色体末端的复制。
端粒