分子生物学笔记.docx
《分子生物学笔记.docx》由会员分享,可在线阅读,更多相关《分子生物学笔记.docx(17页珍藏版)》请在冰豆网上搜索。
分子生物学笔记
分子生物学笔记
第一章基因的结构第一节基因和基因组
一、基因(gene)
是合成一种功能蛋白或RNA分子所必须的全部DNA序列.
一个典型的真核基因包括
①编码序列—外显子(exon)
②插入外显子之间的非编码序列—内合子(intron)
③5'-端和3'-端非翻译区(UTR)
④调控序列(可位于上述三种序列中)
绝大多数真核基因是断裂基因(split-gene),外显子不连续。
二、基因组(genome)
一特定生物体的整套(单倍体)遗传物质的总和,
基因组的大小用全部DNA的碱基对总数表示。
人基因组3X109(30亿bp),共编码约10万个基因。
每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-valueParadox)。
人类基因组计划(humangenomeproject,HGP)
基因组学(genomics),结构基因组学(structuralgenomics)和功能基因组学(functionalgenomics)。
蛋白质组(proteome)和蛋白质组学(proteomics)
第二节真核生物基因组
一、真核生物基因组的特点:
?
,
①真核基因组DNA在细胞核内处于以核小体为基本单位的染色体结构中.
②真核基因组中,编码序列只占整个基因组的很小部分(2—3%),
二、真核基因组中DNA序列的分类?
?
(一)高度重复序列(重复次数>lO5)
卫星DNA(SatelliteDNA)
(二)中度重复序列
1.中度重复序列的特点
①重复单位序列相似,但不完全一样,
②散在分布于基因组中.
③序列的长度和拷贝数非常不均一,
④中度重复序列一般具有种属特异性,可作为DNA标记.
⑤中度重复序列可能是转座元件(返座子),
2.中度重复序列的分类
①长散在重复序列(longinterspersedrepeatedsegments.)?
LINES
②短散在重复序列(Shortinterspersedrepeatedsegments)?
SINES
SINES:
长度<500bp,拷贝数>105.如人Alu序列
LINEs:
长度>1000bp(可达7Kb),拷贝数104-105,如人LINEl
(三)单拷贝序列(UniqueSequence)
包括大多数编码蛋白质的结构基因和基因间间隔序列,
三、基因家族(genefamily)
一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同
祖先基因(ancestralgene)经重复(duplication)和突变产生。
基因家族的特点:
①基因家族的成员可以串联排列在一起,形成基因簇(genecluster)或串联重复基因(tandemlyrepeatedgenes),如rRNA、tRNA和组蛋白的基因;
②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;
③有些成员不产生有功能的基因产物,这种基因称为假基因(Pseudogene).
Ψa1表示与a1相似的假基因.
假基因分类。
加工过的假基因(processedpseudogene)。
典型的基因家族
1.tRNA基因?
单倍体人基因组中1300个tRNA基因,tRNA基因簇.
2.rRNA基因
>l00copy.rRNA基因簇(重复单元28S、18S、5.8s-rRNA)
3.组蛋白基因
30-40copy.定位:
7q32-q36
组蛋白基因簇(重复单位:
H1,H2A,H2B,H3、H4)
特点:
无intron,Poly(A)-RNA.?
4.珠蛋白基因
α类:
16p13,基因簇(24Kb):
5’—ζ—Ψζ—Ψα1—α2—α1—3’
β类:
11p15,基因簇(60Kb):
5’—ζ—Gr—Ar—Ψβ—δ—β—3’
四、超基因家族(Supergenefamily,Superfamily)
由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同.
五、人类基因组中的重复序列标记
1、A1u序列
单倍体人基因组50万-100万拷贝,平均每隔3-6Kb就有一个Alu序列,
人A1u序列长300bp:
2X130bp重复序列;?
+31bp间隔序列(中间);
两侧7-21bp正向重复(directrepeats),返座子?
Alu序列广泛散布于人基因组,约90%巳克隆的人基因合有Alu序列
Alu序列标志。
2、可变数串联重复?
?
?
,?
?
Variablenumbertamdemrepeat,VNTR.
又称小卫星DNA(minisatelliteDNA)
由短重复单位(6-40bp)串联重复(6-100次以上)而成,多位于基因的非编码区,广泛分布。
VNTR多态性—分子标记—DNA指纹图(fingerprint).
小卫星DNA突变与肿瘤,H-Ras。
3、短串联重复(shorttandemrepeat,STR)
又称微卫星DNA(microstalliteDNA)
2-6个核苷酸组成的重复单位串联重复(10-60次),两侧为特异的单拷贝序列,人基因组中每l0kbDNA序列至少一个STR序列。
{CA)n,50,000-100,000拷贝.
新一代遗传标记,人类基因组研究,肿瘤,遗传病.
第三节线粒体基因组
人线粒体基因组的特点:
1、人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA(22rRNA,2tRNA).
2、线粒体DNA为母系遗传.
3、结构基因不含内含子,部分区域有基因重叠,因此病理性mtDNA突变更易发生.
4、mtDNA突变频率更高.
5、线粒体DNA突变的表型表达与核DNA不同。
第四节细菌和病毒基因组
一、细菌基因组的特点。
1.功能相关的几个结构基因往往串联在—起,受它们上游的共同调控区控制,形成操纵子结构,
2.结构基因中没有内含子,也无重叠现象。
3.细菌DNA大部分为编码序列。
二、病毒基因组的特点
1.每种病毒只有一种核酸,或者DNA,或者RNA;
2.病毒核酸大小差别很大,3X103一3X106bp;
3.除逆病毒外,所有病毒基因都是单拷贝的。
4.大部份病毒核酸是由一条双链或单链分子(RNA或DNA),仅少数RNA病毒由几个核酸片段组成.?
5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子.
6.有重叠基因.
第五节染色质和染色体
细胞分裂间期—染色质(chromatin)
分裂期—染色体(chromosome)
一、染色质的基本单位—核小体
(一)核小体(nucleosome)结构
DNA绕在组蛋白八聚体(H2A、H2B、H3、H4各一对)核心外1.8周(146bp),形成核小体核心颗粒。
两个核小体核心颗粒之间有LinkerDNA(0-80bp),
核小体核心颗粒+Linker=核小体(长180-210bp)
核小体DNALadder.
(二)组蛋白(histone):
一类小的带有丰富正电荷<富含Lys,Arg)的核蛋白,与DNA有高亲和力.
组蛋白分类:
1.核小体核心组蛋白,H2A,H2B,H3,H4。
分子量较小(102-135aa)
作用:
盘绕DNA形成核小体。
2.H1组蛋白:
较大(220aa),作用:
与LinkerDNA结合后利于核小体稳定和更高级结构的形成?
?
。
二、染色质的高级结构
1、30nm染色质纤丝?
,
2、袢环结构(loopeddomain)?
。
3、细胞分裂期染色体
分裂期染色体=一对姐妹染色单体(Chromatid)
有丝分裂中期46条染色体按大小和形状排列的的光学显微镜图像称为人的染色体核型(Karyotype)
三、染色体的结构要素?
。
(一).着丝粒(centromere):
细胞分裂时染色体与仿锤丝相连结的部位,为染色体的正常分离所必需。
?
(二).端粒(telomere):
真核生物线状染色体分子末端的DNA区域
端粒DNA的特点:
1、由富含G的简单串联重复序列组成(长达数kb).
人的端粒DNA重复序列:
TTAGGC。
2、端粒的末端都有一条12-16碱基的单链3’端突出。
端粒的作用:
防止DNA末端降解,保证染色体的稳定性和功能
(三)、复制原点
第五章?
信号转导
细胞外信号通过与细胞表面的受体相互作用转变为胞内信号并在细胞内传递的过程称为信号转导(signaltransduction)
跨膜信号转导过程包括:
1,胞外信号被质膜上的特异性受体蛋白识别,受体被活化;
2,通过胞内信号转导物(蛋白激酶,第二信使等)的相互作用传递信号;
3,信号导致效应物蛋白的活化,引发细胞应答(如激活核内转录因子,调节基因表达)。
第一节?
胞内信使
细胞内信使(intracellularmessenger)是具有信息传递作用的一些小分子,也称为第二信使(secondmessengers)。
一、cAMP{环磷酸腺苷)?
,
生成:
腺苷酸环化酶催化ATP生成cAMP;
代谢:
cAMP磷酸二酯酶水解cAMP产生5’-AMP
功能:
,
①激活蛋白激酶A
②抑制蛋白磷酸酯酶
二、cGMP(环磷酸鸟苷)
生成酶:
鸟苷酸环化酶
代谢酶:
cGMP磷酸二酯酶
功能:
①激活蛋白激酶G②调控细胞膜离子通道
三、三磷酸肌醇(inositoltriphosphate,IP3)和甘油二酯(diacyglycerol,DAG)
G-蛋白偶联受体激活磷脂酶Cβ生成IP3及DAG
功能:
1、IP3:
开放胞内钙库,激活Ca2+途径.
2、DAD:
在Ca2+和磷脂酰丝氨酸存在下,激活蛋白激酶C,
四、钙离子
细胞内钙离子主要贮存于胞内钙库(如肌细胞的肌浆网,SR)和线粒体中。
细胞质膜两铡[Ca2+]跨膜梯度:
细胞外液>>胞浆
胞浆内[Ca2+]的调节一通过(质膜和钙库膜上的)钙离子通道(进入)和钙泵(出),
钙通道开放的条件:
①质膜或钙库膜去极化(可兴奋细胞);
成②IP3介导钙库膜上钙通道开放(任何细胞).
钙泵激活.线粒体钙泵的作用.
Ca2+功能:
与钙调蛋白(calmodulin,CaM)结合形成Ca2+?
CaM复合物:
①激活腺苷酸环化酶和磷酸二酯酶,②激活Ca2+?
CaM依赖蛋白激酶
钙通道阻断剂及其临床应用。
五、一氧化氮(NO)
NO合成酶催化L-精氨酸生成NO和胍氨酸
NO合成酶(NOS)分类:
①神经元型(nNOS).
②内皮细胞型(ecNOS)
③诱导型(iNOS)
功能:
激活乌苷酸环化酶,刺激cGMP合成。
NO的生理病理作用
第二节蛋白激酶和蛋白磷酸酯酶
蛋白激酶(Proteinkinase,PK)催化蛋白质的含羟基氨基酸(丝/苏和酪)的侧链羟基形成磷酸酯(ATP的γ磷酸基转移至氧).
蛋白质磷酸酯酶(Proteinphosphatase,PPase)催化磷酸蛋白的磷酸酯键水解而去磷酸化。
细胞内任何一种蛋白质的磷酸化状态是由蛋白激酶和蛋白磷酸酯酶的两种相反酶活性之间的平衡决定的。
蛋白质可逆磷酸化的调节在信号转导过程中有重要作用,是细胞生命活动的调控中心。
一、信号转导过程中的蛋白激酶
{一)丝氨酸/苏氨酸蛋白激酶(Ser/ThrPK)
是一大类特异地催化蛋白质的丝氨酸和苏氨酸残基磷酸化的激酶家族,参与多种信号转导过程。
1、蛋白激酶A(PKA)
-cAMP依赖性蛋白激酶.
PKA由两个催化亚基C和两个调节亚基R所构成
PKA参与cAMP介导的转录水平调控。
PKA的其它(下游)底物:
①多种代谢相关酶②核内组蛋白和非组蛋白③膜蛋白等。
2、蛋白激酶C(PKC)
-Ca2+激活的/磷脂依赖性蛋白激酶.
调节:
可被Ca2+,DAG和磷脂酰丝氨酸激活.TPA(佛波酯)也可激活.
PKC分子由N-端的调节区和C—端催化区(亲水的蛋白激酶结构域)所组成。
PKC有多种亚型(>12种).
PKC可激活:
①受体,如EGFR,胰岛素受体,细胞因子受体等。
②细胞骨架蛋白如Map,Tau.
②膜蛋白,如Na+-H+交换蛋白,Ca2+-ATP酶等.
④核蛋白/转录因子,起始因子等,
⑤信号转导物如鸟苷酸环化酶,Raf-1等.
3、Ca2+?
钙调蛋白依赖性蛋白激酶(Cam-PK)
Cam-PKII是一种多功能的蛋白激酶.
4。
cGMP依赖的蛋白激酶(PKG)
功能:
调节胞内钙离子.
5,DNA依赖的蛋白激酶(DNA-PK)
调节:
结合游离DNA片段后被激活,
底物:
核内DNA结合蛋白和转录因子,如SPl,Fos/Jun,Myc和P53,
作用:
①参与DNA修复和重组,
②通过激活TF调节基因表达;
③参与细胞周期的关卡机制(Checkpoint).
6.丝裂原激活的蛋白激酶(Mitogen-activatedproteinkinase,MAPK)
调节:
MAPK激酶-MAPKK(MEK)。
下游底物:
核内转录因子如Myc,Jun,Ets及其它胞内蛋白.
(二)酪氨酸蛋白激酶(Tyrosineproteinkinase,TPK)
—特异地催化蛋白质的酪氨酸残基磷酸化,
蛋白质酪氨酸磷酸化在细胞生长,分化和转化的调节中起重要作用。
1、经典的src激酶家族
原癌基因c-src蛋白产物Src是一种酪氨酸蛋白激酶,它有三个基本结构域:
从C-端至N--端依次为SH1、SH2,SH3(SH=srchomolog)。
SHl结构域:
具酪氨酸激酶活性,
SH2结构域:
能识别并结合含磷酸化酪氨酸的短序列,
SH结构域:
通过脯氨酸和疏水性氨基酸残基与靶蛋白结合,
Src家族:
包括原癌基因src,yes,lyn,fyn,lck,blk,fgr,bcd和yrk编码蛋白,它们都有TPK活性.共同参与细胞转化的信号转导过程.
SH2结构域在信号转导途径中的重要作用:
由于含SH2结构域的信号转导分子可以识别和结合其他含磷酸化酪氨酸的蛋白,因此,通过蛋白质的酪氨酸磷酸化/去磷酸化调节可以决定信号转导分子的结合与解离,从而导致信号的开启或关闭。
2、JAK嫩酶家族
JAK(Januskinase)激酶家族包括Jakl,Jak2,Jak3,Tyk2等,
Jak激酶具有一个TPK结构域和一个激酶样结构域,它们与Src的TPk激酶结构域具有同源性,但JaK激酶没有SH2,SH3结构域;
Jak激酶主要参与细胞因子的信号转导.
二、蛋白磷酸酯酶对磷酸化的调节
(一)、丝氨酸/苏氨酸蛋白磷酸酯酶?
这类酶选择性地作用于含磷酸丝氨酸或磷酸苏氨酸残基的肽链,使之脱去磷酸基团并改变生物活性.
主要成员:
PPl,PP2A,PP2B,PP2C,等.
PP2A,催化亚基及其功能.?
(二)酪氨酸蛋白磷酸酯酶(PTPase)
蛋白质酪氨酸磷酸酯酶催化磷酸化酪氨酸残基的去磷酸化反应,与相应的酪氨酸蛋白激酶共同调节蛋白质的磷酸化水平,
PTPase家族可分为2类:
1、胞质型(非受体型):
小的可溶性蛋白,只有一个催化结构域,
特点是合有SH2domain,如PTPlC,,PTPlB等.?
,
2.受体型(PTPR),是大的跨膜蛋白,特点是有2个串联的胞浆催化结构域,如白细胞共同抗原CD45,
PTPlC(存在于造血细胞):
N端2个串联重复的SH2结构域{识别Tyr?
P,并指导蛋白与蛋白结合),C端为磷酸酯酶催化结构域。
Jak可作为PTP1C底物.
PTPase基因可能是肿瘤抑制基因.
第三节?
细胞膜受体介导的信号转导
一、受体的分类
质膜受体和胞内受体(胞浆或核受体,如类固醇激素受体)
膜受体的分类:
(一)G蛋白耦联受体家族
又称为七次胯膜受体家族,特点是具有七段跨膜的α螺旋结构,本身无酶活性,胞浆侧肽链上有磷酸化位点,受体功能受磷酸化调节。
成员;肾上腺素受体、多巴受体、视紫红蛋白等。
(二)酪氨酸激酶受体家族
受体本身胞浆侧有蛋白酪氨酸激酶活性,并且胞浆侧肽链上有自身磷酸化位点,配基结合后受体形成二聚体,二聚体中每个亚基可以磷酸化对应的另一亚基,从而启动信号转导。
这类受体主要包括多数生长因子受体(如IGF,EGF,PDGF,NGF,SCF,HGF等生长因子的受体),除胰岛素受体外,这类受体均由一条肽链组成.
(三)细胞因子受体家族
这类受体本身无TPK活性,但其胞浆侧近膜部分有非受体酪氨酸蛋白激酶的结合位点,在配基与受体结合后,受体发生二聚化或寡聚化,并激活Jak族蛋白酪氨酸激酶.
此类受体包括细胞因子受体以及生长激素、促乳素等受体.
细胞因子(cytokine):
是淋巴细胞和造血细胞产生的一大类对细胞生长和分化有调节作用的蛋白因子。
包括干扰素(IFN)、白细胞介素(IL)、白血病抑制因子(LIF)、抑癌素M等(但IL-8R为G蛋白藕联受体)
(四)离子通道受体
与配基结合后构成离子通道,主要存在于神经突触,如乙酰胆碱(ACH),5-HT受体等。
二、G蛋白介导的信号转导?
。
G蛋白藕联受体的信号转导途径由三部分组成:
①细胞膜受体;②G蛋白③效应物(effector),其中G蛋白将受体与效应物藕联.
G-蛋白(G-protein)是一种鸟苷酸结合蛋白,是由α、β和γ三个亚基组成的异三聚体,多,β和γ亚基总是紧密结合在一起作为一个功能单位Gβγ
Gα亚基可分为Gs,Go,Gi,Gq等,其活性可被霍乱毒素(CT)或百日咳毒素(PT)修饰。
G-蛋白介导的信号转导的机制:
G-蛋白循环。
G-pr的效应物:
离子通道、腺苷酸环化酶、磷脂酶C、磷脂酶A2等
三、RAS-MAPK信号转导途径
1、途径中的信号分子
Ras:
具鸟苷酸结合活性的一种胞浆蛋白(与G-蛋白不同)
Ras活性与其结合的鸟苷酸有关。
鸟苷酸交换因子(SOS)
Ras?
GDP?
Ras?
GTP
(失活)?
GTP酶激活蛋白(GAP)?
(激活)
接头蛋白:
生长因子受体结合蛋白Grb2,通过其SH2结构域与Tyr被磷酸化的受体结合,同时通过其SH3域与具有pro富集区的SOS结合,并通过SOS活化Ras蛋白.
2、Ras-MAPK途径:
生长因子→生长因子受体(具酪氨酸激酶活性)→含有SH2结构域的接头蛋白(如Grb2)→鸟苷酸交换因子SOS→Ras-GTP→Rafl→MAPKK(MEK)→MAPK→转录因子→调节基因表达。
3.Ras-MAPK途径的调节
①Ras-MAPK途径中信号转导分子的突变(如Ras)和表达量的改变.
②其他信号转导途径的影响
cAMP-PKA:
抑制Raf-1;?
PKC:
活化Raf~l,
四、Jak-stat途径:
STAT:
信号转导物与转录激活剂(signaltransducerandactivatorsoftranscription)
至少6种,分子量84-113KD,含一个SH2结构域(羧端),一个SH3样结构域,并合有DNA结合域,Stat的激活依赖通过磷酸化形成二聚体.
Jak-Stat途径:
细胞因子→受体(二聚体化)→Jak→Stat→Stat二聚体(活化)→易位至核,影响转录.
拓扑异构体的互变由拓扑异构酶催化。
发生一条链或两条链的断开和连接。
拓扑异构体:
具有完全相同的碱基顺序,但L值不同的超螺旋。
分为I,II型
两种拓扑异构酶:
TopoisomeraseI,II
第三节DNA双螺旋的呼吸作用
甲醛的变性实验
呼吸作用的定义
碱基对的稳定性
生物学作用
第四节DNA的变性复性和分子杂交
一、变性(溶解)
在某些物理化学因子的作用下,DNA双链间的氢键断裂,双链解离形成单链。
㈠性质变化
增色效应;黏度降低;沉
降速度增加。
㈡因素
⑴温度:
温度升高引起的
DNA变性称热变性。
加热
使氢键断裂。
可用热变性曲线描述热变
性过程。
见下图
融点Tm:
50%DNA分子解链时的温度。
融点与DNA分子中的GC有关,随(G+C)%
的含量呈线性增加
⑵化学:
甲酰胺破坏氢键
二、复性
去除变性条件后,单链DNA在适当条件下重新形成双链,回复到原有的物理和生物学特性。
㈠复性动力学
复性过程是两条单链DNA碰撞形成双链DNA的过程,是双分子反应。
服从二级反应动力
学规律。
控制复性反应的两个参数是C0和t
Rateofreaction
Thereactionfollowsthesecondorderequation
CistheconcerntrationofDNAthatissingle-strandedattimet
kisareassociationrateconstant.
Progressofreaction
Integratetherateequationbetweenthelimits;
InitialconcerntrationofDNA=C0attimet=0;
Concentrationremainingsinglestranded=Caftertimet
CriticalparameterisC0t1/2
Whenthereactionishalfcompleteatthetimet=1/2
ThereforeC0t1/2=1/k.
复性反应进行到50%时的C0.t为C0t1/2
C0t曲线:
用已经复性的DNA浓度,即1-C/C0
对C0t的对数作图。
如右图所示.
C0t值的意义:
C0t1/2值可以用来表示反应体系
中DNA的总长度(单拷贝)。
这种总长度称为
DNA的复杂性。
通过测定复性动力学可以预测
基因组的大小。
真核基因组DNA的复性动力学:
第1是快复性动力学组分,高度重复序列。
第2是中复性动力学组分,中度重复序列。
第3是慢复性动力学组分,单拷贝序列。
X:
DNA的复杂性
C0t曲线特征:
⑴原核生物每种图形的现状
大致相同;⑵重复序列多,复性快。
曲线意义:
求DNA的复杂度。
三、分子杂交
原理:
基于DNA的变性与复性的特性。
双链DNA加热以后,变成单链,在去除变性条件
后,在一定的条件下,具有互补顺序的DNA
能再形成双链。
探针:
一种标记的一段DNA或RNA,与待
测基因序列的DNA或RNA互补
分子杂交技术的种类:
⑴固相杂交(待测核
酸固相化);⑵Southernblot,待测核酸为DNA;⑶Northernblot,待测核酸为RNA。
液相原位杂交示意图:
⑴Dotshybridization,点状杂交,待测核酸为DNA或RNA;⑵Colony
orplaquehybridization,菌落或噬菌班杂交,待测核酸为DNA。
⑶Tissuehybridization,组织
原位杂交,检测mRNA表达和定位。
研究基因的定位,拷贝数,测序。
菌落原位杂交:
基因文库:
染色体DNA文库,cDNA文库。
第三章基因和基因组
一、原核生物基因组
⒈特征
⑵通常含有质粒;
⑶操纵子结构;
⑷顺反子;
⑴只有一个染色体;
⑸有SD序列;
⑹基因重叠;
⑺一般没有内含子;
⑻只有一个复制起