北京大学分子生物学笔记.docx
《北京大学分子生物学笔记.docx》由会员分享,可在线阅读,更多相关《北京大学分子生物学笔记.docx(48页珍藏版)》请在冰豆网上搜索。
北京大学分子生物学笔记
北京大学分子生物学笔记
第一章基因的结构
第一节基因和基因组
一、基因(gene)
是合成一种功能蛋白或RNA分子所必须的全部DNA序列.
一个典型的真核基因包括
①编码序列—外显子(exon)
②插入外显子之间的非编码序列—内合子(intron)
③5'-端和3'-端非翻译区(UTR)
④调控序列(可位于上述三种序列中)
绝大多数真核基因是断裂基因(split-gene),外显子不连续。
二、基因组(genome)
一特定生物体的整套(单倍体)遗传物质的总和,
基因组的大小用全部DNA的碱基对总数表示。
人基因组3X109(30亿bp),共编码约10万个基因。
每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-valueParadox)。
人类基因组计划(humangenomeproject,HGP)
基因组学(genomics),结构基因组学(structuralgenomics)和功能基因组学(functionalgenomics)。
蛋白质组(proteome)和蛋白质组学(proteomics)
第二节真核生物基因组
一、真核生物基因组的特点:
,
①真核基因组DNA在细胞核内处于以核小体为基本单位的染色体结构中.
②真核基因组中,编码序列只占整个基因组的很小部分(2—3%),
二、真核基因组中DNA序列的分类•
(一)高度重复序列(重复次数>lO5)
卫星DNA(SatelliteDNA)
(二)中度重复序列
1.中度重复序列的特点
①重复单位序列相似,但不完全一样,
②散在分布于基因组中.
③序列的长度和拷贝数非常不均一,
④中度重复序列一般具有种属特异性,可作为DNA标记.
⑤中度重复序列可能是转座元件(返座子),
2.中度重复序列的分类
①长散在重复序列(longinterspersedrepeatedsegments.)LINES
②短散在重复序列(Shortinterspersedrepeatedsegments)SINES
SINES:
长度<500bp,拷贝数>105.如人Alu序列
LINEs:
长度>1000bp(可达7Kb),拷贝数104-105,如人LINEl
(三)单拷贝序列(UniqueSequence)
包括大多数编码蛋白质的结构基因和基因间间隔序列,
三、基因家族(genefamily)
一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同
祖先基因(ancestralgene)经重复(duplication)和突变产生。
基因家族的特点:
①基因家族的成员可以串联排列在一起,形成基因簇(genecluster)或串联重复基因(tandemlyrepeatedgenes),如rRNA、tRNA和组蛋白的基因;
②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;
③有些成员不产生有功能的基因产物,这种基因称为假基因(Pseudogene).
Ψa1表示与a1相似的假基因.
假基因分类。
加工过的假基因(processedpseudogene)。
典型的基因家族
1.tRNA基因
单倍体人基因组中1300个tRNA基因,tRNA基因簇.
2.rRNA基因
>l00copy.rRNA基因簇(重复单元28S、18S、5.8s-rRNA)
3.组蛋白基因
30-40copy.定位:
7q32-q36
组蛋白基因簇(重复单位:
H1,H2A,H2B,H3、H4)
特点:
无intron,Poly(A)-RNA.
4.珠蛋白基因
α类:
16p13,基因簇(24Kb):
5’—ζ—Ψζ—Ψα1—α2—α1—3’
β类:
11p15,基因簇(60Kb):
5’—ζ—Gr—Ar—Ψβ—δ—β—3’
四、超基因家族(Supergenefamily,Superfamily)
由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同.
五、人类基因组中的重复序列标记
1、A1u序列
单倍体人基因组50万-100万拷贝,平均每隔3-6Kb就有一个Alu序列,
人A1u序列长300bp:
2X130bp重复序列;
+31bp间隔序列(中间);
两侧7-21bp正向重复(directrepeats),返座子?
Alu序列广泛散布于人基因组,约90%巳克隆的人基因合有Alu序列
Alu序列标志。
2、可变数串联重复•,•
Variablenumbertamdemrepeat,VNTR.
又称小卫星DNA(minisatelliteDNA)
由短重复单位(6-40bp)串联重复(6-100次以上)而成,多位于基因的非编码区,广泛分布。
VNTR多态性—分子标记—DNA指纹图(fingerprint).
小卫星DNA突变与肿瘤,H-Ras。
3、短串联重复(shorttandemrepeat,STR)
又称微卫星DNA(microstalliteDNA)
2-6个核苷酸组成的重复单位串联重复(10-60次),两侧为特异的单拷贝序列,人基因组中每l0kbDNA序列至少一个STR序列。
{CA)n,50,000-100,000拷贝.
新一代遗传标记,人类基因组研究,肿瘤,遗传病.
第三节线粒体基因组
人线粒体基因组的特点:
1、人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA(22rRNA,2tRNA).
2、线粒体DNA为母系遗传.
3、结构基因不含内含子,部分区域有基因重叠,因此病理性mtDNA突变更易发生.
4、mtDNA突变频率更高.
5、线粒体DNA突变的表型表达与核DNA不同。
第四节细菌和病毒基因组
一、细菌基因组的特点。
1.功能相关的几个结构基因往往串联在—起,受它们上游的共同调控区控制,形成操纵子结构,
2.结构基因中没有内含子,也无重叠现象。
3.细菌DNA大部分为编码序列。
二、病毒基因组的特点
1.每种病毒只有一种核酸,或者DNA,或者RNA;
2.病毒核酸大小差别很大,3X103一3X106bp;
3.除逆病毒外,所有病毒基因都是单拷贝的。
4.大部份病毒核酸是由一条双链或单链分子(RNA或DNA),仅少数RNA病毒由几个核酸片段组成.
5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子.
6.有重叠基因.
第五节染色质和染色体
细胞分裂间期—染色质(chromatin)
分裂期—染色体(chromosome)
一、染色质的基本单位—核小体
(一)核小体(nucleosome)结构
DNA绕在组蛋白八聚体(H2A、H2B、H3、H4各一对)核心外1.8周(146bp),形成核小体核心颗粒。
两个核小体核心颗粒之间有LinkerDNA(0-80bp),
核小体核心颗粒+Linker=核小体(长180-210bp)
核小体DNALadder.
(二)组蛋白(histone):
一类小的带有丰富正电荷<富含Lys,Arg)的核蛋白,与DNA有高亲和力.
组蛋白分类:
1.核小体核心组蛋白,H2A,H2B,H3,H4。
分子量较小(102-135aa)
作用:
盘绕DNA形成核小体。
2.H1组蛋白:
较大(220aa),作用:
与LinkerDNA结合后利于核小体稳定和更高级结构的形成•。
二、染色质的高级结构
1、30nm染色质纤丝,
2、袢环结构(loopeddomain)。
3、细胞分裂期染色体
分裂期染色体=一对姐妹染色单体(Chromatid)
有丝分裂中期46条染色体按大小和形状排列的的光学显微镜图像称为人的染色体核型(Karyotype)
三、染色体的结构要素。
(一).着丝粒(centromere):
细胞分裂时染色体与仿锤丝相连结的部位,为染色体的正常分离所必需。
(二).端粒(telomere):
真核生物线状染色体分子末端的DNA区域
端粒DNA的特点:
1、由富含G的简单串联重复序列组成(长达数kb).
人的端粒DNA重复序列:
TTAGGC。
2、端粒的末端都有一条12-16碱基的单链3’端突出。
端粒的作用:
防止DNA末端降解,保证染色体的稳定性和功能
(三)、复制原点
第二章DNA的复制、修复和重组
第一节DNA的复制(DNAReplication)
一、DNA复制的基本特性
1.半保留性(Semi-Conservative)
Meselson-Stahl实验
2.双向复制(一般)
复制起始点(origin)+两侧复制叉=复制单位(复制子,Replicon)
3.半不连续性(Semi-discontinuous)
前导链(leadingstrand)-连续合成
随从链(LaggingStrand)-不连续,由岗崎片段(okazakifragment)连接而成.
二、DNA复制必需的成份(真核生物)
1.染色体DNA复制必需三种核苷酸序列①复制起点②着丝粒③端粒.
2.RNA引物(RNAPrimer)
一般8-14nt.带游离3'-OH末端.
3.参加DNA复制的主要酶和蛋白质
①DNA聚合酶(DNAPolymerase)
真核DNA复制的主要酶DNAPola/δ.
功能:
从5'-3'方向延伸与模板互补的子代链.
②引发酶(Primase)
与其他多种蛋白组成多蛋白复合体-引发体(Primosome).催化RNA引物合成和复制起始.
③DNA连接酶(DNALigase)
催化一个双链DNA的5'磷酸与另一双链DNA的3'-OH形成磷酸二酯键.
④DNA解链酶(DNAHelicase),打开DNA双链.
⑤增殖细胞核抗原(Proliferatingcellnuclearantigen.PCNA)
辅助催化前导链合成.
⑥端粒酶(Telomerase)
末端复制问题。
端粒酶负责染色体末端(端粒)复制,是由RNA和蛋白质组成的核糖核蛋白.其中的RNA成分是端粒复制的模板.(因此端粒是逆转录酶)
作用:
维持端粒长度.
端粒酶活性可用基于PCR的“TRAP”(Telomeraserepeatamplificationprotocol)法测定(Kim,Netal.,science,266,2011-2014(1994)
端粒与细胞寿命。
端粒、端粒酶与肿瘤的关系:
绝大多数恶性肿瘤具有端粒酶活性但端粒缩短,但也有约5%的肿瘤无端粒酶活性且端粒较长。
端粒酶作为新的肿瘤标志和肿瘤治疗靶点.
第二节DNA修复(DNArepair)
DNA修复是维持基因组完整性的重要机制,在保护基因组避免发生可能导致肿瘤或遗传疾病的突变中起关键的作用。
引起DNA损伤的因素:
1、细胞内源性损伤因素:
DNA复制错误;自发损伤包括碱基互变异构、碱基脱氨(C→U、A→I)和碱基丢失等;氧化代谢副产物如活性氧物质(Reactiveoxygenspecies,ROS)的攻击等。
2、环境中的损伤因素:
辐射(含紫外线、X射线)产生胸腺嘧啶二聚体;化学致癌物(氧化脱氨,烷化剂或代谢活化物如苯并芘、黄曲霉素等产生碱基加合物)
一、碱基切除修复(Baseexcisionrepair、BER)
该途径中最关键的是必须通过一种糖苷酶(glycosylase)先除去变异碱基(如被氧化、烷基化或脱氨的碱基),该糖苷酶催化连接损伤碱基与脱氧核糖之间的糖苷键水解,释放游离碱基并在DNA中产生一个去碱基位点,然后由去嘌呤/去嘧啶(AP)核酸内切酶、DNA聚合酶和DNA连接酶等利用相对的一条正常链为模板进行修补合成。
BER途径中的重要糖苷酶:
(1)尿嘧啶DNA糖苷酶(UDG),从DNA中除去尿嘧啶碱基;
(2)3—甲基腺嘌吟(3MeA)DNA糖苷酶,可修复烷化剂产生的损伤;
(3)负责修复DNA氧化损伤的糖苷酶(如Fpg/MutMDNA糖苷酶)
BER是修复内源性DNA损伤(自发水解、烷基化和活性氧攻击)的主要途径,因此对于降低自发突变的频率、防止肿瘤发生有重要作用。
二、核苷酸切除修复(Nucleotideexcisionrepair,NER)
首先由多聚体复合物识别损伤,再在损伤的两侧进行切除。
随着DNA链被解开,包含损伤的单链片段释放出来,留下的缺口由DNA聚合酶填补,DNA连接酶封闭。
该途径包括20种以上蛋白,可以修复紫外辐射诱导的环丁烷嘧啶二聚体(CPD)和(6—4)光产物((6—4)PPs),以及一些化学物质产生的大加合物。
人的NER系统有关基因及其蛋白质产物功能。
NER系统缺陷与着色性干皮病(Xerodermpigmentosum,XP)
NER可再分为二条子途径:
(1)全基因组修复(GlobalGenomicrepair,GGR)途径:
修复整个基因组内的损伤,其效率取决于损伤的化学特性、损伤部位的DNA序列和染色质结构。
(2)转录藕联修复(Trancsription—coupledrepair,TCR,):
特异地修复基因组中具有转录活性(即表达)的基因的被转录DNA链上的损伤,该途径的特点是依赖RNA聚合酶II催化的转录,其中的一些蛋白是普通转录因子TFIIH的亚基。
三、错配修复(Mismatchrepair)
负责修复DNA复制过程中由于错误掺入而产生的错配。
STR序列复制-模板链的滑动产生小的环状突出(loop)-重复序列扩张(expansion)或丢失:
微卫星不稳定性(microsatelliteinstability)
Ecoli中的MMR途径需要mutS,mutH,mutL和uvrD基因产物和特异性核酸外切酶、DNA聚合酶和DNA连接酶等。
在酵母和人类已鉴定了mutS,mutH的多种同源物。
遗传性非息肉性结肠癌(HNPCC)基因缺陷。
微卫性不稳定与肿瘤。
新的肿瘤基因诊断标志。
四、重组修复(Recomhinantrepair)
修复DNA的两条链均受损伤的部位的双链断裂或链间交连。
Furtherreadings:
1WoodRD,DNArepairineukaryotes,AnnRevBiochem,1996,65:
135—167
2KrokanHE,eta1.,DNAglycosylaseinthebaseexcisionrepairofDNA.BiochemJ,1997,325:
1—16
3VrielingH,eta1.,Transcriptioncoupledrepairanditsimpactonmutagenesis,MutationRes,1998,400:
135—142
第三节重组(recombination)
重组的本质是基因的重排或交换.即2个DNA分子间或一个DNA分子的不同部位间,通过断裂和重接,交换DNA片段从而改变基因的组合和序列.
一.同源重组(Homologousrecombination)
指DNA同源序列间的重组,常发生于两个较长的同源DNA片段或同源染色体之间。
可通过同源重组将外源基因定位整合到细胞基因组中.
二.转座(transposition)
可移动的DNA元件(mobileDNAelements)
-转座元件(Transposableelement).它是指那些可在DNA分子内
或DNA分子间转移的DNA片段.
转座元件的转移过程-转座
转座的特点:
1.转座后原来位置的转座元件序列仍然保留,但同时又把新合成的DNA复本插入到另外一个位点.
2.转座过程需要转座酶(transposase).它催化断裂和重接两步连续的过程(需要M2+)
3.转座元件插入位置的两茶有3-12bp的正向重复序列(靶序列),它是由于转座酶错位切割DNA造成的.这种短正向重复序列是存在转座元件的特征.
转座元件的分类
①转座子(transposon):
通过DNA复制而转移的转座元件.
②逆转座子(retroposon)或返座子,通过RNA阶段实现转移的转座元件(DNA→RNA→DNA→插入新位点)
逆转座子例:
Alu.LINE1.逆假基因(retro-pseudogene)
转座的遗传效应-导致基因重排、插入、缺失。
第三章基因表达的调控
基因表达:
DNA→mRNA→蛋白质的遗传信息传递过程
基因表达的调控
第一节基因的活化
基因的“开关”-染色质的活化
一、活性染色质的结构
间期核染色质:
异染色质(heterochromatin),高度压缩(不转录);
常染色质(euchromatin),较为松散,
常染色质中约10%为活性染色质(更开放疏松)。
活性染色质→←非活性染色质
二、活性染色质的结构特点
(一)DNaseI敏感性
转录活性(或有潜在转录活性)的染色质对DNaseI更敏感.
DNaseI超敏感位点(DNaseIHyperSensitiveSites,DHSS)
(二)组蛋白H3的CyS110上巯基暴露,
三、活性染色质结构的形成
(一)、核小体位相(Phasedpositioning)
1.核小体的旋转定位(rotationalpositioning)
指核小体核心与DNA双螺旋在空间结构中的相互关系,主要包括DNA双螺旋的大沟是面向还是背向核心结构.‘
2.核小体的平移定位(translationalpositioning)
指核小体与特定DNA序列的结合位置和方式,特别是转录活性相关的DNA调控元件(启动子、增强子等)序列与核小体的相互位置关系。
(二)、组蛋白修饰
1.H1组蛋白磷酸化
促进染色体包装,影响转录活性,
2.核心组蛋白修饰
乙酰化:
常发生在组蛋白的Lys,
一般活性染色质是高度乙酰化的。
(三)HMG蛋白结合
HMG(highmobilitygroup)蛋白—高迁移率蛋白,如HMG14/HMG17.
与核小体核心颗粒结合,有利转录。
四、DNA甲基化与基因表达.
(一)、真核生物基因组DNA的甲基化(Methylation)
哺乳动物基因组中5%的C为甲基化(mC),mC主要存在于CpG二核苷酸中.
CpG二核苷酸序列常成簇聚集并零散地分布于人基因组中,形成CpG岛(CpGislands).人基因组中约每10Kb就有一个CpG岛.
CpG岛常与基因相连(可作为寻找基因的标记)。
(二)DNA甲基化的转录抑制作用。
基因表达与甲基化呈负相关
基因甲基化状态:
1、高度甲基化:
基因为持续失活(如女性的一条X染色体;
2、诱导去甲基化:
如组织或发育阶段特异性表达基因;
3、持续低水平甲基化:
具有转录活性(如持家基因)。
持家基因(housekeepinggene):
是指对所有类型组织细胞在任何时候都需要其表达的基因,通常都是维持细胞基本生存所必须的基因,其表达常保持在固定的水平。
又称为组成性基因(Constitutivegene)。
(三)甲基化与基因组印迹
基因组印迹(genomicimprinting):
指基因表达活性只局限于来自双亲之一的基因版本。
被印迹(imprinted)的基因.
基因组印迹的机制--DNA高度甲基化
基因组印记与肿瘤.
第二节转录水平的调控
转录水平的调控是基因表达调控中最重要的环节。
一、真核基因转录基本条件:
特异性基因转录的基本条件包括:
①启动子(特别是核心启动子)
②转录模板(转录起始点(+1)---终止点)
③RNAPolⅡ
④普通转录因子(GTFs)
(一)启动子(promoter)
与基因转录启动有关的一组DNA序列,一般位于RNApoII转录起始点上游100-200bp以内,其功能是决定转录的起始点和调控转录频率.
启动子区域包括核心启动子和启动子上游近侧序列:
1、核心启动子(corepromoter)
是决定转录起始位置的关键序列,也是普通转录因子TFⅡD的结合位点,
①TATA盒(TATAbox)位于转录起始点上游-25~-30bp.
②起始子(initiator,Inr)Inr是与转录起始位点重叠的短的较保守序列.
注:
①不是所有基因都含有TATA盒或Inr序列.有的只有其中之一,有的两者都无.
②这些核心启动子的序列和它们之间的间隔多变
2、上游启动子元件(UpstreamPromoterelement,UPE)
位于较上游(-30一-110bp),能较强影响转录起始的频率,如CAAT盒和GC盒.其中GC盒是转录因子SPl的结合位点。
(二)RNA聚合酶Ⅱ
负责真核生物蛋白编码基因的转录(产物mRNA),有7-10个亚基,最大亚基的羧基末端结构域(CTD)具有7个氨基酸(Tyr-Ser-Pro-Thr-Ser-Pro-Set)的重复序列,其中有多个磷酸化位点.CTD磷酸化对调控基因转录有重要作用.
(三)基础转录因子(basaltranscriptionfactor)
真核基因转录除RNA聚合酶外还需要许多蛋白因子—转录因子参加,其中一些转录因子是RNA聚合酶Ⅱ转录起始必需的,并且可以维持基础水平的转录,因此称为基础转录因子或普通转录因子(generaltranscriptionfactor)
1.RNA聚合酶II的普通转录因子(TFII)
包括TFIID,TFⅡB,TFIIF,TFIIE,TFIIH,TFIIA等.
TFIID是由TATA盒结合蛋白(TATAbindingprotein,TBP)和8种TBP协同因子(TBPassociatedfactor,TAF)组成的复合物,TFIID可识别和结合核心启动子(TATA盒和Inr);
TFⅡB的C端与TFIID和DNA的复合物结合,N-端与TFⅡF协同作用募集RNA聚合酶II,再加上TFIIE,TFIIH形成完整的转录复合物.
TFIIH有蛋白激酶活性,可使RNAPol最大亚基CTD磷酸化,使转录起始过渡到转录延伸.
TFIIA有助于TFIID与TATA盒核心启动子结合.
2、TAF的作用
TFIID中包括至少8种TBP协同因子,分子量为30—250kD,分别命名为TAFⅡ-30~250.
TAFⅡ150识别起始子(1nr)序列.
TAF是基因转录调控的辅助因子,它的作用是通过与多种转录调控因子(激活物或阻遏物)的转录调控结构域结合,而介导转录激活或抑制。
二、基因转录的顺式调控元件
顺式调控元件(cis-regulatingelement)是指对基因表达有调控活性的DNA序列,其活性只影响与其自身同处于一个DNA分子上的基因.
顺式调控元件中的短核心序列:
共有序列或一致序列(consensussequence)。
(一)启动子(promoter)
(二)增强子(enhancer)
能显著提高基因转录效率的一类顺式调控元件(其核心序列常为8-12bp).
增强子的作用特点:
1.能(通过启动子)提高同一条链上的靶基因转录速率;
2.增强子对同源基因或异源基因同样有效;
3.增强子的位置可在基因5’-上游、基因内或3’下游序列中;
4.自身没有5’-或3’-方向性;
5.增强子可远离转录起始点(最多30Kb);
6.增强子一般具有组