分子生物学第二章.ppt
《分子生物学第二章.ppt》由会员分享,可在线阅读,更多相关《分子生物学第二章.ppt(42页珍藏版)》请在冰豆网上搜索。
第二部分第二部分基因与基因组基因与基因组基因基因(Gene)位于染色体上能编码一条多肽链或位于染色体上能编码一条多肽链或RNA并并具有一定长度的具有一定长度的DNA分子。
分子。
原核细胞的基因结构原核细胞的基因结构编码区编码区启动子启动子转录起转录起始位点始位点非翻译区非翻译区转录区转录区起始密码子起始密码子终止密码子终止密码子53转录终止子转录终止子核糖体结核糖体结合位点合位点大肠杆菌中不同基因的启动子序列大肠杆菌中不同基因的启动子序列启动子启动子(Promoter)与与RNA聚合酶结合并起始转录的核苷酸序列,由聚合酶结合并起始转录的核苷酸序列,由-10区区和和-35区序列构成。
区序列构成。
-10Region(Pribnowbox)TATAAT77%76%60%61%56%82%-35RegionTTGACA69%79%61%56%54%54%核糖体结合位点核糖体结合位点(RibosomeBindingSite,RBS)又称又称SD(Shine-Dalgarno)序列,与核糖体小亚基中序列,与核糖体小亚基中16SrRNA的部分序列互补,启动蛋白质的生物合成。
的部分序列互补,启动蛋白质的生物合成。
mRNA序列中的序列中的RBSRBS起始密码子起始密码子转录终止子转录终止子(transcriptionterminator)基因下游的一段反向重复序列,经转录后生成的基因下游的一段反向重复序列,经转录后生成的RNA产产物物形成形成茎茎-环二级结构,可阻止环二级结构,可阻止RNA聚合酶核心酶聚合酶核心酶向下游移向下游移动而动而终止终止转录。
转录。
操纵子操纵子(operon)结构结构操纵子是原核生物基因转录的功能单位,操纵子是原核生物基因转录的功能单位,由启动子、操纵由启动子、操纵序列和结构基因所构成。
序列和结构基因所构成。
53外显子外显子剪切内含子的供剪切内含子的供体和受体位点体和受体位点GTAG内含子内含子转录区转录区起始密码子起始密码子终止密码子终止密码子调控序列调控序列转录终止子转录终止子非翻译区非翻译区转录起转录起始位点始位点真核细胞的基因结构真核细胞的基因结构53-GCGC-CAAT-TATA-TATA盒盒CAAT盒盒GC盒盒增强子增强子内含子内含子外显子外显子转录终止子转录终止子结构基因结构基因调控序列调控序列真核生物启动子与真核生物启动子与基本转录因子基本转录因子及及RNA聚合酶结合,起始聚合酶结合,起始hnRNA的转录。
的转录。
TATA盒盒:
又称又称Goldberg-Hogness盒盒,转录因子转录因子TFIID的的结合位点,启动基因转录。
结合位点,启动基因转录。
CAAT盒盒:
转录因子:
转录因子CTF的结合位点,决定启动子的转录效的结合位点,决定启动子的转录效率。
率。
GC盒盒:
促进转录。
:
促进转录。
增强子增强子(enhancer)一段短的一段短的DNA序列,位于真核基因的任何位置,与序列,位于真核基因的任何位置,与特异特异转录因子转录因子结合,增强转录活性。
结合,增强转录活性。
转录转录终止子终止子(序列序列)AAUAAA当当RNApolII合成合成转录转录终止终止序列后,在终止因子的作用序列后,在终止因子的作用下,下,RNApolII脱离脱离DNA模板,模板,RNA合成终止。
合成终止。
基因组基因组(Genome)生物体或细胞中一套染色体的遗传物质的总和,生物体或细胞中一套染色体的遗传物质的总和,以全长以全长DNA的碱基对的碱基对(bp)数目表示。
数目表示。
病毒基因组的一般特点病毒基因组的一般特点包括包括DNA或或RNA病毒或者动物、植物及细菌病毒。
病毒或者动物、植物及细菌病毒。
1.大小相差很大:
如乙肝病毒大小相差很大:
如乙肝病毒3.2kb编码编码4种蛋白,痘种蛋白,痘状病毒可达状病毒可达300kb,编码几百种蛋白。
编码几百种蛋白。
2.基因组可以是基因组可以是DNA,也可由也可由RNA组成,但每种病毒组成,但每种病毒只含只含1种核酸分子,种核酸分子,呈呈线形或环形,双链或单链。
线形或环形,双链或单链。
3.DNA病毒基因组由连续的病毒基因组由连续的DNA分子组成,有的分子组成,有的RNA病毒是不连续的:
如流感病毒基因组由病毒是不连续的:
如流感病毒基因组由8条条RNA单单链分链分子构成。
子构成。
4.常见基因重叠现象。
常见基因重叠现象。
基因基因A基因基因B基因基因CA和和B完全重叠完全重叠,A和和C部分重叠部分重叠病毒基因组大多序列用来编码蛋白。
病毒基因组大多序列用来编码蛋白。
5.功能密切相关的基因形成一个功能单位或转录单元,可以功能密切相关的基因形成一个功能单位或转录单元,可以转录成合成多个蛋白质的转录成合成多个蛋白质的mRNA分子,即多顺反子分子,即多顺反子mRNA。
6.除逆转录病毒,都是单倍体。
除逆转录病毒,都是单倍体。
7.噬菌体的基因都是连续的,而真核细胞病毒常含内含子。
噬菌体的基因都是连续的,而真核细胞病毒常含内含子。
噬菌体噬菌体(phage)溶菌途径溶菌途径诱导诱导噬菌体噬菌体DNADNA进入进入大肠杆菌大肠杆菌(E.coli)基因组基因组DNA子代子代DNADNA整合到整合到E.coli基因组基因组E.coli被裂解被裂解噬菌体生活史噬菌体生活史溶源途径溶源途径01020304048.5kbcos(左粘性末端左粘性末端)cos(右粘性末端右粘性末端)gamJNulRz头头尾尾整合和重组整合和重组DNA复制复制att裂解裂解左臂区左臂区中心区中心区噬菌体基因组噬菌体基因组右臂区右臂区逆转录病毒逆转录病毒(Retrovirus)RNA逆转录酶逆转录酶外壳蛋白外壳蛋白逆转录病毒对宿主逆转录病毒对宿主细胞的感染细胞的感染1.环形环形DNA分子分子集中分布在集中分布在“拟拟(类类)核核”。
2.绝绝大部分大部分DNA序列用于编码蛋白质,编码基因不含序列用于编码蛋白质,编码基因不含内含子。
内含子。
3.重复序列少,除重复序列少,除rDNA为为多拷贝外,其它基因为单多拷贝外,其它基因为单拷贝。
拷贝。
4.功能密切相关的基因形成一个功能单位或转录单元,功能密切相关的基因形成一个功能单位或转录单元,转录成多顺反子转录成多顺反子mRNA。
5.DNA分子具分子具有有一个复制起点。
一个复制起点。
原核细胞基因组的一般特点原核细胞基因组的一般特点细菌基因组细菌基因组DNA大肠杆菌基因组大肠杆菌基因组(4.6X106bp)部分大肠杆菌基因组部分大肠杆菌基因组真核生物基因组的特点真核生物基因组的特点1.基因组基因组DNA的分子量大,线形的分子量大,线形DNA分子分子与组蛋白结合与组蛋白结合形成染色体,贮存在细胞核中。
每个染色体的形成染色体,贮存在细胞核中。
每个染色体的DNA具有许具有许多多复制起始点。
复制起始点。
2.真核生物基因占整个基因组的比例很小,基因组中非编真核生物基因占整个基因组的比例很小,基因组中非编码序列远远多于编码序列。
码序列远远多于编码序列。
3.编码蛋白质的基因常以单拷贝存在,并且转录成合成一编码蛋白质的基因常以单拷贝存在,并且转录成合成一条多肽链的条多肽链的mRNA分子,即分子,即单顺反子单顺反子mRNA。
4.真核生物存在大量真核生物存在大量重复序列重复序列,重复序列的长短不一,重,重复序列的长短不一,重复频率不同复频率不同。
5.编码基因含有内含子,在编码基因含有内含子,在mRNA成熟过程中被切除成熟过程中被切除。
人类基因组人类基因组(3X109bp)人类基因组计划人类基因组计划(Humangenomeproject,HGP)测定人类基因组的测定人类基因组的全部核苷酸序列,全部核苷酸序列,破解人类遗传破解人类遗传信息的奥秘。
信息的奥秘。
Nature,Vol.409,No.682215February2001Science,Vol.291,No.550716February20011.鉴定疾病相关基因。
鉴定疾病相关基因。
2.促进生命科学领域的基础研究,阐明基因的结构与功促进生命科学领域的基础研究,阐明基因的结构与功能关系,细胞的发育、生长、分化的分子机理,疾病发生能关系,细胞的发育、生长、分化的分子机理,疾病发生的机理等。
的机理等。
3.有利于理解生物如何进化,以追溯人类多数基因的起源。
有利于理解生物如何进化,以追溯人类多数基因的起源。
4.促进生命科学与信息科学相结合,刺激相关学科的发促进生命科学与信息科学相结合,刺激相关学科的发展,如展,如生物信息学生物信息学(bioinformatics)。
HGP的意义的意义人类基因组结构特点人类基因组结构特点1.单拷贝序列单拷贝序列(单一序列单一序列)在一个基因组中只出现一次或很少几次的碱基序列为单在一个基因组中只出现一次或很少几次的碱基序列为单一序列,是结构基因的特点。
结构基因编码的蛋白质包括一序列,是结构基因的特点。
结构基因编码的蛋白质包括结构蛋白、酶、激素、受体和调节蛋白等。
结构蛋白、酶、激素、受体和调节蛋白等。
2.重复多拷贝序列重复多拷贝序列(重复序列重复序列)重复顺序是指在一个基因组中有多个拷贝的碱基顺序。
重复顺序是指在一个基因组中有多个拷贝的碱基顺序。
根据重复片段的长度及重复的频率分:
根据重复片段的长度及重复的频率分:
高度重复序列高度重复序列中度重复序列中度重复序列
(1)高度重复序列高度重复序列重复片段的长度单位在几个到几百个碱基对之间,重复重复片段的长度单位在几个到几百个碱基对之间,重复频率高达频率高达106,且集中在某一区域串联排列。
,且集中在某一区域串联排列。
一般不能编码蛋白质,用于维持染色体的结构、间隔结一般不能编码蛋白质,用于维持染色体的结构、间隔结构基因等。
构基因等。
卫星卫星DNA(satelliteDNA)重复单元为重复单元为5-200bp,重复次数可达,重复次数可达105次,位于着丝次,位于着丝粒、端粒部位。
粒、端粒部位。
小卫星小卫星DNA(minisatelliteDNA)重复单元为重复单元为15-100bp,所形成的序列长度为所形成的序列长度为1-5kb,又称可变数目串联重复序列又称可变数目串联重复序列(variablenumberoftandemrepeats,VNTR)。
微卫星微卫星DNA(microsatelliteDNA):
重复单元为重复单元为16bp,又称短串联重复序列又称短串联重复序列(shorttandemrepeat,STR)。
在基因组中出现的数目及频率存在个体间的差。
在基因组中出现的数目及频率存在个体间的差异异(多态性多态性),可用于检测,可用于检测DNA指纹指纹(DNAfingerprinting)。
(2)中度重复序列中度重复序列重复长度重复长度300-7000bp不等,重复次数在不等,重复次数在102-105左右。
左右。
重复基因:
重复基因:
组蛋白基因,组蛋白基因,rRNA基因,基因,tRNA基因基因重复序列:
重复序列:
短分散短分散DNA序列序列(短分散元件短分散元件SINE)长分散长分散DNA序列序列(长分散元件长分散元件LINE)2.多基因家族多基因家族多基因家族是指由某一祖先基因经过重复和变异所产生的多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因。
一组基因。
基因家族的不同成员可成簇排列在同一条染色体上,各基基因家族的不同成员可成簇排列在同一条染色体上,各基因之间由重复序列隔开。
因之间由重复序列隔开。
组蛋白基因家族成簇地集中在第组蛋白基因家族成簇地集中在第7号染色体号染色体基因家族的不同成员成簇排列在不同的染色体上。
基因家族的不同成员成簇排列在不同的染色体上。
珠蛋白、免疫球蛋白基因珠蛋白、免疫球蛋白基因组蛋白基因家族组