分子生物学考纲Word文档格式.docx

上传人:b****8 文档编号:22585582 上传时间:2023-02-04 格式:DOCX 页数:84 大小:66.56KB
下载 相关 举报
分子生物学考纲Word文档格式.docx_第1页
第1页 / 共84页
分子生物学考纲Word文档格式.docx_第2页
第2页 / 共84页
分子生物学考纲Word文档格式.docx_第3页
第3页 / 共84页
分子生物学考纲Word文档格式.docx_第4页
第4页 / 共84页
分子生物学考纲Word文档格式.docx_第5页
第5页 / 共84页
点击查看更多>>
下载资源
资源描述

分子生物学考纲Word文档格式.docx

《分子生物学考纲Word文档格式.docx》由会员分享,可在线阅读,更多相关《分子生物学考纲Word文档格式.docx(84页珍藏版)》请在冰豆网上搜索。

分子生物学考纲Word文档格式.docx

但真核生物中DNA含量并不与生物的复杂性相一致,这种反常现象称为C值矛盾。

C值矛盾表现在:

1、结构、功能相似的同一类生物中,甚至亲缘关系十分接近的物种之间,它们的C值可相差10倍乃至上千倍。

如:

豌豆的C值为14pg,而蚕豆只有2pg。

两栖类C值的变动范围很大,为109-1011bp。

2、较低等生物的C值大于较高等生物的C值

两栖动物(1011bp)>哺乳动物(109bp)

3、真核生物的C值之大,远远超过其基因编码所需

将内含子算上,哺乳动物的一个基因长约5-8Kb,少数10Kb,则哺乳动物应有40-60万个基因。

目前研究表明,实际基因数估计不会超过这个数值的10%(3-4万)。

有些基因的序列不编码蛋白质,则基因组中只含有2%-3%的DNA序列用于编码蛋白质。

余下那么多DNA序列具何功能?

难道不被表达的DNA序列都是调控基因吗?

目前还无法圆满解释。

第二节原核生物基因组

一、原核生物基因组的特点

1、不具备明显的核结构,只有类核,即DNA相对集中的区域。

2、基因组小,一般只有一个染色体,大多为双链环状,少数为单链或线型。

Ø

E.coliDNA分子量为2.4×

109,相当于4.2×

106bp,含3000-4000个基因;

噬菌体DNA分子长48502bp,含46个基因;

ΦX174DNA分子长5386bp,含有11个基因;

SV40病毒DNA分子量为3×

106bp,含5个基因。

3、染色体DNA并不与蛋白质固定地结合,不具核小体结构。

4、结构简练,重复序列和非编码序列很少,体现经济原则。

如:

ΦX174中非编码序列占217/5386;

T4-DNA中占282/5577,均不到5%。

5、功能密切相关的基因构成转录单元,并常转录成含多基因信息的mRNA分子,称为多顺反子mRNA。

6、有重叠基因:

同一段DNA片段可以编码2—3种蛋白质分子。

二、大肠杆菌的基因组

大肠杆菌无明显的核结构,其DNA相对地集中于类核区。

对数生长期的细胞具有2-4个类核。

E.coliDNA长度为4.2×

106bp,每个基因平均长度为1000bp,整个基因组有3000-4000个基因,目前已经定位的基因有1400多个。

功能上相关的基因串联在一起组成操纵子结构,由一个启动子转录调控。

E.coli有260多个基因具有操纵子结构。

E.coli的lac操纵子、Trp操纵子和His操纵子分别有3个、5个和9个相关酶蛋白串联在一起。

E.coli基因组中,几乎所有的基因都是单拷贝的。

基因组中几乎全都是由结构基因组成,很少有非必需的DNA。

三、噬菌体的基因组

噬菌体基因组研究得最好的有ΦX174、λ、T4等。

我们以ΦX174为例。

1、DNA为单链环状,共5386bp。

2、共有11个基因,依次为A,A'

,B,K,C,D,E,J,F,G和H。

3、由于ΦX174的DNA数量有限,因而在基因排列上更加体现经济原则

A、3个转录启动子PA、PB和PD,分别从基因A、B、D开始转录。

基因H和A之间有一强终止子信号,所有的转录都将终止。

在基因J和F之间有一弱终止子信号,部分转录终止。

B、其DNA分子绝大部分用于编码蛋白质,不翻译部分只占4%(217/5386)。

C、有重叠基因和基因内基因。

B基因在A基因之中,E基因在D基因之中。

λ噬菌体的结构特点

双链DNA噬菌体。

基因组有48502bp,共有46个基因。

整个区域分为5个区域:

头部基因、尾部基因、调控区、复制区和晚期调控区。

λ有线状分子和环状分子。

线状分子两端各有12个核苷酸的粘性末端,通过粘性末端配对,线性分子在生活周期的一定阶段可转变为环状分子

四、原核生物的重叠基因(Overlappinggenes)或嵌套基因(nestedgenes)

概念:

指一个基因的序列中,含有另一基因的部分或全部序列。

即一段序列中含有合成两个或两个以上多肽的基因。

基因重叠现象是英国分子生物学家Sanger1977年在测定噬菌体ΦX174的DNA序列是发现的。

1973年,Weiner和Weber在Qβ噬菌体(E.coli的病毒)发现基因重叠现象。

Weiner和Weber当时认为:

Pr2含量少,对病毒无关紧要,而不予关注。

后来,Weissman证实,Pr1是一种外壳蛋白,故需要量大,而Pr2产量虽少,却是组成有感染力的病毒颗粒所必需的。

1977年Sanger在“自然”杂志上发表了X174DNA的全部核苷酸序列,正式发现了重叠基因。

重叠基因有以下几种情况:

一个基因完全在另一个基因里面。

如基因B在基因A里面,基因E在基因D里面。

部分重叠,如K和C、A和C。

两个基因只有一个碱基对的重叠,如D和J。

三重重叠,如G4噬菌体的基因A、B和K。

A和C的部分重叠

A的终止密码

-ATGA-

C的起始密码

D和J部分重叠

D的终止密码

-TAATG-

J的起始密码

剑桥分子生物学家D.C.Shaw和J.E.Walker在测定噬菌体G4DNA的核苷酸的序列时,发现了三重重叠现象.

第三节真核生物基因组

一、真核生物基因组的特点

1、结构复杂、基因数庞大。

低等真核生物107—108bp

高等真核生物5×

108—1010bp

有些植物和两栖类1011bp

人109bp

2、有若干个染色体,一般不呈环状,DNA与蛋白质紧密结合形成染色体,具多个复制起始点。

3、存在核膜,DNA的转录和翻译存在时空差异。

4、有很多不编码序列(内含子,内元)或介入序列。

5、有大量的重复序列。

6、功能上密切相关的基因集中程度不如原核生物高,大多分散在不同的染色体上,但有许多基因家族和假基因存在。

7、有细胞器基因,如chlDNA,mitDNA,其密码子有特异性。

二、真核生物DNA序列的类型

(一)非重复序列(uniquesequence)

1、概念

一个基因组中只存在一个拷贝

2、含量

单拷贝序列占整个基因组的40%-60%

人:

60-65%;

牛:

55%;

小鼠:

70%;

果蝇:

79%

3、长度和类型

v750-2000bp,相当于一个结构基因的长度。

v大多数蛋白质结构基因属于单拷贝序列,如蛋清蛋白、蚕的丝心蛋白、血红蛋白和珠蛋白都是单拷贝序列。

4、作用

v放大作用,单一拷贝序列通过基因扩增可合成大量蛋白质。

v一个蚕丝心蛋白基因作为模板合成104个丝心蛋白mRNA,每个mRNA可合成105个丝心蛋白,因此,一个单拷贝蚕丝心蛋白基因就可合成109个丝心蛋白分子。

(二)轻度重复序列

一个基因组中含有2-10个拷贝。

2、类型

主要是组蛋白和tRNA等基因。

包括两种情况:

i、几个基因都具有功能,编码同一蛋白质或RNA。

ii、有的基因有功能,有的基因没有功能,如假基因。

(三)中度重复序列(moderatelyrepetitivesequence)

一个基因组含有10-104个拷贝

2、长度

平均长度为300bp,一般不是编码序列。

3、含量

占总DNA的10%-40%

20%;

果蝇:

15%

4、类型

i、短周期分散的重复序列(interspersedrepeatsequence,orinterspersedelement,SINES):

长100-300bp,如人、爪蟾、海胆的Alu序列。

ii、长周期分散的重复序列(longinterspersedelement,LINES):

长5000bp,如KpnI家族。

(四)、高度重复序列(highlyrepetitivesequence)

一个基因组含有大于105个拷贝,分布于着丝点,端粒区,结构基因两侧。

占总DNA的10%-60%,高等真核生物中占20%,由6-10bp组成。

3、种类

卫星DNA

三、Alu家族重复序列

1、含量

Alu家族序列占人基因组DNA总量的5%-6%

2、长度:

300bp

3、拷贝数:

105个拷贝

4、Alu序列

v在170位碱基附近的AGCT是限制性内切酶AluI的酶切位点,Alu序列被AluI切割成(AG↓CT)130bp和170bp两段,故名Alu序列。

Alu序列两端都具有7-20bp的顺向重复序列,各个Alu成员的两端的顺向重复序列都不相同。

如人的两个Alu成员:

GTTTAGATAAG…Alu…GTTTAGATAAA

AAAGAAATG…Alu…AAATAAATGG

Alu序列分散在人及哺乳类动物的基因组中,与长为6000bp的单拷贝序列间隔排列。

Alu家族不只在人基因组中发现,非洲绿猴、小鼠、中国仓鼠等哺乳动物中都有。

5、功能

参与基因活化、DNA复制起始、参与前mRNA的加工等,需进一步证实。

四、KpnI家族

KpnI家族占人类基因组的3%-6%,平均长度为3500-5000bp,拷贝数为3000-4000个。

用限制性内切酶KpnI消化后,可得1.2Kb、1.5Kb、1.8Kb、1.9Kb。

五、卫星DNA(satelliteDNA)

DNA的浮力密度决定于它的G﹢C含量,G﹢C含量越高,浮力密度越大。

ρ=1.660+0.00098(G+C)%g/cm3

在高度重复序列中,常有一些AT含量很高的简单重复序列,AT含量有时高达97%(如螃蟹DNA中的卫星DNA)。

在CsCl密度梯度离心时,易与其它DNA分开,形成两个以上的峰,即含量较多的主峰和高度重复序列的小峰。

小峰在主峰旁似卫星,称为卫星DNA。

卫星DNA占总DNA的1%-30%。

人DNA有1条主带,4条卫星区带。

果蝇DNA有1条主带,3条卫星区带。

位于染色体的着丝粒部位的异染色质区

牛的卫星DNA:

ATATAT

果蝇有三个卫星DNA区带,它们是:

5'

ACAAATT3'

,重复3.6×

106次,占8%;

ACAAACT3'

,重复1.1×

107次,占25%;

ATAAACT3'

第四节基因家族

一、概念

真核生物基因组中有许多来源相同、结构相似、功能相关的一系列基因,成串地排列在一起。

这样一组基因称为基因家族。

二、分类

1、简单多基因家族

家族中只有一个或数个基因以串联方式重复排列,如rRNA、tRNA基因。

2、复杂多基因家族

由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。

海胆和果蝇的组蛋白基因及果蝇tRNA基因。

3、发育调控的复杂多基因家族

在不同组织、细胞类型、时间表达的复杂多基因家族。

珠蛋白和免疫球蛋白基因,属于不同时态表达的复杂多基因家族。

三、rRNA基因家族

高等真核生物有4种rRNA,即28S、18S、5.8S和5SrRNA。

前三种为主体rRNA,它们的基因构成重复单元,5SrRNA基因是独立的串联重复基因。

细菌和低等真核生物中,每个rRNA基因重复单元含有23S、16S和5SrRNA基因,其间插入多个tRNA,每个单元总长5500bp,构成一个转录单位。

四、5SrRNA基因的重复单元

5SrRNA由保守的120bp组成,单独成为复制单元。

每个转录单元由5S基因和非转录区组成。

真核生物中有多拷贝的5SrRNA基因,非洲爪蟾约有2万个5S基因拷贝,人类有2000个拷贝。

五、tRNA基因家族

tRNA长70—90bp,拷贝数为10至数百。

人类约有1300个tRNA基因族。

几种不同的tRNA基因串联重复,基因之间的间隔区较大。

六、组蛋白基因家族

组蛋白有H1、H2A、H2B、H3、H4共5种基因。

这5种基因串联在一起形成一个重复单元。

5种基因的排列顺序、转录方向和基因间隔区因生物种类不同而不同。

组蛋白基因家族中重复单元的数目依生物而异。

鸡:

10个;

哺乳动物:

20个;

非洲爪蟾:

40个;

100个;

海胆:

300-600个

30-40个,位于7号染色体的长臂区。

组蛋白基因缺乏内含子。

因此,间隔序列不是内含子。

七、珠蛋白基因家族

血红蛋白分子是珠蛋白的四聚体,由2个α型亚基和2个β型亚基组成,即α2β2。

α型亚基的基因位于第16号染色体上,β型亚基的基因位于第11号染色体上。

α家族包括1个活性的ξ基因、1个ψξ假基因、2个α基因和2个ψα假基因,集中在28kbp的区域内。

β家族包括ε、2个γ、δ和β基因,以及1个ψβ1假基因,分布在50kbp的区域内。

发育阶段

血红蛋白组成

胚胎期(8周前)

ξ2ε2、ξ2γ2、α2ε2

胎儿期

α2γ2

成年期

α2δ2(2%)、α2β2(97%)、α2γ2(1%)

ξ2ε2(HbGower1)

ξ2γ2(HbGower2)

α2ε2(HbGower3)

α2δ2(HbA2)、α2β2(HbA)、α2γ2(HbF)

α亚基的表达时间顺序是:

ξα

β型亚基的表达时间顺序是:

εγδβ

第五节真核生物的不连续基因(interrupted或discountinuousgene)或断裂基因(splitgene)

核苷酸序列中插入与氨基酸编码无关的DNA间隔区,使一个基因分隔成不连续的若干区段,这种不编码的间断基因称为不连续基因。

编码的序列称为外显子(exon),不编码的序列称为内含子(intron)。

二、不连续基因的发现和检测方法

1977年,Broker和Sharp等人研究腺病毒mRNA时首次发现不连续基因。

很快在SV40中也发现了不连续基因。

所有的哺乳动物、脊椎动物、高等植物及简单的真核生物、甚至少数原核生物都含有不连续基因。

检测方法

1、蛋白质序列或mRNA序列与DNA序列相比较。

2、电镜法——mRNA与DNA杂交法

将成熟mRNA分子与相应DNA进行杂交,形成DNA-RNA异源杂交双链分子,在电镜下观察到形成的R-环结构。

3、S1核酸酶制图法(Berk-sharp制图法)

步骤:

变性的基因组DNA同mRNA杂交,形成异源双链DNA-RNA杂种分子。

用S1核酸酶处理,除去没有杂交的单链的间隔子序列。

用琼脂糖凝胶电泳检测。

三、不连续基因的数目和大小

1、数目

v有些只有一个或少数几个内含子,有的含有较多的内含子。

珠蛋白:

2个;

酵母线粒体cytb:

6个

卵类粘蛋白:

6个;

卵清蛋白:

7个

卵类运铁蛋白:

16个;

伴清蛋白:

17个

α-胶原蛋白:

52个;

组蛋白:

0个

2、不同来源的间隔子的分子大小相差悬殊

vSV40基因间隔子长31bp

v人的营养不良蛋白基因间隔子长210kbp。

3、间隔子的长度一般比表达子长

卵清蛋白基因总长7700bp,而mRNA只有1859bp,间隔子总长为5841bp。

二氢叶酸还原酶(DHFR)基因总长31kb,而mRNA只有2kb,而间隔子长为29kb。

多数内含子长40-125bp,多数外显子编码30-40个氨基酸(90-120bp),短于50bp的内含子很少。

4、编码序列在进化过程中较保守,而内含子变化迅速,差异很大。

v哺乳动物二氢叶酸还原酶(DHFR)基因

四、外显子和内含子之间的关系

1、外显子和内含子联结处的共同序列

各种内含子的两端没有任何广泛的同源性和互补性;

联结处的确具有保守的共同序列。

v内含子5'

端起始的两个碱基是GT,3‘端最后两个碱基总是AG。

vGT-AG法则

2、一个基因的内含子可以是另一基因的外显子

产生多种mRNA的情况

利用多个5'

端转录起始位点

多个3'

端加polyA位点

利用不同的内含子剪接方式

以上3种情况的不同综合

五、内含子的可能功能

不存在内含子的基因

少数真核生物并不存在间隔序列,如编码干扰素、组蛋白的基因和大多数酿酒酵母的基因。

转录调控功能:

内含子通过启动子、起始位点的精确碱基配对,来阻止或增强RNA聚合酶的作用,对转录具有调控作用。

形成不同成熟的mRNA:

内含子具各种剪接信号,不同细胞选择不同的拼接点,使初始转录产物形成不同的成熟mRNA。

内含子具有自己特定的蛋白质编码,可能携带某种信号,作为基因调控的因素

第六节假基因(pseudogene)

是基因组中因突变而失活的基因,它和同一家族的活跃基因在结构上和DNA序列上有相似性,但它不具有功能,不能转录或翻译成成熟的mRNA或蛋白质,或产生过早终止的无活性的肽链,或由于错误的阅读框架形成无活性的蛋白质,这种序列称为假基因。

只有一个或两个拷贝,有时在功能基因旁边,有时很远,甚至可能在另一条染色体上

无法表达,没有用处

二、举例

最早发现假基因是在非洲爪蟾的5SrRNA基因中。

5SrRNA基因中有活性的编码序列为120bp,有101bp序列与5SrRNA基因相同,但少了19bp,不能转录,成为无活性的基因。

DNA序列分析表明,缺乏正常转录的起始信号。

假基因的ψβ1结构特点

缺乏内含子剪接加工的5‘共同序列;

polyA的信号由AATAAA突变成AATGAA;

正常的起始密码ATG被GTG所取代;

从第38氨基酸开始有20个核苷酸的缺失,造成一个终止密码,使肽链提前终止。

第七节人类基因组计划

一、HGP产生的背景

人类基因组是指人类生殖细胞所含有的全部染色体,估计有约10万个基因,由3X109bp组成。

这3X109bp如果印刷出来,其篇幅相当于13套大英百科全书。

1985年3月7日

vDulbecco在《Science》上提出了HGP的设想。

1985年6月

v美国能源部提出了HGP的初步草案。

1986年6月

v在新墨西哥州讨论了这一计划的可行性。

v在冷泉港讨论会上,主持了有关“人类基因组计划”的专家会议

1987年

v美国能源部与国家医学研究院为HGP下拨启动经费约550万美元。

v年总额近1.66亿美元。

v美国开始筹建人类基因组计划实验室。

1989年

v美国成立“国家人类基因组研究中心”。

J.Waston出任第一任主任。

1990年

v美国国会批准美国的“人类基因组计划”于10月1日正式启动。

v15年投入30亿美元,对人类全基因组分析。

v美、英、日、德、法及中国等6个国家参加,有16个实验室及1100名生物科学家、计算机专家和技术人员参与。

v搞清楚30亿对核苷酸,就好象搞清楚整个地球上的30亿对人各姓什么(假说天下只有四个姓氏!

)人的基因组就象地球那么大,一个染色体就象一个国家那么大,一个基因就象我们所在这憧楼那么大,..........还有“制图”就象在高速公路上标上路标.........等等。

二、HGP的任务

遗传学图(geneticmap)选择遗传标记以cM(摩尔根重组单位)为图距单位。

人的基因组巳有7000多个信息丰富的遗传标记,分辨率巳达0.7cM(1cM=1000Kb);

物理学图(physicalmap)以碱基对数为图距单位,由巳知序列作为基因的物理图标,现分辨率巳达到200Kb以内;

序列图(sequencemap)分子水平的物理学图,即DNA的碱基排列图,可望在10年内完成;

转录图(transcriptionmap)转录图是基因图的雏形,现至少巳有25万个cDNA序列,并正在以每天1000多个的速度增长;

基因克隆计划:

克隆和鉴定10万个人的基因

基因组多样性计划:

群体多样性的研究;

代表基因组到个体基因组的研究。

cDNA计划:

目标是建立不同组织、不同基因在不同时期的表达“目录”,即个体基因表达的时空图;

蛋白组计划:

HGP的基因序列可马上转化为蛋白质一级结构。

仿照HGP从单一的蛋白质转向大规模的种类、结构和功能的研究。

细胞计划:

从分子水平到细胞水平的研究。

中国的HGP指导思想:

参与、分享,重点是以我们的资源,依靠我们自己的力量,为我们的子孙克隆我们自己的基因

三、HGP的意义

1、寻找基因

对现在仍无法治疗的常见病、传染病、遗传病的研究工作需要大量基因;

研制医治人类各种疾病的新一代药物需要基因;

对人类器官的再植需要基因;

对人类体能、智能的提高需要基因;

有效、大量生产人类生存所必需的肉、蛋、奶、粮食等需要基因;

新兴的生物基因产业的蓬勃发展需要基因,

2、使人类对自身的了解进一步加深

如果法律允许,每个人都可以拿到一张自己的基因组图,这张图记录着一个生命的奥秘和隐私。

假如是一个孩子,凭借这张图就可以知道这个孩子将来是什么性格,是不是色盲,会长多高,会不会秃顶,是胖是瘦,什么时候会患什么病,什么时候死亡,也就是说,基本可以知道这个孩子一生的命运。

3、有助于人类基因的表达调控研究

自杀基因

一个人会自杀,是因为

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 学科竞赛

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1