真核生物基因组结构PPT文档格式.ppt
《真核生物基因组结构PPT文档格式.ppt》由会员分享,可在线阅读,更多相关《真核生物基因组结构PPT文档格式.ppt(68页珍藏版)》请在冰豆网上搜索。
逐渐增加的趋势。
一、真核生物基因组的大小一、真核生物基因组的大小支支原原体体细细菌菌酵酵母母霉霉菌菌蠕蠕虫虫昆昆虫虫鸟鸟类类两两栖栖类类哺哺乳乳类类1010109108107106低等动物的低等动物的低等动物的低等动物的CC值大于高等动物值大于高等动物值大于高等动物值大于高等动物如:
两栖类的如:
两栖类的CC值大于哺乳类值大于哺乳类值大于哺乳类值大于哺乳类肺鱼的肺鱼的肺鱼的肺鱼的CC值比哺乳动物大值比哺乳动物大值比哺乳动物大值比哺乳动物大10101515倍倍倍倍同一门中的动物同一门中的动物同一门中的动物同一门中的动物CC值变化很大值变化很大值变化很大值变化很大如:
两栖类中的如:
两栖类中的CC值变化很大,可相差值变化很大,可相差值变化很大,可相差值变化很大,可相差100100倍倍倍倍家蝇的比果蝇的大家蝇的比果蝇的大家蝇的比果蝇的大家蝇的比果蝇的大66倍倍倍倍指指指指CC值与生物进化复杂性之间不相对应的现象值与生物进化复杂性之间不相对应的现象值与生物进化复杂性之间不相对应的现象值与生物进化复杂性之间不相对应的现象,也,也,也,也叫叫叫叫CC值反常理论值反常理论值反常理论值反常理论。
说明真核生物基因组中许多的说明真核生物基因组中许多的说明真核生物基因组中许多的说明真核生物基因组中许多的DNADNA序列不编码蛋白质。
序列不编码蛋白质。
表现:
C值悖理理论(值悖理理论(C-valueparadox)植物植物鸟类鸟类哺乳动物哺乳动物爬行动物爬行动物两栖动物两栖动物硬骨鱼硬骨鱼软骨鱼软骨鱼棘皮动物棘皮动物甲壳动物甲壳动物昆虫昆虫软体动物软体动物蠕虫蠕虫霉菌霉菌藻类藻类真菌真菌格兰氏阳性菌格兰氏阳性菌格兰氏阴性菌格兰氏阴性菌支原体支原体阴影部分为一个门内阴影部分为一个门内C-值的范围值的范围二、真核生物基因组的基因数量二、真核生物基因组的基因数量不同物种编码基因差别很大,从不同物种编码基因差别很大,从不同物种编码基因差别很大,从不同物种编码基因差别很大,从500500个到个到个到个到5000050000个,个,个,个,有有有有100100倍的差距。
倍的差距。
真核生物的基因数量通常在真核生物的基因数量通常在真核生物的基因数量通常在真核生物的基因数量通常在60006000到到到到5000050000之间。
之间。
人的人的人的人的基因组的全长为大约基因组的全长为大约基因组的全长为大约基因组的全长为大约3X103X1099对对对对碱基,编码碱基,编码碱基,编码碱基,编码3-43-4万个基因万个基因万个基因万个基因;
但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量可能不超过可能不超过可能不超过可能不超过30003000个,比很多细菌的基因数量还少。
个,比很多细菌的基因数量还少。
其中,其中,其中,其中,CC是单链是单链是单链是单链DNADNA在在在在tt时刻的浓度。
时刻的浓度。
kk复性速度常数复性速度常数复性速度常数复性速度常数三、真核生物基因组的非重复序列和重复序列三、真核生物基因组的非重复序列和重复序列1.DNA复性动力学复性动力学2.DNADNA的复性过程遵循二级反应动力学。
的复性过程遵循二级反应动力学。
DNA复性过程中复性的速度用公式表示:
复性过程中复性的速度用公式表示:
dC/dt=-kC02对上式积分后重排,对上式积分后重排,对上式积分后重排,对上式积分后重排,得出得出得出得出复性动力学方程复性动力学方程复性动力学方程复性动力学方程:
CCCC0011(11kkCC00tt)CC00为单链为单链为单链为单链DNADNA的起始浓度,的起始浓度,的起始浓度,的起始浓度,CC为单链为单链为单链为单链DNADNA在在在在tt时刻的浓度,时刻的浓度,时刻的浓度,时刻的浓度,单位单位单位单位mol/Lmol/L。
tt为复性时间为复性时间为复性时间为复性时间,单位为单位为单位为单位为ss(秒)。
重组速率常数(秒)。
重组速率常数kk的的的的单位为单位为单位为单位为L/molL/mol,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和DNADNA序列的复杂性。
序列的复杂性。
当当C/C0=1/2时的时的C0t值定义为值定义为C0t1/2C/C0=1/2=1/(1+kC0t(1/2)Cot(1/2)=1/k(mol.Sec/L)即复性反应即复性反应完成一半时完成一半时p在在控控制制反反应应条条件件(初初始始浓浓度度、温温度度、离离子子强强度度、片片段段大大小小)相相同同的的前前提提下下,DNA分分子子的的C0t(1/2)值值,取取决决于于核核苷苷酸的排列复杂性。
酸的排列复杂性。
pDNA序序列列的的复复杂杂度度(complexity)X:
最最长长的的没没有有重重复复序序列列的核苷酸对的数值。
的核苷酸对的数值。
AAAAAAAAX=1ATCGATCGATCGX=4N=105X=105DNA序列的复杂性、初始浓度、片段大小、温度、离子强度序列的复杂性、初始浓度、片段大小、温度、离子强度DNA复性的影响因素:
复性的影响因素:
X=kCot1/2n相同核苷酸数量的相同核苷酸数量的DNA,复杂性小的,复杂性小的DNA分子复性快,分子复性快,Cot(1/2)值小;
复杂性大的值小;
复杂性大的DNA分子复性慢,分子复性慢,Cot(1/2)大。
大。
nCot曲线:
曲线:
表示复性速度与表示复性速度与DNA顺序复杂性的关系。
顺序复杂性的关系。
Cot(1/2)=1/k(mol.Sec/L)Cot曲线曲线2.利用复性动力学鉴定基因组序列利用复性动力学鉴定基因组序列原核生物原核生物Cot曲线的特点:
曲线的特点:
形状相似(跨越形状相似(跨越2-3个数量级),个数量级),Cot(12)不相同不相同单一序列,只是复杂性不单一序列,只是复杂性不同。
同。
复杂性复杂性X1不同原核生物的不同原核生物的Cot曲线曲线复复性性分分数数(1-c/c0)CotP74图图16真核生物真核生物DNA复性复性曲线的模曲线的模式图式图复性反应分为复性反应分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型根据复性动力学特征的不同,将真核生根据复性动力学特征的不同,将真核生物物DNA序列分为序列分为4类:
类:
p零时复性序列零时复性序列p快速复性序列快速复性序列p中速复性序列中速复性序列p慢速复性序列慢速复性序列1)零时复性序列:
零时复性序列:
具有具有反向重复结构反向重复结构(也称回文结构),可在(也称回文结构),可在同一条链内形成双链区,变性后再复性时,在链同一条链内形成双链区,变性后再复性时,在链间复性之前就已发生间复性之前就已发生链内复性链内复性,因此不遵循二级,因此不遵循二级反应动力学方程。
由于这种序列的复性速度非常反应动力学方程。
由于这种序列的复性速度非常快,在动力学上称为零时(或瞬时)复性序列。
快,在动力学上称为零时(或瞬时)复性序列。
DNA复性后可出现发卡形结构。
这种序列常复性后可出现发卡形结构。
这种序列常常是常是DNA复制酶复制酶、转录酶转录酶以及以及特异蛋白质特异蛋白质的结合的结合部位。
部位。
22)快速复性序列:
)快速复性序列:
也叫高度重复序列(也叫高度重复序列(Highlyrepetitivesequence)大大部部分分集集中中于于异异染染色色质质区区,特特别别是是在在着着丝丝粒粒和和端粒区,端粒区,往往没有转录功能往往没有转录功能。
占基因组的占基因组的10-60%,长度长度6200bp,重复次数在,重复次数在105以上。
以上。
P74图图16真核生物真核生物DNA复性复性曲线的模曲线的模式图式图复性反应分为复性反应分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型3)中速复性序列)中速复性序列:
l基因组中重复次数基因组中重复次数105的重复顺序的重复顺序,重复单位平均长重复单位平均长度约度约300bp;
l复性速度快于单拷贝顺序,慢于高度重复顺序。
复性速度快于单拷贝顺序,慢于高度重复顺序。
l多与单拷贝基因间隔排列。
多与单拷贝基因间隔排列。
l多为非编码序列多为非编码序列,如,如Alu序列序列l也有编码基因也有编码基因产物的,如产物的,如rDNA、tDNA、组蛋白基、组蛋白基因家族因家族,一般往往以基因家族的形式存在。
一般往往以基因家族的形式存在。
也叫中度重复序列也叫中度重复序列(moderaterepetitivesequences)Alufamily(Alu家族)家族):
长长约约300bp的的片片段段,大大多多数数片片段段含含有有一一个个限限制制性性内内切切酶酶Alu的酶切位点(的酶切位点(AGCT);
均匀分散在整个基因组中的非重复序列间均匀分散在整个基因组中的非重复序列间;
在人类基因组中占在人类基因组中占13;
4)慢速复性序列:
)慢速复性序列:
C0t1/2一般在一般在103mol.s/L以上,复性速度极慢,以上,复性速度极慢,在一个基因组中只有一个拷贝或在一个基因组中只有一个拷贝或23个拷贝,也个拷贝,也称非重复序列(单一序列、单拷贝序列)。
称非重复序列(单一序列、单拷贝序列)。
l结构基因结构基因(蛋白质基因蛋白质基因)大多是单拷贝序列。
大多是单拷贝序列。
P74图图16真核生物真核生物DNA复性复性曲线的模曲线的模式图式图复性反应分为复性反应分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型大部分结构基因大部分结构基因位于非重复的位于非重复的DNA序列内序列内第二节第二节断裂基因(断裂基因(splitgene)不连续基因(不连续基因(interruptedgene)编码某一编码某一RNARNA的基因中有些序列并不出现在成熟的基因中有些序列并不出现在成熟的的RNARNA序列中,成熟序列中,成熟RNARNA的序列在基因中被其他的的序列在基因中被其他的序列隔开。
序列隔开。
一、断裂基因由外显子和内含子组成一、断裂基因由外显子和内含子组成11、断裂基因的发现、断裂基因的发现通过成熟通过成熟mRNAmRNA(或(或cDNAcDNA)与编码基因的)与编码基