基因组学.docx
《基因组学.docx》由会员分享,可在线阅读,更多相关《基因组学.docx(27页珍藏版)》请在冰豆网上搜索。
基因组学
概论
1.证明双螺旋的证据:
生物物理学数据、X射线衍射图谱、碱基比例
2.B-型DNA:
1)DNA具有规则的螺旋形式,每34A(3.4nm)形成一整圈,直径为20A。
每圈10个核苷酸。
2)螺旋包含两条多聚核苷酸链,碳-磷酸骨架位于外部,碱基位于内部。
3)A与T,G与C总是互补配对,通过氢键相连。
这称为碱基互补配对。
3.基因/顺反子(cistron),指能产生一条肽链的DNA片段。
包括编码区和其上下游非编码区(引导区和尾部),以及在编码片段(外显子)间的割裂序列(内含子)。
基因是DNA;基因包含编码区和非编码区;编码区包含外显子(Exon,编码)和内含子(Intron,非编码)
4.基因组,指生物体遗传物质的全部序列,它包括每一条染色体和任何亚细胞器的DNA序列。
是包含了全部的遗传信息,是一个双倍体细胞DNA组成的一半(一条染色体),多细胞真核生物有两套独立的基因组:
核基因组和细胞器基因组
5.细胞内的RNA组分
编码RNA:
mRNA4%,寿命短
非编码RNA(功能性RNA):
rRNA核糖体组分最丰富(>80%)
1)tRNA转运aa到核糖体
2)小RNA核小RNA,核仁小RNA,微RNA,短干扰RNA
6.转录组:
一个细胞、组织或生物体的全部RNA的集合,其复杂性主要来自mRNA,但也包括非编码RNA。
7.比较不同转录组差异的技术:
转录组水平的差异显示技术
8.蛋白质表达类型:
管家蛋白,是那些(理论上)在所有细胞中都表达的基因,因为它提供了对人和细胞类型生存都是必需的功能。
含量丰富,表达差异小
使细胞具有特化功能的蛋白含量相对少
9.蛋白质组:
在整个基因组中所表达的全部蛋白质的集合。
对于有些基因,一条基因能表达多种蛋白质,所以蛋白质组的蛋白质数量远大于基因组的基因数量。
10.蛋白功能多样性
催化作用:
酶结构作用:
骨架蛋白运动作用:
肌动蛋白、肌球蛋白运输作用:
血红蛋白
调节作用:
信号蛋白、活化调节蛋白保护作用:
抗体储存作用:
肝脏铁蛋白
11.基因组学,是研究基因组的科学,它包含了庞大的数据采集和高通量(high-throughput)的研究方法方法。
12.最初的七大物种(模式生物):
大肠杆菌、酵母、线虫、果蝇、拟南芥、小鼠和人
13.人类基因组研究成果表明:
基因数量少得惊;2、人类基因组中存在“热点”和大片“荒漠;3、三分之一为“垃圾”DNA;
4、种族歧视毫无根;5、男性基因突变比例更高
14.中国人类基因组计划研究成果:
1)1%测序任务,第三条染色体3000万bp,精确度99.99%,发现142个基因,其中80个为预测基因
2)人类基因组基本数据:
人类基因组包含31.647亿碱基对、平均每个基因碱基数是3000、基因总数约为3万个、不同个体间的碱基顺序有99.9%相同、已发现的基因中约一半功能未知
3)1%的人类基因组被用来编码蛋白:
基因序列占25%、外显子序列仅占1%、重复序列超过50%
4)在超过人类基因组50%以上的重复序列中绝大部分是转座子
15.转座子:
能将自身插入基因组新位置的DNA序列(与靶位点无任何相关序列)。
基因组结构
1.染色体的功能:
a)染色体是DNA的紧密结构更适合在细胞中存在;
b)包装可以保护DNA免于损伤;
c)只有包装成染色体的DNA才能在每次细胞分裂时有效将DNA传递给两个子细胞。
d)染色体将每个DNA分子全面地组织起来,从而有助于基因的表达和亲本染色体间的重组。
2.C值--单倍体基因组中DNA的总量
基因组大小(C值大小)大致上与物种进化的复杂性相关,随着物种复杂度的增加C值一般增加,但是存在例外。
这种例外被称为C值佯谬或C值悖论。
现象:
①某些低等物种的基因组更大、②相似生物的基因组差异很大、③物种复杂性与基因组的相关性不精确
低等生物基因密度相对较高,复杂度高的生物基因密度低
3.真核生物基因组结构特点
a)线性
b)DNA与蛋白质包装成染色体,有至少两条染色体
c)转录产物为单顺反子,即一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链,每个基因转录有各自的调节原件
d)存在重复序列
e)不编码区域多于编码区域
f)大部分是断裂基因:
基因有内含子
g)存在大量DNA多态性:
单核苷酸多态性(SNP),串联重复序列多态性
h)具有端粒结构
4.DNA包装成染色体
a)染色体比所含DNA分子短得多
b)染色体=DNA+组蛋白(染色质核酸酶保护实验)
c)八个组蛋白分子(H2A,H2B,H3,H4各两个)组成桶装的核心八聚体,称核小体,DNA缠绕连接于核小体外
d)除核心八聚体蛋白外,还有一组附加组蛋白,它们相互连接,统称为连接组蛋白。
如脊椎动物中的H1a-e,H1。
H1t和H5
e)每个连接组蛋白附着于一个核小体,形成染色小体
5.人染色质核酸酶保护分析步骤:
1)提取染色质、2)DNA酶处理:
有限量酶处理和充分量酶处理、3)蛋白酶降解、4)凝胶电泳
原理:
酶消化无蛋白保护的DNA,有限量酶消化只切割一次,充分量酶消化切割所有无蛋白保护DNA
结论:
每个蛋白-DNA复合物有146bpDNA,间隔区有200-146=54bpDNA
6.核型与核型分析
a)可以通过一些染色技术来产生特定染色体典型的带型特征。
b)这种中期的特有染色体表型被称为核型。
包括染色体的数目、大小、形态特征等。
c)核型分析对于探讨人类遗传病的机制、物种亲缘关系与进化,远缘杂种的鉴定,具有重要意义。
7.着丝粒DNA序列含有重复序列和少数基因
8.酿酒酵母着丝粒中DNA与蛋白质的相互作用:
1)着丝粒包括CDEI、II和III三个元件,I和III在酵母16条染色体中高度保守,II可变。
2)Cse4和Mif2结合,形成被CDII序列包绕的核心复合体。
3)Cbf1和Cbf3分别识别并结合CDEI和III,从而固定了蛋白质与DNA的结合。
4)Cbf1和Cbf3还至少结合20种其它蛋白,形成着丝点(动粒,Kinetochore)。
5)着丝点作为微管的附着点,由微管负责将分裂的染色体拉入子代。
9.着丝粒大小、组成在不同生物间的差异
高等生物着丝粒DNA更大,组成更复杂。
类似与染色体其它区域,包含了核小体。
其中部分区域除包含H3组蛋白外,还包含CENP-A蛋白,使核小体更坚实、紧密。
10.端粒:
真核生物所特有的染色体末端区域
由DNA序列和蛋白质组成的复合物
DNA序列相当保守,一般由多个短核苷酸串联组成。
人类的端粒DNA是由数百拷贝的5’-TTAGGG-3’重复序列组成
具有保护线性DNA的完整复制、保护染色体末端和决定细胞的寿命等功能。
11.基因不均匀分布
a)染色体染色后带型不均匀
b)等容线(isochore)模型:
脊椎动物和植物的基因组是许多DNA片段的嵌合体,每个片段至少长300kb,并有均一的碱基组成但与临近的片段之间有一些差异。
人类基因组DNA,可见五种组分的异粒:
富含AT的异粒L1和L2,以及富含GC的异粒H1、H2、H3。
12.DNA多态性
a)Polymorphism(多态性):
指基因组群中同时发生的等位基因不同(不同表型的等位基因或限制性模式的DNA变化)。
b)单核苷酸改变,称为单核苷酸多态性(SNP)
c)串联重复序列多态性
13.重复DNA序列
散布重复序列(interspersedrepeat),重复序列以随机方式散布于整个基因组中
串联重复序列(tandemlyrepeat),重复序列一个接一个的方式排布
14.串联重复DNA序列与卫星DNA
a)串联重复序列也叫卫星DNA(satelliteDNA),密度梯度离心分离到基因组DNA时,这些重复序列可形成卫星带。
b)一个基因组中的卫星DNA重复单元长度可以在5bp以下到200bp以上。
c)大多数位于着丝粒。
d)小卫星(minisatellite)和微卫星(microsatellite)DNA,是两种没有出现在卫星带中的串联重复序列,其中前者形成长达20kb的聚集区,每个重复单元最多25bp;后者通常聚集区小于150bp,其重复单元只有13bp或更小。
15.基因家族
一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同祖先基因(ancestralgene)经重复(duplication)和突变产生。
16.基因家族的特点:
1)基因家族的成员可以串联排列在一起,形成基因簇(genecluster)或串联重复基因(tandemlyrepeatedgenes),如rRNA、tRNA和组蛋白的基因;
2)有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;
3)有些成员不产生有功能的基因产物,这种基因称为假基因
17.存在核外基因的证据:
a)非孟德尔遗传指杂交后代没有表现出孟德尔亲代性状的分离,这反映了分离性状与减数分裂纺锤体缺少关联
b)体细胞分离亲代性状在体细胞中分离,并由此出现了该生物的非均一性,使植物发育的一个显著特点,反映了分离性状与有丝分裂纺锤体缺少关联。
c)这些现象表明有基因存在与核外,而且不随减数分裂和有丝分裂的纺锤体而分离,因而不能把基因组的两份拷贝分别分配到配子或子细胞中。
18.细胞器基因组
a)通常是环状。
b)编码部分而非全部的细胞器蛋白
c)叶绿体基因组相对较大,在高等植物中约为140kb。
d)动物线粒体基因组较小,哺乳动物约16.5kb、酵母约80kb、植物变化较大最小的约100kb
19.线粒体基因组
a)动物细胞线粒体DNA非常紧凑,一般编码13种蛋白质(与呼吸作用有关)、2个rRNA和22个tRNA。
b)酵母线粒体DNA有较长的内含子,所以比动物细胞的大5倍。
c)线粒体是通过内共生演化的
d)高等动物线粒体基因完全来源于母体。
“非洲夏娃”学说
20.原核生物基因组:
①比真核生物基因组小②比真核生物基因数少③物理结构不同于真核:
单一环状DNA分子④连续基因:
无内含子⑤重复序列罕见⑥操纵子
21.拟核(nucleoid),细菌中包含基因组的紧凑结构。
无核膜,染色较浅。
细菌染色体(DNA和蛋白质的有序包装),主要包含蛋白质核心和超螺旋DNA环。
22.大肠杆菌环状基因组的超螺旋(Supercoiled)结构
超螺旋分别是由DNA双螺旋再次螺旋(正超螺旋)或去螺旋(负超螺旋)形成。
在大肠杆菌中,超螺旋是由DNA解旋酶和拓扑异构酶I产生和调控的。
23.大肠杆菌环状基因组的基因排布
基因间几乎无间隔和基因内无内含子。
这样,大肠杆菌基因组中非编码DNA仅占11%。
几乎不存在重复序列。
仅在少数特定菌株中存在少数重复序列。
24.操纵子是原核生物基因组的特征,指一组在基因组中彼此相邻的基因,两基因头尾间可能仅隔一两个核苷酸。
操纵子的所有基因都作为一个单位表达。
25.质粒
a)原核生物主染色体之外的DNA,常以环状形式存在。
b)可能存在两个或两个以上的DNA分子。
c)一些可以整合到基因组中,一些独立。
d)主要类型:
抗性、生殖、杀伤、降解、毒性
26.病毒基因组结构
其不具有传统细胞的结构
27.具有独特的生命属性
1)专性寄生:
只在一个物种的宿主细胞中复制。
2)其基因组复制与表达至少需要部分改变宿主的遗传装置。
3)病毒需要适应宿主的基因系统:
许多病毒需要利用宿主DNA或RNA聚合酶进行基因组复制和表达,而所有病毒都利用宿主的核糖体和翻译装置来合成其子代蛋白。
其基因组可能是DNA分子,也可能是RNA分子,且可能是双链,也可能是单链
28.分类:
细菌病毒(噬菌体)和真核细胞病毒
29.噬菌体由蛋白质外壳(capsid)和内部核酸组成
三种常见的外壳结构:
a)二十面体结构,例如大肠杆菌MS2噬菌体
b)丝状或螺旋状结构,例如大肠杆菌M13噬菌体
c)头-尾结构,噬菌体所特有的,例如大肠杆菌T4噬菌体
30.多数噬菌体一个DNA或RNA分子就包含了整个基因组,但是一些RNA噬菌体,其基因组的基因由几个不同的RNA分子携带,称为节段基因组
31.重叠基因:
同一段DNA能携带两种以上不同蛋白质的信息。
32.噬菌体根据其生命周期可以分为两类:
1)裂解性(烈性,virulent),在首次感染后不久就杀死其宿主细胞。
典型代表T4噬菌体。
2)溶源性(温和性,temperate),这类噬菌体可以进入溶源性周期,在宿主细胞内静止停留,甚至经历宿主细胞的多次传代。
典型代表λ噬菌体。
33.T4噬菌体的裂解性感染周期的分子事件:
一步生长曲线经历潜伏期(Latentperiod),22分钟
噬菌体与细菌外表面受体蛋白结合,将DNA注入细菌中→噬菌体DNA开始转录→噬菌体DNA复制→外壳蛋白合成→宿主细胞裂解,释放新的噬菌体
34.λ噬菌体从溶源性感染周期到裂解性感染周期的分子事件:
噬菌体基因组DNA通过位点特异性重组在大肠杆菌基因组的整合位点发生重组,整合入大肠杆菌基因组DNA→停留在细菌中,随细菌DNA多代复制→受到外界诱导而转换成裂解性感染模式→将噬菌体DNA切割出来→噬菌体基因表达、DNA复制、外壳合成,新噬菌体释放出来
35.真核生物病毒:
外壳为二十面体或丝状;
显著特征:
外壳可能被脂质膜包被,这种膜结构是在新病毒颗粒离开细胞时,从宿主细胞处获得,并可以随后通过插入特异性蛋白质来进行修饰。
36.逆转录病毒的复制策略:
1)注入、2)逆转录、3)整合
1.基因组结构维持与改变
基因组的相对稳定(维持)是物种生存的需要:
依靠复制(模板依赖性)与修复;基因组改变是进化的基础
基因组改变的类型:
1)突变小范围序列改变单个或几个核苷酸的替换、插入、缺失来源于DNA复制错误或诱变破环。
2)重组大范围序列重建同源重组、位点特异性重组、转座来源于染色体内或染色体间序列的交换。
2.基因组复制:
半保留复制的实验证明—Meselson-Stahl实验
3.拓扑异构酶—解旋酶解决了拓扑问题
催化断裂-再连接反应的酶。
在DNA分子一条或两条链上形成切口,通过切口解开螺旋。
4.复制起始—双向复制
两个复制叉(复制眼),一条链为模板,双向复制;每条链复制中,合成方向相同:
5’到3’;两条链复制方向反向平行;复制起始存在着固定的位点,复制起点细菌:
环形基因组只有单一的复制起点
真核生物:
线性基因组存在多个复制起点
5.大肠杆菌复制起点
复制起点oriC,长约245bp2个重复基序
1)9核苷酸5拷贝DnaA蛋白结合位点结合30个DnaA蛋白
2)13核苷酸3拷贝富含AT
几个解旋相关蛋白:
DnaA,HU,DnaC,DnaB解旋酶
6.酵母复制起点:
自主复制序列ARS,不足200bp
1)含四个具相似序列的亚结构域:
2)A+B1起始识别序列约40bp,为起始识别复合物(ORC)结合部位
3)B3与大肠杆菌复制起点相似结合ARS结合因子(ABF1),从而使B2的双螺旋结构解开
7.复制延伸
1)在复制起点形成复制叉
2)母代双链中一条连续复制,称前导链;一条不连续,称滞后链(半不连续)
3)DNA聚合酶(细菌5个,其中DNA聚合酶III是复制酶;真核生物9个,其中DNA聚合酶δ是复制酶)、引物
4)前导链连续合成,后滞链非连续合成,合成方向:
5’到3’
5)滞后链合成中,最初形成一些短的片段,称冈崎片段;真核生物的冈崎片段则短得多
6)模板依赖性的DNA聚合酶需要引物来启动单链上的DNA合成
8.非连续合成中的引物与引发酶
a)RNA引物:
DNA聚合酶不能作用于无引物的单链模板,而RNA聚合酶可以
b)细菌中引发酶(primase)合成4-15bp的引物;引发酶不是转录酶
9.细菌和真核生物在DNA合成引发中的差异:
细菌只需引发酶合成RNA引物
真核生物由引发酶和DNA聚合酶α形成复合物合成RNA引物和其后的约20个DNA核苷酸
10.大肠杆菌复制需要多种蛋白的协作
拓扑异构酶、解旋酶(DnaB):
解旋;DNA聚合酶III:
复制;引发酶:
提供引物;单链结合蛋白(SSB):
稳定打开的双链;连接酶:
连接冈崎片段;其它蛋白。
11.大肠杆菌复制中解旋酶的作用
1)DnaB是大肠杆菌中复制相关的主要解旋酶,是一种5’→3’解旋酶
2)它可以沿后滞链移动,同时使碱基对断裂
3)另外两种3’→5’解旋酶:
PriA、Rep
4)拓扑异构酶解除解旋所产生的扭转张力
12.大肠杆菌复制中单链结合蛋白的作用
a)单链结合蛋白(SSB),复制中打开的单链容易重新结合及降解,SSB是一种缺乏酶活性的蛋白,会结合到多聚核苷酸上防止两条链的重新结合及降解。
b)大肠杆菌SSB是由4个相同的亚基组成。
c)当复制复合物开始复制时,SSB必须与单链分离,这一作用由复制介导蛋白(RMP)来完成。
13.引发小体(primosome)与复制体(replisome)
1)引发小体,复制起始中,解旋酶结合到起点以后形成引发前复合物,然后引发酶结合,形成引发小体。
2)引物合成后,由DNA聚合酶III二聚体来延伸。
3)DNA聚合酶III二聚体与引物小体结合称为复制体。
14.大肠杆菌复制中完成滞后链合成的方式
复制酶DNA聚合酶III不具备5’->3’外切酶活性,到达下一个冈崎片段末端的RNA引物时停止
DNA聚合酶I和RNaseH共同作用去除RNA引物,代之以DNA
15.真核生物中后滞链合成的方式
RNaseH模型:
RNaseH去除引物至其最后一个核苷酸,侧翼内切核酸酶(FEN1)去除最后一个核苷酸和部分DNA
侧翼模型:
DNA聚合酶δ和解旋酶使引物与模板间碱基对断开,并被推成分支,再有FEN1切除分支
16.大肠杆菌基因组复制终止
存在终止序列:
Tus蛋白识别位点
Tus蛋白的不同结合方向控制了复制叉是否能够通过
17.复制中的突变(复制中的自发错误):
尽管DNA聚合酶存在校正能力,但是但突变仍不可避免
点突变:
转换嘌呤到嘌呤或嘧啶到嘧啶;颠换嘌呤到嘧啶或嘧啶到嘌呤
插入或缺失:
出现在编码区可能导致移码;其它区域可能导致多态性(复制滑移)
存在很多不影响基因组功能的突变
18.沉默突变:
1突变在基因间非调控区域或基因间非编码区域,对整体基因组功能无影响的突变。
可发生在人类基因组的98.5%。
2编码区的突变不影响编码蛋白的氨基酸序列,同义突变
19.点突变对基因编码区的四种影响
1同义:
突变后,由于密码子兼并性,而不影响所编码的氨基酸;②非同义:
引起氨基酸的错误编码
2无义:
引起过早终止;④通读:
引起无法终止
20.编码区的插入或缺失突变可能导致不同的影响
插入或缺失的核苷酸是3的倍数,仅影响个别氨基酸,因此影响可能较小;非3的倍数,将导致移码
21.非编码区突变可能影响基因组的功能
基因表达调控区域的突变:
顺式作用元件,如核心启动子、关键调节序列;内含子剪接位点的突变:
如5’剪接点
22.DNA聚合酶确保DNA复制精确性的机制:
核苷酸选择:
聚合前选择正确的核苷酸;校对:
3’到5’外切酶活性,聚合后切除错配的核苷酸
23.四类DNA修复系统:
直接修复、切除修复(针对诱变损伤)、错配修复(针对复制错误、重组修复)
24.切除修复(主要修复系统):
1)DNA糖基化酶切除碱基,产生无碱基(AP)位点
2)AP内切核酸酶产生单核苷酸切口
3)DNA聚合酶填补碱基
4)DNA连接酶连接断裂
25.错配修复中子代DNA的识别:
1)大肠杆菌中子代新生分子尚未甲基化,从而可以区分
2)甲基化位点:
3)5’-GATC-3’A甲基化
4)5’-CCA/TGG-3’C甲基化
26.SOS应答:
修复难以进行时绕过主要损伤位点,允许某些复制错误保留,继续复制
27.重组,各种包括多聚核苷酸断裂和再连接的过程。
28.同源重组,也叫一般性重组,发生在具有高度序列同源性的DNA片段之间。
这些片段可处在不同染色体上,也可以是同一染色体的不同部分。
真核生物中,发生于减数分裂时期,负责减数分裂中的互换。
29.同源重组的Holliday模型:
交换→连接→分支迁移→断裂→Holliday结构分离
重组是由于异源双链体DNA间发生断裂与单链的交换,产生异源双链体DNA片段;当双链体DNA的单链与相对应的另一双链体中的单链发生置换时,会产生一个分叉结构(Holliday结构),分叉迁移使交叉点移动,封闭切口,两次(相互的)交换才能产生一个联合分子,联合分子可以通过切开相接的链来形成两条分开的双链体分子。
30.Holliday结构与重组体的形成
参与交换的链在解离过程中被切开,则水平分离,基因组不是重组体,但包含异源双链体DNA;没被切开,则垂直分离,产生互相重组的基因组
31.Holliday模型的缺陷与Meselson-Radding修正模式
单分子切口,切口链侵入未打开的双螺旋,形成D-环;被取代链断开,形成另一个分子上的切口,修正:
在两分子切口形成过程中引入交换的D环
32.双链断裂模型
单分子双链断裂,外切酶使断裂扩大,一个3’端侵入未打开的双螺旋,形成D-环,另一个3’端链延伸,相互移动形成双交换,即形成两个Holliday结构
33.位点特异性重组
同源重组是发生于两段高度序列同源的DNA区域间,但是这种广泛同源的区域并不是重组的必要条件,该过程也能由两个只具有很短相同序列的DNA分子引发。
这称为位点特异性的重组。
λDNA整合到大肠杆菌基因组中
34.λDNA整合到大肠杆菌基因组中参与的酶
1)整合通过att位点,λ基因组中的attP位点和大肠杆菌基因组中的attB位点,之间的特异性重组进行。
2)每个结合位点的中心有一个15bp的相同的核心序列:
O序列。
3)细菌基因组中O序列旁侧的可变序列为B和B’;λ基因组旁侧的可变序列为P和P’。
4)核心序列突变会导致att位点失活,旁侧序列突变只会降低重组效率。
35.重组酶通过识别重组位点来发生重组
①每个重组位点由一对对称排列重组酶识别位点构成。
识别序列中间所包围的是一个短的不对称序列,称为交换区,DNA的断裂和重新连接就发生在这里。
②单个DNA分子上的两个位点可能反向重复,也可能同向重复排列。
③同一个DNA分子上两反向位点间重组发生倒位,而两同向位点间发生缺失。
④个不同分子间发生插入。
36.转座,是一个DNA片段从基因组中的一个位置移动到另一个位置的过程。
这些可移动的片段称作转座元件或转座子。
保守型转座:
剪切-粘贴复制型转座:
增加拷贝数
经过RNA中间体(逆转座),逆转座子不需要RNA中间体,DNA转座子
37.核基质:
细胞核内除核膜、染色质、核仁和核孔外的骨架结构。
在核内每一条染色体都有自己的地域
38.染色质:
真核生物细胞中细胞核内DNA和蛋白质高度包装的紧密复合体结构。
39.染色质的低水平包装:
核小体和30nm螺旋管纤维是分裂间期细胞核染色质形式(松散)。
中期染色体是最高水平的压缩。
40.