基因组学复习试题.docx
《基因组学复习试题.docx》由会员分享,可在线阅读,更多相关《基因组学复习试题.docx(14页珍藏版)》请在冰豆网上搜索。
基因组学复习试题
第1章
1)什么是C-值悖理?
什么是N-值悖理?
C-值悖理:
生物基因组的大小同生物进化所处地位的高低无关的现象。
N-值悖理:
基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理
2)什么是序列复杂性?
基因组中不同序列的DNA总长,用bp表示。
3)RNA分子有哪些种类?
mRNAtRNArRNAscRNAsnRNAsnoRNA小分子干扰RNA
4)不编码蛋白质的RNA包括哪些类型?
tRNArRNAscRNAsnRNAsnoRNA小分子干扰RNA
5)什么是假基因?
假基因是如何形成的?
来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。
产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。
6)假基因能否表达?
为什么?
能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。
最初人们认为,假基因是不能转录的基因,随着基因组数据的积累,现在已知有不少假基因仍然保持转录的活性,特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能,如产生残缺蛋白质。
7)如何划分基因家族?
什么是超基因家族?
基因家族:
将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。
超基因家族:
起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。
8)低等生物与高等生物基因组组成有何差别?
为什么会产生这些差别?
低等生物:
1)结构紧凑,一般不存在内含子(古细菌除外);
2)大小在5Mb以下;
3)缺少重复序列;
4)很少非编码序列。
高等生物:
1)结构松弛,含有大量重复序列;
2)基因大多为断裂基因,由内含子和外显子构成;
3)由线性DNA与蛋白质组成染色体结构;4)含有细胞器基因组。
9)有哪些结构异常的基因?
举例说明。
重叠基因:
编码序列彼此重叠的基因。
1.单个的mRNA可以编码2种或多种蛋白质。
例如:
大肠杆菌噬菌体ΦX174基因组长5386bp,共编码11个基因,有7个基因为重叠基因,其中3个重叠基因A,A*和B共享部分3’端序列。
2.由不同的启动子转录的彼此重叠的mRNA,各自编码不同的蛋白质。
例如:
人类核基因组INK4a/ARF座位有2个蛋白质产物p16和p19,他们利用同一座位的不同启动子,第一个外显子不同,但共享第二和第三个外显子,产生两个不同读框的mRNA。
基因内基因:
一个基因的内含子中包含其他基因。
例如:
线虫基因组中一个编码甘氨酸合成酶的基因FGAM有21个内含子,内含子9中含有一个独立的基因,内含子11中含有4个独立的基因。
反义基因:
与已知基因编码序列互补的负链编码的基因。
例如:
大麦有3个可在种胚糊粉层专一性表达的α-淀粉酶基因,2个为A型,一个为B型,由赤霉素诱导表达。
基因组中已检测到编码A型α-淀粉酶反义RNA基因,它的表达受控于脱落酸,这是脱落酸拮抗赤霉素的分子机制之一。
第2章
名词解释
遗传图、物理图、重叠群、小卫星、微卫星
问答题:
1.理想的遗传作图标记应该满足哪些条件?
RFLP、SSLP和SNP标记各有什么特点和优缺点?
2.造成遗传图发生偏离的因素有哪些?
1)什么是遗传图?
遗传作图的理论基础是什么?
遗传图是应用遗传学分析方法将基因或其他DNA序列标定在染色体上构建的连锁图。
基础:
孟德尔1865年首次描述的遗传学原理。
2)什么是分子标记?
有哪些分子标记?
各有什么特点?
是指以DNA片段为标记,通过DNA片段的电泳使DNA产生多态性。
限制性片段长度多态性(restrictionfragmentlengthpolymorphisms,RFLP)
特点:
1).处于染色体上的位置固定。
2).同一亲本及其子代相同位点上的多态性片段特征不变。
3).同一凝胶电泳可显示同一位点不同的多态性片段,具有共显性特点。
4).有两种等位形式。
简单序列长度多态性(simplesequencelengthpolymorphisms,SSLP)
具有多等位性。
又可分为可变串联重复(variablenumberoftandemrepeat,VNTR)
特点:
多态信息含量较高,但数量有限,而且在基因组上分布不均匀,不适合PCR扩增。
简单串联重复序列(singlesequencerepeat,SSR)
特点:
1)染色体上的位置相对固定;
2)操作简单,可以用PCR扩增;
3)同一凝胶电泳可显示不同多态性片段,表现为共显性;4)有多种等位形式。
单核苷酸多态性(singlenucleotidepolymorphisms,SNP)
特点:
1)理论上同一碱基位置SNP等位形式最多为4,但多数为2.
2)直接从STS测序中可寻找到SNP.
3)数量极大,
4)SNP与人类易感性疾病有关,涉及药物基因组学.
5)编码区SNP主要分布在密码子的第3个碱基位置.
3)什么是RFLP?
为什么会产生RFLP?
限制性片段长度多态性(restrictionfragmentlengthpolymorphisms):
由于同源染色体同一区段DNA序列的差异,当用限制酶处理时,可产生长度不同的限制性DNA片段,这些DNA片段经琼脂糖凝胶电泳分离,可直接显示不同个体同一位点的DNA组成的差异。
凡是可以引起酶切位点变异的突变如点突变和一段DNA的重新组织(如插入和缺失造成酶切位点间的长度发生变化)以及碱基突变等均可导致RFLP的产生
4) 什么是SSR标记?
为什么会产生SSR?
SSR标记有哪些优点?
SSR标记:
是一类由几个核苷酸(一般为1~6个)为重复单位组成的长达几十个核苷酸的串联重复序列。
主要产生于DNA复制时出现的“滑序”事件以及SSR序列等位形式之间的不等交换。
优点:
1)染色体上的位置相对固定,数量丰富且分布均匀;
2)操作简单,可以用PCR扩增;
3)同一凝胶电泳可显示不同多态性片段,表现为共显性;
4)有多种等位形式。
5)什么是SNP?
基因组中单个核苷酸的突变。
6)是什么原因造成染色体不同区段之间交换频率的差别?
同源染色体之间的不均等交换。
7)什么是重组热点?
染色体上某些比其他位点有更高交换频率的位点。
第3章
名词解释
限制性作图、序列标记位点、序列标记位点作图、作图试剂、、克隆文库、指纹
问答
物理作图的主要方法有哪些?
原理分别是什么?
各有什么优缺点?
什么叫序列标记位点?
序列标记位点需要具备什么条件?
如何在基因组当中寻找序列标记位点?
如何组建克隆重叠群?
1)什么是基因组物理图?
物理图与遗传图有何不同?
有了遗传图为什么还要绘制物理图?
直接检测DNA标记在染色体上的实际位置。
前者是描述的基因相对位置,后者是具体的碱基位置
因为遗传图存在以下缺点:
1.遗传学图谱分辨率有限。
2.遗传学图的覆盖面较低。
3.遗传图分子标记的排列会出现偏差。
2)如何制备与分离大分子DNA?
采用脉冲凝胶电泳(pulsed-filedgelelectrophoresis,PFGE)将一个方向不断变换的电场,取代简单的单一电场(单向电场)使电泳中受阻的DNA分子在电场改变时扭转迁移方向,较小的分子比较大的分子重新排列的快,以此达到分离的目的。
分辨率达到10Mb。
3)何谓限制性作图?
将限制性酶切位点标定在DNA分子的相对位置。
4)什么是YAC载体?
它有什么优缺点?
酵母人工染色体(yeastartificialchromosome,YAC),具有酵母染色体的特性,以酵母细胞为宿主,能在酵母细胞中复制。
优点:
容量大,插入片段可达1400kb.
缺点:
转化效率低;插入子稳定性差;嵌合克隆比例高,达48%;插入DNA的制备相当困难。
5)什么是BAC载体?
它有什么优缺点?
细菌人工染色体(bacterialartificialchromosome,BAC),具有细菌染色体的特性,以细菌细胞为宿主,能在细菌细胞中复制。
优点:
单拷贝复制,不会因重组发生嵌合;采用类似制取质粒的方法直接克隆DNA,便于机械化操作。
6)什么是重叠群(contig)?
如何构建重叠群?
相互重叠的DNA片段组成的物理图成为重叠群。
最早采用染色体步移法,首先丛集引文库中挑选一个随机或者指定的克隆,将该克隆的起始末端序列分离纯化作为探针,然后再基因文库中找到与之重叠的第二个克隆。
在第二个克隆的基础上重复操作程序寻找第三个克隆,一次延伸,直到完成所需要的重叠群。
7)STS作图依据的原理是什么?
两个STS出现在同一片段的机会取决于他们在基因组中的距离,彼此靠的越近,分离的几率越小。
两个STS之间相对距离的估算与连锁分析的原理一样,它们之间的图距根据它们的分离频率来算。
8)什么是DNA指纹?
有哪些DNA指纹?
DNA指纹:
指确定DNA样品所具有的特定DNA片段组成。
种类:
限制性带型(restrictionpattern)指纹;重复序列(repetitiveDNA)指纹;重复序列DNAPCR(repetitiveDNAPCR)或者分散重复序列PCR(interspersedrepeatelementPCR,IRE-PCR);STS作图(STScontentmapping)指纹。
第4章
名词解释:
顺序间隙、物理间隙、支架、覆盖面
问答:
自动化测序的原理?
基因组测序与组装有哪些策略?
他们各有什么优缺点?
重叠群之间的间隙有哪两种?
1)DNA测序中采用的DNA多聚酶与细胞的DNA多聚酶有什么差别?
1.高酶活性
2.无5’→3’外切酶活性
3.无3’→5‘外切酶活性
2) 鸟枪法测序与作图法测序有何差别?
鸟枪法测序把基因组全部打散成短序列,测序后通过程序寻找互相覆盖的部分进行连接得到整个的序列结果。
适合小,简单,重复序列少的基因组,测序速度快,并且无须提供相关的遗传图谱和物理图谱,效率高。
作图法先将DNA分解成长序列,然后把长序列通过mapping定位到染色体上某段位置,再把长序列打散成短序列进行测序,适合大分子DNA克隆,测序时间长,依赖遗传图谱和物理图谱,效率低。
3)为何原核生物基因组更适合鸟枪法测序?
因为原核生物基因组结构紧凑,一般不含有内含子(古细菌除外),大小在5Mb以下,缺少重复序列,很少非编码的序列。
而鸟枪法适合基因组小,简单,重复序列少的测序。
4)图解说明BAC克隆测序与序列组装的过程.
书82页
5)为何BAC克隆测序和全基因组鸟枪法测序都会留下间隙(gap)?
任何基因组的测序都不可避免的会出现序列间隙和物理间隙。
6)什么是物理间隙?
什么是序列间隙?
如何填补这两类间隙?
物理间隙:
构建基因组文库被丢失的DNA序列,他们从已有的克隆群体中永远的消失。
物理间隙的缝合需要利用其他载体或者宿主菌重新构建一个基因组文库,然后利用间隙两侧的序列作为探针,或者制备相应的PCR引物,从新文库筛选阳性克隆,重新测序。
序列间隙:
测序时遗漏的序列,这些序列任然保留在尚未挑选到的克隆中。
序列间隙可以通过利用相邻已知顺序作为探针,筛选已有的基因组文库,挑选阳性克隆重新测序进行缝合。
7)大型基因组鸟枪法测序的缺点是什么?
如何克服这些缺点?
容易产生间隙,组装时容易出错
与作图法结合或多次测序多次组装
8)基因组鸟枪法测序要构建大小不同的插入片段克隆文库,原因何在?
1.采用多个基因组文库时因为任何一种载体都会因某些插入片段与宿主菌的不兼容而不能扩增,使一些DNA
片段丢失
2.多种质粒文库也增加了克隆片段的总长,扩大了覆盖面
文库的构建有助于在2kb质粒来源的两端测序序列组装时校正由重复序列产生的差错
和BAC文库的构建可以使下片段DNA文库组建的重叠群在大分子克隆中有效而准确地归并与整合,避免了再全基因组范围内直接进行重叠群排序所产生的错误,可提高序列组装的效率,保证序列组装的可信度。
9)为何着丝粒区和近端粒区DNA的测序非常困难?
重复序列多
第5章
1)简述原核生物和真核生物基因结构的特点与差别.
真核生物有内含子外显子
2)什么是ORF?
开放读框(openreadingframe),由一系列指令氨基酸的密码子组成。
3)什么是序列同源性?
什么是序列一致性?
什么是序列相似性?
同源性:
起源于同一祖先但发生变异的序列之间的关联性。
一致性:
同源DNA序列的同一碱基位置上相同的碱基成员,或蛋白质中同一氨基酸位置相同的氨基酸成员的比例。
相似性:
同源蛋白质氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。
4)什么是直系同源基因?
什么是共生同源基因?
它们的差别是什么?
直系同源基因:
不同物种之间的同源基因,他们来自物种分割之前的同一祖先。
共生同源基因:
同一生物内部的同源基因,他们常常是多基因家族的不同成员,其共同的祖先可能存在于物种形成之前或之后。
直系来自不同物种,共生来自同一物种。
5)蛋白质结构域在基因注解中有何意义?
由于蛋白质的整体功能是通过各个结构之间的协同作用而实现的,因此结构域的组成提供了蛋白质功能解毒的关键信息。
6)基因剔除的原理.
在一段无关片段的两侧连接与带换基因两侧相同的顺序,将这一构件导入目的细胞,由于同源片段之间的重组,可以使无关片段取代靶基因整合到染色体中。
为了便于筛选,用于取代的外源DNA中含有报告基因。
基因剔除是最简便的基因失活的方法,用于高等生物基因功能的研究。
第6章
1)异染色质与常染色质的差别是什么?
异染色质,分布在细胞核周缘,结构致密,着色深。
常染色质,分散在整个细胞核当中,结构比较松弛,着色浅。
2)何谓SAR?
何谓MAR?
骨架附着区(scaffoldattachmentregion,SAR):
与染色体骨架附着区结合的DNA序列。
基质附着区(matrixattachmentregion,MAR):
与核基质结合结合的DNA序列。
3)什么是CpG岛?
CpG岛有什么分布特点?
CpG岛是如何产生的?
CpG岛:
基因组中富含双碱基CpG的序列。
特点:
1.主要在脊椎动物中发现,其它种属基因组中也有CpG岛,但特征不明显.
2.绝大多数CpG岛中很少出现胞嘧啶甲基化,因此被认为是基因转录活跃区.
岛主要分布在基因的启动子区和第一个外显子区.
4.绝大多数管家基因含有CpG岛,是寻找基因的一个指标.
5.在染色体上分布很不均匀,但与基因的分布频率一致。
产生原因:
1.由于细胞内胞嘧啶甲基化与脱氨基事件常常发生,导致复制时的C→A错配.在下一轮复制时原来的胞嘧啶(C)位置由胸腺嘧啶(T)取代,即发生碱基代换.因此基因组DNA顺序进化的总趋势是A/T比例增加.
2.管家基因对生物的存活极其重要,启动子区是基因调控的主要成分,因此很少发生可遗传的C→A的突变,保留了较平均值更高的G/C比.
4)叶绿体和线粒体基因组起源于原核生物的依据何在?
1.细胞器基因表达的过程很多方面与细菌相似;
2.细胞器基因与细菌基因相似性高于核基因。
5)真细菌和古细菌操纵子的组成有何差异?
6)什么是DNA转座子?
什么是RNA转座子(或逆转座子)?
这两类转座子的转座方式有何特点?
DNA转座子:
基因组中广泛存在的一类可以移动位置的遗传因子,涉及DNA的直接转座。
RNA转座子:
以RNA为中介进行转座。
第一类本身含有编码转座子酶的基因,可以自主转录。
第二类本身不含有编码转座子酶的基因,需要在转座的时候提供转座酶才能转座。
8) 逆转座子可分为哪几类?
各有什么特点?
LTR类逆转座子:
A.逆转录病毒。
B.逆转录转座子(缺少外壳蛋白基因)
非LTR类逆转座子:
C.重复序列LINE(缺少逆转座子边界顺序)D.重复序列SINE(由mRNA反转录产生)
9) 线粒体基因组与叶绿体基因组在结构与组成上有何差异?
线粒体基因组:
1.结构非均一
2.不同种属之间线粒体基因组大小变化很大
3.含有大量短序列正向或反向重复序列
叶绿体基因组:
1.结构紧凑,少非编码序列
2.不同种属之间叶绿体基因组大小比较恒定
3.拷贝数不恒定
4.有两段很长的反向序列
第12-13章
1) 什么RNA世界?
科学依据多年的科学研究而提出的一条关于生命科学的理论。
其内容为:
生命进化的早期,没有蛋白质(酶),某些RNA可以催化RNA的复制--也就是说RNA是唯一的遗传物质,是生命的源头。
2)何谓“生命的三界”?
真细菌,古细菌,真核生物三域
3) 基因组主要通过什么方式增加基因的数目?
1.整个基因组加倍;2.单条或部分染色体加倍;3.单个或成群基因加倍。
4) 新基因的产生有哪些主要方式?
基因或基因组加倍
结构域洗牌
逆转录及其随后的变异或重排
外源基因水平转移
基因裂变与融合
非编码顺序转变为编码顺序.
5) 什么是外显子洗牌?
什么是结构域重排?
它在基因组进化中起什么作用?
外显子洗牌:
由不同基因中编码不同结构域的片段彼此连接形成的全新编码序列。
结构域重排:
不同的结构域重新排列产生具有创新功能的基因。
它们会有一个全新的结构组合,可为细胞提供完全不同的生物学功能。
6) 转座子对基因组进化有何影响?
1.大多数转座因子含有控制基因表达的序列,转座子的插入也能改变基因的表达模式
2.参与基因编码序列重排,为基因创新提供原材料
3.可引起基因组重排
7) 基因组的扩张有哪些方式?
1.整个基因组加倍;
2.单条或部分染色体加倍;
3.单个或成群基因加倍。
1) 什么是分子钟?
(第14章)
单位时间内同源蛋白质氨基酸序列或DNA核苷酸序列取代的比率称为分子钟。