基因组学期末复习资料.doc
《基因组学期末复习资料.doc》由会员分享,可在线阅读,更多相关《基因组学期末复习资料.doc(22页珍藏版)》请在冰豆网上搜索。
第一章 基因组概论
1、 基本概念
隔裂基因:
大多数真核生物蛋白质基因的编码顺序(Exon)都被或长或短的非编码顺序(Intron)隔开。
重叠基因/嵌套基因:
指调控具有独立性但部分使用共同基因序列的基因/同一段DNA能携带两种不同蛋白的信息.
假基因:
一般由先前的功能基因积累突变形成,称为假基因,用符号Ψ表示。
基因家族:
真核基因组中有许多来源相同、结构相似、功能相关的基因,这组基因称为基因家族。
基因组:
一个物种的一套完整遗传物质的总和,包括核基因组和细胞质基因组。
基因组学:
研究生物体基因组的组成、结构与功能的学科。
结构基因组学:
着重研究基因组的结构并构建高分辨的遗传图、物理图、序列图和转录图以及研究蛋白质组成与结构的学科。
功能基因组学:
主要是利用结构基因组学研究所得到的各种信息在基因组水平上研究编码序列及非编码序列生物学功能的学科。
人类元基因组:
指人体内共生的菌群基因组的总和,包括肠道、口腔、呼吸道、生殖道等处菌群。
Alu序列:
灵长类动物细胞的主要散在的重复DNA序列。
含有限制性内切酶Alu的切点(AG↓CT)。
2、 原核与真核生物基因组与顺反子的等价关系
在简单基因组中基因与顺反子等价
原核和低等真核细胞:
基因与产物之间的关系比较简单。
通常是一基因一相应产物,而且基因往往与产物共线性。
基因和顺反子等价:
基因是遗传的功能单位;也是可表达的遗传信息的单位。
在细菌中:
基因是编码区(开放阅读框)。
细菌基因常常组合成一个操纵子,这样几种产物均由一条多顺反子mRNA翻译而成。
在真核细胞中:
基因是转录的单位。
大多数基因以单顺反子mRNA的形式转录。
3、 基因组C值与C值矛盾
基因组C值是一个物种的基因组固有的DNA含量,一般是恒定的。
C值矛盾或C值悖论:
C值大小与生物进化不协调的现象。
C值矛盾原因:
基因内(内含子)、基因间的间隔序列、重复序列和假基因序列
4、 基因组序列复杂性与基因组大小的关系
①序列复杂性:
不同序列的DNA总长。
②DNA序列复杂性:
C0t1/2=1/k,起始浓度DNA(C)在保温时间t后有半数DNA完全复性的数值。
③C0t1/2值越大,复性速率越慢,在特定数量DNA中含有重复的特定序列拷贝数比例越小,基因组的序列复杂性越大。
第二章 基因组遗传图谱
1、 基本概念:
遗传图:
采用遗传分析的方法将基因或其它DNA序列标定在染色体上构建连锁图。
图距单位为cM,1cM=1%的交换值。
家系图:
指某一家族各世代成员数目、亲属关系与该基因表达的性状或疾病在该家系中分布情况的示意图。
SNP/单核苷酸多态性:
同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象。
共分离:
在有性繁殖的后代,假如基因附近有一紧密连锁的分子标记,在细胞减数分裂时分子标记与基因之间由于相距太近很少有机会发生交换,那么这种分子标记与连锁的基因有最大的可能同时出现在同一个个体中,这种现象被称为共分离。
2、 植物基因组遗传图谱的构建方法
①.选择亲本:
要求亲缘关系远,遗传差异性大,亲本间分子标记具有多态性。
②.产生构图群体:
配制杂交组合,建立分离群体
③.遗传标记的染色体定位:
有单体、三体、代换系与附加系分析等方法,依据染色体剂量的差异à将遗传标记定位在特定染色体上。
即当供体材料总DNA等量时,DNA杂交带的信号强弱与该标记位于的染色体剂量成正比。
④.标记间的连锁分析:
通过分析分离群体内双亲间有多态性的遗传标记间的连锁交换情况和趋于协同分离的程度à即可确定标记间的连锁关系和遗传距离。
3、 人类基因组遗传图谱的构建方法
家系分析法:
分析8个家系134个成员(186个减数分裂)→根据5264个SSR标记绘制而成。
对于X染色体,另外利用12个家系的170个成员分析(105个减数分裂)→将5264个标记定位在2335个位点上→构建的人类基因组遗传图谱密度为每个标记599kb。
4、 细菌基因组遗传图谱的构建方法
·细菌是单倍体,不发生减数分裂。
·设计部分二倍体,让细菌在同源区段发生交换。
·部分二倍体作图技术:
接合、转化、转导
接合转移:
两个细菌机械接触,其中一细菌(供体)将DNA转移到另一细菌中。
转移的DNA可以是供体细胞染色体的一段拷贝或整个染色体;转移的DNA也可是质粒/附加体转移).而且供体DNA分子转移后,必须与受体细胞DNA发生双交换才能整合到受体细胞染色体中。
否则,转移的DNA将随受体细胞分裂而丢失,除质粒附加体转移例外。
细菌遗传作图中采用的都是生化标记,显性或野生型具有生化特性(如合成色氨酸),隐性表型是可以互补的性状(如不能合成色氨酸),从而检测转移DNA是否进入受体细胞。
感染(转导):
以噬菌体为媒介,将长度可达50Kb的DNA片段从供体细胞转移到受体细胞。
转化:
供体细胞释放的一段DNA(通常小于50Kb),经受体细胞摄取后整合到基因组中,可借助抗性培养基筛选重组克隆。
∆第三章 物理图绘制
1、 基本概念
物理图:
用分子生物学方法直接检测DNA标记在染色体上的实际位置绘制成的图谱。
图距单位为bp。
限制性作图:
将限制性酶切位点标定在DNA分子的相对位置。
基因组文库:
指将基因组DNA通过限制性内切酶部分酶解后所产生的基因组DNA片段随机的同相应的载体重组、克隆,所产生的克隆群体代表了某种有机体整个基因组。
重叠群:
一群相互重叠的克隆或DNA序列,可以是草图序列或精确序列,包括连续的(内部无间隙)或不连续的(内部含间隙)DNA序列。
克隆指纹:
指确定DNA样品所具有的特定DNA片段组成,一个克隆的指纹表示了该克隆所具有的指定序列的特征,可以同其他克隆产生的同类指纹比较。
作图试剂:
STS作图过程中用到的可覆盖待研究的染色体或基因组的DNA片段群。
2、物理作图的方法
1.限制性作图:
将限制性酶切位点标定在DNA分子的相对位置。
2.依靠克隆的基因组作图:
根据克隆的DNA片段之间的重叠顺序构建重叠群,绘制物理连锁图。
3.荧光原位杂交:
将荧光标记的探针与染色体杂交确定分子标记的所在位置。
4.序列标记位点作图(STS):
通过PCR或分子杂交将小段DNA序列定位在基因组的DNA区段中。
3、遗传图与物理图的区别
n遗传图谱分辨率有限:
遗传图谱的分辨率依赖于得到的交换的数目。
对于人类与大多数真核生物来说,巨大数量的后代不易获得。
n遗传图谱的精确度有限:
重组的热点/冷点
n遗传图谱的准确度有限:
环境因素与取样误差
(补充:
前者是描述的基因相对位置,后者是具体的碱基位置
遗传图谱是某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。
由遗传重组测验结果推算出来的、在一条染色体上可以发生的突变座位的直线排列(基因位点的排列)图。
物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离[碱基对(bp)或千碱基(kb)或兆碱基(Mb)]的图谱。
以人类基因组物理图谱为例,它包括两层含义,一是获得分布于整个基因组30000个序列标志位点(STS,其定义是染色体定位明确且可用PCR扩增的单拷贝序列)。
4、限制性作图的基本原理
比较一种DNA分子被不同限制性内切酶切割所产生的片段大小。
n首先用一种酶处理样品后,电泳确定DNA片段的大小。
n然后用第二种酶处理,获得第二组片段。
n最后用两种酶混合处理,获得第三组片段。
n收集上述资料进行对比组装。
n两种酶切位点交替出现的区段用加减法确定其相对位置。
n连续出现2个或多个相同酶切位点的区段,采用部分酶解法。
n切点过多时可以采用末端同位素标记结合部分酶解进行绘图。
5、重叠群的组建
•染色体步移法(chromosomalwalking):
先从基因文库的一个克隆开始,然后从文库中寻找与之重叠的第二个克隆,再继续确定第三个克隆,依次类推。
如果探针含有基因组范围分布的重复序列,会有非特异杂交,这时需要预杂交,封闭非特异位点。
以插入片段末端为探针,减少重复序列出现的可能性。
•指纹法(clonefingerprinting)
6、DNA指纹的类型及指纹作图的基本原理
•克隆指纹法的原理:
如果2个克隆彼此重叠,它们一定含有相同的顺序。
有3种类型:
1,限制性带型指纹(用不同限制性酶消化后,经凝胶分离产生的条带)、
2,重复顺序DNA指纹(将不同克隆的限制性片段电泳转膜后,与基因组范围分布的重复序列(探针)杂交形成的带型。
)、
3,STS指纹(根据STS序列设计引物,扩增文库当中的克隆,能扩出条带的克隆都含有顺序重叠的插入子)
7、STS作图的原理
1.STS在染色体上的位置是确定的。
2.两个不同的STS出现在同一片段的机会取决于它们在基因组中的位置,彼此接近,同时出现在同一片段的机会就大,反之则小。
3.STS作图与连锁分析是一样的,不同之处仅在于两个标记间的图距是根据分离频率来计算的。
主要采用的方法是辐射杂种作图。
8、辐射杂种作图的程序及其图距
辐射杂种的作图单位为厘镭(centiRay,cR):
DNA分子暴露在N拉徳(rad)X射线剂量下两个分子标记之间发生1%断裂的机率。
辐射杂种群
PCR检测STS标记,根据成对STS出现频率,判断标记是否连锁及连锁程度
第四章基因组测序与序列组装
1、 基本概念
作图测序:
克隆依次测序,限制测序?
全基因组随机测序:
全基因组鸟枪法测序,随机测序?
全基因组测序是对未知基因组序列的物种进行个体的基因组测序。
序列间隙:
因覆盖率的原因而留下的未能测序的序列,仍存在于克隆文库中,这类间隙称为序列间隙。
物理间隙:
因克隆载体自身的限制或DNA顺序特殊的组成等原因造成某些顺序丢失或未能克隆,这类间隙称为物理间隙。
克隆文库:
单个基因组的DNA片段克隆集合体。
读序:
2、 第一、二、三代测序技术的代表及其基本原理
第二代测序技术——循环阵列合成测序法(P68)代表:
Roche454、IlluminaSolexa和ABISOLiD
第三代测序技术——单分子测序,直接测序代表:
Helicos公司的单分子测序仪、PacificBiosciences公司的SMRT技术和OxfordNanoporeTechnologies公司的纳米孔单分子技术。
3、序列间隙与物理间隙的缝合
解决办法:
通过相邻已知的顺序作为探针筛选已有的基因组文库
解决办法:
利用其它宿主菌与载体重建文库
测序时遗漏的测序
顺序间隙
载体或宿主菌选用不当而被遗失的测序
物理间隙
重叠群间的间隙
4、 作图法测序与鸟枪法测序的原理与两者区别
l序列组装原理:
直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸。
鸟枪法策略
指导测序策略
不需背景信息
构建克隆群(遗传、物理图谱)
时间短
需要几年的时间
需要大型计算机
得到的是草图(Draft)
得到精细图谱
5、 怎样判断序列组装的正确
6、 人类基因组的测序策略
构建BAC克隆
↓
限制性酶处理获得指纹
↓
根据指纹重叠方法组建B