分子遗传学讲解Word格式.docx
《分子遗传学讲解Word格式.docx》由会员分享,可在线阅读,更多相关《分子遗传学讲解Word格式.docx(23页珍藏版)》请在冰豆网上搜索。
primarystructure:
氨基酸通过肽键连接成一条多肽链。
secondarystructure:
指多肽采取的不同构象,由不同氨基酸之间形成的氢键所稳定。
例如:
螺旋;
片层
tertiarystructure:
是将多肽链的二级结构组分折叠成为三维构型而形成的。
它被各种化学力所稳定:
氨基酸残基间的氢键;
带电荷的氨基酸R基团间的静电相互作用;
疏水相互作用;
半胱氨酸残基间的二硫键
quaternarystructure:
两条或更多已形成三级结构的多肽链组合在一起形成一个多亚基蛋白质。
11.鉴定与某一蛋白质相互作用的蛋白质:
a.噬菌体展示:
该技术采用了一种基于噬菌体或某种丝状噬菌体的独特的克隆载体。
b.酵母双杂交:
激活因子(转录因子):
一类控制基因表达的蛋白质,包含DNA结合结构域和转录激活结构域。
双杂交系统使用缺乏某一报告基因相应激活因子的酿酒酵母菌株,此时报告基因是不表达的。
12.编码RNA和功能RNA的区别:
编码RNA占总RNA的4%,codingRNA----hnRNA------合mRNA
功能RNA:
占总RNA的96%,合成pre-rRNA,pre—tRNA,sn-RNA(核小RNA),sno-RNA(核仁小RNA),mi-RNA(微小RNA),si-RNA(短干扰RNA).
第二章
1.DNA重组技术:
借助工具酶按预定的方式操作DNA分子,将DNA分子切成小片段,并重新将它们连接在一起,形成自然界不存在的组合体。
2.不同类型的酶:
末端修饰酶:
改变DNA分子末端,为连接实验的设计增加可操作空间。
A.末端脱氧核糖核苷酸转移酶:
属于模板非依赖的DNA聚合酶。
B.碱性磷酸酶:
去掉DNA分子5’端磷酸基团,从而阻止这些分子连接到其他分子上。
C.T4多聚核苷酸激酶:
向DNA分子5’端添加磷酸基团,主要用于DNA分子的末端标记。
DNA聚合酶:
以现有DNA或RNA分子为模板合成DNA的酶,称为(依赖模板的)DNA聚合酶。
核酸酶
DNA连接酶:
通过DNA连接酶可以将限制性内切核酸酶消化产生的DNA片段重新连接起来,或者连接到一个新的分子上。
T4DNA连接酶:
从T4噬菌体感染后的大肠杆菌细胞中提取。
3.研究中使用的DNA聚合酶类型
DNA聚合酶I(Kornberg聚合酶)的不同版本,
Klenow聚合酶:
用枯草杆菌蛋白酶处理DNA聚合酶I,可获得两个片段,大片段的分子质量约76kDa,保留聚合酶活性和3’
5’外切核酸酶活性,又叫Klenow片段。
小片段的分子质量约34kDa,具有5’
3’外切核酸酶活性。
DNA重组研究中所使用的不同类型酶的活性及主要作用;
明确DNA聚合酶的重要特征,区分基因组研究中所使用的各种DNA聚合酶;
说明限制性内切酶切割DNA的方式;
区分平端与粘端连接,并说明如何提高平端连接的效率;
详述克隆载体的主要特征,并描述如何将这些载体用于克隆实验中;
列举用于克隆长片段DNA的载体,并评价每种载体的优缺点;
描述如何进行PCR反应。
第三章
1.遗传图谱:
指应用遗传学技术(遗传重组)构建的能在基因组上显示基因和其它序列特征位置的线性排列图,反映了基因或标记间的相对距离和顺序。
cM
物理图谱:
指应用分子生物学技术直接分析DNA分子,从而构建的能显示包括基因在内的序列特征位置的图谱,它反映了基因或标记间的实际距离。
bp,kb,Mb
2.用于遗传学作图的遗传标记
遗传标记:
可以示踪染色体、染色体某一片段、某个基因座在家系中传递的任何一种遗传特征。
可分为:
a.形态标记b.细胞学标记c.生化标记d.DNA分子标记
所有的标记都必须具有多态性!
分子标记:
指在DNA水平,具有相对差异的等位基因的DNA多态性标记,是DNA水平上遗传变异的直接反映。
优点:
a.不受时间和环境的限制b.遍布整个基因组,数量无限c.不影响性状表达d.变异丰富,多态性好e.大部分为共显性,能鉴别纯合体和杂合体
A.限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP)用限制性内切酶酶切基因组DNA时,在同一种生物的不同个体间出现含同源序列的酶切片段长度的差异。
B.简单重复序列(Simplesequencerepeat,SSR,Microsatellite(微卫星)指重复单位相对较小(2-6bp的基序),由于重复单位数目的变化而形成的多态性。
C.单核苷酸多态性(Simplenucleotidepolymorphism,SNP)基因组中的某些位点上,有些个体只有一个核苷酸与其它个体不同,这种分散在基因组中的单个碱基的差异就称为SNP。
a.通过寡核苷酸杂交分析检测SNP
(1)DNA芯片技术:
应用面积为2cm2或更小的玻璃或硅质晶片,在上面高密度的排列着许多寡核苷酸,待测DNA用荧光标记后与芯片杂交,再用荧光显微镜检测,发出荧光的表明寡核苷酸与待测DNA杂交上了。
此方法在一次实验中可以检测许多个SNP。
(2)液相杂交技术:
在微量滴定板的孔中进行,每个孔中含有一种不同的寡核苷酸;
寡核苷酸的一端与荧光染料连接,另一端与荧光淬灭复合物连接,且其两个末端可以形成碱基配对;
当淬灭复合物与荧光染料相邻时,无荧光发出;
如果寡核苷酸与待测DNA能够杂交,则会破坏环形结构,此时淬灭复合物远离荧光染料,有荧光发出。
b.通过耐扩增突变系统检测SNP(AmplificationRefractoryMutationSystem,ARMS)将SNP位点引入PCR引物3’端的最后一个碱基,直接进行PCR扩增。
在严谨的PCR条件下,存在SNP的引物对不能扩增出目的条带。
3.遗传图谱的局限性:
a.遗传图谱的分辨率依赖于所得到的交换数目;
b.遗传图谱的准确率有限
4.物理作图的常用方法:
1)限制性作图:
在DNA分子上定位限制性内切酶酶切位点的相对位置;
2)荧光原位杂交(FISH):
将分子标记与完整染色体杂交来确定标记的位置;
3)序列标签位点(STS)作图:
通过对批量的基因组片段进行PCR和(或)杂交分析,来对短序列进行定位作图。
A.限制性作图(Restrictionmapping)
a.双酶解(doubledigest)
Key:
分析重叠片段
b.部分酶解+完全酶解:
比较分析这两种情况下的片段大小。
c.末端标记+部分酶解
利用放射性的同位素标记DNA的3’端或5’端
部分酶解
放射自显影
B.荧光原位杂交(FISH)
原位杂交是以标记的DNA分子为探针,检测完整染色体的一种杂交分析方法。
C.序列标签位点作图(STS作图)
用STS技术绘制物理图是到目前为止最为有效的方法。
STS其实只是基因组中任何单拷贝的短DNA序列,长度在100-500bp,但要求序列已知且在染色体上有唯一的定位。
要得到至少5套包含相关染色体或整个基因组的DNA片段(染色体上每一点平均有5个片段相对应),然后用各个DNA片段做模板,用不同STS标签上的序列做引物进行PCR扩增,筛选阳性克隆。
A.任何一个唯一的DNA序列均可作为STS
一个DNA序列要成为STS,要满足两个条件:
它的序列必须是已知的,以便于用RCR方法检测该STS在不同DNA片段中存在与否;
STS必须在拟研究的染色体或基因组上有唯一的定位。
因此,需要确保STS不位于重复DNA区域。
可以通过以下途径获得STS:
表达序列标签(EST):
通过对cDNA克隆测序获得的短序列,代表了表达的基因的一部分。
如果EST来自单一序列DNA,不是基因家族中的某一成员,可以被用作STS;
简单序列长度多态性(SSLP):
如果将被遗传定位的SSLP用作STS进行物理定位,会很有价值,因为它们可以在遗传图谱和物理图谱间提供直接联系;
随机基因组序列:
通过对克隆的基因组DNA随机小片段测序获得。
B.用于STS作图的DNA片段群
STS作图必需的第二个要素是覆盖拟研究的染色体或基因组5倍以上的DNA片段群(作图试剂)。
作图试剂可以来自克隆文库和放射杂交体组。
6.放射杂交体:
利用高剂量的射线将供体细胞染色体打断成若干小片段,再与近缘物种的受体细胞融合,形成放射杂交体;
该方法由GossandHarris(1975,1977)最先提出,后又经Benhametal.(1989)逐步完善,早期主要被用于人类及其它哺乳动物高通量染色体图谱的构建。
目前,放射杂交作图已从最初仅适用于单条染色体作图发展到全基因组作图。
放射杂交作图是基于染色体上的两个STS相距越近其通过断裂分开的频率越低的原理,通过PCR方法研究细胞中供体的STS的分布,利用统计学的手段计算STS间的断裂分离频率,从而可以推算出STS间的距离和在染色体上的排列顺序。
使用PCR方法鉴定STS时,必需保证其只能从供体,而不能从受体基因组中扩增出相应片段。
目前,在大麦、小麦、玉米、棉花中都有构建放射杂交图谱的报道。
第四章
1.链终止DNA测序法
基本原理:
聚丙烯酰胺凝胶电泳(PAGE)能够把长度只差一个核苷酸的单链DNA分子区分开。
链终止法测序的起始材料是均一的单链DNA分子。
a.首先由短寡聚核苷酸在每个分子的相同位置上退火,并充当引物合成与模板互补的新DNA链。
b.在测序反应体系中加入少量的被不同荧光标记物标记的双脱氧核糖核苷三磷酸(ddNTP)后,合成的互补链可在不同位置随机终止反应,产生一系列只差一个核苷酸的DNA分子。
c.通过PAGE电泳可以读出待测DNA分子的序列。
链终止法测序需要单链DNA模板,制备单链DNA的方法:
(1)把DNA克隆到质粒载体中,再通过碱或煮沸变性形成单链DNA。
缺点是质粒DNA会被少量的细菌DNA或RNA污染。
(2)把DNA克隆到M13噬菌体载体中。
在噬菌体颗粒中,DNA分子以单链形式存在。
缺点是该系统只能用于短片段DNA,大于3kb的片段被克隆到M13载体后会发生缺失和重排。
(3)把DNA克隆到噬菌粒中。
噬菌粒是一种质粒克隆载体,除含有自身的复制起点外,还包含来源于M13噬菌体的起始位点。
如果大肠杆菌中既有噬菌粒又有噬菌体,噬菌粒上的噬菌体起始位点就会被激活,产生含有噬菌粒单链形式的噬菌体颗粒,双链质粒DNA就被转变为单链DNA。
这一系统避免了M13克隆的不稳定性,可用于克隆10kb或更长的片段。
2.热循环法测序:
热循环法测序类似于进行PCR反应,相对于传统链终止法测序有如下优点:
(1)它用双链而不是单链DNA作为起始材料。
(2)只需要很少量的DNA就可以进行测序,产物以线性方式积累,因此DNA在测序前不必克隆,可直接对挖带回收纯化后的PCR产物进行测序。
3.化学降解法测序:
化学降解法也是通过检查末端核苷酸已知的分子长度来确定序列的。
这些不同长度的分子是通过能在特定的核苷酸处进行特异切割的化学试剂的处理而产生的。
步骤:
首先,用硫酸二甲酯处理分子,在鸟嘌呤的嘌呤环上添加甲基集团。
只加少量是硫酸二甲酯,以使平均每条多核苷酸链上只有一个鸟嘌呤被修饰。
在添第二种试剂-------哌啶之前,多核苷酸链仍然是完整的,并没有被切割。
加入哌啶之后可以去除修饰后的嘌呤环,并在无碱基位点上游的磷酸二酯键处立即切割DNA分子,这样就得到一系列切开的DNA分子,其中每条链的5’端连接一个放射性的磷基团对DNA进行标记。
然后通过聚丙烯胺凝胶电泳,从凝胶中纯化出一条链后,分成4份样品,每份样品都用一种切割试剂进行处理,电泳后条带在凝胶上的位置通过放射自显影来观察。
移动最远的条带代表最小的DNA片段。
4.建立克隆重叠群的方法:
A.可以通过染色体步移来建立克隆重叠群,但该方法费力。
最简单的构建克隆重叠群的方法是从基因组文库的一个克隆开始,鉴定出与第一个克隆中的插入片段重叠的第二个克隆,依此类推。
这就是染色体步移法。
B.更快的克隆重叠群组装方法,一个改进的方法是使用克隆指纹图谱技术。
该技术提供了待克隆DNA片段的物理结构信息,将这些物理结构信息和其它克隆的相关信息做一些比较分析,就能鉴定出重叠序列。
克隆指纹图谱技术:
a.限制性图谱:
通过用多种限制性内切酶消化克隆,并在琼脂糖凝胶上分离消化产物而得到。
b.重复DNA指纹图谱:
通过对利用一类或多类重复序列特异的探针进行Southern杂交所得到的一系列限制性片段进行分析而获得的。
c.重复DNA的PCR或散步重复元件的PCR:
运用在重复序列内退火的引物,能够扩增出两相邻重复序列之间的单拷贝DNA。
为了鉴定出可能的重叠区,重复DNA进行PCR之后获得的产物大小可以作为与其他克隆相比较的指纹。
d.STS作图:
非常有用,因为它能够产生一个定位于STS物理图谱上的克隆重叠群。
5.全基因组鸟枪法测序
鸟枪法测序中最费时的地方是将单个序列重叠群通过封闭序列间隙和物理间隙而连在一起的阶段。
通过使用两种或两种以上的不同载体中所克隆的片段产生的序列能够有效提高基因组的整体覆盖面。
解决由于重复序列引起的组装问题的有效策略是确保其中一个克隆文库中插入片段的长度大于所研究基因组中最长的重复序列。
6.单纯的ORF扫描对高等真核生物DNA效果不佳
原因之一是真核生物基因组中基因间的间隔很大,发现假ORF的概率就会增加。
原因之二是真核生物的ORF是不连续的,经常被内含子所隔开,而且单个外显子的长度一般小于100个密码子。
7.对ORF扫描的基本程序已经作了三项改良:
a.密码子偏倚:
指特定生物体的基因中,并不是所有密码子的使用频率都是平等的。
如亮氨酸可由6种密码子编码,但在人类基因组中,亮氨酸大多由CTG编码。
b.外显子-内含子边界。
GU-AG规则:
核mRNA的剪接点一般都为GU….AG
c.上游调控序列可用来定位基因起始区。
上游调控序列也具有显著的序列特征,它们作为识别信号在参与基因表达的DNA结合蛋白中起重要作用。
但调控序列是易于变化的,对于真核生物尤为明显,因此通过该方法定位基因也存在很大局限性。
8.同源性搜索:
通过查询DNA数据库来判断所检测序列是否与已知基因的序列相同或相似。
通过同源性搜索可以来检验一系列三联体密码子是真正外显子还是随机序列,一定程度上可以弥补ORF识别的局限性。
同源性搜索的另一个主要用途是为新基因确定功能。
比较基因组学:
相关种属的基因组序列既具有从它们的共同祖先继承过来的相似性,又具有由于物种开始单独进化而产生的种属特异性。
由于自然选择,序列相似性在基因内部最大,而在基因间区域最小,当相关基因组进行比较时,同源基因由于它们的序列相似性很高,就很容易被鉴定出来。
可以通过比较基因组学来检测ORF的真实性,如果某一个新定位的ORF在相关基因组中都不存在,那么它很有可能不是一个真正基因。
9.同源基因具有共同的进化祖先,是通过基因间的序列相似性而发现的。
同源基因分为两类:
(1)直系同源基因(orthologousgene):
是那些不同生物体间存在的同源物,它们的共同祖先早于物种间的分裂。
同源基因通常具有相同或类似的功能。
如人类和黑猩猩的肌红蛋白基因是同源基因。
(2)旁系同源基因(paralogousgene):
存在于相同生物体中,常是可识别的多基因家族的成员,它们的共同祖先可能早于或晚于物种间的分裂。
如人类肌红蛋白和球蛋白基因是旁系同源基因。
10.A.通过基因失活进行功能分析
a.同源重组可以使单个基因失活:
a.DNA重组:
是指由于不同DNA链的断裂和连接而产生的DNA片段的交换和重新组合,形成新的DNA分子的过程。
b.同源重组:
两个具有相似序列的DNA分子同源区段间的相互交换。
b.不用同源重组进行基因失活:
(1)转座子标记技术:
通过向基因中插入转座元件或转座子使基因功能失活。
转座子标记技术的缺点是它很难瞄准单个基因,因为一般情况下转座是一种随机事件,转座子跳跃后就很难预测它会在哪里定位。
(2)RNA干扰(RNAi):
利用双链小RNA高效、特异性降解细胞内同源RNA,从而阻断靶基因表达,使细胞出现靶基因缺失的表型。
RNA干扰的过程:
为真核细胞植入一段双链RNA后,细胞质内的Dicer酶(一种RNaseIIInuclease)会识别该外来基因,并将其切断成短链小干扰RNA(siRNA)。
恰巧,真核细胞内又存在一组RNA诱导的沉默复合体蛋白(RISC),它能够找到siRNA,并把它解旋为一条自由的ssRNA(singlestrandedRNA)和一条绑在RISC上的ssRNA。
基于碱基互补配对原则,被绑在RISC上的那条ssRNA可以从细胞质中存在的自然RNA中选出互配的mRNA序列,并引导RISC将其切断,从而抑制该mRNA的翻译过程
第五章核生物基因组
1.核小体的包装过程:
DNA在核心八聚体外缠绕两圈,长度为140-150bp,每个核小体由50-70bp的连接DNA分隔,这样重复单位长190-220bp。
每个连接组蛋白附着于一个核小体,它像夹子一样,防止卷曲的DNA从核小体上脱离下来。
2.中期染色体的特征:
中期染色体高度浓缩,形态可见;
每条染色体都含有两个拷贝的DNA分子,两个拷贝在着丝粒处结合在一起;
可通过染色技术绘制全套染色体的核型图。
3.着丝粒:
全着丝粒染色体:
着丝粒并不唯一,沿着染色体存在多个着丝粒结构。
秀丽隐杆线虫就含有全着丝粒染色体。
以前,人们一直认为着丝粒DNA完全由重复序列组成,是遗传学上的无活性区域。
随着对拟南芥着丝粒序列测定之后,人们发现拟南芥着丝粒DNA中含有少量基因(7-9genes/100kb)。
4.端粒:
端粒是染色体末端的重要标志。
人类端粒DNA由数百拷贝的重复基序5’-TTAGGG-3’组成,并在双链分子3’端有一短的延伸序列。
5.在核基因组中基因是如何组织的?
A.基因只构成了人类基因组中的一部分以人的第12号染色体上一个50kb的片段为例,该片段包含如下几个遗传学特征:
(1)包含4个基因:
PKP2、SYB1、FLJ10143、CD27。
这4个基因都不是连续的,内含子数目从SYB1的2个到PKP2的8个不等。
(2)包含88个全基因组范围内的重复序列。
全基因组范围内的重复序列(散布重复序列):
在基因组中很多地方都会出现的重复序列。
主要有4种类型:
长散布核元件(LINE),短散布核元件(SINE),长末端重复元件(LTR),DNA转座子。
在上述基因组片段中,4种类型的重复序列都存在,大多数位于基因间区域,个别位于内含子中。
(3)包含7个微卫星,其中有4个位于内含子中。
(4)在观察的50kb人的基因组片段中,约30%的部分由功能未知或不明确的非基因、非重复序列或单拷贝DNA组成。
外显子的总长度为4745bp,相当于总长度的9.5%。
在整个人类基因组中,外显子加起来只有48Mb,仅占总长度的1.5%。
相比之下,全基因组范围内的重复序列却占基因组的44%。
6.真核生物基因组中,基因分类的方法:
(1)按照基因的功能进行分类。
可进行更具体的基因功能描述;
缺点:
有些基因功能未知,用这种方法进行分类会遗漏部分基因。
(2)按照提示基因功能的结构域进行分类。
可以应用于功能未知的基因,因此可以扩大基因组中每种基因类别的份额。
按此方法分类,越复杂的生物,其每一类基因的数目应该越多。
7.多基因家族:
具有相同或相似序列的基因家族是许多基因组的共同特征。
rRNA基因属于最经典的多基因家族的例子,这些家族是基因扩增产生的。
有些多基因家族的成员虽然序列相似,但基因产物的特征却明显不同,如哺乳动物的珠蛋白基因。
8.假基因:
指具有与功能基因相似的序列,但不能翻译有功能蛋白质的无功能基因。
它往往存在于真核生物的多基因家族中。
(1)常规假基因:
指基因的核苷酸序列因为突变而发生改变,导致基因失活。
如珠蛋白假基因。
(2)已加工的假基因:
以某个基因的mRNA合成的cDNA拷贝再次插入到基因组后,由于缺少上游调控序列不能转录而引起的基因失活。
9.重复DNA可分为两大类:
串联重复序列和散布重复序列(全基因组范围内重复序列)。
A.串联重复DNA也叫卫星DNA,因为在用密度梯度离心法分离基因组DNA时,含有串联重复序列的DNA片段会形成“卫星”带。
如将人DNA截断成50-100kb的片段,离心后会形成一个主带和三个卫星带。
虽然一部分卫星DNA散布于整个基因组,但大多位于着丝粒,它们可能作为一种或多种特殊的着丝粒蛋白的结合位点而发挥结构性作用。
B.散布重复序列最常见的发生机制是转座,最分散的重复序列往往有天然的转座活性。
转座也是一些病毒基因组的特征,它能插入到被感染细胞的基因组中,然后在基因组中从一个位置移到另一个位置。
人们已经明确一些散布重复序列是从有转座能力的病毒衍生而来的。
10.小卫星形成长达20kb的聚集区,每个重复单位最多25bp。
微卫星区较短,通常小于150bp,其重复单位为2-13bp。
小卫星DNA与染色体结构特征有关,染色体端粒就是一种小卫星DNA。
微卫星最常见的类型是双核苷酸重复,其中有一半重复基序是CA。
微卫星是由于细胞分裂中负责基因组复制的过程出错而产生的,即当DNA复制时,微卫星拷贝有时发生滑移,导致插入或