可变剪接与蛋白质组多样性及其调节机制解读Word文件下载.docx
《可变剪接与蛋白质组多样性及其调节机制解读Word文件下载.docx》由会员分享,可在线阅读,更多相关《可变剪接与蛋白质组多样性及其调节机制解读Word文件下载.docx(8页珍藏版)》请在冰豆网上搜索。
第一部分可变剪接与蛋白质组多样性5
据预测,人类基因组可能有约35,000个基因,果蝇约14,000个,而简单的模式生物线虫约19,000个基因。
生物的复杂性与其基因组基因数量似乎存在明显差异。
原因在蛋白质组。
基因重排,RNA编辑,和可变剪接等机制可以从一个基因产生多种蛋白,从而使蛋白质组中蛋白质的数量超过基因组中基因的数量。
其中,从影响的基因数量和生物种类范围来
-看,可变剪接是扩大蛋白质多样性的最重要的机制14。
一、可变剪接的频率。
5,6
1.5%。
从1977年WalterGilbert提出可变剪接概念,1980年Baltimore在小鼠IgM基因发现第一个可变剪接产生膜型、分泌型IgM,至2001年,用经典分子生物学实验的方法研究,一共仅发现了数百种有可变剪接的基因。
并推测在高级真核细胞生物约5%的基因有可变剪接。
2.35%-60%。
高通量的基因组测序和EST测序,使得生物信息学的方法研究可变剪接成为可能。
EST来源于完全加工的mRNA,它们提供了一个广泛的mRNA多样性的样品库。
这种多样性可以用计算机分析。
最近两年,多个研究小组通过不同的生物信息学的方法,从整个人基因组的水平进行分析,结果一致显示约35%-60%的人基因有可变剪接形式。
而且,由于对大多数基因来说,每个基因只测了很少几EST甚至没有EST;
EST不是全长的mRNA,多位于mRNA的5’和3’端;
EST来源于有限的组织和发育阶段;
很有可能存在有更多的可变剪接而在现在的EST库中没有显示。
因此实际可变剪接的频率可能比预测的更高。
这还有待于建立新的高通量的分子生物学方法,如生物芯片的方法,以进一步实验验证。
二、单个基因可变剪接产生的多样性5。
一个基因可以通过如下几种方式产生多个转录体,如不同的转录起始位点,可变剪接,选择不同的加尾信号位点,RNA编辑等。
可变剪接包括3种类型:
1.内含子的保留;
2.可变外显子的保留或切除;
3.3’和5’剪接位点的转移(shift)导致外显子的增长或缩短。
可变剪接对蛋白质结构的影响也是多样性的,如多肽链中一个到数百个氨基酸的增加或减少;
某功能域的有无;
如果可变剪接使读码框架改变,则可能无法有效翻译,mRNA被监视系统降解。
单独一个基因通过可变剪接产生的十几种剪接异构体的现象很常见。
有些基因甚至能够产生成千上万种剪接异构体。
最突出的例子是果蝇(Drosophilamelanogaster)的Dscam基因,可以通过可变剪接产生38,000多种mRNA异构体。
Dscam基因编码一个神经元轴突定向受体,它细胞外有一个由10个免疫球蛋白重复序列组成的结构域,第2,3,7个免疫球蛋白重复序
列分别由第4,6,9号外显子编码,4号外显子盒(cassette)有12个变异体,6号外显子有48个变异体,9号外显子有33个变异体,再加上17号外显子的2个变异体。
每个成熟的DscammRNA分别只有一个有4,6,9,17号外显子的变异体,由此理论推测Dscam基因共有12×
48×
33×
2=38016剪接异构体。
对Dscam基因50个cDNA克隆随机测序发现了49种不同的剪接异构体,说明实际存在的剪接异构体即使没有理论那么多,也至少有上千种。
人的Neurexins,n-Cadherins,calcium-activatedpotassiumchannels等基因也有类似的高度多样的剪接异构体。
上述现象非常类似于淋巴细胞TCR或免疫球蛋白的胚系基因重排,不同之处在于后者发生在DNA水平,前者发生在RNA水平。
基因重排产生的高度多样抗原受体库可以识别高度复杂的自身和异己抗原。
而Dscam基因的转录异构体可能有神经系统的发育有关。
神经元的定向迁移和相互连接可能是发育过程中最复杂的事件。
果蝇约有25,000个神经元,要使它们生长的轴突准确的,可重复性的到达目的地,使这些神经元准确的连接在一起,必然需要一个特殊的系统。
Dscam基因的38,000多种mRNA异构体,每个异构体各编码一个不同的受体,每个受体具有识别不同分子定向信号的潜能,从而有能力指导各个生长的轴突到达准确的位置。
如果将可变剪接与其它RNA加工过程(如RNA编辑)联系起来共同考虑,基因产物会更复杂。
例如,果蝇的para基因(voltage-gatedactionpotentialsodiumchannel)有13个可变外显子,可编码1536种不同的mRNA,另外,para的转录体还要经过在11个已知位点的RNA编辑,这样理论上一共可以产生1,032,192个不同的para转录异构体。
根据受可变剪接影响的基因的概率,以及单个基因可能产生的可变剪接体的数目,足以表明可变剪接对蛋白质组多样性的巨大影响。
三、可变剪接的功能和生物学意义5,11
1.可变剪接是在RNA水平调控基因表达的机制之一。
一个基因通过可变剪接产生多个转录异构体,各个不同的转录异构体编码结构和功能不同的蛋白质,它们分别在细胞/个体分化发育不同阶段,在不同的组织,有各自特异的表达和功能。
因此,可变剪接是一种在转录后RNA水平调控基因表达的重要机制。
目前已知的可变剪接异构体中,只有一小部分明确确定了功能和生物学意义。
第一个确定的可变剪接异构体功能是IgM基因,其末端最后两个外显子的可变剪接,决定了所编码的膜型/分泌型IgM的产生。
最著名的例子是果蝇性别决定系统,在此系统中,至少5个基因(sxl,tra,msl2,dsx,andfru转录体的可变剪接级联反应最终决定了果蝇雄性和雌性性别特征的表达。
有些基因,可变剪接造成的蛋白质异构体之间功能上的差异没有被实验检测出来。
不过阴性的结果不能代表没有功能差异,只是目前没有检测出来而已。
也有很多异构体造成读码框架改变,不能被翻译为蛋白质,而是直接被降解了。
真核生物也有mRNA监视系统NMD(nonsense-mediateddegradation,检测mRNA中异常提前出现的终止密码子,一经发现,立即降解异常的mRNA,防止其翻译。
在大多数情况下,检测可变剪接造成的蛋白质异构体之间功能上的差异的实验还没有开展。
最近发展的RNAi技术,可以适应高通量的从功能基因组水平研究各基因可变剪接异构体的功能的要求。
2000年已经有人将RNAi技术应用于模式生物线虫的可变剪接异构体的大规模研究上。
(目前已经大量开始用于哺乳动物系统)
2.多样性与复杂性
可变剪接是从相对简单的基因组提高蛋白质组多样性的重要机制,蛋白质组的多样性与多细胞高等生物的复杂性相适应。
从可变剪接涉及的基因分布格局分析,可变剪接多发生在参与信号传导和表达调节等复杂过程的基因上,如受体,信号传导通路(凋亡),转录因子等。
对个体分化发育和一些关键的细胞生理过程如凋亡、细胞兴奋等的精确调控有重要意
义。
从可变剪接涉及的基因系统分类分析,可变剪接多发生在免疫和神经等复杂系统。
正如Dscam基因所示,可变剪接产生的多样性,赋予这些系统精确处理复杂信息相适应的潜力。
第二部分可变剪接的调节机制7
可变剪接能够产生惊人的多样性,但我们对其调节机制所知不多。
剪接位点的选择受到结合到非剪接位点RNA元件的剪接因子的多重调节。
参与可变剪接调节的RNA元件包括ESE、ISE、ESS、ISS。
剪接因子包括SR和hnRNP家族蛋白等多种因子。
真核生物新生的mRNA前体经过5’戴帽,剪接,3’加尾等加工成为成熟的mRNA。
在剪接反应过程中,含有内含子和外显子的新生的mRNA前体,在剪接体作用下切除内含子,并将外显子依次连接起来的过程。
剪接反应由剪接体执行,剪接体包括5个小核糖核蛋白复合体U1,U2,U4,U5和U6snRNPs,和50-100种非snRNP蛋白。
剪接体通过RNA-RNA,RNA-蛋白质,蛋白质-蛋白质等多重相互作用以精确切除每个内含子和以正确次序连接外显子。
为有效剪接,绝大部分内含子需要:
1.一个保守的5’剪接位点,A/CAG↓GURAGU;
2.一个分支点序列,后面跟着一个多聚嘧啶PytractY10-20;
3.一个3’剪接位点YAG。
剪接体的形成是一个多步骤依次进行过程,形成多个中间体:
1E-复合体形成:
U1snRNA通过碱基互补识别5’剪接位点,SR蛋白结合。
U2AF65和U2AF35识别多聚嘧啶Pytract和3’剪接位点;
2A-复合体形成:
U2snRNA通过碱基互补识别分支点序列BPS;
需ATP;
3B-复合体形成:
U4/U6_U5tri-snRNP随后与mRNA结合;
4C-复合体形成:
最后,RNA-RNA,RNA-蛋白质相互作用构象改变形成有催化活性的剪接体。
(见图1)
一、参与可变剪接的RNA顺式作用元件:
根据它们所在的位置和作用特点,分为4类:
1.ESE:
exonsplicingenhancer外显子剪接增强子;
2.ISE:
intronsplicingenhancer内含子剪接增强子;
3.ESS:
exonsplicingsilencer外显子剪接沉默子;
4.ISS:
intronsplicingsilencer内含子剪接沉默子。
ESE和ISE是剪接因子SR蛋白结合位点,提高相邻剪接位点的活性。
ESS和ISS是hnRNP蛋白结合位点,抑制相邻剪接位点的活性。
ESE、ISE、ESS、ISS都是很短的序列基序,一般由6-10碱基组成。
每一类成员内部之间即有相对的特异性,也有简并性,作用有交叉和冗余。
二、SR蛋白
SR蛋白是一个多细胞生物中高度保守的剪接因子家族,其成员多带有一个或二个拷贝的RNA识别基序(RRM),后面有一个精氨酸/丝氨酸富含结构域(RS)。
RRM介导RNA结合,并决定各SR蛋白的底物特异性;
RS结构域参与蛋白-蛋白间相互作用。
各SR蛋白在固有剪接和可变剪接中有多种作用。
其中之一是识别并结ESE或ISE,提高相邻剪接位点的活性。
SR蛋白的底物ESE/ISE含有简并性的共有识别序列基序,因此不同SR蛋白之间底物有交叉,其特异性取决于SR蛋白各自的表达水平、亲和力和与其它蛋白的相互作用。
SR-相关蛋白(SRrp)是另一组带有SR结构域,并参与剪接反应的蛋白。
它们可能有RRM,如U1-70K蛋白,U2AF65/35,SRm160/300KD(两个SR相关核基质蛋白),和可变剪接调控因子,如Tra和Tra2。
SR与SRrp都可以增强相邻弱(suboptimal)剪接位点的活
性。
图1。
三、hnRNP蛋白
hnRNP蛋白是一组由多种RNA结合蛋白组成的具有多种功能的多肽家族。
其成员带有多种不同形式的RNA结合基序和富含甘氨酸结构域。
富含甘氨酸结构域可能参与蛋白-蛋白相互作用。
hnRNPA、B、C家族的蛋白与新生的mRNA前体组装成40S的结构。
多种hnRNP蛋白始终伴随mRNA,影响mRNA的剪接,出核转运,甚至在胞浆的翻译,RNA定位,和降解。