1、有一种基因叫理想读后感有一种基因叫理想读后感 如何查找一个基因的启动子序列如何查找一个基因的启动子序列定义:启动子是参与特定基因转录及其调控的 DNA 序列。 包含核心启动子区域和调控区域。核心启动子区域产生基础 水平的转录,调控区域能够对不同的环境条件作出应答,对 基因的表达水平做出相应的调节。 区域:启动子的范围非常大,可以包含转录起始位点上游 2000bp, 有些特定基因的转录区内部也存在着转录因子的结 合位点,因此也属于启动子范围。南京妇幼保健院乳腺科刘 小丰 这项搜寻要从 UCSC 基因组浏览器开始,网址为 genome.ucsc/cgi-bin/hgGateway。 以编码 pen
2、drin (PDS)的基因为例来说明上述问题。 PDS 与耳蜗的异常发育、 感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有 关。 进入 UCSC 的主页后, 在 Organism 的下拉菜单中选择 Human,然后点击 Browser。使用者现在到了人类基因组浏 览器入口。本例的搜寻很简单:在 assembly 的下拉菜单中 选择 Dec. xx,在 position 框中键入 pendrin,然后点击 Submit。 返回的页面结果显示一个已知的基因和两个 mRNA 序列。继续点击 mRNA 序列的登录号 AF030880,出现包含 这个 mRNA 区域的图解概要。 为了获得这个区域更
3、清晰的图 像,点击紧靠 zoom out 的 1.5X 按钮。最后点击页面中部的 reset all 按钮,使各个路径的设置恢复默认状态。 然而,对于本例的搜寻目的来说,默认设置不是理想的 设置。按照视图利用页面底部的 Track Controls 按纽,将一 些路径设置为 hide 模式(即不显示) ,其他设置为 dense 模 式(所有密集在一条直线上) ;另一些路径设置为 full 模式(每个特征有一个分开的线条,最多达 300) 。在考虑这 些路径内究竟存在那些资料之前,对这些路径的内容和表现 做一个简要的讨论是必要的,许多这些讨论是由外界提供给 UCSC 的。下面是对基因预测方法的更
4、进一步讨论,这些信 息也可以在其他地方找到。 对于 Known Genes(已知基因)和预测的基因路径来 说,一般的惯例是以一个高的垂直线或块状表示每个编码外 显子,以短的垂直线或块状表示 5端和 3端 非翻译区。 起连接作用的内含子以非常细的线条表示。翻译的方向 由沿着细线的箭头指示。 Known Genes LocusLink 内的 mRNA 参照序列, 已经利用 BLAT 程序将这些序列与基因组序列进行比对排列。 Acembly Gene Predictions With Alt-splicing 路径是利 用 Acembly 程序将人类 mRNA 和 EST 序列数据与人类基因 组序列
5、进行比对排列而来的。 Acembly 程序试图找到 mRNA 与基因组序列的最好的比对排列以及判断选择性剪接模型。 假如有多于 1 个的基因模型具有统计学意义,则它们都全部 显示出来。 有关 Acembly 的更多信息可以在 NCBI 的网站找 到(.ncbi.nih/IEB/Research/Acembly/) 。 Ensembl Gene Predictions 路径由 Ensembl 提供。 Ensembl 基因通过许多方法来预测,包括与已知 mRNA 和 蛋白质进行同源性比较,ab initio 基因预测使用 GENSCAN 和基因预测 HMMs。 .ebi.ac.uk/ensembl
6、/ Fgenesh+ Gene Predictions 路径通过寻找基因的结构特 征来预测基因内部的外显子,例如剪接位点的给位和受位的 结构特征,利用一种动态的程序算法推定编码区域和推定外 显子 5端和 3端的内含子区域;这个方法也 考虑到蛋白质相似性的资料。 Genscan Gene Predictions 路径由 GENSCAN 方法衍 生而来,通过这个方法,可以确定内含子、外显子、启动子 区域和 poly(A)信号。 此时, 这个方法并不期望查询的序列只 出现 1 个基因,因此可以对部分基因或被基因之间的 DNA 分隔的多个基因进行准确的预测。 Human mRNAs from Genb
7、ank 路径显示基因库的人类 mRNAs 与基因组序列的比对排列。 Spliced ESTs 和 Human EST 路径显示 GenBank 的 ESTs 序列与基因组的序列对齐比较。由于 ESTs 通常代 表了转录基因的片断, 一个 EST 很有可能对应于某个外显子 区。 最后, Repeating Elements by RepeatMasker 这个路径 显示的是重复元件,例如散在的或长或短的核元素(SINEs 和 LINEs),长末端重复序列(LTRs)和低复杂性区域 (repeatmasker.genome.washington/cgi-bin/Rep eatMasker)。一般来
8、说,在将基因预测方法应用于核苷酸序 列之前,需要去掉或掩饰这些成分。 回到视图显示的例子,可以看到大多数路径返回了几乎 同样的基因预测结果。作为一个规则,通过多种方法预测的 外显子提高了预测的正确率而不会出现“假阳性 ”结果。多数方法显示 3端非翻译区,以左侧 大而短的块状表示。Acembly 路径显示除了全长序列产物 (如这个部分第 3 条线所示)之外还有 3 个可能的选择性剪 接,其它大多数路径显示与此预测结果相符。Genscan 路径 从左、右方向往远处延伸:GENSCAN 可以被用于预测多个 基因。 尽管这些图解概要很有用,然而研究者更需要与这些垂 直线或块状相对应的序列。以此为例,用
9、 Fgenesh+预测作 为获得原始序列数据的基础,但不管选择哪个路径其步骤都 是一样的。 点击标有 Fgenesh+ Gene Predictions 的路径, 出现的是一个描述预测的概要页面。 序列的区域与 pendrin 基因相似(从这个例子一开始就 已经知道了) 。给出了序列的大小及序列开始和结束的预测, 并显示预测是以负链为基础的。想要获得序列,点击 Genomic Sequence。使用者将被带到一个标题为 Get Genomic Sequence Near Gene 的查询页面,在这个页面上, 可以获得转录物、 编码区、 启动子或转录物加启动子的序列。 点击 Transcript
10、 返回的页面显示完整的转录子,外显子 以大写字母表示。 点击 Coding Region Only 得到的是编码区,外显子以大 写字母表示。 点击 Transcript + Promoter,返回的页面显示的是在上 述选择 Transcript 所获序列的 5端添加了启动子序 列, 以大写字母表示外显子。 启动子的长度显示在文本框内。 点击 Promoter 返回的页面正好是启动子区2 基因启动子序列的预测分析 真核细胞的基因表达调节虽然是多个水平的调节,但主要是 转录水平的调节. 转录水平的调节基础就是转录因子蛋白与 启动子 DNA 序列之间的结合和激活. 转录因子蛋白的结构 可以分成结合域
11、(BD,binding domain)以及激活域(AD, activation domain). 作为基因启动子 DNA 的序列也具有特 征性的结构. 但是相比较而言,目前基因启动子以及转录因 子蛋白结合的种类,积累的资料还十分有限,数据库容量偏 小,计算技术相对滞后,其预测结果仅供参考,还必须结合 其他的分子生物学技术进行证实. 一般情况下,确定了一种新基因的编码区序列之后,通 过与 htgs 数据库的同源性比对, 可以很方便地确定其相应的 基因组 DNA 序列. 在确定编码基因的起始密码子之后, 指导 基因表达的启动子序列一般位于其上游基因序列 300-3 000 nt 之间,鲜有例外.
12、可以从翻译起始密码子上有的基因组 DNA 序列,选取 3 000 nt 左右的核苷酸序列进行生物信息 学分析. 例如可以应用在线软件分析技术,或自行研发的启 动子序列分析技术等软件分析,如: .cbs.dtu.dk/services/promoter/、 .fruitfly/cgi-bin/seq_tools/promoter.pl, bimas.dcrt.nih/molbio/proscan/等. 根据这些软件 分析的结果,首先确定进行缺失突变体构建时应该采用的引 物序列,如果一段序列的缺失导致报告基因表达水平的升高, 那么说明这一段基因序列存在着启动子的静息子(silencer) 的序列,
13、对于基因的表达水平具有负调节作用. 通过逐步缺 失的策略, 最终确定启动子 DNA 的核心序列. 报告基因表达 载体的构建以及细胞转染技术,仍然是目前研究基因启动子 序列活性最为基本的方法. 研究转录因子蛋白的结合及其对基因表达水平的调节作 用和性质有许多技术,但是利用生物信息学技术预测的启动 子 DNA 序列的结合的转录因子蛋白结果只有部分参考的意 义. 凝胶迟滞(gel shift)试验、超级迁移实验(super shift)、竞 争性结合实验、酵母单杂交技术(yeast one hybrid)、噬菌体 展示技术(phage display)等在转录因子蛋白与启动子 DNA 序列结合的研究
14、中具有重要应用前景. 干擾素增強 GH3 細胞中人生長激素基因表達機制 干擾素,生長激素基因啟動子,GH3 細胞,熒光素酶報 告基因 interferon-,hGH gene promoter,GH3 cell line,luciferase reporter gene 為了研究干擾素(IFN-r) 對大鼠垂體 GH3 細胞中人生長激素(hGH)基因啟動子活性 的影響及其可能的作用機制,採用熒光素酶報告基因方法, 將含 hGH 基因啟動子(-4842bp)和熒光素酶報告基因的表 達質粒 pGL3-484-Luc 單獨轉染或與垂體特異性核轉錄因子 Pit-1 蛋白表達質粒(pcDNA-Pit-1
15、-cDNA)或 Pit-1 反義寡核苷 酸(Pit-1 OND)共轉染於大鼠垂體 GH3 細胞中,觀察加入 IFN及細胞內信號轉導途徑的抑制劑後 GH3 細胞中 熒光素酶表達的變化,反映其對 hGH 啟動子活性的影響; 將含不同長度 hGH 基因啟動子序列的熒光素酶表達質粒 pGL3-380-Luc(-3802bp)、pGL3-250-Luc(-2502bp)、 pGL3-132-Luc(-1322bp)和 pGL3-66-Luc(-662bp)分別轉 染 GH3 細胞,觀察它們對 IFN-的反應,以尋找 IFN-影響 hGH 基因啟動子活性的關鍵序列。結果表 明,IFN-(105u/L, 1
16、06u/L)均能促進大鼠垂體 GH3 細胞中熒光素酶的表達,最高達對照組的 131%(P0.001); 在胞內信號轉導抑制劑中, 只有絲裂原活化蛋白激酶(MAPK) 信號轉導途徑抑制劑 PD98059(40mol/L),能完全阻 斷 IFN-的促進作用;Pit-1 蛋白過表達和表達被抑制 對 IFN的促進作用沒有影響;含不同長度 hGH 基因 啟動子序列質粒中,只有 pGL3-380-Luc 和 pGL3-250-Luc 仍具有對 IFN-的反應性。這說明 IFN-能增強 大鼠垂體 GH3 細胞中 hGH 基因的啟動子的活性,此作用可 能是通過激活細胞內依賴 MAPK 的途徑完成的,並與 hG
17、H 基因上游-250-132bp 啟動子序列密切相關,但與垂體特異 性核轉錄因子 Pit-1 蛋白關係不大。 The method of luciferase reporter gene was used to investigate the effect of interferon- (IFN-) on the activity of human growth hormone (hGH) gene promoter in rat pituitary GH3 cells, to elucidate the post-receptor signal transduction pathway an
18、d the key promoter sequence which mediated the action of IFN-. The luciferase expression plasmid pGL3-484-Luc containing hGH gene promoter (-484-2bp) and luciferase reporter gene were transfected alone or cotransfected with pituitary-specific transcription factor Pit-1 expression plasmid (PcDNA-Pit-
19、1-cDNA) or Pit-1 antisense oligonucleotide (Pit-1 OND) into rat GH3 cells. The changes of luciferase expression in the GH3 cells were determined, after treatment with IFN- or IFN- plus inhibitors of intracellular signaling pathways, to observe the effect of IFN- and these inhibitors on the activity
20、of hGH gene promoter. The various deletion constructs of Luc-reporter: pGL3-380-Luc, pGL3-250-Luc, pGL3-132-Luc and pGL3-66-Luc, which contained the -380-2bp, -250-2bp, -132-2bp and -66-2bp sequences of hGH gene promoter, respectively, were transfected into GH3 cells, then the changes of luciferase
21、expression in the GH3 cells were assayed, after treatment with IFN-, to find out the key sequence which mediated the action of IFN-. Our results showed that IFN-7 (105u/L, 106u/L) could increase luciferase expression in GH3 cells transfected with pGL3-484-Luc alone, the maximal action being 131% of
22、the control (P0.001). Among the inhibitors of intracellular signaling transduction pathways, only mitogen-activated protein kinases (MAPK) inhibitor PD98059 (40mol/L) could pletely blocked the stimulatory effect of IFN- on hGH gene promoter activity. Pit- overexpression or inhibited Pit-1 expression
23、, both had no effect on IFN-7-induced hGH gene promoter activity. When various deletion constructs of Luc-reporter were transfected into GH3 cells, only pGL3-380-Luc and pGL3-250-Luc still responded to IFN-. In conclusion, IFN- could increase the activity of hGH gene promoter in rat pituitary GH3 ce
24、lls. This stimulatory effect of IFN- may be associated with the intracellular MAPK signaling pathway and with -252-132bp sequence in hGH gene promoter, but had no relationship with pituitary-specific transcription factor Pit-1. 如何查找一个基因的启动子序列 关键词: 基因 件 启动子序列 软定义:启动子是参与特定基因转录及其调控的 DNA 序列。包含核心 启动子区域和调
25、控区域。 核心启动子区域产生基础水平的转录,调控区域能够对 不同的环境条件作出应答,对基因的表达水平做出相应的调节。 区域:启动子的范围非常大,可以包含转录起始位点上游 2000bp, 有些特定基因的转录区内部也存在着转录因子的结合位点, 因此也属于启动子范 围。 这项搜寻要从 UCSC 基因组浏览器开始,网址为 genome.ucsc/。 以编码 pendrin (PDS)的基因为例来说明上述问题。PDS 与耳蜗的异常发育、感 觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。 进入 UCSC 的主页后,在 Organism 的下拉菜单中选择 Human,然后点击 Browser。使用者
26、现在到了人类基因组浏览器入口。本例的搜寻很简单:在 assembly 的下拉菜单中选择 Dec. xx,在 position 框中键入 pendrin,然后 点击 Submit。返回的页面结果显示一个已知的基因和两个 mRNA 序列。继续点击 mRNA 序列的登录号 AF030880, 出现包含这个 mRNA 区域的图解概要。为了获得这 个区域更清晰的图像,点击紧靠 zoom out 的 1.5X 按钮。最后点击页面中部的 reset all 按钮,使各个路径的设置恢复默认状态。 然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图 利用页面底部的 Track Controls 按纽
27、, 将一些路径设置为 hide 模式 (即不显示) , 其他设置为 dense 模式 (所有资料密集在一条直线上) ; 另一些路径设置为 full 模式(每个特征有一个分开的线条,最多达 300)。在考虑这些路径内究竟存在 那些资料之前, 对这些路径的内容和表现做一个简要的讨论是必要的,许多这些 讨论是由外界提供给 UCSC 的。下面是对基因预测方法的更进一步讨论,这些信 息也可以在其他地方找到。 对于 Known Genes(已知基因)和预测的基因路径来说,一般的惯例是 以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示 5端 和 3端非翻译区。 起连接作用的内含子以非常细的线
28、条表示。 翻译的方向由沿着细线的箭 头指示。 Known Genes LocusLink 内的 mRNA 参照序列,已经利用 BLAT 程序 将这些序列与基因组序列进行比对排列。 Acembly Gene Predictions With Alt-splicing 路径是利用 Acembly 程序将人类 mRNA 和 EST 序列数据与人类基因组序列进行比对排列而来的。 Acembly 程序试图找到 mRNA 与基因组序列的最好的比对排列以及判断选择性剪 接模型。假如有多于 1 个的基因模型具有统计学意义,则它们都全部显示出来。 有关 Acembly 的更多可以在 NCBI 的网站找到 (.n
29、cbi.nih/IEB/Research/Acembly/)。 Ensembl Gene Predictions 路径由 Ensembl 提供。Ensembl 基因通过许 多方法来预测,包括与已知 mRNA 和蛋白质进行同源性比较,ab initio 基因预 测使用 GENSCAN 和基因预测 HMMs。 .ebi.ac.uk/ensembl/ Fgenesh+ Gene Predictions 路径通过寻找基因的结构特征来预测基 因内部的外显子, 例如剪接位点的给位和受位的结构特征,利用一种动态的程序 算法推定编码区域和推定外显子 5端和 3端的内含子区域;这个方法也考虑 到蛋白质相似性的。
30、 Genscan Gene Predictions 路径由 GENSCAN 方法衍生而来,通过这个 方法,可以确定内含子、外显子、启动子区域和 poly(A)信号。此时,这个方法 并不期望查询的序列只出现 1 个基因,因此可以对部分基因或被基因之间的 DNA 分隔的多个基因进行准确的预测。 Human mRNAs from Genbank 路径显示基因库的人类 mRNAs 与基因组序 列的比对排列。 Spliced ESTs 和 Human EST 路径显示 GenBank 的 ESTs 序列与基因 组的序列对齐比较。由于 ESTs 通常代表了转录基因的片断,一个 EST 很有可能 对应于某个
31、外显子区。 最后,Repeating Elements by RepeatMasker 这个路径显示的是重复 元件,例如散在的或长或短的核元素(SINEs 和 LINEs),长末端重复序列(LTRs) 和低复杂性区域 (repeatmasker.genome.washington/cgi-bin/RepeatMasker)。 一般 来说,在将基因预测方法应用于核苷酸序列之前,需要去掉或掩饰这些成分。 回到视图显示的例子, 可以看到大多数路径返回了几乎同样的基因预测 结果。 作为一个规则,通过多种方法预测的外显子提高了预测的正确率而不会出 现“假阳性”结果。多数方法显示 3端非翻译区,以左侧大而短的块状表示。 Acembly 路径显示除了全长序列产物(如这个部分第 3 条线所示)之外还有 3 个 可能的选择性剪接, 其它大多数路径显示与此预测结果相符。 Genscan 路径从左、 右方向往远处延伸:GENSCAN 可以被用于预测多个基因。 尽管这些图解概要很有用, 然而研究者更需要与这些垂直线或块状相对 应的序列。以此为例,用 Fgenesh+预测作为获得原始序列数据的基础,但不管 选择哪个路径其步骤都是一样的。点击标有 Fgenesh+ Gene Predictions 的路 径,出现的是一个描述预测的概要页面。 序列的区域与 pendrin 基因相似(从这个例子一就已经知道
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1