1、择:MGTA 和FASTA.DNA sequence :使用它来选择输入的数据 DNA 序列,这里需要说明的是如果你输入的数据是氨基酸序列的话,比对窗口只显示一个标签,假如是 DNA 序列的话如此显示两个标签,一个是 DNA 序列的,另一个是氨基酸序列的。Protein sequences :选择输入的氨基酸序列,选择后,所以的位点就被当作氨基酸残基位点来对待。Translate/untranslate :只有比对的序列是编码蛋白的 DNA序列的时候才可用。它可以根据指定的遗传密码表将 DNA 序列翻译成特定的氨基酸序列。Select genetic code table :使用它将编码蛋白的
2、 DNA 翻译成特定的蛋白序列。R everse plement :将选择的一整行的 DNA 序列变为与之互补配对碱基序列。Exit alignment explorer :退出序列比对的资源管理窗口Edit 菜单:使用这个菜单可以对我们的比对序列进展想要的一些编辑工作具体为Undo:撤销上一步操作;Copy:复制;Cut:剪切; Paste:粘贴;这三个操作都可以只针对一个碱基或氨基酸残基也可以是一段甚至是整个序列;Delete:从比对表格中删除一段序列;Delete gaps:去掉序列中的空缺;Insert blank sequence:重新插入一空行;标签和序列都是空的;Insert s
3、equence from file :从已保存的文件中插入新的序列;Select sites :选择一列序列,与点击比对表上方的灰白空格作用类似;Select sequence:选择一行序列,与点击比对表格左侧的标签名作用类似;Select all:全选;Allow base editing :只读保护,只有选择后才能对序列进展编辑操作,否如此所以的序列为只读格式,不能进展任何编辑操作。Search 菜单:用来快捷查找序列中的标记未定或者目的碱基或残基。Find motif :输入你想要查看的一小段序列。找到后会以黄色标出;Find next :在序列的下游查找目的序列片段;Find prei
4、ous :在序列的上有查找目的序列片段;Find marked sites :查找标记位点;Highlight motif :突出标记已经选择的位点。Web 菜单:这个菜单提供一个 Genbank 的入口,可以在网上直接做 Blast 搜索。当手上没有准备好要比对的序列时,可以直接去网上搜索。Query gene banks :开启 NCBI 的主页;Do blast search: 开启NCBI BLAST 主页;Show browser :开启网页浏览器。Sequencer 菜单:此菜单下只有一个子菜单: edit sequencer file ,用来打开一个打开文件对话框,此对话框可以打
5、开一个 sequencer data file ,一旦打开,这个文件就在 trace data file viewer/editor 的对话框中展示出来。这个编辑窗口允许你查看和编辑automatd DNA sequencer 产生的trace data 。它可以阅读和编辑 ABI 和Staden 格式文件并且序列可以直接被导入到序列比对窗口或被上传到网页浏览器做 blast 搜索。Display 菜单:这个菜单相对简单,主要用来调整工具栏。Toolbars :工具栏菜单,它包含一些子菜单,选择后就会出现在比对的窗口中;Use colors :将不同的位点以不同的颜色显示;Background
6、 color :选择后位点的显示与位点一样的背景颜色;Font :字体对话框,通过选择来调整窗口中的序列字符的大小。Alignment 菜单Mark/unmark site:在比对的表格中标记或者不标记一个单一位点,一次每条序列只能被标记一个位点,不同序列间的位点你可以选择同一列的,也可以是错开的,要根据自己的目的进展选择。选择标记后的序列可以使用alignmarked sites 进展比对分析。Align marked sites: 比对标记的序列,在这里如果在两个或多个序列间标记了不在一列的位点重新比对后会出现空格 。Unmarked all sites :把所以标记的位点去标记;Dele
7、te gap-only site :去掉序同是空格的一列;这在多序列比对前很有用。Auto-fill gaps :使用空格补齐不同长度的序列。建树:1)下载数据2)初步聚类:3)建树进化树的构建另一种方式:MEGA软件构建系统发育树摘要 :以白色念珠菌属下面的十个种的18s RNA 为例,构建系统发育树来说明MEGA软件的使用方法。1背景简介1.1 MEGA分子进化遗传分析MEGA 的全称是Molecular Evolutionary Genetics Analysis。MEGA is an integrated tool for automatic and manual sequence a
8、lignment, inferring phylogenetic trees, mining web-based databases, estimating rates of molecular evolution, and testing evolutionary hypotheses. MEGA 可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。MEGA 还可以通过网络NCBI进展序列的比对和数据的搜索。最新版本:MEGA 5.1 Beta (软件开发者建议其结果不用于发表文章) 建议下载版本:MEGA 5.05 for Windows and Mac OS。MEGA 5 h
9、as been tested on the following Microsoft Windows operating systems:Windows 95/98, NT, 2000, XP, Vista, version 7, Linux and Mac OS 1. MEGA 5.05 可免费下载,只需输入名字与有效,下载会发送至,点击可下载。1.2系统发育树定义系统发育树英文:Phylogenetic tree又称为演化树evolutionary tree,是明确被认为具有共同祖先的各物种间演化关系的树。是一种亲缘分支分类方法cladogram。在树中,每个节点代表其各分支的最近共同祖先,
10、而节点间的线段长度对应演化距离如估计的演化时间1.3系统发育树的分类根据有根和无根来区分:树可分为有根树和无根树两类。有根树是具有方向的树, 根据系统发生树可推断出物种的起源包含唯一的节点,将其作为树中所有物种的最近共同祖先。最常用确实定树根的方法是使用一个或多个无可争议的同源物种作为外群英文outgroup,这个外群要足够近,以提供足够的信息,但又不能太近以至于和树中的种类相混。把有根树去掉根即成为无根树。一棵无根树在没有其他信息外群或假设如假设最大枝长为根时不能确定其树根。无根树是没有方向的,其中线段的两个演化方向都有可能。基于单个同源基因差异构建的系统发生数应称之为基因树。因为这种树代表
11、的仅仅是单个基因的进化历史。而不是它所在物种的进化历史。物种树一般最好是从多个基因数据的分析中得到。例如一项关于植物进化的研究中,用了100个不同的基因来构建物种树,因为进化是发生在生物体种群水平上的,而不是发生在个体水平上的,虽然外表上不需要更多的数据,但实际上还是有必要的。基因树和物种树之间的差异是很重要的,如果只用等位基因来构建物种数,那许多人人和大猩猩就会分到一起,而不是和其他人分到一起。1.4构建方法要构建一个进化树phyligenetic tree。构建进化树的算法主 要分为两类:独立元素法discrete character methods和距离依靠法distance metho
12、ds。所谓独立元素法是指进化树的拓扑形状是由序列上的每个状态决定的,而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法Maximum Parsimony methods和最大可能性法Maximum Likelihood methods;距离依靠法包括除权配对法UPGMAM和邻位相连法Neighbor-joining。2 蛋白质序列分析使用方法2.1 打开网址c:iknowdocsharedatacur_work.ncbi.nlm.nih.govprotein,将菌名输入到protein后面的框内,点Search键,选择一个搜索
13、结果点击进入2.2 将搜索出来的结果选择send to下拉箭头内的选项,Analysis Tool和BLAST,选择好后点击Submit进展搜索2.3进入BLAST页面,点击页面最下面的BLAST按钮,进展blast ,如下列图:2.4 从结果中选择10个蛋白质序列,进展复制,粘贴到TXT文档内,然后将TXT文档后缀名改为FASTA2.5 将保存好的,以Fasta做后缀的序列打开2.6 点击菜单栏内的Alignment选项,选择Align by ClustalW选项。2.7 弹出如如下图对话框,选择OK键,对数据进展处理经过一段时间的数据处理,数据处理完成如如下图所示:2.8 选择菜单栏中Da
14、ta选项中的Save Session选项进展保存。再选择Export Alignment中的MEGA Format和 FASTA format 进展保存。2.9 选择菜单栏中的 Analysis 选项中的 Phylogeny中的 Construct/Test Maximum Likelihood Tree选项进展数据处理。将数据按下表填写,点击pute键数据将按下表方式处理:最大进化树如下所示:2.10 点击菜单栏下一行的Distance选项,选择下拉菜单中的第一个选项,进展数据处理出现如下对话框,按如下图所示,点击pute键即可得出最终结果:3 核酸序列分析使用方法打开网址c:iknowdocsharedatacur_work.ncbi.nlm.nih.govnuccore,其余方法同上,如如下图片所示,不再详述。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1