简单使用说明Word文件下载.docx
《简单使用说明Word文件下载.docx》由会员分享,可在线阅读,更多相关《简单使用说明Word文件下载.docx(14页珍藏版)》请在冰豆网上搜索。
计算信号肽潜在的断裂位点等功能。
更重要的是此软件包为免费软件。
软件分为三个版本,分别用于Unix系统,DOS系统与WINDOWS95或98系统,以用于WINDOWS系统的版本为例,介绍一下这个软件的基本用法。
软件包为一个自解压执行文件,文件名Anthe_5_0.exe,大小为2,013,184字节。
执行此文件,输入解压后存放的目录名,便可将所有文件解压在此目录下。
其文件如下图
软件运行后的主程序中按钮是极其简单的相关介绍,基本无任何用处。
但是在软件目录中的自解压压缩文件doc_ant.exe文件
,可以解压在另一个目录,是HTML格式的介绍文件,对软件进行了一些较详细说明介绍。
如图
运行Documentation_antheprot.html
即可。
主程序名为Anthewin,
双击便打开了ANTHEPROT5.0主窗口。
也可以在桌面上建立它的快捷方式,双击快捷方式运行ANTHEPROT5.0主程序。
通过主程序,我们可以载入蛋白序列,对序列进行编辑、打印、拷贝、改变设定等操作,可以在此调用各种所需的分析工具,对蛋白序列进行分析。
一.序列编辑功能
ANTHEPROT5.0的主窗口便是其序列编辑窗口,如图:
可以使用按键或菜单中的(或快捷键Ctrl+0)命令打开各种序列文件(其他按钮在后面说明),程序识别的文件类型包括:
单序列文件格式:
*.SEQ,(ANTHEPROT3.3支持以下格式的单序列文件:
DNA/Strider格式、EMBL格式、NBRF格式、Pearson/Fasta格式、PIR格式与IG/Stanford格式);
含有多个蛋白序列的蛋白数据库文件:
*.BAS,(以Pearson/Fasta格式添加序列,上限为30条序列或32K文件大小);
ClustalV或ClustalW文件:
*.ALN含有ClustalW格式的多队列;
含有多队列的Multalin4.1格式文件:
*.MUL;
在Prosite蛋白数据库中查寻出Site结果的文件:
*.SIT,
蛋白质原子空间结构的PDB格式文件:
*.PDB;
使用IBCP()服务器预测蛋白二级结构所获得的结果文件格式:
*.CNS;
序列可以从ANTHEPROT编辑窗口以键盘输入,或者以*.SEQ等文件格式载入,也可以从其它文件复制粘贴到编辑窗口。
最简单的序列格式为Pearson/Fasta格式,为文本格式文件,带有>
开始的为序列蛋白的名称,其后便是蛋白序列。
下面为一个此格式的例子:
>
MBN
VLSEGEWQLVLHVWAKVEADVAGHGQDILIRLFKSHPETLEKFDRFKHLKTEAEMKASEDL
KKHGVTVLTALGAILKKKGHHEAELKPLAQSHATKHKIPIKYLEFISEAIIHVLHSRHPGD
FGADAQGAMNKALELFRKDIAAKYKELGYQG
程序支持的一些编辑功能如下:
●取消,恢复(Undo):
Ctrl+Z。
●查找Ctrl+T。
●支持复制与粘贴。
●可以自定义字符颜色,背景色与打印字体。
●可打印序列文件。
输入或载入序列后,便同时打开了一个图像窗口,以彩图的形式显示出蛋白序列。
不同的蛋白残基以不同的颜色表示。
下面便是打开一个序列后的主程序窗口的例子:
二.工具栏与基本功能
当序列格式识别后,Methods菜单便被激活,相应的快捷按键也出现在工具栏中。
如果序列格式未能识别则不会出现下图中新的工具按钮。
这些按键依次为:
打开文件按键;
存储文件按键;
打印按键;
更改字体与格式按键;
更改设定颜色按键;
进行蛋白序列二级结构预测;
在蛋白序列中查找符合PROSITES数据库的特征序列;
绘制出蛋白序列的所有理化特性曲线;
在Internet或本地蛋白序列数据库中查找类似序列;
计算蛋白序列分子量,比重与各蛋白残基百分组成;
计算蛋白序列滴定曲线与等电点;
选定一个片段后,绘制HelicalWheel图;
进行点阵图(DotPlot)分析;
计算信号肽潜在的断裂位点;
打开一个简单的帮助文件;
退出程序。
三.基本分析工具介绍
除了通过单击快捷按键的方式进行各种蛋白序列分析,通过菜单进行各种操作也非常方便。
下面让我将一些主要分析工具的功能介绍一下:
1.点阵图(DotPlot)
DotPlot分析方法对以下分析工作非常有用:
●在一条序列内查找重复序列;
●在2条序列中不同位置查找类似片段;
●在不同序列中查找同源性。
只有当程序载入一条序列时,才可以激活DotPlot程序,选择菜单命令DotPlot或单击按键,运行DotPlot程序,可再选择要进行比较的第二条序列。
然后,再确定参数与限制条件,包括:
窗口尺寸:
移动片段的长度
矩阵:
选择替代矩阵
下图为含有两个蛋白酶序列的点阵图,两个酶具有同源性,因为由点阵图可以看到,基本上有非常好的斜线。
但由于此斜线的位置开始于位置115,很容易知道,水平轴的蛋白序列含有前体(由1到第114个残基组成),也清楚地看到,它们具有一个小的内部重复片段(图上非常短的红线)。
2.类似性查找(SimilaritySearch)
此程序用来在一个蛋白数据库(可以是本地数据库,也可是网上的数据库)中,找出所有与给定序列具有同源性的序列。
选择菜单命令Methods/SimilaritySearch/LocalFasta,或者Methods/SimilaritySearch/atPBILNPS@server便实现在蛋白数据库中对类似性蛋白序列的查找。
需注意,如果在本地蛋白数据库中查找,需要先下载SwissProt蛋白质数据库。
Prosite蛋白数据库1.4兆与Swiss-Prot蛋白数据库41版,85.7兆左右,压缩格式下载后,将其放置在ANTHEPROT5.0同一个目录,便可在本地使用程序的检索功能。
3.查找Site/signature
在ANTHEPROT主窗口单击按键或选取菜单命令Methods/Sitedetection(Prosite),便进行位点与特征序列的查找。
程序查找给定序列是否存在PROSITE数据库中已定义的特征序列,缺省设置为100%匹配,也可设定为Mismatch1or2(一到两个不匹配)或者Similaritylevel(类似水平)。
当前PROSITE数据库是95年2月发布的,共1054个不同位点与特征序列,含有两个文件,PROSITE.DAT与PROSITE.DOC。
此两个文件必需均放在ANTHEPROT程序的目录下,程序才能进行。
下图为查找结束后程序输出的结果:
绿色的文字可连接到PROSITE文件中相应的位置。
需要知道的是,蛋白序列中找到的特征序列并不一定具有生物学意义,只能说,查找的结果对寻找潜在的有意义片段具有很大帮助。
4.在序列数据库中查找一个自定义的特征序列:
Patternsearch
选择菜单命令Databases/Patternsearch,便开始在网上的蛋白数据库或本地蛋白数据库中查找含有自定义特征序列的蛋白。
所定义的特征序列必需符合PROSITE规定的语法。
语法规则如下:
-位置分隔符;
-[]允许此位置为括号内的任何一个残基;
-{}允许此位置为除了括号内所包括的任何一个残基;
-x代表任何残基;
-x(3)代表任何3个氨基酸残基,
根据以上语法,如果要查找的特征序列为N-[PT]-{GM}-x
(2)-[ILVM],则序列N-P-K-G-H-V,N-T-L-K-G-M将能够找到,而序列N-L-K-G-H-V,N-T-G-K-H-V将不能找到。
查找结束后,所有找到的序列将以Pearson格式,以SEQ_x.BAS为文件名存储在硬盘中。
5.预测物理化学特性曲线
Antheprot可以以图示的方法,显示出预测的蛋白质的物理化学特性曲线,下图为一个亲水性特性曲线的例子。
在图中,一个可移动的光标,显示了目前在序列中的位置为115,此位置的氨基酸残基(L)显示为红色,同时显示前5个与后五个残基(为AIIHVLHSRHP),特性值(-7)与参数(5)也显示在图中。
光标可以如下方式移动:
鼠标左键在选定位置单击;
方向键左或右为每次移动一个位置;
Shift+方向键左或右为每次移动十个位置;
方向键上或下为放大缩小。
可显示的物理化学特性曲线包括:
亲水曲线(Hydrophobicityprofile)
疏水曲线(Hydrophilicityprofile)
易溶性曲线(Solventaccessibilityprofile)
抗原性曲线(Antigenicityprofile)
跨膜区域曲线(transmembranousregionsprofile)
结合抗原性曲线(Combinedantigenicityprofile)
6.二级结构预测
Antheprot提供了几种方法进行蛋白质二级结构预测,包括:
●GORI方法:
在菜单中选择Method/Secondarystructureprediction/Garnieretal
●Gibrat方法:
在菜单中选择Method/Secondarystructureprediction/Gibratetal
●DoublePredictionMethod–DPM方法:
在菜单中选择Method/Secondarystructureprediction/DPM
●Homologue方法:
在菜单中选择Method/Secondarystructureprediction/Levin
●
Predator方法:
在菜单中选择Method/Secondarystructureprediction/Predator
●或全部使用以上几种方法:
单击按键或在菜单中选择Method/Secondarystructureprediction/All,其快捷键为Ctrl+L。
五种方法的输出形式分别举例如下:
GORI方法
Gibrat方法
DoublePredictionMethod–DPM方法
Homologue方法
Predator方法
全部使用以上几种方法的输出形式为
上图中加入了自定义的由X射线衍射法确定的二级结构图,可以显示在一个窗口,与其它预测的二级结构相比较。
自定义的二级结构由以*.XRA为扩展名的文件输入。
其格式为Pearson/Fasta文件格式,下面是一个*.xra文件的例子,
Myoglobin
CCCHHHHHHHHHHHHHHTTSHHHHHHHHHHHHHHHCHHHHHTCHHHHTCCSHHHHHHCHHHHHHH
HHHHHHHHHHHTTTTCCHHHHHHHHHHHHHTTCCCHHHHHHHHHHHHHHHHHHCTTTTSHHHHHH
HHHHHHHHHHHHHHHHHHHTCCC
H代表螺旋,图中表示为蓝色;
E代表折叠,图中表示为橙色;
T代表转角,图中表示为绿色;
C代表其它松散结构,图中表示为黑色。
7.计算蛋白序列分子量,比容与各蛋白残基百分组成
程序可以非常方便地对蛋白序列进行分子量,比容与各蛋白残基百分组成的计算。
单击按键或选取Methods/AAComposition,specificvolume,M.
Weight便进行计算。
快捷键为Ctrl+M。
输出形式如下:
8.计算蛋白序列滴定曲线与等电点
ANTHEPRO5.0还可根据一定算法,对输入的蛋白序列计算其滴定曲线与等电点。
图a
单击按键或选取Methods/Titrationcurve便可进行计算,快捷键为Ctrl+U。
输出图形如上图a。
9.选定一个片段后,绘制HelicalWheel图
ANTHEPRO4.3还可先选定一个蛋白片段,绘制其HelicalWheel图。
单击按键或选取Methods/HelicalWheel便可进行计算与绘制。
在二级结构预测输出窗口,用鼠标左键定义起始点,用鼠标右键定义结束点,选择菜单命令HelicalWheel,也可很方便的绘制此定义片段的HelicalWheel图
输出图形的例子如下:
在此窗口,单击鼠标左键放大图形,单击鼠标右键缩小图形。
10.进行潜在的信号肽与断裂位点预测
ANTHEPRO4.3还对输入的蛋白片段,进行潜在的信号肽与断裂位点预测。
单击按键或选取Methods/Potentialcleavagesiteofsignalpept.,再选择是原
核序列或或者真核序列便可进行预测。
输出结果举例如下:
四.结果的输出以及与其它应用程序进行数据交换
ANTHEPRO5.0所输出的所有文字、结果图形与曲线,均可以打印,也可以拷贝到剪贴板,粘贴到其它应用软件如WORD中,或者输出为*.BMP格式的位图文件,使用其它软件进行再编辑(位图文件体积较大,转换成*.jpg文件体积较小且画面质量较好)。
程序的缺省设置将输出图形背景色设为黑色(不大符合人们使用习惯,打印黑色背景也会造成墨的浪费,建议修改设置),在所有图形输出窗口,均可以以InvertMode(即黑白反色模式)输出,或者可以在Options菜单由用户定义背景与前景色颜色。
这样,可以将黑色背景反转为白色,符合人们的使用习惯。
总的来说,ANTHEPRO5.0蛋白质分析软件包的用于WINDOWS系统的版本界面为WINDOWS传统窗口界面,菜单选项丰富,文件基本命令与其他WINDOWS应用程序相同(如:
等等),界面友好,容易上手。
掌握使用后可以极大地加快研究蛋白序列的速度,并且能够获得具有发表质量的图表与数据,是一个不可多得的免费好软件。