本地Blast2GO安装Word文档格式.docx
《本地Blast2GO安装Word文档格式.docx》由会员分享,可在线阅读,更多相关《本地Blast2GO安装Word文档格式.docx(15页珍藏版)》请在冰豆网上搜索。
软件环境操作系统:
Linux(Centos,Ubuntu,Fedora等),最好有root权限,方便配置mysql。
数据库:
Mysql(或者Mysql的分支MariaDB),要有能创建数据库权限的用户,如果没有,可以参照我另一篇日志在没有Root权限的情况下安装Mysql。
Java运行环境:
一定要OracleJDK(6、7都行),不要用OpenJDK,否则无法运行b2g4pipe!
可参照我另一篇日志Linux安装JDK(内含没root权限时安装方法)。
LocalNCBI-Blast,可参照我另一篇文章Linux系统中NCBIBLAST+本地化教程。
注:
1.除非是已经非root安装mysql在有足够磁盘空间的分区(home)下,请一定参照网上的方法把Mysql的数据库目录配置到有足够空间的目录下面!
2.安装oraclejdk,不用卸载openjdk,并切换java到oraclejdk。
1sudo/usr/sbin/alternatives-configjava手动准备数据1)避免不稳定的网络环境使下载中断,自己用迅雷或者FTP客户端(wget也支持断点续传)下载以下4个文件(一共5.1G):
godatabase:
http:
/archive.geneontology.org/latest-full/目录下对应的go_XXXX-assocdb-data.gzgene_info.gz:
ftp:
/ftp.ncbi.nlm.nih.gov/gene/DATA/gene_info.gzgene2accession.gz:
/ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gzidmapping.tb.gz:
/ftp.pir.georgetown.edu/databases/idmapping/idmapping.tb.gz2)解压文件。
提示:
gzip-d解压文件后会删除原来的压缩文件。
1gzip-d*.gz3)下载local_b2g_db.zip文件,并解压。
内含创建数据库的b2gdb.sql文件和导入idmapping文件的java程序ImportIdMapping.class及其依赖的库mysql-connector-java-5.0.8-bin.jar。
为了方便,上述文件都放到同一目录下。
解压后文件清单如下:
123456789./:
31.48GB2.97KBImportIdMapping.class2.33KBb2gdb.sql1.83KBdownload_and_install.sh3.27GBgene2accession1.32GBgene_info22.37GBgo_201307-assocdb-data4.51GBidmapping.tb528.18KBmysql-connector-java-5.0.8-bin.jar导入数据库0)预防针。
b2gdb.sql建立数据库以及用户时,默认只赋予用户(blast2go)在本机(localhost)访问数据库(b2gdb)的权限,如下所示:
b2gdb.sqlMySQL12GRANTALLONb2gdb.*TOblast2golocalhostIDENTIFIEDBYblast4it;
FLUSHPRIVILEGES;
如果你今后需要在自己电脑使用服务器的b2g数据库,那么你需要赋予blast2go在任意主机(%)访问数据库的权限,修改如下:
b2gdb.sql12GRANTALLONb2gdb.*TOblast2go%IDENTIFIEDBYblast4it;
没这样设置的结果就是,PC远程连接服务器的数据库提示connectiontimeout,即使PC和服务器的防火墙设置无问题,仍然无法连接数据库。
那么补救措施就是在服务器登陆mysql(必要时-P指定端口),运行上述两句mysql命令。
1)配置download_and_install.sh文件:
download_and_install.shShell1234567891011121314151617#!
/bin/sh#配置以下7行godbname=go_201307-assocdb-data#根据http:
/archive.geneontology.org/latest-full/下assocdb-data.gz文件更改dbname=b2gdb#数据库名称,不用改dbuser=root#数据库用户名dbpass=passwordofroot#数据库用户密码dbhost=localhost#数据库所在ipdbport=3306#数据库端口,3306是默认的,如果是无root权限安装的MySQL,一定要改为设置的端口,比如我的33060path=/home/shenwei/Public/Data/local_b2g#数据文件目录,注意路径末尾不要有“/”#如果已经下载数据文件,下列部分保持注释#DownloadtheGOdatabasetheNCBImappingfilesandthePIRmapping#wgethttp:
/archive.geneontology.org/latest-full/$godbname.gz181920212223242526272829303132333435363738394041#wgetftp:
/ftp.ncbi.nlm.nih.gov/gene/DATA/gene_info.gz#wgetftp:
/ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz#wgetftp:
/ftp.pir.georgetown.edu/databases/idmapping/idmapping.tb.gz#如果已经下载并解压数据文件,下列部分保持注释#unzipfiles#gzip-dv$godbname.gz#gzip-dvgene_info.gz#gzip-dvgene2accession.gz#gzip-dvidmapping.tb.gzecho1.CreatetheDBTablesandusermysql-h$dbhost-P$dbport-u$dbuser-p$dbpassb2gdb.sql#ImportdatatotheGODatabaseecho2.Import$godbnamemysql-h$dbhost-P$dbport-u$dbuser-p$dbpass$dbnameImport-ImportBlastResults-OneXMLFile,导入10_BlastResults_2011.xml,菜单栏Mapping-RunGoMappingStep即可。
运行一分钟左右完成。
数据库更新,导入数据中断的解决方案:
1)assocdb-data数据的更新:
下载解压新的assocdb-data文件后,注释download_and_install.sh中其它导入数据的命令,只保留第二步:
123#ImportdatatotheGODatabaseecho2.Import$godbnamemysql-h$dbhost-u$dbuser-p$dbpass$dbnameuseb2gdb;
Databasechangedmysqltruncatetablegene2accession;
QueryOK,0rowsaffected(16.67sec)mysqltruncatetablegene_info;
QueryOK,0rowsaffected(2min2.49sec)1314151617mysqltruncatetablegi2uniprot;
QueryOK,0rowsaffected(0.00sec)mysqlquitBye注意,上面truncatetablegi2uniprot花费0.00sec是因为当时我还没有导入idmapping.tb,即gi2uniprot中还没有数据,所以速度很快。
3)用download_and_install导入数据时,如果出现中断,请参照上面“数据库各文件大小”核对数据文件大小,确认已导入和未导入的数据库,按照“数据库更新”的操作恢复导入过程,切勿简单地重新运行download_and_install。
参考1.Blast2GO安装http:
/2.Blast2GODocumentationhttp:
/3.LocalBlast2GODatabaseInstallationhttp:
/4.其它无数Google出来的页面其它根据b2gPipe.properties文件可以看出,blast2go的不仅能做基本的go注释(本文所安b2g数据库所支持),还能(需要)做GoSlim、SimapIntegration等(均需联网),甚至在线blast,这需要运行b2gPipe或者b2gGUI的电脑能链接互联网。
那么通过ssh连接服务器做的时候就需要服务器联网,或者通过代理让服务器联网;
或者在自己联网的PC上做。
至于,PC远程连接服务器的数据库提示connectiontimeout的情况,请参照前文“导入数据库”的“0)预防针”部分。
感谢各位的反馈。