生物信息学网址.docx
《生物信息学网址.docx》由会员分享,可在线阅读,更多相关《生物信息学网址.docx(11页珍藏版)》请在冰豆网上搜索。
生物信息学网址
核酸数据库:
1.GenBankhttp:
//www.ncbi.nlm.nih.gov/Genbank
Locusname(位点名)
Accessionnumber(注册号或登陆号)
GI(GenInfoidentifier)
2.EST数据库http:
//www.ncbi.nlm.nih.gov/dbEST/index.html
◆GenBank的二级数据库
◆5’端或3’端的cDNA序列(EST)
3.UniGenehttp:
//www.ncbi.nlm.nih.gov/UniGene/
◆NCBI的另一个核苷酸数据库
◆来源于同一基因的非重复EST组成基因序列群
4.STS数据库http:
//www.ncbi.nlm.nih.gov/dbSTS/index.html
◆GenBank的二级数据库UniSTS
◆短序列(200-500bp),仅在基因组中出现一次
◆已定位于染色体上如何找到一个STS
◆检索:
NCBI主页选择UniSTS后输入关键词———检索到的条目——每一条目详细内容——点击“mapviewer”查看染色体定位
5.GSS数据库http:
//www.ncbi.nlm.nih.gov/dbGSS/index.html
◆GenBank的二级数据库
◆基因组短序列
◆cosmid/BAC/YAC外源插入片段的末端序列
◆AluPCR序列
6.HTGS数据库http:
//www.ncbi.nlm.nih.gov/HTGS/
◆GenBank的二级数据库
◆尚未完成测序的重叠群(>2kb)的序列
◆新序列的增加速度很快
7.基因组数据http:
//www.ncbi.nlm.nih.gov/sites/entrez?
db=genome
◆NCBI的另一个数据库
◆测序完成和正在测序物种基因组序列、遗传图、物理图等
◆序列收集在GenBank
8.单核苷酸多态性http:
//www.ncbi.nlm.nih.gov/sites/entrez?
db=snp
9.EMBL数据库
数据库主页http:
//www.ebi.ac.uk/embl输入关键词——检索到的条目——每一条目详细内容
10.DDBJ数据库
数据库主页http:
//www.ddbj.nig.ac.jp/Welcome-e.html输入关键词
——检索到的条目——每一条目详细内容
11.启动子数据库http:
//www.epd.isb-sib.ch/
12.miRNA数据库http:
//www.mirbase.org/
◆可以通过miRNA名、关键词、染色体位置等检索数据库
◆分析一条DNA序列中是否可能包含miRNA
13.蛋白质数据库
(1)UniPROThttp:
//www.uniprot.org/
(2)PIR数据库http:
//pir.georgetown.edu
(3)prosite数据库http:
//www.expasy.org/prosite
14.结构数据库
(1)PDB(ProteinDataBank)http:
//www.rcsb.org
X射线衍射图、核磁共振(NMR)光谱图和电镜图(文字和三维结构图)
(2)SWISS-3DIMAGEhttp:
//www.expasy.ch/sw3d/
蛋白质的平面和立体图
15.酶和代谢数据库
(1)KEGG主页http:
//www.genome.ad.jp/kegg/点击“PATHWAY”——“PATHWAY”网页点击任何代谢路径,如糖酵解/糖原异生途径(Glycolysis/Gluconeogenesis)
(2)检索GeneticInformationProcessing
KEGG主页点击“PATHWAY”——“PATHWAY”网页点击任何遗传信息路径,如Proteinexport路径——可以查看参加这一路径蛋白质的信息
(3)检索EnvironmentalInformationProcessing
KEGG主页点击“PATHWAY”——“PATHWAY”网页点击任何EnvironmentalInformationProcessing路径,如MAPKsignalingpathway路径——可以查看与这一路径相连的其它信号路径或参加这一路径的蛋白质信息
(4)检索CellularProcesses
KEGG主页点击“PATHWAY”——“PATHWAY”网页点击任何CellularProcesses路径,如Cellcycle路径——可以查看与这一路径相连的其它信号路径或参加这一路径的蛋白质信息
16.物种分类数据库
Taxonomy数据库
http:
//www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html
17.文献数据库
(1)PubMedhttp:
//www.ncbi.nlm.nih.gov/PubMed/
(2)OMIMhttp:
//www.ncbi.nlm.nih.gov/sites/entrez?
db=OMIM
◆人类基因、遗传疾病
◆输入疾病、基因名称——条目
(3)Agricolahttp:
//agricola.nal.usda.gov/
◆美国农业部农业图书馆的数据库
◆农业类刊物
18.Entrezhttp:
//www.ncbi.nlm.nih.gov/gquery/
NCBI的检索体系
优点:
三种检索体系中最容易操作的体系
缺点:
检索范围有限
19.检索、管理和引用文献的工具
20.SRShttp:
//srs.ebi.ac.uk/
21.DBGEThttp:
//www.genome.jp/dbget/
日本GenomeNet的检索体系
优点:
与KyotoEncyclopediaofGenesandGenomes
(KEGG)database相连
操作较SRS简单
缺点:
检索面较SRS窄
22.BLAST检索
blastn用核苷酸序列检索核苷酸数据库
blastp用蛋白质序列检索蛋白质数据库
blastx将核苷酸序列通过6种阅读框翻译成不同的蛋白
质序列检索蛋白质数据库
tblastn用蛋白质序列检索核苷酸数据库(数据库中的序
列被翻译出不同的蛋白质序列)
tblastx将核苷酸序列通过6种阅读框翻译成不同的蛋白质序列检索核苷酸数据库(数据库中的序列也被翻译出不同的蛋白质序列)
23.Primer-BLASThttp:
//www.ncbi.nlm.nih.gov/tools/primer-blast
◆设计PCR引物
◆分析引物特异性
24.多重比对http:
//www.ncbi.nlm.nih.gov/tools/cobalt/
◆多重比对
◆进化分析
基因预测:
25.重复序列
http:
//www.repeatmasker.org/
26.确定开放读码框(ORFFinder)
http:
//www.ncbi.nlm.nih.gov/projects/gorf/
27.genefinding(softberry)
在Softberry主页选择“GeneFindinginEukaryota”类中的“FGENESH”-----在FGENESH网页输入D63710序列(fasta格式)、选择物种(human)作为参照---结果
28.Genescanhttp:
//genes.mit.edu/GENSCAN.html
是用三种物种为参照,脊椎动物,拟南芥属和玉米
29.genemarkerhttp:
//exon.biology.gatech.edu
v用于真核、原核和病毒等基因的预测
v多种物种参照
在GeneMark的分析主页选择“GenePredictioninEukaryotes”---在“GenePredictioninEukaryotes”网页输入D63710的序列、选择物种“H.sapiens”,选择输出格式选项
基因精细结构分析
30.BCMhttp:
//dot.imgen.bcm.tmc.edu
v包括多种基因预测软件
vNNPP分析启动子位点
在BCM的分析主页选择“GeneFeatureSearches”-------在“GeneFeatureSearches”网页粘贴D63710序列、选择“NNPP/Eukaryotic-eukaryoticpromoterprediction”
31.分析启动子位点Promoter2.0PredictionServer
http:
//www.cbs.dtu.dk/services/Promoter
32.分析转录因子结合位点
(1)http:
//www-bimas.cit.nih.gov/molbio/proscan
(2)PLACE(ADatabaseofPlantCis-actingRegulatoryDNAElement)http:
//www.dna.affrc.go.jp/PLACE/index.html
在PLACE主页点击“SignalScanSearch”
33.非编码RNA基因的预测
http:
//en.wikipedia.org/wiki/List_of_RNA_structure_prediction_software
蛋白质的性质和结构分析
34.ExPASy(ExpertProteinAnalysisSystem)
http:
//www.expasy.org
35.分析蛋白质的pI、Mw、氨基酸组成
打开ExPASy主页“Tools&Software”-----在“Primarystructureanalysis”栏目选择“ProtParam”分析软件-----在ProtParam主页粘贴序列进行分析
36.分析蛋白质的疏水性
在“Primarystructureanalysis”栏目选择“ProtScale”分析软件
37.分析蛋白质的重复结构
在“Primarystructureanalysis”栏目选择“REP”分析
38.预测蛋白质的-螺旋、-折叠及其它二级结构
在“Secondarystructureprediction”栏目选择“SOPMA”分析软件
39.分析膜蛋白
在“Topologyprediction”栏目选择“SOSUI”分析工具------在SOSUI主页选择分析“SOSUI”
40.分析膜锚定蛋白的GPI位点
在“Post-translationalmodification”栏目选择“big-PIPredictor”分析软件
41.分析蛋白质的翻译后修饰
(1)1.分析信号肽及其剪切位点
在“Post-translationalmodificationprediction”栏目选择“SignalIP”分析软件
(2)2.分析糖链连接点
在“Post-translationalmodificationprediction”栏目选择“NetOGlyc”软件分析O-连接糖链的连接位点
在“Post-translationalmodificationprediction”栏目选择“NetNGlyc”软件分析N-连接糖链的连接位点
42.分析蛋白质的亚细胞定位
在“Topologyprediction”栏目选择“PSORT”软件分析蛋白质在细胞中的定位-----在PSORT网页选择分析方法,如选择WoLFPSORT
43.分析化学因子作用蛋白质的位点
在“Proteinidentificationandcharacterization”栏目选择“PeptideCutter”分析软件
44.Gramene数据库(http:
//www.gramene.org)
以一个物种基因组作模板与其他物种基因组比较
方法:
在Gramene数据库主页点击“COMPARATIVEMAPS”----------在Gramene-CMAPs网页点击“Maps”-------在Maps网页选择物种(Oryzasativa),然后点击“ChangeSpecies”-----在更新后的网页Ref.Set选择需要的图后点击“ShowSelectedSet’sMaps”-----在打开网页选择染色体的编号,点击“DrawselectedMaps”显示这条染色体----点击“Mapoptions”中“Mapset”的“AddMapsleft”或“AddMapsright”------选择比较的染色体,点击“Redraw”显示比较图----可以继续比较新的染色体
45.查找分子标记信息
在Gramene数据库主页点击“Markers/Sequences”----在Markers网页输入标记名称查找
46.大豆数据库http:
//www.soybase.org/
大豆分子育种相关数据库,包括遗传图谱、基因、分子标记、QTL等信息
47.麦类数据库http:
//wheat.pw.usda.gov/
由美国农业部和国家农业图书馆的植物基因组计划支持的麦类作物基因组数据库
48.玉米基因组数据库http:
//www.maizegdb.org/
玉米基因组信息数据库
49.QTL(数量性状位点)
v在Gramene数据库主页点击“QTL”
v输入QTL名称、性状或其他关键词
vSimplesearch、Powersearch
v具体性状QTL目录和注释
vQTL的在染色体上的位置
50.查看突变体信息
v在Gramene数据库主页点击“Genes”
v输入基因名称、性状或其他关键词
v信息列表
v基因详细信息
51.水稻突变体数据库
v在RMD数据库()主页点击“Keywordsearch”
v在检索网页进行“Simplesearch”或“Advancedsearch”
v检索结果目录
v查看详细结果(文字、图片)
v也可以进行BLAST检索
52.家畜家禽基因组数据库
(1)ArkDB(http:
//www.thearkdb.org)
以牛的数据库为例,点击1号染色体,选择Map类型(LinkageMaps—MARC2004(A):
1,点击打开新页面-------查看Map介绍,点击“DrawMap”调出遗传连锁图-----点击各分子标记,查看其详细信息
(2)http:
//www.animalgenome.org/
检索QTL信息:
v在数据库主页的“Resources&Tools”选择AnimalQTLdb
v在QTL数据库浏览QTL信息
v在QTL数据库查询
53.UCSCGenomeBioinformaticshttp:
//genome.ucsc.edu/
v各种动物的基因组注释数据
v点击数据库主页的“GenomeBrowser”
v各个物种的基因组信息
v查询基因组特定区段和关键词(结果1,结果2)
核酸序列的其他分析方法
54.确定DNA序列的分子量和碱基组成
在本地计算机上利用BioEdit工具进行分析-------拷贝fasta格式的序列,在BioEdit分析工具的“File”栏目选择“NewfromClipboard”输入序列-------选择被粘贴序列的名称,在“Sequence”栏目点击“NucleicAcid→NucleotideComposition”-------文字分析结果和图形结果
55.序列转换
选择被粘贴序列的名称,在“Sequence”栏目点击“NucleicAcid→Complement”获得互补序列、“NucleicAcid→ReverseComplement”获得反向互补序列、“NucleicAcid→DNA-RNA”获得RNA序列
56.翻译全场DNA
选择被粘贴序列的名称,在“Sequence”栏目点击“NucleicAcid→Translate→Frame1”获得氨基酸序列
57.分析限制性内切酶切割位点
选择被粘贴序列的名称,在“Sequence”栏目点击“NucleicAcid→RestrictionMap”--------在“CreateRestrictionMap”页面中选择限制性内切酶种类、选择阅读框等后点击“GenerateMap”
58.设计PCR引物http:
//frodo.wi.mit.edu/primer3
◆确定PCR产物片段大小
◆确定引物所在区段
◆确定引物序列的长度范围
◆确定引物Tm(meltingtemperature)值范围
59.在染色体上定位DNA序列
采用electronicPCR(e-PCR)功能定位DNA序列http:
//www.ncbi.nlm.nih.gov/projects/e-pcr/
方法:
在e-PCR网页点击“Forwarde-PCR”-----在Forwarde-PCR网页粘贴序列或输入序列注册号-----分析结果(检测到3个定位的marker),点击“Marker”栏目中的marker名称,查看在染色体上的具体位置---选择的marker在染色体上的物理或遗传位置
60.Reversee-PCR分析方法(举例)
在e-PCR网页点击“Reversee-PCR”-------在Reversee-PCR网页选择数据库(Dataset)、点击“UniSTSinput”、输入序列注册号