1、生物信息学网址核酸数据库:1. GenBank http:/www.ncbi.nlm.nih.gov/GenbankLocus name(位点名)Accession number (注册号或登陆号)GI(GenInfo identifier)2.EST数据库http:/www.ncbi.nlm.nih.gov/dbEST/index.html GenBank的二级数据库 5 端或3 端的cDNA 序列(EST)3. UniGene http:/www.ncbi.nlm.nih.gov/UniGene/ NCBI 的另一个核苷酸数据库 来源于同一基因的非重复 EST 组成基因序列群 4.STS数
2、据库 http:/www.ncbi.nlm.nih.gov/dbSTS/index.html GenBank的二级数据库 UniSTS 短序列(200-500 bp),仅在基因组中出现一次 已定位于染色体上 如何找到一个STS 检索:NCBI主页选择UniSTS后输入关键词 检索到的条目 每一条目详细内容 点击“map viewer”查看染色体定位 5.GSS数据库 http:/www.ncbi.nlm.nih.gov/dbGSS/index.html GenBank的二级数据库 基因组短序列 cosmid / BAC / YAC 外源插入片段的末端序列 Alu PCR 序列 6. HTGS数
3、据库 http:/www.ncbi.nlm.nih.gov/HTGS/ GenBank 的二级数据库 尚未完成测序的重叠群( 2 kb)的序列 新序列的增加速度很快 7.基因组数据 http:/www.ncbi.nlm.nih.gov/sites/entrez?db=genome NCBI 的另一个数据库 测序完成和正在测序物种基因组序列、遗传图、物理图等 序列收集在GenBank 8.单核苷酸多态性http:/www.ncbi.nlm.nih.gov/sites/entrez?db=snp 9.EMBL数据库数据库主页http:/www.ebi.ac.uk/embl输入关键词 检索到的条目
4、每一条目详细内容 10. DDBJ数据库 数据库主页http:/www.ddbj.nig.ac.jp/Welcome-e.html输入关键词检索到的条目 每一条目详细内容 11.启动子数据库 http:/www.epd.isb-sib.ch/12.miRNA数据库http:/www.mirbase.org/ 可以通过miRNA名、关键词、染色体位置等检索数据库 分析一条DNA序列中是否可能包含miRNA 13.蛋白质数据库 (1)UniPROT http:/www.uniprot.org/(2)PIR数据库http:/pir.georgetown.edu(3)prosite 数据库 http:
5、/www.expasy.org/prosite 14.结构数据库(1)PDB (Protein Data Bank) http:/www.rcsb.org X 射线衍射图、 核磁共振(NMR) 光谱图和电镜图(文字和三维结构图)(2)SWISS-3D IMAGE http:/www.expasy.ch/sw3d/ 蛋白质的平面和立体图 15.酶和代谢数据库(1)KEGG主页http:/www.genome.ad.jp/kegg/点击“PATHWAY”“PATHWAY”网页点击任何代谢路径,如糖酵解/糖原异生途径(Glycolysis/Gluconeogenesis)(2)检索Genetic I
6、nformation ProcessingKEGG主页点击“PATHWAY”“PATHWAY”网页点击任何遗传信息路径,如 Protein export 路径可以查看参加这一路径蛋白质的信息 (3)检索Environmental Information ProcessingKEGG主页点击“PATHWAY”“PATHWAY”网页点击任何Environmental Information Processing 路径,如 MAPK signaling pathway 路径可以查看与这一路径相连的其它信号路径或参加这一路径的蛋白质信息 (4)检索Cellular ProcessesKEGG主页点击“
7、PATHWAY”“PATHWAY”网页点击任何Cellular Processes 路径,如 Cell cycle 路径可以查看与这一路径相连的其它信号路径或参加这一路径的蛋白质信息16.物种分类数据库Taxonomy数据库http:/www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html 17.文献数据库(1)PubMed http:/www.ncbi.nlm.nih.gov/PubMed/(2)OMIM http:/www.ncbi.nlm.nih.gov/sites/entrez?db=OMIM 人类基因、遗传疾病 输入疾病、基因名称 条目 (3)
8、Agricola http:/agricola.nal.usda.gov/ 美国农业部农业图书馆的数据库 农业类刊物18. Entrez http:/www.ncbi.nlm.nih.gov/gquery/ NCBI 的检索体系优点:三种检索体系中最容易操作的体系缺点:检索范围有限 19. 检索、管理和引用文献的工具 20.SRS http:/srs.ebi.ac.uk/21.DBGET http:/www.genome.jp/dbget/ 日本GenomeNet的检索体系优点:与 Kyoto Encyclopedia of Genes and Genomes (KEGG) database
9、相连操作较SRS简单缺点:检索面较 SRS 窄22.BLAST 检索blastn 用核苷酸序列检索核苷酸数据库blastp 用蛋白质序列检索蛋白质数据库blastx 将核苷酸序列通过 6 种阅读框翻译成不同的蛋白 质序列检索蛋白质数据库tblastn 用蛋白质序列检索核苷酸数据库(数据库中的序 列被翻译出不同的蛋白质序列)tblastx 将核苷酸序列通过 6 种阅读框翻译成不同的蛋白质序列检索核苷酸数据库(数据库中的序列也被 翻译出不同的蛋白质序列) 23. Primer-BLAST http:/www.ncbi.nlm.nih.gov/tools/primer-blast 设计PCR引物 分
10、析引物特异性24.多重比对 http:/www.ncbi.nlm.nih.gov/tools/cobalt/ 多重比对 进化分析基因预测:25.重复序列http:/www.repeatmasker.org/26. 确定开放读码框(ORF Finder)http:/www.ncbi.nlm.nih.gov/projects/gorf/27.gene finding(softberry)在Softberry主页选择“Gene Finding in Eukaryota”类中的“FGENESH”-在FGENESH网页输入D63710序列(fasta格式)、选择物种(human)作为参照-结果28Gen
11、escan http:/genes.mit.edu/GENSCAN.html是用三种物种为参照,脊椎动物,拟南芥属和玉米29.genemarker http:/exon.biology.gatech.eduv 用于真核、原核和病毒等基因的预测v 多种物种参照在GeneMark的分析主页选择“Gene Prediction in Eukaryotes”-在“Gene Prediction in Eukaryotes”网页输入D63710的序列、选择物种“H. sapiens”,选择输出格式选项基因精细结构分析30. BCM http:/dot.imgen.bcm.tmc.eduv 包括多种基因预
12、测软件v NNPP分析启动子位点在BCM的分析主页选择“Gene Feature Searches”-在“Gene Feature Searches”网页粘贴D63710序列、选择“NNPP/Eukaryotic-eukaryotic promoter prediction”31.分析启动子位点 Promoter 2.0 Prediction Serverhttp:/www.cbs.dtu.dk/services/Promoter32.分析转录因子结合位点(1)http:/www-bimas.cit.nih.gov/molbio/proscan(2)PLACE (A Database of P
13、lant Cis-acting Regulatory DNA Element) http:/www.dna.affrc.go.jp/PLACE/index.html 在PLACE主页点击“Signal Scan Search”33.非编码RNA基因的预测 http:/en.wikipedia.org/wiki/List_of_RNA_structure_prediction_software蛋白质的性质和结构分析34. ExPASy (Expert Protein Analysis System)http:/www.expasy.org 35. 分析蛋白质的pI、Mw、氨基酸组成打开ExPAS
14、y 主页 “Tools & Software”-在“Primary structure analysis”栏目选择“ProtParam”分析软件-在ProtParam主页粘贴序列进行分析36.分析蛋白质的疏水性在“Primary structure analysis”栏目选择“ProtScale”分析软件37.分析蛋白质的重复结构在“Primary structure analysis”栏目选择“REP”分析38. 预测蛋白质的螺旋、折叠及其它二级结构在“Secondary structure prediction”栏目选择“SOPMA”分析软件39.分析膜蛋白在“Topology predi
15、ction”栏目选择“SOSUI”分析工具-在SOSUI主页选择分析“SOSUI”40.分析膜锚定蛋白的GPI位点 在“Post-translational modification”栏目选择“big-PI Predictor ”分析软件41.分析蛋白质的翻译后修饰(1)1. 分析信号肽及其剪切位点在“Post-translational modification prediction”栏目选择“SignalIP”分析软件(2)2. 分析糖链连接点在“Post-translational modification prediction”栏目选择“NetOGlyc” 软件分析O连接糖链的连接位点
16、在“Post-translational modification prediction”栏目选择“NetNGlyc” 软件分析N连接糖链的连接位点42.分析蛋白质的亚细胞定位在“Topology prediction”栏目选择“PSORT” 软件分析蛋白质在细胞中的定位-在PSORT网页选择分析方法,如选择WoLF PSORT43.分析化学因子作用蛋白质的位点在“Protein identification and characterization”栏目选择“PeptideCutter”分析软件44. Gramene 数据库(http:/www.gramene.org)以一个物种基因组作模板
17、与其他物种基因组比较方法:在Gramene 数据库主页点击“COMPARATIVE MAPS ”-在Gramene-CMAPs网页点击“Maps”-在Maps网页选择物种(Oryza sativa),然后点击“Change Species”-在更新后的网页Ref. Set选择需要的图后点击“Show Selected Sets Maps” -在打开网页选择染色体的编号,点击“Draw selected Maps”显示这条染色体 -点击“Map options”中“Map set”的“Add Maps left”或“Add Maps right”-选择比较的染色体,点击“Redraw”显示比较图
18、 -可以继续比较新的染色体 45.查找分子标记信息在Gramene 数据库主页点击“Markers/Sequences”-在Markers网页输入标记名称查找46.大豆数据库 http:/www.soybase.org/ 大豆分子育种相关数据库,包括遗传图谱、基因、分子标记、QTL 等信息47.麦类数据库 http:/wheat.pw.usda.gov/ 由美国农业部和国家农业图书馆的植物基因组计划支持的麦类作物基因组数据库 48.玉米基因组数据库 http:/www.maizegdb.org/ 玉米基因组信息数据库 49.QTL(数量性状位点)v 在Gramene数据库主页点击“QTL”v
19、输入QTL名称、性状或其他关键词v Simple search、Power search v 具体性状QTL目录和注释 v QTL 的在染色体上的位置 50.查看突变体信息v 在Gramene数据库主页点击“Genes”v 输入基因名称、性状或其他关键词v 信息列表 v 基因详细信息 51.水稻突变体数据库v 在RMD数据库()主页点击“Keyword search”v 在检索网页进行“Simple search”或“Advanced search”v 检索结果目录 v 查看详细结果(文字、图片)v 也可以进行BLAST检索 52.家畜家禽基因组数据库(1)ArkDB (http:/www.t
20、hearkdb.org) 以牛的数据库为例,点击1号染色体 ,选择Map类型(Linkage Maps MARC2004 (A) : 1,点击打开新页面-查看Map介绍,点击“Draw Map”调出遗传连锁图- 点击各分子标记,查看其详细信息 (2)http:/www.animalgenome.org/ 检索QTL信息:v 在数据库主页的“Resources & Tools”选择Animal QTLdb v 在QTL数据库浏览QTL信息 v 在QTL数据库查询 53. UCSC Genome Bioinformatics http:/genome.ucsc.edu/ v 各种动物的基因组注释数
21、据 v 点击数据库主页的“Genome Browser”v 各个物种的基因组信息 v 查询基因组特定区段和关键词(结果1,结果2)核酸序列的其他分析方法54. 确定DNA序列的分子量和碱基组成在本地计算机上利用BioEdit工具进行分析-拷贝fasta格式的序列,在BioEdit分析工具的“File”栏目选择“New from Clipboard”输入序列-选择被粘贴序列的名称,在“Sequence”栏目点击“Nucleic AcidNucleotide Composition”-文字分析结果和图形结果 55.序列转换选择被粘贴序列的名称,在“Sequence”栏目点击“Nucleic Aci
22、dComplement”获得互补序列、“Nucleic AcidReverse Complement”获得反向互补序列、“Nucleic AcidDNA-RNA”获得RNA序列56.翻译全场DNA选择被粘贴序列的名称,在“Sequence”栏目点击“Nucleic AcidTranslate Frame 1”获得氨基酸序列57.分析限制性内切酶切割位点选择被粘贴序列的名称,在“Sequence”栏目点击“Nucleic AcidRestriction Map” -在“Create Restriction Map”页面中选择限制性内切酶种类、选择阅读框等后点击“Generate Map”58.设
23、计PCR引物 http:/frodo.wi.mit.edu/primer3 确定PCR产物片段大小 确定引物所在区段 确定引物序列的长度范围 确定引物Tm(melting temperature)值范围59. 在染色体上定位DNA序列采用electronic PCR(e-PCR)功能定位DNA序列http:/www.ncbi.nlm.nih.gov/projects/e-pcr/方法:在e-PCR网页点击“Forward e-PCR”-在Forward e-PCR网页粘贴序列或输入序列注册号-分析结果(检测到3个定位的marker),点击“Marker”栏目中的marker名称,查看在染色体上的具体位置-选择的marker在染色体上的物理或遗传位置60. Reverse e-PCR分析方法(举例)在e-PCR网页点击“Reverse e-PCR”-在Reverse e-PCR网页选择数据库(Dataset)、点击“UniSTS input”、输入序列注册号
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1