UCSC使用介绍.pptx
《UCSC使用介绍.pptx》由会员分享,可在线阅读,更多相关《UCSC使用介绍.pptx(40页珍藏版)》请在冰豆网上搜索。
,迪康金诺2019年真核转录组生物信息培训班,UCSC数据库介绍及应用,目录CONTENTS,01UCSC数据库简介,02UCSC的使用,03UCSC的使用示例,04BINGO插件使用,01,UCSC简介,UCSC数据库,UCSC是生物领域里常用的数据库之一,由UniversityofCaliforniaSantaCruz(UCSC)创立和维护,主要包含了人类、小鼠、果蝇等多种常见动物的基因组信息。
UCSC里也包括了一系列的分析工具,帮助用户浏览基因信息、查看已有基因组注释信息和下载基因序列等。
用户可以通过它可靠和迅速地浏览基因组的任何一部分,并且同时可以得到与该部分有关的基因组注释信息,如已知基因,预测基因,表达序列标签,信使RNA,CpG岛,克隆组装间隙和重叠,染色体带型,小鼠同源性等。
UCSC数据库,网址https:
/genome-asia.ucsc.edu/index.html,基因组浏览器,在线比对工具,可以选择蛋白比对或基因序列比对,将Tracks相关信息,Tracks之间的交叉,以及Tracks包含的序列信息进行查询,快速确定引物扩增区间,不同版本基因组坐标转换,数据下载,收录的物种,02,UCSC使用,UCSCGenomesBrowser,收录物种,物种检索,版本选择,信息检索,UCSCGenomesBrowser,GenomeBrowser的结构为:
最上方为基因组版本号,以下依次为:
浏览控制按键,搜索栏,染色体条带图,下方显示目标区域在染色体上的位置,以及各类Tracks。
什么是Tracks,Tracks(路径)是指基因组序列上的各类区域注释信息,如基因区,外显子,组蛋白修饰,CpG岛等。
这些信息被分列于基因组序列下方,我们可以通过tracks查看相关基因序列的各类信息,并进行比较。
Tracks可以被隐藏,也可以有多种显示方式,因此我们可以挑选感兴趣的Tracks进行显示;同时,我们也可以将自己得到的基因组注释信息(如mRNA,CHIP-Seq结果等)作为customTracks上传。
所有Track的分类和列表如下页所示。
不同的物种,不同的基因组版本号,基因组浏览器中包含的Tracks种类也不一样,越完备的基因组,Tracks越多。
UCSCGenomesBrowser结果示例,Genomebackbone,Knowngenes,RepeatMask,SNP151,Converstation,Refseqgene,Literature,GTEx,Encode,Tracks(全部),Tracks(分栏),Tracks的显示分为5个等级(最多)hide:
不显示该Track,去掉不用的信息;dense:
信息综合在一条线段上;squish:
与pack类似,但高度只有pack的一半pack:
每一项都用一条线段显示,但彼此互补,减少所占的空间full:
每项都用一条线段分行显示。
结果详细信息的查询,点击线,详细描述,UCSCBlat,Blat(Blast-likealignmenttool)是UCSC提供的序列比对工具。
有如下特点:
DNA(95%以上相似度,至少40个碱基的相似区域);RNA(80%以上相似度,至少20个氨基酸的相似区域);,应用:
查找mRNA或蛋白在基因组中的位置;决定基因外显子的结构;显示全长基因的编码区域;分离物种内的EST;查找基因家族,查找基因在物种间的同源性。
UCSCBlat,输入序列,上传文件,参数配置,比对结果,点击在browser里查看比对结果,比对结果,比对的详细情况,UCSCTableBrowser,提供了数据库的链接,用文本形式获取储存在GenomeBrowser数据库中的基因组和注释数据。
主要功能:
1)为整个染色体或者一些特定序列获取DNA序列信息或注释信息。
2)用特定的条件对输出结果进行筛选。
3)创建自己的Track,并在GenomeBrowser中进行浏览。
4)整合多重查询,并为其产生相关的输出。
5)为选定的数据集提供基本的统计结果(序列数,总碱基数等)。
6)显示一个数据表格的详细情况,并且列出在数据库中相关表格。
7)根据其他应用程序和数据库的要求,格式化输出结果,GeneSorter,用户可以使用GeneSorter借助不同的标准,例如基因表达谱或蛋白同源性以及其它的一些用户自行设定的条件对基因进行分类。
通过网页上的链接可以很方便地切换到GenomeBrowser页面和其它的UCSC网站页面,了解更多的表达谱信息、蛋白间相互作用信息和其它的相关信息。
去年,GBD还在GeneSorter中添加了几个新的内容,现在GeneSorter可以对人类、小鼠、大鼠、秀丽隐杆线虫、黑腹果蝇和酵母等六种模式生物的基因进行分类。
UCSCGeneSorter是一个用来开发基因家族和基因间关系的一个非常优秀的资源。
这个工具显示了与所选基因组相关的其他基因组列表。
通过这个工具可以找到:
蛋白水平的相似性,基因表达谱的相似性或是基因组的相似性。
GeneSorter,输出结果,In-SilicoPCR,In-SilicoPCR,In-SilicoPCR:
电子PCR,模拟PCR.用一组序列作为PCR引物来搜索数据库返回相关的序列。
MaxProductSize-Maximumsizeofamplifiedregion.MinPerfectMatch-Numberofbasesthatmatchexactlyon3endofprimers.Minimummatchsizeis15.MinGoodMatch-Numberofbaseson3endofprimerswhereatleast2outof3basesmatch.FlipReversePrimer-Invertthesequenceorderofthereverseprimerandcomplementit.,位置,长度,引物,解链温度,UCSC数据库dowload,UCSC提供数据下载,UCSC数据库dowload,03,UCSC使用示例,1)打开UCSCGenomeBrowser;2)选择物种,在搜索栏中输入miRNA的名称,点击submit。
hsa-miR-3194-3p,UCSC使用实例-1,利用UCSC查找已知的miRNA序列信息:
3)直接点击图中的miRNA(基因组下第一行),4)点击页面中的下图中所示的GenomicSequence,5)设置需要显示的miRNA在基因组位置上下游的序列。
6)点击submit,得到FASTA格式的序列信息(页首)。
UCSC使用实例-2,查找已经序列上是否有SNP位点及相关信息,1、使用UCSC上In-SilicoPCR工具,2、把以基因组序列为模板的上下游引物输入相应的位置,submit,3、获得上下游引物所覆盖的序列,如下图,点击序列所在位置(红框标记),4、打开的页面上显示SNP名字和在染色体上相对位置,点击SNP名字,UCSC使用实例-3,批量查找SNP位点基因组信息,1、使用UCSC上TableBrowser工具,1)确定查询物种,基因组版本号,选择变异及相应的track,一列SNP位点,2)点击pastelist,在弹出框里输入snp信息,然后点击submit,3)选择输出格式、输出文件名后点击getoutput。
UCSC使用实例-4,查找目标区内基因信息,1、使用UCSC上TableBrowser工具,chr1:
11,102,837-11,267,747,1)确定查询物种,基因组版本号,group及相应的track,2)修改查找的targetregion,通过点击defineregions,3)可以通过输入框输入region,也支持本地上传文件。
完成后,点击submit,4)选择输出文件格式和输出文件名,UCSC使用实例-5,下载从人类第四条染色体开始简单重复10次以上的序列。
1)打开TableBrowser;2)选择哺乳动物、人类、最新的基因组版本;3)group选择Repeats,track选择SimpleRepeats,region选择position,chr4,点击filter的create,4)在筛选菜单中指定copynumber为大于等于“=”,筛选值为10,点击submit;,5)按要求选择输出文件是否存为文件夹还是直接在网页上显示6)点击getoutput,得到如图所示的重复序列结果,谢谢观看Thanksforyourattention!