ImageVerifierCode 换一换
格式:DOCX , 页数:19 ,大小:283.03KB ,
资源ID:26474501      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/26474501.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(使用cBio Cancer Genomics Portal综合分析癌症基因和临床资料.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

使用cBio Cancer Genomics Portal综合分析癌症基因和临床资料.docx

1、使用cBio Cancer Genomics Portal综合分析癌症基因和临床资料使用cBio Cancer Genomics Portal综合分析癌症基因和临床资料文章目录cBio Cancer Genomics Portal简介cBio Cancer Genomics Portal所需设备cBio Cancer Genomics Portal使用方法cBio Cancer Genomics Portal结果的查看和解释OncoPrintMutual ExclusivityCorrelation PlotsMutationsProtein ChangesSurvivalNetworkIGV

2、, Download, Bookmark多个癌症交叉查询查看癌症研究数据查看单一癌症的基因组改变:患者视图通过编程语言访问查询cBioPortalcBio Cancer Genomics Portal提供了研究分析癌症基因数据的可视化工具,cBioPortal可以帮助癌症组织和细胞学研究得到的分子学数据认识和理解遗传、表观遗传、基因表达和蛋白质组学。通过自定义数据的交互界面要以主研究人员探求研究基因改变和临床之间的联系。cBioPortal提供了图形化的结果,使复杂的癌症基因组学资料更易理解和接受,而不需要特殊的生物信息学知识。cBio Cancer Genomics Portal简介大样本癌

3、症基因组计划,如如癌症基因图谱(Cancer Genome Atlas, TCGA,http:/cancergenome.nih.gov/)和国际癌症基因组联盟(The International Cancer Genome Consortium, ICGC),得到了大量的有关癌症基因组的资料,但是这些资料对于研究人员来说,如何整合、探索和分析,是一个比较困难的事情,尤其是对于那些电脑水平欠佳的人来说,更是一件头疼的事情。cBio Cancer Genomics Portal(http:/cbioportal.org/)的出现就是为了减少这种难度的。cBioPortal方便了研究人员探求多维癌

4、症基因组数据,它要以可视化分析基因、样本和数据类型。我们可以对癌症研究中的样本的基因改变进行可视化,比较基因改变频率,或者综合分析单一样本中基因组改变。cBioPortal还可以研究生物学途径,生存率等等。cBioPortal整合的基因数据类型包括体细胞突变,DNA拷贝数改变,mRNA和microRNA表达,DNA甲基化,蛋白丰度以及磷蛋白丰度。迄今为止,cBioPortal包含了10已发表的肿瘤研究结果和20多个TCGA的结果。每个肿瘤样本和数据可以从网站上下载。cBioPortal把这些复杂的数据从基因水平上进行了整合和简化,每个样本可以查询特定的生物学特性,如基因突变,纯合子缺失,基因扩

5、增,mRNA和miRNA的增加或减少,蛋白质的增加或减少等。这让研究人员可以查询每个基因和样本的基因改变,验证一些假设。cBioPortal的数据来源和分析选项来源于多个网站,如TCGA data portal (https:/tcga-data.nci.nih.gov/tcga/), the ICGC data portal(http:/dcc.icgc.org/), the Broad Institutes Genome Data Analysis Center (GDAC) Firehose (http:/gdac.broadinstitute.org), the IGV, the Un

6、iversity of California, Santa Cruz (UCSC) Cancer Genomics Browser (30), IntOGen (31), Regulome Explorer (http:/explorer.cancerregulome.org),以及Oncomine (Reserach Edition) 等。cBioPortal提供的分析选项有癌症基因组数据,基因水平改变的引起的相关生物功能变化,综合分析基因组数据和临床资料,患者数据等。cBioPortal并不直接存储这些原始数据,原始数据来源于其它网站,如TCGA, ICGC, and Gene Expre

7、ssion Omnibus (GEO) (http:/www.ncbi.nlm.nih.gov/geo/)等。cBio Cancer Genomics Portal所需设备如果想使用cBioPortal,一台可以上网的电脑必不要少,当然现在最好还能翻墙,因为cBioPortal部分地区打不开。另外浏览器必须支持Javascript,这个到是不会有太大问题。但是注意:官方建议使用Google Chrome, Firefox 3.0以上, Safari, Internet Explorer 9.0以上版本。还在用XP?!换了吧,XP最高是Internet Explorer 8.0,Adobe Fl

8、ash player注意:这个浏览器插件主要是为了可视化分析结果用的,一般浏览器都应该有,如果没有可以在此下载安装Java Runtime Environment注意:这个主要是为了加载Integrative Genomics Viewer (IGV)用的,可以在此下载安装Adobe PDF Reader这人就不必说了,都有。可以使用一般的Adober Reader 但是我更建议使用PDFXCview,原因要以参阅升级为Windows 8.1,顺便说说我常用的那些软件。Vector graphic editor注意:这个东东是为了可视化和编辑从cBioPortal下载的SVG文件的,可以使用A

9、dobe Illustrator (或者Inkscape (http:/inkscape.org/).cBio Cancer Genomics Portal使用方法cBioPortal的癌症基因数据可以通过浏览器浏览和查询,网址为http:/cbioportal.org。我们可以查询一个癌症的研究或者多个症状研究结果,如果是单个癌症样本,还可看到相关的基因组改变。如果想查询一个癌症研究结果,我们可以探索和可视化所选定基因的基因组改变,包括这些基因之间改变之间的相关性,同一基因不同数据之间的关系。我们可以选择25余种癌症的研究结果。当选择基因组资料时,一般默认选择突变和CNAs。如果有相应mRN

10、A和miRNA表达或者相应的蛋白和磷酸化蛋白数据,也可以选择,如果没有这两项就不可选。蛋白和磷酸化蛋白基于反向蛋白芯片浅析浅析(reverse phase protein array, RPPA)实验结果。mRNA和miRNA数据和蛋白和磷酸化蛋白数据,标准分数(Z scores)通过实验值预先计算,我们可以设定或者默认设置(平均数的2倍标准差)。mRNA表达的Z scores由每个样本通过比较mRNA的基因表达和在代表典型基因表达的参考样本中的分布而决定。如果邻近组织的表达数据可用的话,邻近组织的表达数据就是参考样本的数据,反之,可以使用所癌症研究中的有疑问的基因的两倍的所有肿瘤的表达值。当

11、研究所分析的样本,默认情况下是匹配所选择的基因组资料。例如,仅查询突变交时会选择测序的数据。但是,我们可以改变这些选项。我们还通过可以User-Defined Case List或者基于Build Case Set自己自定义一个输入特定的样本。当输入基因进行分析时,我们可以手动输入HUGO基因符号,Entrez Gene ID,以及基因别我或者预设置的基因组。如果变异基因列表可用的话,例如MutSig的基因变异或者GISTIC的CNAs,我们可以从这些基因列表中选择基因,也可以通过这些列表建立基因,或者手动输入基因。一般可以通过4步法来进行查询和研究。1. Select Cancer Stud

12、y,选择想要研究癌症,可以通过下拉箭头进行选择,如Gliobastoma (TCGA, Nature 2008)。2. Select Genomic Profiles,选择基因组配置。默认设置选择Mutations,Copy Number data. Select one of the profiles below并选择Putative copy-number alterations (RAE, 203 cases)。注意:Mutations和Copy Number data. Select one of the profiles below一般是默认选中的。mRNA Expression d

13、ata. Select one of the profiles below是默认不选中的,默认的Z Score倍数可以根据用户自己设定。当微阵列和RNA-Seq数据可用时,优先选中RNA-Seq。3. Select Patient/Case Set,选择患者数可以使用下拉箭头进行选择,也可以使用Build Case Set进行选择。如选择“Tumors with sequence and CNA data (91)注意:如果用户自定义列表,该步须通过下拉列表进行选择,然后才可以输入样本ID,并用空格键进行分隔。4. Enter Gene Set,输入基因集合。可以手动输入或者通过限定的列表进行

14、选择。注意:在Advanced: Onco Query Language (OQL)中可以可以使用Onco查询语法(Onco Query Language,OQL)限定查询。OQL可以用于单个癌症和多个癌症的查询。一当文工团OQL查询,相应的结果也就限定了我们可以指定4个数据类型,CNAs,突变,mRNA或miRNA表达改变,以及蛋白或磷酸化蛋白丰度改变。CNA和突变一般是不连续设置,而mRNA,miRNA和蛋白丰度是连续性设置。表达值转换成Z Scores,以利于比较和限定变异倍数。Data TypeKey wordCategories and LevelsDefaultCopy Numbe

15、r AlterationsCNAAMP AmplifiedHOMDEL Homozygously DeletedGAIN GainedHETLOSS Heterozygously DeletedAMPand HOMDELMutationsMUTMUTShow mutated casesMUT=X Specific mutations or mutation types.All somatic, non-synonymous mutationsmRNA ExpressionEXPEXPxOver-expression is greater thanxSDs above the mean.The

16、comparison operators=also work.At least 2 standard deviations (SD) from the mean.Protein/ phosphoprotein level (RPPA)PROTPROTxProtein-level over-expression is greater than xSDs above the mean.The comparison operators andalso work.At least 2 standard deviations (SD) from the mean.5. Download Data,下载数

17、据。通过Submit可以查询并导出数据。可以另存为txt文档,这个文档可以用Excel文件打开。cBio Cancer Genomics Portal结果的查看和解释基于查询标准,cBioPortal把每个基因分成有变异和无变异,这种分法可用于分析和可视化结果。以下举例说明。OncoPrintOncoPrint是一个一组肿瘤样本中多个基因的简基因组改变明扼要的图形化结果。行代表基因,列代表样本。不同的符合和颜色编码用于区别基因组的变异,如突变,CNAs(扩增和纯合子缺失),以及基因表达或蛋白丰度的改变。如果把鼠标放置在图形上还要以看到额外的信息,如ID号(每个样本代表一个患者样本或者细胞系),

18、可以与患者的查看页面连接,同样还可以显示氨基酸的改变。默认情况下样本根据变异进行排序。我们可以存储原始样本文件。我们还可以从图形化结果上移除未变异的样本。多个样本的基因变异,OncoPrints可以帮助确认一些趋势,如基因之间的排斥性和共生性。OncoPrints另外还包含一些基因查询信息,这些查询信息可以Sanger Cancer Gene Census上得到,并且和NCBI的Gene数据库相联系。我们以视网膜母细胞瘤的基因CDKN2A(编码编码细胞周期素依赖性激酶抑制剂p16) CDK4(编码细胞周期素依赖性激酶4)和多形性成胶质细胞瘤中的RB1作为样本。1. Select Cancer

19、Study选择Gioblastoma (TCGA, Natrue 2008)2. Select Genomic Profiles选择Mutations,Copy Number data. Select one of the profiles below和Putative copy-number alterations (RAE, 203 cases)3. Select Patient/Case Set选择Tumors with suqencing and CNA data (91)4. Enter Gene Set中输入CDKN2A CDK4 RB1然后Submit,可以得到如下OncoPri

20、nt图从这个图上可以看到,65个样本(71%)三个基因有至少有1个变异,其是每个基因的变异情况也在图上进行了标示。CDKN24多数的变异是homozygous deletions,并且有3个突变mutations。CDK4是单纯的amplifications。RB1包含1个homozygous deletions和3个突变mutations。有以下几点需要说明:1. 当设置好查询条件后,提交查询,OncoPrint结果是自动生成的。2. 如果基因过多,超出一个视屏,可以使用上下滚动条进行完形查看3. cBioPortal为了使OncoPrint更国简练,因此显示可能不能满足部分人的需要,但是可

21、以通过Customize选项进行结果显示的细微调节。一般要以有3个选项可以调节,Zoom调节OncoPrint的宽度,Remove Unaltered Cases把未变异的基因去除,Remove Whitespace去除中间空白区域。4. 可以把结果下载为PDF,SVG或Txt格式进行保存。5. 把鼠标放置在变异基因上,可以看到更多的信息。6. 可以通过上方的Modify Query进行查询的调整。Mutual Exclusivity癌症中的生物学进程或者路径常常通过多种不同的基因或者不同的机制进行调节。cBioPortal中的Mutual Exclusivity可以发现既往不知道一些癌症发病

22、机制,这些机制可能在肿瘤形成和癌症的进展中起到重要作用。在Mutual Exclusivity标签中,和特定肿瘤相关的基因倾向于相互排斥,如果存在基因排斥,也就是说这个肿瘤可能只有一种基因问题。相反是基因共生,一种肿瘤如果有多个基因同时存在,那这几个基因可能共生,其都在肿瘤的发生和发展中起到作用,这个肿瘤也很可能并非单一基因问题。如上例中的三个基因的变异可以通过Mutual Exclusivity标签查看统计学数据。从上图要以看到这三个基因之间都存在排他性,其中又以CDK4-RB1的排他性最强,但是没有统计学意义(P0.11),可能是由于样本量较小有关。CDK4-CDKN2A和RB1-CDKN

23、2A之间的排他性有统计学意义(P0.05,红框表示)。这也符合已知的RB信息通路在多形性成胶质细胞瘤的作用,可以通过RB1本身的失活(突变或者删除)引起失效,CDK4通过扩增而活化(CDK要以抑制RB1活性),或者CDK抑制剂p16而使CDK失活,p16是编码CDKN2A的基因。odds ratio (OR) 的计算一般通过如下方法。假设有两个基因分别是G1和G2,这两个基因之间的共生OR一般如下计算。OR(A*D)/(B*C)A:代表两个基因中都有变异数量B:代表在G1中有变异但是G2中没有C:代表G2中有变异但是G1中没有D:代表两个基因中都没有的变异数P值的计算主要是Fisher精确检验

24、。Correlation PlotscBioPortal提供了离散基因和连续基因的可视化分析,如mRNA或者蛋白丰度,或DNA甲基化。在查询时指定每个基因,cBioPortal会生在不同的散点图。打开Plot选项,在Plot Type中的mRNA versus copy-number选项展示的盒须图表示mRNA表达和它的拷贝数之间的关系。Copy-number status可以是纯合子缺失,杂合子缺失,二倍体,增进(即有少量拷贝扩增)或者扩增(即有大量拷贝扩增)。mRNA-versus-DNA methylation选项表示mRNA表达与DNA甲基化之间的比较。甲基化值是CpG位点甲基化水平的

25、一个估计值,是甲基化和未甲基化位点之间的比值。RPPA protein level versus mRNA选项表示蛋白丰度与mRNA丰度之间比较的散点图。基因和数据类型可以通过下拉菜单进行选择,所有的散点图可以导出为PDF文件格式以利于发表,也可以导出为SVG格式。例如我们分析一下ERBB2(一个编码表皮生长因子受体的致癌基因)在结肠和直肠腺癌中的作用。ERBB2可以结直肠癌样本中扩增。1. Select Cancer Study选择Colon and Rectum Adenocarcinoma (TCGA, Provisional)2. Select Genomic Profiles选择Mu

26、tations和Putative copy-number alterations from GISTIC3. Select Patient/Case Set选择All Tumors 4. Enter Gene Set中输入ERBB2然后Submit,选择Plots选项。1. Plot Type中选择mRNA vs. Copy Number2. Data Type-mRNA -选择mRNA expression (microarray),- Copy Number - 选择Putative copy-number alternations from GISTIC。可以得到如下图。从下图可以看到E

27、RBB2 mRNA扩增样本中ERBB2 mRNA是增加的。注:Hetloss, heterozygously deleted; Diploid, two alleles present; Gain, low-level gene amplification event; Amp, high-level gene amplification event.3. Plot Type选择RPPA protein level v. mRNA时, 可以得到如下图。可以看到ERBB2 mRNA高表达的肿瘤ERBB2蛋白量更高。注:Homdel, homozygously deleted; Hetloss,

28、heterozygously deleted; Diploid, two alleles present; Gain, low-level gene amplification event; Amp, high-level gene amplification event; Mutated, nonsynonymous mutation.MutationsMutations栏提供了所有非同义突变的图形化和表格式结果。图形化结果显示Pfam蛋白质结构域的上下的所有突变。所有DNA根据RefSeq isoform (http:/www.broadinstitute.org/oncotator/)标

29、准进行标准化。当DNA突变不在isoforms中时,图形化结果不包括这些突变。但是cBioPortal会在另提供这方面的信息。突变图形下有一个所有非同义突变的表格,该表格可以通过Show/hide columns自定义显示信息,一般包括以下信息:Sample ID: 每个样本的ID号,可以通过链接连接到单患者视图页面;AA change: amino acid change,氨基酸的改变;Type: type of mutations突变类型,如missense, nonsense, splice site, frameshift insertion or deletion, in-frame

30、 insertion or deletion, nonstop, nonstart;Copy: 扩增类型,如Diploid, two alleles present; Gain, low-level gene amplification event; Amp, high-level gene amplification event等;COSMIC: 在COSMIC (Catalogue Of Somatic Mutations In Cancer)部位的突变数;MS: Mutation Status, Somatic;VS: Validations Status,是否有意义突变Mutation Assessor: Predicted Functional Impact Score (via Muation Assessor) for missense mutations. 预计突变引起的功能性影响分数;Center: Sequncing Center;Chr: Chromosome;Start Pos: Start Positions;End Pos: End Position;Ref: Reference Al

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1