1、CLINDBN:该变异所引起的疾病名称CLINACC:该变异的登记号和版本号(VariantAccession and Versions)CLINSDB:该变异所引起疾病所在数据库名称该变异所引起疾病所在数据库中的IDPopFreqMax:该变异人群中的最大等位基因频率1000_All:该变异在千人基因组计划数据库中的人群等位基因频率1000_AFR:该变异在千人基因组计划数据库中非洲人群的等位基因频率1000_AMR:该变异在千人基因组计划数据库中美国人群的等位基因频率1000_EAS:该变异在千人基因组计划数据库中东亚人群的等位基因频率1000_EUR:该变异在千人基因组计划数据库中欧洲人
2、群的等位基因频率1000_SAS:该变异在千人基因组计划数据库中南亚人群的等位基因频率Snp138:该变异在dbSNP数据库中的IDCosmic70:该变异在癌症体细胞突变数据库COSMIC中的IDESP6500siv2_ALL:该变异在美国国家心肺血液研究所的ESP6500数据库中的人群等位基因频率ESP6500siv2_AA:该变异在美国国家心肺血液研究所的ESP6500数据库中的非洲裔人群等位基因频率ESP6500siv2_EA:该变异在美国国家心肺血液研究所的ESP6500数据库中的欧洲裔人群等位基因频率ExAC_All:该变异在ExAC数据库中的人群等位基因频率ExAC_AFR:该变
3、异在ExAC数据库中非洲人群的等位基因频率ExAC_AMR:该变异在ExAC数据库中美国人群的等位基因频率ExAC_EAS:该变异在ExAC数据库中东亚人群的等位基因频率ExAC_FIN:该变异在ExAC数据库中芬兰人群的等位基因频率ExAC_NFE:该变异在ExAC数据库中非芬兰欧洲人群的等位基因频率ExAC_OTH:该变异在ExAC数据库中除已指定人群之外的人群等位基因频率ExAC_SAS:该变异在ExAC数据库中南亚人群的等位基因频率CG46:该变异在CG46数据库中的人群等位基因频率。CG46是由CompleteGenomics(BGI)公司对46个样本的全基因组测序而建立的数据库,截
4、止2017年,他们已经对超过20000个样本进行了全基因组测序和分析。ICGC_Id:国际癌症基因协作组中各研究的IDICGC_Occurrence:该变异在ICGC数据库中的发生情况。该栏数据结构如COCA-CN|1|187|0.00535,指中国结直肠癌的研究(https:/icgc.org/),在187例患者中有1例发生突变,突变比例为0.00535Nci60:该变异在nci60数据库中的等位基因频率。Nci60是被广泛用于药物筛选的人类60种肿瘤细胞系组合,已经进行了全外测序。随着研究的进步,美国癌症研究所NCI在2016年宣布NCI-60细胞系“退休”,PDX新模型“上任”。Inte
5、rpro_domain:InterPro算法预测的突变所处的保守结构域(http:/www.ebi.ac.uk/interpro/)dbscSNV_ADA_SCORE:基于adaptive boosting预测变异对剪接位点改变的可能性dbscSNV_RF_SCORE:基于Random Forest预测变异对剪接位点改变的可能性。得分代表剪接影响的可能性大小,如果dbscSNV_ADA_SCORE和dbscSNV_RF_SCORE得分均小于0.6,则对剪接位点没有影响(PMID: 28132688)。Omim_phenotype:在OMIM数据库中该基因(不是该变异)对应的表型QUAL:测序质
6、量分数,计算方法为Q = -10log10(e),可衡量碱基未正确检出的概率。FILTER:对变异位点做进一步的过滤。无论你用什么方法对变异位点进行过滤,过滤完了之后,在FILTER一栏都会留下过滤记录,如果是通过了过滤标准,那么这些通过标准的好的变异位点的FILTER一栏就会注释一个PASS,如果没有通过过滤,就会在FILTER这一栏提示除了PASS的其他信息(other FILTER flag)。如果这一栏是一个“.”的话,就说明没有进行过任何过滤INFO&FORMAT:该栏数据结构GT:AD:AF:ALT_F1R2:ALT_F2R1:FOXOG:QSS:REF_F1R2:REF_F2R1
7、。GT:基因型,对于一个二倍体生物,0表示跟REF一样,1表示表示跟Alt一样;2表示第二个Alt;AD:对应两个以逗号隔开的值,这两个值分别表示覆盖到REF和Alt碱基的reads数,相当于支持REF和支持Alt的测序深度;AF:支持Alt的测序深度占总测序深度的比例,即等位基因丰度NORMAL:与肿瘤组织对应的正常组织中的信息,一般通过外周血测序获得TUMOR:肿瘤组织中的信息此外还可能包含各种算法对非同义突变保守性预测值,这些算法包括SIFT prediction(T: tolerated; D: deleterious),PolyPhen HumanDiv prediction (D:
8、Probably damaging, P: possibly damaging; B: benign)、LTR、MutTaster、MutationAssessor、FATHMM、CADD、GERP+等等。2、分析挖掘数据对全外显子检测(或者属于较大pannel范畴的情况也可以),可以进行肿瘤突变负荷(Tumor mutationburden)计算。临床研究表明,使用PD1/PD-L1抑制剂等免疫治疗药物时,具有较高突变负荷的患者具有较好的客观缓解率(ORR)、较长的无进展生存期(PFS),同时持续临床疗效(DCB)也更佳。然而,由于目前没有统一的肿瘤突变负荷计算方法,在做纵向比较时需谨慎。该
9、分析使用的计算方法为,肿瘤组织中突变丰度大于等于5%,正常组织中突变丰度小于等于1%,ExonicFunc.refGene一栏去除“.”、synonymous SNV、unknown标签的数据,PopFreqMax一栏去除人群等位基因频率大于0.1%的数据(注意保留“.”)。此外,免疫治疗相关的一些基因突变(如EGFR、干扰素信号通路的JAK、B2M等)值得关注。对全外显子检测,能够发现大量的体细胞突变。有的突变是致病性的称为为驱动突变或司机突变(与之对应的称为乘客突变或继发性突变),这些突变或导致DNA修复缺陷,或导致细胞不受调控的增殖生长,或导致细胞不能正常凋亡,或导致细胞侵袭性增强,或导
10、致免疫逃逸。因而从大量的体细胞突变中鉴定肿瘤的驱动基因突变既是基因检测的重要目的之一,同时也是一项艰难的工作。一般来说一个肿瘤的发生其驱动基因突变的数目为0-8个,且他们不会分布于同一个关键的肿瘤相关信号通路中(比如BRAF和KRAS,比如APC和CTNNB1)或并行的两个重要信号通路中(比如PIK3CA和KRAS)。一般来说原癌具有较为明显突变热点聚集倾向(比如KRAS和PIK3CA),而抑癌基因的突变位点较为分散(比如RB1和VHL)。对全外显子检测目前已经在肿瘤中得到较为广泛的应用,如何高效寻找驱动基因突变急需指导和规范化的文件,但由于肿瘤细胞突变多为体细胞突变,遗传性突变领域的规范化文
11、件(后面会具体讲)难以照搬使用。因为体细胞突变的意义和遗传性突变的意义比如致病性突变这样的描述有所不同,比如我们可以采用响应药物的突变(responsive)、耐药突变(resistant)、驱动性突变(driver)、继发性突变(passenger)来描述突变的意义。值得庆幸的是,2017年伊始,分子病理协会(Association for Molecular Pathology, AMP)、美国临床肿瘤协会(American Societyof Clinical Oncology)和美国病理学家联盟(College ofAmerican Pathologists)对高通量测序在肿瘤诊疗领域
12、的应用从突变记载(HGVS)、注释解读、报告进行了指导和规范(PMID: 27993330)。该指导规范中对参考序列数据库(如NCBI)、人群基因频率数据库(如1000G、ExAC)、肿瘤数据库(如COSMIC、ICGC)、疾病数据库(如HGMD、ClinVar)、预测软件(如PolyPhen2、Human Splicing Finder)的使用和注意事项给出了意见。该规范还推荐对肿瘤细胞的体细胞变异划分为四个级别:具有确定性临床意义的突变(variants with strong clinical significance,Level A和Level B)、可能具有临床意义的突变(varia
13、nts with potential clinical significance,Level C和Level D)、临床意义不明的突变(variants of unknown clinical significance)、良性或可能良性的突变(variants deemed benign or likely benign),并详细阐述如何将检测到突变结合数据库以归类到这四个级别中。其中具有确定性临床意义/可能具有临床意义的突变包括四个等级的证据:Level A:可作为预测药物反应或耐药性的FDA批准的针对特定类型肿瘤(适应症)的治疗的突变;或者已经被包括在专业指南中(如肿瘤的NCCN)作为特定
14、类型肿瘤的治疗、诊断或预后的突变;Level B,可作为预测药物反应或耐药性的基于充分研究和专家共识的治疗的突变,或者是基于充分研究和专家共识的具有特定疾病诊断、预后意义的突变;Level C,可作为预测药物反应或耐药性的FDA或专业协会批准的跨适应症的治疗的突变,或者是已经作为临床试验的入组参考标准,或者是基于多项研究的具有特定疾病诊断、预后意义的突变;Level D,基于临床前研究、案例报道的可能具有临床意义的突变;或者有研究表明该突变有助于疾病诊断和预后判断。目前,寻找肿瘤驱动基因突变的具体策略可以说是多种多样(图2)。通过寻找热点基因的热点突变(recurrent mutation)是一种较为确定的策略,相关的研究证据较为充分。例如EGF
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1