肿瘤基因检测的解读流程Word文档格式.docx

上传人:b****6 文档编号:18659389 上传时间:2022-12-31 格式:DOCX 页数:7 大小:22.55KB
下载 相关 举报
肿瘤基因检测的解读流程Word文档格式.docx_第1页
第1页 / 共7页
肿瘤基因检测的解读流程Word文档格式.docx_第2页
第2页 / 共7页
肿瘤基因检测的解读流程Word文档格式.docx_第3页
第3页 / 共7页
肿瘤基因检测的解读流程Word文档格式.docx_第4页
第4页 / 共7页
肿瘤基因检测的解读流程Word文档格式.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

肿瘤基因检测的解读流程Word文档格式.docx

《肿瘤基因检测的解读流程Word文档格式.docx》由会员分享,可在线阅读,更多相关《肿瘤基因检测的解读流程Word文档格式.docx(7页珍藏版)》请在冰豆网上搜索。

肿瘤基因检测的解读流程Word文档格式.docx

变异在染色体上的结束位置

Ref:

参考基因组的序列

Alt:

检测样本基因组的序列

Func.refGene:

变异所处参考基因的功能区(exonic,intronic,UTR3,UTR5,splicing,upstream,downstream,intergenic)(此处的exonic特指外显子编码氨基酸区,不包括外显子的UTR区)

Gene.refGene:

变异所处参考基因名称(如果是基因间,则是两侧的基因)

GeneDetail.refGene:

非外显子区处于特定转录本中的具体位置(如果是基因间,则是距离两侧的基因的距离)

ExonicFunc.refGene:

外显子区的变异类型(frameshiftinsertion,frameshiftdeletion,stopgain,stoploss,nonframeshiftinsertion,nonframeshiftdeletion,synonymousSNV,nonsynonymousSNV),如果这一栏是一个“.”的话,就说明该变异不在外显子区

AAChange.refGene:

氨基酸水平的改变(同一个基因可能具有多个转录本,氨基酸改变的位置在分歧的转录本中有可能纷歧样)

经注释后的vcf文件还会包括如下信息:

CLINSIG:

该变异在ClinVar数据库中的临床意义(Benign,Likelybenign,Uncertainsignificance,Likelypathogenic,Pathogenic,Drug-response)

CLINDBN:

该变异所引起的疾病名称

CLINACC:

该变异的挂号号和版本号(VariantAccessionandVersions)

CLINSDB:

该变异所引起疾病所在数据库名称

该变异所引起疾病所在数据库中的ID

PopFreqMax:

该变异人群中的最年夜等位基因频率

1000_All:

该变异在千人基因组计划数据库中的人群等位基因频率

1000_AFR:

该变异在千人基因组计划数据库中非洲人群的等位基因频率

1000_AMR:

该变异在千人基因组计划数据库中美国人群的等位基因频率

1000_EAS:

该变异在千人基因组计划数据库中东亚人群的等位基因频率

1000_EUR:

该变异在千人基因组计划数据库中欧洲人群的等位基因频率

1000_SAS:

该变异在千人基因组计划数据库中南亚人群的等位基因频率

Snp138:

该变异在dbSNP数据库中的ID

Cosmic70:

该变异在癌症体细胞突变数据库COSMIC中的ID

ESP6500siv2_ALL:

该变异在美国国家心肺血液研究所的ESP6500数据库中的人群等位基因频率

ESP6500siv2_AA:

该变异在美国国家心肺血液研究所的ESP6500数据库中的非洲裔人群等位基因频率

ESP6500siv2_EA:

该变异在美国国家心肺血液研究所的ESP6500数据库中的欧洲裔人群等位基因频率

ExAC_All:

该变异在ExAC数据库中的人群等位基因频率

ExAC_AFR:

该变异在ExAC数据库中非洲人群的等位基因频率

ExAC_AMR:

该变异在ExAC数据库中美国人群的等位基因频率

ExAC_EAS:

该变异在ExAC数据库中东亚人群的等位基因频率

ExAC_FIN:

该变异在ExAC数据库中芬兰人群的等位基因频率

ExAC_NFE:

该变异在ExAC数据库中非芬兰欧洲人群的等位基因频率

ExAC_OTH:

该变异在ExAC数据库中除已指定人群之外的人群等位基因频率

ExAC_SAS:

该变异在ExAC数据库中南亚人群的等位基因频率

CG46:

该变异在CG46数据库中的人群等位基因频率.CG46是由CompleteGenomics(BGI)公司对46个样本的全基因组测序而建立的数据库,截止2017年,他们已经对超越20000个样本进行了全基因组测序和分析.

ICGC_Id:

国际癌症基因协作组中各研究的ID

Nci60:

该变异在nci60数据库中的等位基因频率.Nci60是被广泛用于药物筛选的人类60种肿瘤细胞系组合,已经进行了全外测序.随着研究的进步,美国癌症研究所NCI在2016年宣布NCI-60细胞系“退休”,PDX新模型“上任”.

Interpro_domain:

InterPro算法预测的突变所处的守旧结构域(http:

//www.ebi.ac.uk/interpro/)

dbscSNV_ADA_SCORE:

基于adaptiveboosting预测变异对剪接位点改变的可能性

dbscSNV_RF_SCORE:

基于RandomForest预测变异对剪接位点改变的可能性.得分代表剪接影响的可能性年夜小,如果dbscSNV_ADA_SCORE和dbscSNV_RF_SCORE得分均小于0.6,则对剪接位点没有影响(PMID:

28132688).

Omim_phenotype:

在OMIM数据库中该基因(不是该变异)对应的表型

QUAL:

测序质量分数,计算方法为Q=-10log10(e),可衡量碱基未正确检出的概率.

FILTER:

对变异位点做进一步的过滤.无论你用什么方法对变异位点进行过滤,过滤完了之后,在FILTER一栏城市留下过滤记录,如果是通过了过滤标准,那么这些通过标准的好的变异位点的FILTER一栏就会注释一个PASS,如果没有通过过滤,就会在FILTER这一栏提示除PASS的其他信息(otherFILTERflag).如果这一栏是一个“.”的话,就说明没有进行过任何过滤

INFO&

FORMAT:

该栏数据结构GT:

AD:

AF:

ALT_F1R2:

ALT_F2R1:

FOXOG:

QSS:

REF_F1R2:

REF_F2R1.GT:

基因型,对一个二倍体生物,0暗示跟REF一样,1暗示暗示跟Alt一样;

2暗示第二个Alt;

AD:

对应两个以逗号隔开的值,这两个值分别暗示覆盖到REF和Alt碱基的reads数,相当于支持REF和支持Alt的测序深度;

AF:

支持Alt的测序深度占总测序深度的比例,即等位基因丰度

NORMAL:

与肿瘤组织对应的正常组织中的信息,一般通过外周血测序获得

TUMOR:

肿瘤组织中的信息

另外还可能包括各种算法对非同义突变守旧性预测值,这些算法包括SIFTprediction(T:

tolerated;

D:

deleterious),PolyPhenHumanDivprediction(D:

Probablydamaging,P:

possiblydamaging;

B:

benign)、LTR、MutTaster、MutationAssessor、FATHMM、CADD、GERP++等等.

2、分析挖掘数据

对全外显子检测(或者属于较年夜pannel范畴的情况也可以),可以进行肿瘤突变负荷(Tumormutationburden)计算.临床研究标明,使用PD1/PD-L1抑制剂等免疫治疗药物时,具有较高突变负荷的患者具有较好的客观缓解率(ORR)、较长的无进展生存期(PFS),同时继续临床疗效(DCB)也更佳.然而,由于目前没有统一的肿瘤突变负荷计算方法,在做纵向比力时需谨慎.该分析使用的计算方法为,肿瘤组织中突变丰度年夜于即是5%,正常组织中突变丰度小于即是1%,ExonicFunc.refGene一栏去除“.”、synonymousSNV、unknown标签的数据,PopFreqMax一栏去除人群等位基因频率年夜于0.1%的数据(注意保管“.”).另外,免疫治疗相关的一些基因突变(如EGFR、干扰素信号通路的JAK、B2M等)值得关注.

对全外显子检测,能够发现年夜量的体细胞突变.有的突变是致病性的称为为驱动突变或司机突变(与之对应的称为乘客突变或继发性突变),这些突变或招致DNA修复缺陷,或招致细胞不受调控的增殖生长,或招致细胞不能正常凋亡,或招致细胞侵袭性增强,或招致免疫逃逸.因而从年夜量的体细胞突变中鉴定肿瘤的驱动基因突变既是基因检测的重要目的之一,同时也是一项艰难的工作.一般来说一个肿瘤的发生其驱动基因突变的数目为0-8个,且他们不会分布于同一个关键的肿瘤相关信号通路中(比如BRAF和KRAS,比如APC和CTNNB1)或并行的两个重要信号通路中(比如PIK3CA和KRAS).一般来说原癌具有较为明显突变热点聚集倾向(比如KRAS和PIK3CA),而抑癌基因的突变位点较为分散(比如RB1和VHL).

对全外显子检测目前已经在肿瘤中获得较为广泛的应用,如何高效寻找驱动基因突变急需指导和规范化的文件,但由于肿瘤细胞突变多为体细胞突变,遗传性突变领域的规范化文件(后面会具体讲)难以照搬使用.因为体细胞突变的意义和遗传性突变的意义比如致病性突变这样的描述有所分歧,比如我们可以采纳响应药物的突变(responsive)、耐药突变(resistant)、驱动性突变(driver)、继发性突变(passenger)来描述突变的意义.值得庆幸的是,2017年伊始,分子病理协会(AssociationforMolecularPathology,AMP)、美国临床肿瘤协会(AmericanSocietyofClinicalOncology)和美国病理学家联盟(CollegeofAmericanPathologists)对高通量测序在肿瘤诊疗领域的应用从突变记载(HGVS)、注释解读、陈说进行了指导和规范(PMID:

27993330).该指导规范中对参考序列数据库(如NCBI)、人群基因频率数据库(如1000G、ExAC)、肿瘤数据库(如COSMIC、ICGC)、疾病数据库(如HGMD、ClinVar)、预测软件(如PolyPhen2、HumanSplicingFinder)的使用和注意事项给出了意见.该规范还推荐对肿瘤细胞的体细胞变异划分为四个级别:

具有确定性临床意义的突变(variantswithstrongclinicalsignificance,LevelA和LevelB)、可能具有临床意义的突变(variantswithpotentialclinicalsignificance,LevelC和LevelD)、临床意义不明的突变(variantsofunknownclinicalsignificance)、良性或可能良性的突变(variantsdeemedbenignorlikelybenign),并详细论述如何将检测到突变结合数据库以归类到这四个级别中.其中具有确定性临床意义/可能具有临床意义的突变包括四个品级的证据:

LevelA:

可作为预测药物反应或耐药性的FDA批准的针对特定类型肿瘤(适应症)的治疗的突变;

或者已经被包括在专业指南中(如肿瘤的NCCN)作为特定类型肿瘤的治疗、诊断或预后的突变;

LevelB,可作为预测药物反应或耐药性的基于充沛研究和专家共识的治疗的突变,或者是基于充沛研究和专家共识的具有特定疾病诊断、预后意义的突变;

LevelC,可作为预测药物反应或耐药性的FDA或专业协会批准的跨适应症的治疗的突变,或者是已经作为临床试验的入组参考标准,或者是基于多项研究的具有特定疾病诊断、预后意义的突变;

LevelD,基于临床前研究、案例报道的可能具有临床意义的突变;

或者有研究标明该突变有助于疾病诊断和预后判断.

目前,寻找肿瘤驱动基因突变的具体战略可以说是多种多样(图2).通过寻找热点基因的热点突变(recurrentmutation)是一种较为确定的战略,相关的研究证据较为充沛.例如EGFR的突变主要发生在胞内酪氨酸激酶(TK)区域的前四个外显子上(18~21),目前发现的TK区域突变有30多种.缺失突变主要发生在外显子19上,最罕见的是delE746-A750,替代突变最罕见的是发生在外显子21上的L858R,复制或拔出突变发生在外显子20上.发生在外显子20上的替代突变T790M为耐药突变,研究还发现L858Q、D761Y、T854A等耐药突变.HER2基因在乳腺癌、膀胱癌、结直肠癌、胃癌中主要突变方式是扩增或者表达上调,鲜有突变,在20~30%的乳腺癌中存在HER2基因明显扩增或过表达,可是在肺癌中,其激活机制为扩增、过表达及点突变,点突变在肺癌中的发生概率约占2-4%,多发生在其激酶结构域中,罕见的激活性点突变包括p.S310,p.L755,p.G776L,p.V777L,p.S855I,p.N857S等.BRAFV600E突变临床意义在Pubmed中有上百遍报道.BRAF突变存在于1%–3%的非小细胞肺癌中.V600E是最罕见的肿瘤驱动突变,在肺癌中也有多种其他类型的BRAF突变被报道,包括G466V、G469A和D594G.尽管性药物例如vemurafenib在包括BRAFV600E突变的黑色素瘤中高度有效,但这些药物对BRAF其他位点突变,或者V600E突变肺癌中的肿瘤驱动活性还需评估.

图2 

鉴定驱动基因突变战略(PMID:

24479672)

热点基因的热点突变在很大都据库中有不完全的收录,这些数据库有Civic数据库,OncoKB数据库,Personalizedcancertherapy数据库,ClinicalKnowledgebase数据库等等.

预测变异对卵白质功能的影响,可以作为寻找肿瘤驱动突变的一种有益弥补方法.比力罕见的预测工具如SIFT、PolyPhen2、MutationAssessor等等,这些算法的原理一般是基于氨基酸的进化守旧性,有的考虑到卵白质结构域的功能(例如TP53卵白的有害突变多位于DNA结合结构域),还有的会考虑卵白的空间结构.对检测到的变异各算法预测值在上述的vcf文件中可查阅.对SIFT,值越小变异有害性的可能性越年夜,推荐阈值0.05;

对PolyPhen2,值越年夜变异有害性的可能性越年夜,推荐阈值0.3;

对MutationAssessor,值越年夜变异有害性的可能性越年夜,推荐阈值8,需要注意的是,分歧的参考文献阈值可能分歧(PMID:

23819521).

将基因放在信号通路中分析,这对不是十分罕见的小众肿瘤驱动基因寻找有很年夜帮手.在美国,每年有年夜约18,000名患者被确诊为脑膜瘤.它们约占原发性脑肿瘤的三分之一,女性患病比率高一倍.可是一直以来对脑膜瘤的遗传突变了解甚少.在一项研究中(PMID:

23334667),科学家们对17个脑膜瘤样本进行了全基因组或是外显子组测序.在这些肿瘤中发现改变基因后,研究人员随后又对另外两组肿瘤进行了测序.研究人员发现,相比年夜大都类型的肿瘤,脑膜瘤具有较少数量的遗传改变或损伤.在一些肿瘤中,他们发现两个在已知致癌信号通路中发挥作用的基因存在突变.在3个肿瘤中发现的SMO,是Hedgehog信号的成员.在5个肿瘤中发现了AKT1,该基因介入了与乳腺癌、结直肠癌和肺癌相关的PI3K-AKT-mTOR信号.第6个肿瘤具有一个畴前已知的,与mTOR信号通路相关的突变.总的来说,这些突变基因信号通路构成了所研究的15%脑膜瘤的重要驱动子.

对遗传性肿瘤,可以借助遗传病致病基因鉴定的方案,流程即1、了解临床资料2、核心表型转化为中文人类表型标准用语(CHPO)3、基因检测及其质控4、生信分析5、遗传学分析,包括关联候选基因、遗传变异位点分析解读和家系验证6、表型相似度分析.2013年ACGM推荐的与遗传性肿瘤/遗传病相关基因包括BRCA1、BRCA2、TP53、STK11、MLH1、MSH2、MSH6、PMS2、APC、MUTYH、VHL、MEN1、RET、PTEN、RB1、SDHC、SDHD、TSC1、TSC2、WT1、NF2等(PMID:

23788249).查找正常对比组织突变丰度(N_Freq)≥40%,比对遗传性肿瘤相关突变基因,是否有遗传性肿瘤相关胚系突变,检查并依照下述步伐进行确认.依照基因名+c.__或基因名+p.__进行谷歌搜索或进入NCBI、HGMD、OMIM等网站查阅是否有相关致病性报道,依照ACMG指南进行位点致病性判定或可借助InterVar在线辅助判定(仅适用于exon范围内突变).发现遗传性肿瘤相关的基因突变,还应推荐家族其他直系血亲进行基因检测做进一步简直认.

美国医学遗传学与基因组学学会(AmericanCollegeofMedicalGeneticsandGenomics,ACMG)和分子病理协会(AssociationforMolecularPathology,AMP)在2015年对临床实验室的基因检测进行了指导和规范(PMID:

25741868).该指导规范主要就是适用于孟德尔遗传病相关基因变异或者是生殖系变异.指导规范推荐记载突变遵循统一的规范——人类基因组变异协会(HumanGenomeVariationSociety,HGVS),并将变异根据人群基因频率(populationdata)、软件预测(computationaldata)和功能试验(functionaldata)等参数分为五个级别:

致病性突变(pathogenic)、可能致病性突变(likelypathogenic)、意义不明突变(uncertainsignificance)、可能良性突变(likelybenign)和良性多态性突变(benign).这五个级别如何认定?

该规范列出了致病性/可能致病的各种情况的支持证据,证据强度依次包括超强证据(PVS1)、强证据(PS1-4,注意这里的数字不代表证据强度的区别,仅暗示同一证据强度的分歧的证据情况,下同)、中度证据(PM1-6)、支持性证据(PP1-5),良性多态性/可能良性证据强度依次包括自力证据(BA1)、强证据(BS1-4)、支持性证据(BP1-6).需要特别指出的是对致病性突变和引起卵白功能缺失的突变区别开来,只有一种突变对某种疾病具有因果关系(causative),才华够被认定为致病性突变.应当注意到致病性突变这个界说对多基因遗传病其实不太适合.同时应该注意到当一个突变被报道为致病性的时候,对个人或者健康管理人员可能认为它是一个可干预的突变(actionable).另外,该规范还对数据库使用、文献使用、软件预测使用给出了指导性的建议.

最后也是最重要的是陈说的出现形式,标注突变判定依据,功能注释,文献出处,遗传规律,及其他可能的相关疾病症状.在研究进展更新后,特别是以前被认定为意义不明突变时,最好能够对突变数据进行再分析更新.将突变进行分类也是有帮手的,比如该突变意义不明,但该突变所在的基因与已知疾病建立了明确的关系;

比如突变属于偶然性发现(IncidentalFindings).

3、面向临床干预的解读

首先应充沛收集患者个体表型数据、家族病史、临床病理和临床治疗的资料,这些信息对鉴定驱动基因、了解发病机制、指导用药和治疗方案、耐药与预后分析具有很年夜的价值.

其次在进行临床干预解读时应考虑到FDA批准靶向治疗药物及其陪伴检测、NCCN指南推荐的治疗方案.对FDA和NCCN指南未涉及的,可参考文献(包括基于FDA/NCCN和文献编纂的二级数据库),可是要考虑到文献报道的证据强度,比如是什么机构的研究,发表在什么期刊上;

要考虑到文献的证据级别比如是临床试验、还是案例报道、还是临床前的研究.具体可参考AMP关于体细胞突变和遗传性突变的证据强度划分的指导意见.

最后还应考虑和制药公司/医疗机构/研究机构的临床试验尽可能对接.

凝结数据分析和临床注释于一张纸的陈说可以说其实不容易,而且它决定了终端客户的最终体验.临床解读陈说应当作到简洁明了、重点突变的原则,体现严谨而缜密的逻辑机构,到达便于阅读、理解和指导临床干预的目的.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1