外显子组测序信息分析_精品文档.pptx

上传人:b****2 文档编号:2563753 上传时间:2022-11-01 格式:PPTX 页数:32 大小:2.03MB
下载 相关 举报
外显子组测序信息分析_精品文档.pptx_第1页
第1页 / 共32页
外显子组测序信息分析_精品文档.pptx_第2页
第2页 / 共32页
外显子组测序信息分析_精品文档.pptx_第3页
第3页 / 共32页
外显子组测序信息分析_精品文档.pptx_第4页
第4页 / 共32页
外显子组测序信息分析_精品文档.pptx_第5页
第5页 / 共32页
点击查看更多>>
下载资源
资源描述

外显子组测序信息分析_精品文档.pptx

《外显子组测序信息分析_精品文档.pptx》由会员分享,可在线阅读,更多相关《外显子组测序信息分析_精品文档.pptx(32页珍藏版)》请在冰豆网上搜索。

外显子组测序信息分析_精品文档.pptx

外显子组测序在医学研究中的应用一一外显子组测序技术简介外显子组测序技术简介二二外显子组测序流程外显子组测序流程三三外显子组测序信息分析内容外显子组测序信息分析内容四外显子组测序的应用方案外显子组测序的应用方案一、外显子组测序技术简介一、外显子组测序技术简介外显子组序列仅占全基因组序列的1%左右,与人类85%致病基因突变相关。

与全基因组测序相比,外显子组测序不仅费用较低,而且测序覆盖度更深,数据准确性更高。

外显子测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后,再进行高通量测序的基因组分析方法。

二、外显子组测序流程二、外显子组测序流程基因组DNA的随机打断DNA片段的末端修复和接头的连接PCR扩增文库DNA液相探针杂交捕获目的片段PCR扩增捕获的DNA片段测序文库的检测HiSeq2500测序生物信息分析三、外显子组测序信息分析流程三、外显子组测序信息分析流程主要信息分析内容归类主要信息分析内容归类3.1、数据过滤与评估、数据过滤与评估3.2、整体质量评估、整体质量评估3.3、SNP检测与注释检测与注释3.4、InDel检测与注释检测与注释3.5、高级分析、高级分析3.1、数据过滤与评估、数据过滤与评估1.过滤接头。

对含接头的reads去除接头序列。

2.一条reads上N(未能确定出具体的碱基类型)的比例大于5%,则过滤掉该reads。

3.过滤低质量reads,过滤掉Q3085%reads。

3.1.1、原始数据过滤、原始数据过滤3.1.2、测序数据测序数据统计与评估统计与评估测序质量值分布图碱基含量分布图3.2、整体测序质量评估、整体测序质量评估3.2.1、测测序深度序深度统计统计注:

横坐标代表测序深度,纵坐标代表目标区域上对应深度的碱基数占总碱基数的百分比。

目标区域的单碱基分布近似服从泊松分布。

3.2.2、外显子、外显子捕捕获统计获统计TargetregionstatX1X2X3X4Length_of_target_region(Mb)1118.70118.70118.70118.70Reads_mapping_ref(singlereads)2182.95168.4897.7696.16Mapping_datasize(Mb)3137211263697769616Effective_sequences_on_target(Mb)592.0590.8666.8464.37Average_sequencing_depth_on_target747.3146.7543.0541.45Mismatch_rate_in_target_region8Mismatch_rate_in_all_effective_sequence9Base_covered_on_target(Mb)106904681566846437Coverage_of_target_region11Fraction_of_target_covered_with_at_least_20x12Fraction_of_target_covered_with_at_least_10x13Fraction_of_target_covered_with_at_least_4x14当比对到参考基因组目标区域的数据量在60%之上,认为外显子捕获效率合格。

3.2.3、染色体覆盖深度分布、染色体覆盖深度分布注:

横坐标为染色体长度,纵坐标为覆盖深度取对数。

3.3、SNP检测及注释检测及注释3.3.1、SNP检测检测SNP的检测主要使用GATK软件工具包实现。

BMKIDSNPNumberTransitionNumberTransversionNumberTi/TvRatioHeterozygosityNumberHomozygosityNumberX19852546691723160822.11207400777854X28425165733992691172.13167179675337X3263326178220851062.0926436236890X4289954196145938092.0930446259508Total1556901TypeR01R02R03R04INTERGENIC449352380794113110125682INTRAGENIC34252896892975INTRON401739343966111218121865UPSTREAM244522135061056521DOWNSTREAM95551835652773230377UTR_3_PRIME395407112124UTR_5_PRIME21651891776850SPLICE_SITE_ACCEPTOR31361414SPLICE_SITE_DONOR61541921CDSNON_SYNONYMOUS_CODING19711899882925NON_SYNONYMOUS_START2100START_GAINED37834693100START_LOST8632STOP_GAINED2624108STOP_LOST5310SYNONYMOUS_CODING17721732923940SYNONYMOUS_STOP1100Other1068932183.3.2、SNP注释注释3.3.3、突突变变特征特征突变频谱图注:

横坐标为不同类型的突变,纵坐标为不同类型突变对应的频率。

3.3.3、突突变变特征特征突变位点上下文碱基偏好性注:

横坐标为突变位点上下文的碱基位置,0为SNP突变位点,负数代表突变位点前的碱基,正数代表突变位点后的碱基,纵坐标为不同碱基对应的比例。

从图上可以看出,不同类型的SNP突变上下文具有不同的碱基偏好性。

3.4、InDel检测检测及注释及注释3.4.1、InDel检测检测RegionR01R02R03R04TotalInsertion5168944234152331657392775Deletion57643510611670517840107838Heterozygosity89744788482858630639-Homozygosity195881644733523774-Total109332952953193834413200613TypeR01R02R03R04INTERGENIC48070416011357914755INTRAGENIC410337123117INTRON45413396821370114581UPSTREAM30602706759851DOWNSTREAM116331026535533851UTR_3_PRIME333174UTR_5_PRIME26524687106SPLICE_SITE_ACCEPTOR152364SPLICE_SITE_DONOR6833CDSCODON_DELETION151635CODON_INSERTION12502EXON_DELETED2672427393FRAME_SHIFT94922730CODON_DELETION151635CODON_INSERTION12502Other19241263.4.1、InDel注释注释3.5、高级分析高级分析3.5.1、基因融合、基因融合注:

最外圈表示人基因组及基因组上基因分布情况;文字代表发生基因融合的基因ID;红色线条代表染色体间基因融合;绿色线条代表染色体内基因融合。

3.5.2、氨基酸替换预测、氨基酸替换预测ChrIDPosCodonsSubstitutionSNPTypePredictionGenechr1881627CTG-tTGL615LSynonymousTOLERATEDENSG00000188976chr111884555GAG-GgGE198GNonsynonymousTOLERATEDENSG00000011021chr112776344ATG-tTGM1LNonsynonymousTOLERATEDENSG00000188984chr112919111GAA-aAAE83KNonsynonymousDAMAGINGENSG00000120952chr116356501GCC-aCCA447TNonsynonymousTOLERATEDENSG00000186510注:

Codons:

密码子的变化情况;Substitution:

氨基酸的替换信息;SNPType:

SNP的类型;Prediction:

预测结果(damaging/tolerated),TOLERATED表示这个突变是可以容忍的,即对蛋白质功能没有影响或影响很小,DAMAGING表示突变是有害的,即对蛋白质功能有较大影响;Gene:

发生替换所在的基因。

3.5.3、样品间差异表达基因、样品间差异表达基因COG分类统计分类统计COG数据库是基于细菌、藻类、真核生物的系统进化关系构建得到的,利用COG数据库可以对基因产物进行直系同源分类。

注:

横坐标为COG各分类内容,纵坐标为基因数目。

在不同的功能类中,基因所占比例多少反映对应时期和环境下代谢或者生理偏向等内容,可以结合研究对象在各个功能类的分布作出科学的解释。

差异基因GO注释聚类图topGO有向无环图3.5.4、样品间差异表达基因、样品间差异表达基因GO分类分类统计统计差异基因KEGG通路示意图3.5.5、样品间差异表达基因、样品间差异表达基因KEGG注释注释四、外显子组测序的应用思路四、外显子组测序的应用思路4.1WES找寻孟德尔疾病致病基因思路找寻孟德尔疾病致病基因思路全外全外显子子测序序Whole-exomesequencing分析及分析及预测候候选基因突基因突变致病性致病性Analysisandpredictcandidatecausativevariats生物学功能研究生物学功能研究Functionalresearch在多个家系或散在多个家系或散发病例中病例中进行突行突变筛查研究研究Mutationscreening遴遴选和采集和采集病例和家系病例和家系Samplescollection4.2WES肿瘤研究上的思路肿瘤研究上的思路样本选取全基因组测序及分析WES样本选取外显子组测序及分析基因突变功能验证样本选取外显子组测序及分析转录组测序基因突变功能验证4.3WES在复杂疾病上的研究的思路在复杂疾病上的研究的思路样本选取(遗传性较高)外显子组测序找到与疾病高度关联的低频突变在大样本里进行大规模验证Biomarker,生物技术服务专家

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 笔试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1