高通量测序技术.pptx

上传人:wj 文档编号:119558 上传时间:2022-10-03 格式:PPTX 页数:62 大小:61.91MB
下载 相关 举报
高通量测序技术.pptx_第1页
第1页 / 共62页
高通量测序技术.pptx_第2页
第2页 / 共62页
高通量测序技术.pptx_第3页
第3页 / 共62页
高通量测序技术.pptx_第4页
第4页 / 共62页
高通量测序技术.pptx_第5页
第5页 / 共62页
点击查看更多>>
下载资源
资源描述

高通量测序技术.pptx

《高通量测序技术.pptx》由会员分享,可在线阅读,更多相关《高通量测序技术.pptx(62页珍藏版)》请在冰豆网上搜索。

高通量测序技术.pptx

高通量测序技术,内容提要,Sequencing,Ingeneticsandbiochemistry,sequencingmeanstodeterminetheprimarystructureofanunbranchedbiopolymer.,(Carlson2010),GenomeandSequencing,基因组(Genome)包含了一个物种的全部遗传信息,这些信息决定了它们的生物学特征。

基因组既可以指一套染色体,也可以指其中的全部核酸。

绝大多数基因组都是由脱氧核糖核酸(DNA)组成,但是也有一些病毒基因组是由核糖核酸(RNA)组成。

DNA测序(DNAsequencing,或译DNA定序)是指分析特定DNA片段的碱基序列,也就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤的(G)排列方式。

(Ridley,2006),WhySequencing?

对于每个物种来说,基因组包含了整个物种的遗传信息。

测序技术能够真实地反映基因组DNA上的遗传信息,进而全面地揭示基因组的复杂性和多样性。

从根源上寻找导致蛋白功能差别的位点为物种鉴定、临床诊断和司法鉴定提供基础疾病预测研究基因间的相互作用揭示物种进化的历程生命之树,ThreebasicproblemsofSequencing,如何读到DNA片段的碱基信号?

如何读到DNA片段的连续碱基信号?

如何读到一批DNA片段的连续碱基信号?

通过扩增来增加DNA的数量从而放大信号有足够多的DNA合成反应中止于同一个碱基,让合成反应的中止依次出现在每个碱基上,在不同模板的反应间建立有效的隔离方式,测序技术的发展历程,(Biomarker2013),测序技术的发展历程,(Guohui2013),测序技术原理及过程,Sanger/454/SOLID/Illumina/PacBio,第一代测序技术,最早的测序技术源于RobertHolley研究小组1965年对酵母苯丙氨酰-tRNA的77个核苷酸全序列的测定,Holley本人也因此而获得了1968年的诺贝尔生理医学奖。

20世纪70年代后期,第一代快速有效的DNA测序技术体系终于建立,其中最为著名的是Sanger的“双脱氧末端终止法”。

RobertW.Holley,FrederickSanger,ABI3730,(Qiu2006),sanger法测序反应原理,原料:

DNA聚合酶DNA模板单链寡核苷酸引物dNTPddNTPwithfluorochromes,sanger法测序反应原理,(Biomarker2013),sanger法测序优缺点,96孔板或384孔板的一个孔,第二代测序技术,焦磷酸测序法Pyrosequencing,边合成边测序SequencingBySynthesis,SBS,边连接边测序SequencingByLigation,SBL,400bp,2*150bp,2*75bp,400-600Mb/10h,1.5T/run(3.5d),300Gb/run(7d),基于焦磷酸测序法的454测序,T、A、C、G依次循环进入PTP板,如果发生碱基配对,就会释放一个焦磷酸。

这个焦磷酸在ATP硫酸化酶和萤光素酶的作用下将萤光素氧化成氧化萤光素,同时释放出光信号。

基于焦磷酸测序法的454测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于Solexa的IlluminaHiseq测序,Solexa是一种基于边合成边测序技术(Sequencing-By-Synthesis,SBS)的新型测序方法。

通过利用单分子阵列实现在小型芯片(FlowCell)上进行PCR反应。

3羟基经过特殊化学基团的保护,在聚合酶延伸反应能起类似于ddNTP的作用,使每次测序反应只有单个碱基被延伸,且其信号可以通过类似传统Sanger法中荧光检测方法检测,每次反应完成后,用特异的酶将修饰基团去除,便可以进行下一个碱基的测序,基于Solexa的IlluminaHiseq测序,Parallelsampleprocessing,Automatedclustergeneration,Automatedsequencing,SIMPLIFIEDSAMPLEPREP,cBotCLUSTERGENERATION,HiSeq2000/2500SEQUENCING,基于Solexa的IlluminaHiseq测序,基于Solexa的IlluminaHiseq测序,基于Solexa的IlluminaHiseq测序,基于Solexa的IlluminaHiseq测序,DNA(0.1-1.0ug),Singlemoleculearray,Samplepreparation,Clustergrowth,Sequencing,基于Solexa的IlluminaHiseq测序,基于Solexa的IlluminaHiseq测序,Single-ReadSequencing(SR,单向测序),Paired-EndSequencing(PE,双向测序),只检测基因片段一端的序列信息。

检测基因片段的两端序列信息。

基于Solexa的IlluminaHiseq测序,ClusterAmplification扩增后的簇,Single-Read,P7Linearization(fpg)线性化,OH,Paired-EndRead,基于Solexa的IlluminaHiseq测序,Barcode/Index,基于Solexa的IlluminaHiseq测序,1,2,Imageacquisition,第三代测序技术简介PacBio单分子测序技术,第三代测序技术简介PacBio单分子测序技术,Reads&Contigs,Contig,Contigs,N,N/2,ContigN50,PacBio可以解决NGS哪些困扰?

PacBio可以解决NGS哪些困扰?

此外,由于无需PCR,不会产生由于PCR过程中碱基错配导致的系统误差。

疟原虫,均一覆盖,偏好覆盖,SequenceBiasRelatedHolesin2ndGenData,PacBio可以解决NGS哪些困扰?

AccuracyIncreaseWithSequencingCoverage,.,PacBio可以解决NGS哪些困扰?

PacBio第三代测序技术原理,介孔分子筛,特制的DNA聚合酶,-反应速度快在体外工作时3bp/s-准确率高,是PCR用聚合酶的1000倍-链置换特性(即可以循环进行复制反应)-每一个SMARTcell中有15万个ZMW孔,PacBio第三代测序技术原理,介孔分子筛,特制的DNA聚合酶,-NGS将荧光标记在核酸骨架上,需要检测一个切除一个-BioPac将荧光标记在焦磷酸链上,随着DNA合成反应的进行,被随时释放,无需额外切割,PacBio第三代测序技术原理,将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部,进行合成反应。

孔底垂直发射激光激光激发4种荧光标记的dNTP不会激发游离的dNTP,二代测序数据的基本处理,数据样式,质量值,比对的过程,原理和常用软件,Fastq格式,FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。

其序列以及质量信息都是使用一个ASCII字符标示,目前已经成为高通量测序结果的事实标准。

序列标识以及相关的描述信息,以开头;第二行是序列第三行以+开头,后面是序列标示符、描述信息,或者什么也不加第四行,是质量信息,和第二行的序列相对应,每一个碱基都有一个质量评分,根据评分体系的不同,每个字符的含义表示的数字也不相同。

Fastq格式,EAS139:

136:

FC706VJ:

2:

2104:

15343:

1973931:

Y:

18:

ATCACG,质量值,PhredqualityscoresQaredefinedasapropertywhichislogarithmicallyrelatedtothebase-callingerrorprobabilitiesP.,FastA格式,文件后缀名:

*.fasta*.fa,Fasta格式首先以大于号“”开头,接着是序列的标识符数据库中的序列标识符必须保证唯一,换行后是序列信息,序列中允许空格,换行,空行,直到下一个大于号,表示该序列的结束,Rawreads过滤,Usingacustomperlscript,wefilteredoutthereadswithmorethan10%unidentifiednucleotidesormorethan65%baseswithQ7.,(Wangetal.2010),Q20与Q30表示质量值(Q)大于等于20或30的碱基所占百分比,WeappliedthermdupcommandofSAMTOOLStoremovethePCRduplicationsgeneratedintheprocessofsequencing.,重测序数据的基本处理比对,bwamem-t32Btau_4.2.faWYX02.filter.1.filter.fq.gzWYX02.filter.2.filter.fq.gz|perl00.01.filter.duplicate.v2.pepiline.pl|samtoolsview-bS-oWYX02.filter.bam-1WYX02.filter.bam.log12WYX02.filter.bam.log2,HighqualityreadswerealignedtothereferencegenomeusingBWA-MEMwithdefaultparameters.,(Qiuetal.2015),WhatsAlignment,Inbioinformatics,asequencealignmentisawayofarrangingthesequencesofDNA,RNA,orproteintoidentifyregionsofsimilaritythatmaybeaconsequenceoffunctional,structural,orevolutionaryrelationshipsbetweenthesequences.,(MountDM.2004),ThemechanismofAlignment,Smith-Waterman算法,建立打分矩阵,递归确定得分规则,ThemechanismofAlignment,动态规划确定得分最大路径(即最佳匹配模式),ThemechanismofAlignment,全局比对是全部待研究的全部序列的全部符号参加比较,最后也是全部序列的全部符号进行排列与计分,比对的结果中各序列长度相同。

ThemechanismofAlignment,局部比对是全部序列的全部符号参加比较,最后只将各序列中得分高的片断中的符号进行排列与计分,即只排列局部的序列片断。

上述的例子中将序列,ThemechanismofAlignment,Findthesequencedreadsplacementinreferencegenome,重测序数据的基本处理比对,bwamem-t32Btau_4.2.faWYX02.filter.1.filter.fq

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1