基因测序与精准医疗行业深度分析报告doc.docx
《基因测序与精准医疗行业深度分析报告doc.docx》由会员分享,可在线阅读,更多相关《基因测序与精准医疗行业深度分析报告doc.docx(69页珍藏版)》请在冰豆网上搜索。
基因测序与精准医疗行业深度分析报告doc
2016年基因测序与精准医疗行业深度分析报告
正文目录
1.基因测序,解读生命密码7
1.1.精准医疗概念解析7
1.2.精准医疗是未来医疗的发展趋势7
1.3.基因测序是精准医疗的推行前提8
1.4.基因测序技术发展与技术原理简介11
1.4.1.第一代测序技术(Sanger测序法)11
1.4.2.第二代测序技术12
1.4.3.第三代测序技术16
1.4.4.不同测序仪比较分析18
2.多因素催化精准医疗迅猛发展20
2.1.传统“一刀切”模式不适用于复杂疾病,发展精准医疗刻不容缓20
2.2.我国肿瘤早期筛查市场巨大20
2.3.测序技术进步带动成本大幅降低,利好基因检测服务端22
2.4.医保控费提升精准医疗需求22
2.5.分级诊疗利好第三方医学检验实验室22
2.6.临床监管规范化,政策开放利好基因检测24
3.基因检测产业链分析26
3.1.上游:
国外寡头垄断测序仪市场,国内公司多方式突围27
3.1.1.测序仪制造壁垒高,Illumina处于绝对垄断地位27
3.1.2.自主研发,合作开发和收购国外企业是国内测序仪制造的主要突破方式28
3.1.3.新技术不断涌现助推基因检测成本降低28
3.2.中游:
技术壁垒低,国内测序服务竞争激烈28
3.2.1.基因检测公司数量多,并购火热,竞争激烈29
3.2.2.测序服务产品渠道和销售策略分析30
3.2.3.测序服务商业模式分析30
3.3.下游:
大数据分析成为基因检测的瓶颈31
3.3.1.基因数据解读能力的落后直接阻碍基因测序在临床的应用32
3.3.2.数据分析难度大,数据分析外包将是大趋势32
3.3.3.生物信息学市场以超过20%的复合增长率迅猛增长33
3.4.终端客户:
现阶段科研机构为主,未来临床医疗值得期待34
3.4.1.终端市场基础科研为主,生育健康最成熟,肿瘤相关增长最快34
3.4.2.肿瘤诊断治疗市场潜力最大35
4.基因检测监管制度与服务审批政策分析36
4.1.参与基因检测监管的机构与职责36
4.1.1.发改委从宏观上制定基因检测产业的发展规划36
4.1.2.卫计委对基因检测机构的资质进行审查和规范37
4.1.3.CFDA对基因检测的仪器、试剂、分析软件进行监管37
4.2.基因检测项目的“双通道”制38
4.3.监管环境:
宽松放任→全面叫停→试点放行→鼓励发展39
5.基因检测在肿瘤早期筛查上的应用实例40
5.1.ctDNA是实现无创肿瘤早期筛查的基础40
5.2.宫颈癌预防双重保障:
HPV基因检测+细胞学检测41
5.2.1.我国宫颈癌发病率高,增长快,呈年轻化趋势41
5.2.2.HPV是宫颈癌的主要致病因素42
5.2.3.HPV基因检测联合细胞学方法:
宫颈癌筛查和临床诊治的新动力44
5.3.SEPTIN9甲基化检测–尖端结直肠癌筛查技术45
6.肿瘤基因检测与精准用药实例分析46
6.1.非小细胞肺癌中突变基因检测的临床应用47
6.1.1.肺腺癌中EGFR阳性病人的治疗策略48
6.1.2.肺腺癌中EGFR阴性性病人的治疗策略49
6.1.3.基因测序对非小细胞肺癌进行个性化治疗的流程50
6.1.4.国内非小细胞肺癌检测情况50
6.2.肠癌中突变基因检测的临床应用52
6.2.1.肠癌中K-ras突变的治疗策略52
6.2.2.肠癌中BRAF突变的治疗策略53
6.2.3.肠癌中PIK3CA突变的治疗策略53
6.3.21基因检测对乳腺癌预测和预后,避免低复发风险者过度治疗54
6.3.1.乳腺癌治疗现状分析54
6.3.2.21基因检测法帮助患者评估复发风险,避免过度治疗54
7.国内基因检测公司投资策略56
7.1.国内基因检测公司分析56
7.2.上游测序仪与试剂国产化,有效降低企业成本57
7.3.中游测序服务产品同质化严重,终端渠道为王57
7.4.下游大数据分析能力和大样本库是关键58
图表目录
图1:
基于大数据的精准医疗是未来的发展趋势7
图2:
基于大数据的精准医疗是未来的发展趋势8
图3:
基因结构示意图9
图4:
测序技术的发展11
图5:
Sanger测序法原理11
图6:
第二代测序核心技术原理简介12
图7:
454测序仪技术应用13
图8:
Illumina测序原理14
图9:
HeliScope测序仪技术15
图10:
PacBioSMRT测序原理16
图11:
纳米孔测序原理示意图17
图12:
IonTorrent测序原理18
图13:
2014年主要疾病死亡率20
图14:
传统医疗在复杂疾病治疗上的用药有效率20
图15:
中美两国癌症发病率和死亡率比较21
图16:
中美两国癌症5年存活率情况21
图17:
美国前列腺癌早期筛查促进死亡率降低21
图18:
基因组测序成本(美元)22
图19:
分级诊疗制度下的就医体系23
图20:
分级诊疗转诊流程示意图23
图21:
分级诊疗转诊流程23
图22:
基因测序市场产业链26
图23:
BBCResearch预测的全球基因测序市场规模27
图24:
Illumina预估的测序服务市场容量27
图25:
国产测序仪的开发方式28
图26:
测序服务商业模式30
图27:
基因与环境共同导致疾病32
图28:
基因数据到医学知识的落后32
图29:
基因检测各环节难度占比33
图30:
基因检测数据分析方法占比33
图31:
2012-2018年生物信息学市场预测33
图32:
基因检测的主要应用领域34
图33:
华大基因各项业务营业收入(亿)34
图34:
华大基因各项业务营业收入占比35
图35:
Illumina预估的测序服务市场容量35
图36:
未来肿瘤检测渗透率35
图37:
中国参与基因检测监管的主要机构与职责36
图38:
美国参与监管的主要机构38
图39:
美国基因检测项目进入临床的途径39
图40:
中国基因检测项目进入临床的途径39
图41:
ctDNA从肿瘤部位浸润到血管的示意图40
图42:
2008年世界不同地区宫颈癌发病率41
图43:
1998-2008年我国宫颈癌发病率41
图44:
高危型HPV的持续感染导致宫颈癌发生的示意图42
图45:
HPV简介42
表46:
HPV亚型42
图47:
HPV基因检测比传统的宫颈癌筛查方法更早发现宫颈癌前病变43
图48:
应用HPV基因分型来筛查宫颈癌的治疗方法44
图49:
Septin9基因甲基化检测试剂盒45
图50:
Septin9基因甲基化检测流程45
图51:
个性化治疗理念与流程46
图52:
肺癌的传统分类47
图53:
肺腺癌的分子亚型47
图54:
根据肿瘤突变状态的疗效分析(EGFR突变阳性)47
图55:
根据突变状态的疗效分析(EGFR突变阴性)47
图56:
根据肿瘤突变状态的疗效分析(EGFR突变阳性)48
图57:
EGFR突变位点与药物敏感性的关系48
图58:
利用基因测序对非小细胞肺癌进行个性化治疗的流程48
图59:
肺腺癌中EML4-ALK融合基因临床应用49
图60:
肺腺癌中EML4-ALK融合基因检测的意义49
图61:
肺腺癌的个性化治疗流程50
图62:
院内EGFR基因突变检测中心50
图63:
EGFR检测情况50
图64:
医院整体送检率分析51
图65:
整体阳性检率分析51
图66:
肠癌中K-ras突变阳性的疗效分析52
图67:
肠癌中K-ras突变阴性的疗效分析52
图68:
肠癌中BRAF突变阳性的疗效分析53
图69:
肠癌中BRAF突变阴性的疗效分析53
图70:
结直肠癌中PIK3CA突变阳性的疗效分析53
图71:
肠癌中BRAF突变阴性的疗效分析53
图72:
肠癌的个性化治疗流程54
图73:
乳腺癌治疗现状分析54
图74:
21基因法预测乳腺癌十年复概率的基因类型54
图75:
RS≥31的乳腺癌患者化疗受益大55
图76:
RS<18的乳腺癌患者化疗受益小55
表1:
常用短语解释9
表2:
基因检测主流方法比较10
表3:
新一代测序技术的特点12
表4:
新一代测序仪比较16
表5:
主流测序仪比较18
表6:
四种癌症早期诊断和晚期诊断的生存率比较21
表7:
基因检测政策法规24
表8:
未来肿瘤检测渗透率27
表9:
2015年国内基因检测产业收购表29
表10:
测序服务销售方式比较30
表11:
测序服务销售方式比较31
表12:
三类医疗器械审批比较37
表13:
非小细胞肺癌治疗时的用药选择50
表14:
非小细胞肺癌治疗时的用药选择53
表15:
国内基因检测公司比较56
1.基因测序,解读生命密码
1.1.精准医疗概念解析
随着人类基因组测序技术的飞速提升、生物医学分析技术的快速发展和大数据分析工具的日益完善,我们正进入全新的医疗健康时代——精准医疗。
不同国家对“精准医疗”的定义不同,解读方式也不同。
英国政府官网对精准医疗的定义是:
精准医疗利用诊断测试和临床数据分析为患者选择最合适的治疗手段。
而美国对精准医疗的定义为是一种新兴的综合考虑到居民基因,环境,生活方式等变量的疾病预防和治疗手段。
中国政府对于精准医疗的定义为:
以患者的最大获益和社会医疗投入的高效配臵为宗旨,结合现代流行病学和预防医学、临床诊断学和治疗学、分子医学、医学信息学技术以及卫生经济学和医学社会学,使传统的医疗模式走向现代化,为每一个人提供量体裁衣般的疾病预防、筛查、诊断、治疗和康复计划,以最小资源投入获取最大健康保障,从而提高整体人群的健康水平。
比较英美中三国对精准医疗的定义,可以发现精准医疗在不同国家包含的内容并不完全相同,比如美国版本的精准医疗更加强调对居民综合数据信息的搜集和分析,而英国版本则侧重对临床数据的收集,中国则更强调利益最大化。
虽然国际上对精准医疗有不同的解释,但是共享一些特性:
首先,精准医疗是基于大数据的诊疗方式。
从医疗方式来看,精准医疗的治疗方案基于对居民患者数据信息。
其次,精准医疗具有更广阔的应用范围。
从医疗范围来看,包括疾病的早期诊断,个性化指导,遗传性风险分析和疾病的检测。
从医疗目标来看,精准医疗现阶段目标均聚焦于癌症治疗,未来将扩展到其他疾病的各个领域。
从医疗机制来看,精准医疗强调对个体疾病分子层面的分析判断。
最后,精准医疗强调个性化与差异化。
从医疗模式来看,精准医疗改变了以往简单式的医患互动关系,强调针对病患全面全程的观察诊断,并提出差异性,个性化的医疗方案。
1.2.精准医疗是未来医疗的发展趋势
传统医疗以病人的临床症状和体征,结合性别、年龄、身高、体重、既往病史、家族疾病史、实验室和影像学评估等数据确定治疗药物和使用剂量、剂型。
这通常是一种已经出现症状和体征后才开始治疗或用药的被动处理方式。
而精准医疗则可以通过更精确的诊断,预测潜在疾病的风险,提供更有效、更有针对性的治疗,预防或干预某种疾病的发生。
和传统医疗相比,精准医疗以患者个人基因组信息为基础决定治疗方针,针对基因给药的治疗方式,能够更精确更高效的治疗疾病。
图1:
基于大数据的精准医疗是未来的发展趋势
图2:
基于大数据的精准医疗是未来的发展趋势
1.3.基因测序是精准医疗的推行前提
每一条DNA分子由两条互补的的脱氧核糖核甘酸链组成,核甘酸所包含的碱基可分成四种:
腺嘌呤adenine(A)、胸腺嘧啶thymine(T)、胞嘧啶cytosine(C)、鸟嘌呤guanine(G)。
基因是指携带有遗传信息的DNA序列,是控制性状的基本遗传单位。
基因通过指导蛋白质的合成来表现所携带的遗传信息,从而控制生物个体的性状表现。
大量基因与组蛋白结合,形成核小体结构。
核小体是染色体结构的最基本单位,大量核小体相互聚集,形成具有复杂结构的染色体。
人类基因组中含有23对染色体。
基因组的个体化差异是精准医疗的基础。
基因测序,事实上就是测定人类基因组上A、T、C、G这四种碱基顺序及其对应的化学修饰。
基因检测是从染色体结构,DNA序列,DNA变异位点或基因表现程度,为医疗研究人员提供评估与基因遗传有关的疾病、体质或个人特质的依据。
目前基因检测常见手段包括荧光定量聚合酶链式反应(RT-PCR)、扩增阻滞突变系统(ARMS-PCR)、荧光原位杂交技术(FISH)、Sanger测序和基因测序技术等,其中基因测序,尤其是二代测序,是现阶段的主流技术。
从人类发现DNA的双螺旋结构,到“人类基因组计划”宣布完成,再到高通量测序技术的出现,正逐渐开启“个人基因组”的时代。
癌症是基因组疾病,每个肿瘤都有独特的基因图谱。
精准医疗就是通过检测癌症患者的基因信息,利用DNA测序技术确认导致患者患病的基因或者受检者是否携带有肿瘤易感基因,来诊断或治疗患者的疾病。
针对每位患者的基因图谱,了解癌细胞内的遗传改变,从而选择更有效的治疗癌症的方式。
肿瘤领域的基因测序是精准医疗最重要的组成部分,其应用将覆盖肿瘤的易感基因检测、早期筛查、疾病确诊、个性化用药指导、随诊与疗效评价等众多治疗环节。
图3:
基因结构示意图
表1:
常用短语解释
表2:
基因检测主流方法比较
1.4.基因测序技术发展与技术原理简介
图4:
测序技术的发展
从1977年第一代DNA测序技术(Sanger法),发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。
虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位臵,但第三和第四代测序技术也已在这一两年的时间中快速发展着。
测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。
1.4.1.第一代测序技术(Sanger测序法)
图5:
Sanger测序法原理
第一代DNA测序技术用的是1975年由Sanger和Coulson开创的链终止法或者是1976-1977年由Maxam和Gilbert发明的化学法。
在1977年,Sanger测定了第一个基因组序列,是噬菌体X174的,全长5375个碱基。
这是人类步入基因组学时代的开端。
后人在Sanger法的多年实践之中不断对其进行改进。
在2001年,完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础,Sanger法核心原理是:
由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP,通过凝胶电泳和放射自显影后可以根据电泳带的位臵确定待测分子的DNA序列。
Sanger测序法一直都是测序的“金标准”,其准确率高,假阳性和假阴性少,而且不需要序列比对。
但是由于成本太高,不能进行商业化的大规模测序,为此,人们在Sanger测序法的基础上开发了下一代测序方法。
1.4.2.第二代测序技术
图6:
第二代测序核心技术原理简介
总的说来,第一代测序技术的主要特点是测序读长可达1000bp,准确性高达99.999%,但其测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。
因而第一代测序技术并不是最理想的测序方法。
经过不断的技术开发和改进,以Roche公司的454技术、illumina公司的Solexa,Hiseq技术和ABI公司的Solid技术为标志的第二代测序技术诞生了。
第二代测序技术大大降低了测序成本的同时,还大幅提高了测序速度,并且保持了高准确性,以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周,但在序列读长方面比起第一代测序技术则要短很多。
表3:
新一代测序技术的特点
虽然这些新一代测序仪以及芯片的实际制作过程似乎都和传统的测序方法有很大的不同,而且各有特点,但实际上它们背后的原理和技术都是非常相似的。
所有二代测序仪都使用了“循环芯片测序法”,也可将其称为“新一代测序技术或者第二代测序技术”。
首先是将基因组DNA随机切割成小片段DNA分子,然后在体外给这些小片段分子的末端连接上接头制成文库。
随后可以通过原位杂交、微乳液PCR或桥式PCR等方法获得测序模板。
真正的测序反应本身和传统测序法一样,是由重复的聚合酶促反应和最后的荧光读取分析反应组成。
文中提到的所有测序仪都是使用合成测序法,即通过聚合酶或连接酶不断地延伸引物获得模板序列,最后对每一轮反应的结果进行荧光图像采集、分析,获得序列结果。
下面我们介绍几款目前主流的测序仪及其对应的测序原理。
图7:
454测序仪技术应用
Roche454454测序仪在一直困扰传统测序技术的文库制备、模板制备和测序这三个瓶颈问题上取得了突破。
Roche454的每张芯片上可以达到数百万个小孔,每一个小孔都是一个独立的“反应站”,互不干扰,测序反应发出的光被连接在芯片上的光纤传送到CCD记录下来(如上图所示)。
这种芯片就好像集成电路一样一次可以同时处理数百万个测序反应。
这种芯片同样也能被其它通过发光检测技术的产品所使用。
454测序仪将试剂和模板统统都吸附在一个个微珠上,然后把这些微珠一个个地放到芯片上的小孔中,每孔一个微珠。
这种固定步骤不仅保证了每孔测序反应的独立性,也极大地节省了试剂消耗费用。
图8:
Illumina测序原理
Illumina测序仪通常也被称作Solexa测序仪,适用于采用各种方法制备的DNA文库,文库中DNA片段可以长达数百bp,并可通过桥式PCR来扩增模板片段。
在桥式PCR反应中,正向引物和反向引物都被通过一个柔性接头固定在固相载体上。
经过PCR反应,所有的模板扩增产物就都被固定到了芯片上固定的位臵。
Illumina测序仪的特点:
对于检测同聚物来说,Illumina测序仪要比454测序仪好很多;
Illumina测序仪在检测碱基替换突变时最易出错,其次是检测插入或缺失突变时。
Illumina测序仪的平均出错率在1%~1.5%,通过质量优化有可能将错误率降低到低于0.1%;
Illumina测序仪在测序长度方面有所缺陷,这是因为它存在被掺入核苷酸上标记的荧光基团或者终止基团切除不完全等原因导致测序信号发生了衰减和相移;
图9:
HeliScope测序仪技术
HeliScope测序仪是一种循环芯片测序设备。
HeliScope测序仪最大的特点是无需对测序模板进行扩增,它使用了一种高灵敏度的荧光探测仪直接对单链DNA模板进行合成法测序。
首先,将基因组DNA切割成随机的小片段DNA分子,并且在每个片段末端加上poly-A尾。
然后通过poly-A尾和固定在芯片上的poly-T杂交,将待测模板固定到芯片上,制成测序芯片。
最后借助聚合酶将荧光标记的单核苷酸掺入到引物上(如上图)。
采集荧光信号,切除荧光标记基团,进行下一轮测序反应,如此反复,最终获得完整的序列信息。
经过数百轮这种单碱基延伸可以获得25bp或更长的测序长度。
HeliScope测序仪的特点如下:
目前使用HeliScope测序仪检测缺失突变的出错率高,一次检测误差率为2%~7%,两次检测误差率为0.2%~1%。
不过,检测碱基替换突变的误差率非常低,一次检测误差率为0.01%~1%,两次检测误差率为0.001%,这是目前所有测序仪当中最高的准确率。
它和454测序仪一样,测序是不同步的,即每条模板测序的程度不同,有快有慢,测序速度要依据每条模板本身的序列而定。
不过,由于使用的是单分子测序,因此也不存在相移问题,所以也不会因为相移问题出现错误;
在荧光标记的核苷酸上没有终止基团。
比如在454测序仪中,同聚物问题是一个非常重要的问题。
而在HeliScope测序仪中则可以很容易地通过控制每一轮测序反应中碱基加入反应的速度来解决这个问题。
无法正确分辨同聚物的长度;
可以通过“两步法”,即测序两次来提高测序的准确性。
这是由于在测序过程中新合成的链同样通过引物固定在芯片上,所以可以变性使新合成的链与模板链分离,重新以反方向再次测序;
表4:
新一代测序仪比较
除了前文提到的这些二代测序仪以外,还有ApplyBiosystems公司基于基于磁珠的大规模并行克隆连接DNA测序法的SOLiD测序仪(ABISOLiDsequencer),CompleteGenomics公司基于DNA纳米阵列与组合探针锚定连接测序法的测序平台等等。
测序仪的发展是基因检测的基础,相比于一代测序,二代测序通量高,但是成本大幅降低,促进了基因检测的发展。
但目前的价格依然难以在市场大规模推广,在二代测序的基础上,科学家们开发了第三代测序技术。
1.4.3.第三代测序技术
测序技术在近两三年中又有新的发展。
以PacBio公司的SMRT和OxfordNanoporeTechnologies纳米孔单分子测序技术为主,被称之为第三代测序技术。
与前两代相比,他们最大的特点就是单分子测序,测序过程无需进行PCR扩增。
图10:
PacBioSMRT测序原理
PacBioSMRT技术应用了边合成边测序的思想,以SMRT芯片为测序载体。
基本原理是:
DNA聚合酶和模板结合,4色荧光标记4种碱基(即是dNTP),在碱基配对阶段不同碱基的加入会发出不同光,根据光的波长与峰值可判断进入的碱基类型。
具有以下特点:
DNA聚合酶是实现超长读长;
可以通过检测相邻两个碱基之间的测序时间,来检测一些碱基修饰情况,如果碱基存在修饰,则通过聚合酶时的速度会减慢,相邻两峰之间的距离增大,可以通过这个来之间检测甲基化等信息;
测序速度很快,每秒约10个dNTP;
但是,同时其测序错误率比较高(这几乎是目前单分子测序技术的通病),达到15%,有望通过多次测序来进行有效的纠错。
图11:
纳米孔测序原理示意图
纳米单分子测序技术与以往的测序技术皆不同,它是基于电信号而不是光信号的测序技术。
该技术的关键之一是,他们设计了一种特殊的纳米孔,孔内共价结合有分子接头。
当DNA碱基通过纳米孔时,它们使电荷发生变化,从而短暂地影响流过纳米孔的电流强度,灵敏的电子设备检测到这些变化从而鉴定所通过的碱基(上图)。
纳米孔测序(和其他第三代测序技术)有望解决目前测序平台的不足,纳米孔测序有以下几个主要特点:
读长很长