第5章--大数据促进医疗和健康.pptx

资源描述

第5章--大数据促进医疗和健康.pptx

《第5章--大数据促进医疗和健康.pptx》由会员分享，可在线阅读，更多相关《第5章--大数据促进医疗和健康.pptx（86页珍藏版）》请在冰豆网上搜索。

第5章--大数据促进医疗和健康.pptx

第5章大数据促进医疗和健康,目录,大数据导论,2,123456,大数据与循证医学大数据带来的医疗新突破医疗信息数字化搜索：

超级大数据的最佳伙伴数据决策的成功崛起【延伸阅读】7【实验与思考】,【导读案例】大数据变革公共卫生,2009年出现了一种新的流感病毒甲型H1N1，这种流感结合了导致禽流感和猪流感的病毒的特点，在短短几周之内迅速传播开来（图5-1）。

全球的公共卫生机构都担心一场致命的流行病即将来袭。

有的评论家甚至警告说，可能会爆发大规模流感，类似于1918年在西班牙爆发的影响了5亿人口并夺走了数千万人性命的大规模流感。

更糟糕的是，我们还没有研发出对抗这种新型流感病毒的疫苗。

公共卫生专家能做的只是减慢它传播的速度。

但要做到这一点，他们必须先知道这种流感出现在哪里。

大数据导论,3,【导读案例】大数据变革公共卫生,图5-1甲型H1N1流感疫情全球流行示意图,大数据导论,4,【导读案例】大数据变革公共卫生,美国，和所有其他国家一样，都要求医生在发现新型流感病例时告知疾病控制与预防中心。

但由于人们可能患病多日实在受不了了才会去医院，同时这个信息传达回疾控中心也需要时间，因此，通告新流感病例时往往会有一两周的延迟，而且，疾控中心每周只进行一次数据汇总。

然而，对于一种飞速传播的疾病，信息滞后两周的后果将是致命的。

这种滞后导致公共卫生机构在疫情爆发的关键时期反而无所适从。

大数据导论,5,【导读案例】大数据变革公共卫生,在甲型H1N1流感爆发的几周前，互联网巨头谷歌公司的工程师们在自然杂志上发表了一篇引人注目的论文。

它令公共卫生官员们和计算机科学家们感到震惊。

文中解释了谷歌为什么能够预测冬季流感的传播：

不仅是全美范围的传播，而且可以具体到特定的地区和州。

谷歌通过观察人们在网上的搜索记录来完成这个预测，而这种方法以前一直是被忽略的。

谷歌保存了多年来所有的搜索记录，而且每天都会收到来自全球超过30亿条的搜索指令，如此庞大的数据资源足以支撑和帮助它完成这项工作。

大数据导论,6,【导读案例】大数据变革公共卫生,谷歌公司把5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行了比较。

他们希望通过分析人们的搜索记录来判断这些人是否患上了流感，其他公司也曾试图确定这些相关的词条，但是他们缺乏像谷歌公司一样庞大的数据资源、处理能力和统计技术。

大数据导论,7,【导读案例】大数据变革公共卫生,虽然谷歌公司的员工猜测，特定的检索词条是为了在网络上得到关于流感的信息，如“哪些是治疗咳嗽和发热的药物”，但是找出这些词条并不是重点，他们也不知道哪些词条更重要。

更关键的是，他们建立的系统并不依赖于这样的语义理解。

他们设立的这个系统唯一关注的就是特定检索词条的使用频率与流感在时间和空间上的传播之间的联系。

谷歌公司为了测试这些检索词条，总共处理了4.5亿个不同的数学模型。

在将得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后，谷歌公司发现，他们的软件发现了45条检索词条的组合，将它们用于一个特定的数学模型后，他们的预测与官方数据的相关性高达97。

和疾控中心一样，他们也能判断出流感是从哪里传播出来的，而且判断非常及时，不会像疾控中心一样要在流感爆发一两周之后才可以做到。

大数据导论,8,【导读案例】大数据变革公共卫生,所以，2009年甲型H1N1流感爆发的时候，与习惯性滞后的官方数据相比，谷歌成为了一个更有效、更及时的指示标。

公共卫生机构的官员获得了非常有价值的数据信息。

惊人的是，谷歌公司的方法甚至不需要分发口腔试纸和联系医生它是建立在大数据的基础之上的。

这是当今社会所独有的一种新型能力；以一种前所未有的方式，通过对海量数据进行分析，获得有巨大价值的产品和服务，或深刻的洞见。

基于这样的技术理念和数据储备，下一次流感来袭的时候，世界将会拥有一种更好的预测工具，以预防流感的传播。

大数据导论,9,大数据与循证医学,5.1,5.1大数据与循证医学,大数据导论,11,循证医学（Evidence-basedmedicine，EBM），意为“遵循证据的医学”，又称实证医学，其核心思想是医疗决策（即病人的处理，治疗指南和医疗政策的制定等）应在现有的最好的临床研究依据基础上作出，同时也重视结合个人的临床经验（图5-2）。

5.1大数据与循证医学,图5-2循证医学金字塔,大数据导论,12,5.1大数据与循证医学,大数据导论,13,第一位循证医学的创始人科克伦（1909-1988），是英国的内科医生和流行病学家，他1972年在牛津大学提出了循证医学思想。

第二位循证医学的创始人费恩斯坦（1925-），是美国耶鲁大学的内科学与流行病学教授，他是现代临床流行病学的开山鼻祖之一。

第三位循证医学的创始人萨科特（1934-）也是美国人，他曾经以肾脏病和高血压为研究课题，先在实验室中进行研究，后来又进行临床研究，最后转向临床流行病学的研究。

5.1大数据与循证医学,大数据导论,14,就实质而言，循证医学的方法与内容来源于临床流行病学。

费恩斯坦在美国的临床药理学与治疗学杂志上，以“临床生物统计学”为题，从1970年到1981年的11年间，共发表了57篇的连载论文，他的论文将数理统计学与逻辑学导入到临床流行病学，系统地构建了临床流行病学的体系，被认为富含极其敏锐的洞察能力，因此为医学界所推崇。

传统医学以个人经验、经验医学为主，即根据非实验性的临床经验、临床资料和对疾病基础知识的理解来诊治病人（图5-3）。

在传统医学下，医生根据自己的实践经验、高年资医师的指导，教科书和医学期刊上零散的研究报告为依据来处理病人。

其结果是：

一些真正有效的疗法因不为公众所了解而长期未被临床采用；一些实践无效甚至有害的疗法因从理论上推断可能有效而长期广泛使用。

5.1大数据与循证医学,图5-3传统医学是以经验医学为主,大数据导论,15,5.1大数据与循证医学,大数据导论,16,循证医学不同于传统医学。

循证医学并非要取代临床技能、临床经验、临床资料和医学专业知识，它只是强调任何医疗决策应建立在最佳科学研究证据基础上。

循证医学实践既重视个人临床经验又强调采用现有的、最好的研究证据，两者缺一不可（图5-4）。

5.1大数据与循证医学,图5-4循证医学重视个人临床经验，也强调研究证据,大数据导论,17,5.1大数据与循证医学,大数据导论,18,1992年，来自安大略麦克马斯特大学的两名内科医生戈登盖伊特和大卫萨基特发表了呼吁使用“循证医学”的宣言。

他们的核心思想很简单。

医学治疗应该基于最好的证据，而且如果有统计数据的话，最好的证据应来自对统计数据的研究。

但是，盖伊特和萨基特并非主张医生要完全受制于统计分析，他们只是希望统计数据在医疗诊断中起到更大的作用。

5.1大数据与循证医学,大数据导论,19,医生应该特别重视统计数据的这种观点，直到今天仍颇受争议。

从广义上来说，努力推广循证医学，就是在努力推广大数据分析，事关统计分析对实际决策的影响。

对于循证医学的争论在很大程度上是关于统计学是否应该影响实际治疗决策的争论。

当然，其中很多研究仍在利用随机试验的威力，只不过现在风险大得多。

由于循证医学运动的成功，一些医生在把数据分析结果与医疗诊断相结合方面已经加快了步伐。

互联网在信息追溯方面的进步已经促进了一项影响深远的技术的发展，而且利用数据做出决策的过程也达到了前所未有的速度。

大数据带来的医疗新突破,5.2,5.2大数据带来的医疗新突破,大数据导论,21,根据美国疾病控制中心（CDC）的研究，心脏病是美国的第一大致命杀手，每年250万的死亡人数中，约有60万人死于心脏病，而癌症紧随其后（在中国，癌症是第一致命杀手，心血管疾病排名第二）。

在2544岁的美国人群中，1995年，艾滋病是致死的头号原因（现在已降至第六位）。

死者中每年仅有2/3的人死于自然原因。

那么那些情况不严重但影响深远的疾病又如何呢，比如普通感冒？

据统计，美国民众每年总共会得10亿次感冒，平均每人3次。

普通感冒是各种鼻病毒引起的，其中大约有99种已经排序，种类之多是普通感冒长久以来如此难治的根源所在。

5.2大数据带来的医疗新突破,大数据导论,22,在医疗保健方面的应用，除了分析并指出非自然死亡的原因之外，大数据同样也可以增加医疗保健的机会、提升生活质量、减少因身体素质差造成的时间和生产力损失。

以美国为例，通常一年在医疗保健上要花费27万亿美元，即人均8650美元。

随着人均寿命增长，婴儿出生死亡率降低，更多的人患上了慢性病，并长期受其困扰。

如今，因为注射疫苗的小孩增多，所以减少了五岁以下小孩的死亡数。

而除了非洲地区，肥胖症已成为比营养不良更严重的问题。

在比尔与美琳达盖茨基金会以及其他人资助的研究中，科学家发现，虽然世界人口寿命变长，但大家的身体素质却下降了。

所有这些都表明我们亟需提供更高效的医疗保健，尽可能地帮助人们跟踪并改善身体健康。

5.2.1量化自我，关注个人健康,大数据导论,23,谷歌联合创始人谢尔盖布林的妻子安妮沃西基（同时也是公司的首席执行官）2006年创办了DNA（图5-5）测试和数据分析公司23andMe。

公司并非仅限于个人健康信息的收集和分析，而是将眼光放得更远，将大数据应用到了个人遗传学上，至今已分析了超过20万人的唾液（图5-6）。

5.2.1量化自我，关注个人健康,图5-5基因DNA图片,大数据导论,24,5.2.1量化自我，关注个人健康,图5-623andMe的DNA测试,大数据导论,25,5.2.1量化自我，关注个人健康,大数据导论,26,通过分析人们的基因组数据，公司确认了个体的遗传性疾病，如帕金森氏病和肥胖症等遗传倾向。

通过收集和分析大量的人体遗传信息数据，该公司不仅希望可以识别个人遗传风险因素以帮助人们增强体质并延年益寿，而且希望能识别更普遍的趋势。

通过分析，公司已确定了约180个新的特征，例如所谓的“见光喷嚏反射”，即人们从阴暗处移动到阳光明媚的地方时会有打喷嚏的倾向；还有一个特征则与人们对药草、香菜的喜恶有关。

事实上，利用基因组数据来为医疗保健提供更好的洞悉是自1990年以来所做努力的合情合理的下一步。

人类基因计划组（HGP）绘制出总数约有23000组的基因组，而这所有的基因组也最终构成了人类的DNA。

这一项目费时13年，耗资38亿美元。

5.2.1量化自我，关注个人健康,大数据导论,27,值得一提的是，存储人类基因数据并不需要多少空间。

有分析显示，人类基因存储空间仅占20兆字节，和在iPod中存几首歌所占的空间差不多。

其实随意挑选两个人，他们的DNA约99.5都完全一样。

因此，通过参考人类基因组的序列，我们也许可以只存储那些将此序列转化为个人特有序列所必需的基因信息。

DNA最初的序列在捕捉的高分辨率图像中显示为一列DNA片段。

虽然个人的DNA信息以及最初的序列形式会占据很大空间，但是，一旦序列转化为DNA的As、Cs、Gs和Ts，任何人的基因序列就都可以被高效地存储下来。

5.2.1量化自我，关注个人健康,大数据导论,28,数据规模大并不一定能称其为大数据。

真正体现大数据能量的是不仅要具备收集数据的能力，还要具备低成本分析数据的能力。

虽然，人类最初的基因组序列分析耗资约38亿美元，不过，如今你只需花大概99美元就能在23andMe网站上获取自己的DNA分析。

业内专家认为，基因测序成本在短短10年内跌了几个数量级。

当然，仅有DNA测序不足以提升我们的健康，我们也需要在日常生活中做出改变。

5.2.2可穿戴的个人健康设备,大数据导论,29,Fitbit是美国的一家移动电子医疗公司（图5-7），致力于研发和推广健康乐活产品，从而帮助人们改变生活方式，其目标是通过使保持健康变得有趣来让其变得更简单。

2015年6月19日Fitbit上市，成为纽交所可

展开阅读全文