大数据在医疗领域的应用.docx

上传人:b****7 文档编号:26654316 上传时间:2023-06-21 格式:DOCX 页数:25 大小:39.42KB
下载 相关 举报
大数据在医疗领域的应用.docx_第1页
第1页 / 共25页
大数据在医疗领域的应用.docx_第2页
第2页 / 共25页
大数据在医疗领域的应用.docx_第3页
第3页 / 共25页
大数据在医疗领域的应用.docx_第4页
第4页 / 共25页
大数据在医疗领域的应用.docx_第5页
第5页 / 共25页
点击查看更多>>
下载资源
资源描述

大数据在医疗领域的应用.docx

《大数据在医疗领域的应用.docx》由会员分享,可在线阅读,更多相关《大数据在医疗领域的应用.docx(25页珍藏版)》请在冰豆网上搜索。

大数据在医疗领域的应用.docx

大数据在医疗领域的应用

大数据在医疗领域的应用

课程前言

可能大家注意到,最近国务院办公厅正式下发了《关于积极推进和规范医疗健康大数据应用的指导意见》,应该说这是我们当前在大数据应用领域非常重要的文件,我围绕着这个文件的一些个精神跟大家讲一下自己的学习的体会。

在正式讲之前,我给各位领导简单的讲一个关于大数据的段子,这个可能大家很多都看过。

比如说某一个用户打电话给一个比萨店,说我要订一份比萨,他就问你的用户卡号是多少,他说我是多少,他说我知道了,你是姓什么,叫什么,住在哪里,你电话号码是什么,你的手机是什么。

然后说我订一份这个海鲜比萨,然后这个店里的接线员就说,说你不要吃这个海鲜比萨,我们通过了解了你的健康档案,说你患有血脂高,不适宜吃这种动物性的东西,最好吃植物性的东西。

说那就是吃一个素的吧,然后说那我要一个比如是10寸的,他说我了解了你们家里头现在就三口人,你适宜买这么大的,你买一个小的就可以了。

然后说那行,你就给我送来吧,说我准备到时候信用卡给你付款,他说你不行,他说我们了解了,你现在信用卡本月那个刷卡记录已经把你的那个额度刷爆了,你准备好现金吧,说那行,那我准备现金,你给我送过来吧。

他说我们看了你现在的行车的轨迹,你离我们比萨店只有5分钟的路,你自己开车过来取得了,说我要给你送过去还得30分钟。

这是个笑话,这个段子说明这个大数据跟我们每个人都密切相关,而且这个数据的关联性实际上是可以给我们每个人画一个像。

所以今天我就跟大家介绍这样一个内容,主要是讲我们怎么样积极规范和来推动我们这个医疗健康大数据的应用。

一、当前的新技术、新趋势和面临的新机遇

第一点,我们讲一下当前新的技术、新的趋势和我们面临新的机遇。

大家都知道,就进入现代社会以来,一个技术主导了一个世纪的发展。

比如说18世纪是机械开始的时代。

到了19世纪有了动力、有了蒸汽机。

到了20世纪的上半个世纪,是我们的机电自动化和重化工。

从20世纪下半个世纪开始,应该说一直到现在,是信息技术主宰我们这个时代的前沿的技术。

到了这个新世纪,21世纪,以这个云计算、物联网、大数据为代表的这个东西,也主导了我们新的世纪。

当今时代,我们的人类社会步入了一个以科技创新不断涌现的重要时期,新的技术革命推动了我们世界范围内生产力、生产方式、生活方式巨大的变革,其中信息技术进一步推动了经济的增长和社会的发展,推动了知识传播应用进程的变化。

所以当今以云计算、物联网和大数据为代表的新的技术,成为我们新时期整个的重大突破发展的一个前沿,也是我们当今面临的最大的机遇,也是我们最大的挑战。

总的来说,当今信息技术的发展有四大趋势,就像前面我们说的,大家都感受到,第一个是互联网的发展,特别是移动互联网的发展和这种互联网泛在的这种网络人人相连、人物相联,物物相连这个网络,通过智能终端的这种发展,这是第一个大的趋势。

由于有了这样的一个移动互联网,有了物联网的这种推进,也有了这个智能终端的发展,当今的社会有一个很大特点,就是这个网络社会促进了社交的发展,这个社交化的平台,比如说大家都熟悉用的微信、微博,已经成了我们现在沟通、协作、分享的一个平台。

由于有了移动互联网,有了一种社交网络,使得我们的数据就剧烈地增长,而且变化非常快,而且它的合适内容也更加多样化。

如何处理这样的数据,用传统的方式能力就不够了,这样就产生了新的计算的模式,就是云计算。

著名的咨询公司麦肯锡,对今后未来20年中间具有颠覆性的科技创新做了预测。

其中移动互联网,我们说的知识工作的自动化,物联网、云计算等等都成为最主要的新的技术。

而支撑这些技术的东西它的基石就是大数据,所以这个海量的数据,以及与他们采集的工具、平台、分析系统一起合起来,我们就称为大数据。

所以大数据的来源既来源于我们互联网上的数据,也来源于我们物联网,用各种传感器传感的数据,各种实时的数据,比如说我们现在的交通的这种流量,我们这种视频的监控,还有各种的比如说地震、物探所探测的数据,我们气象的数据,这样的数据总起来就成了当前的最具有的特征,就是大数据。

在当今大数据和互联网这种蓬勃发展的时候,我们看到了,就是这种世界因互联网而精彩,生活因互联网而更加丰富。

我们还可以戏说,就是互联网和大数据的这种激情碰撞,改变了我们整个发展的格局,改变了生产的方式,改变了生活方式,所以我们戏说,“金风玉露一相逢,便胜却人间无数”。

在产业发展领域,它加速了产业优化升级的步伐。

现在越来越多的企业,通过部署云计算、开发大数据资源,实现了协同设计、协同制造,现在又叫云设计、云制造,利用云平台来推动了我们整个发展。

我们可以举一个例子,大家都看到,我们国家的航天事业发展非常快,我们国人也引以为自豪。

过去我们研制一个新型号的航天器,从开始设计到制造出原型,不管是火箭、导弹,还是卫星,平均要6到7年的周期,现在由于有了现代信息技术的支撑,已经把这个周期从开始设计到出样机,缩减到18个月以内,这主要是得益于我们这种数据资源的共享和云计算,包括这种3D打印。

一个航天器新型号里头要有1万多条导管,这个导管过去如果是逐个的来加工,那周期很长,还要在对接的时候做很多的辅助工作。

现在用这种精确的3D打印,依靠大数据,可以是85%的导管一次成型,直接就可以对接。

在城市和我们目前的广大公共服务中间,也随着云计算和大数据的应用,在智慧城市,在这种社区管理,我们今天还讲到了关于疾病的预防和治疗,食品、药品安全的监管等方面都发挥了重要的作用,给我们个人的生活也带来了巨大的便利。

所以现在的大数据时代,我们常说,是一个5个“无处不在”的时代,包括计算无处不在、网络无处不在、软件无处不在、大数据无处不在,更重要的是给我们带来的服务无处不在。

因为现在我们各位领导、各位同志,你们每个人的手机现在都是智能化的,都是一部功能很强大的电脑,它可以计算,可以联网,里头有很多的软件服务,也产生了大量的数据,我们现在手机上的这个APP,每一个APP都是给我们提供了很好的服务。

比如说我们出差,我们可以找携程、去哪儿,然后我们订票,我们去查航班,可以查航空管家、航旅纵横,我们甚至出去吃饭,我们可以上大众点评,这些都是给我们带来的服务。

所以我们在研究中间,我们认为当今全球的信息化有六大发展趋势:

第一个就是前面说,移动互联网正在高速的发展;第二个就是大数据被多个国家上升成为国家的战略;第三,还有一个重要特征,就是我们的互联网不仅是有生活上的,大家消费上的互联网,更在朝着产业互联网、工业互联网发展前进。

全球的信息化还步入了一个智慧化的阶段。

大家看我们现在都在讲智慧城市建设、智慧社区建设、智慧医疗,我们现在有智慧水务、智慧警务,都是标明我们的信息化建设朝着一个新的阶段,而且这些技术促进了我们各行各业、各个领域的创新。

当然我们说还有一个特点,就是当今网络安全非常重要,既我们常说的制海权、制空权、制太空权之后,制网权成为各国激烈角逐的一个全新的领域。

也就是我们在这个领域里必须捍卫我们网络空间的我们的主权。

其中大数据被多个国家上升成为国家战略。

继美国之后,英国、法国、日本、韩国都把大数据成为国家的在新世纪的重大的发展战略。

我们国家也在去年,以国办发50号文件的正式下发了《大数据发展行动纲要》,明确把大数据作为国家的发展战略。

这个已经写在十三五规划纲要里。

大数据成为全球信息化发展的一个主要趋势,一个是各个国家掀起了我们开放政府数据的热潮,就是把政府掌握的公共数据开放出来,供全社会的共享和开发利用,第二是各国纷纷出台了围绕本国特点大数据的发展战略和这个行动的计划。

第三大数据进一步成为各个国家进行社会治理,甚至包括我们跨国的这种全球治理的一个重要的依托和治理工具。

这方面有很多的案例,比如说以韩国来说,他们首尔地区首都过去夜间也是没有公共交通的,只有出租车,费用还是比较贵的。

等到凌晨一点以后出行,就只好选择这种最贵的出租车。

当时这个市民就通过互联网向市民提出意见,因为韩国年轻人夜生活也很多。

后来就怎么解决这个问题呢?

就是首尔政府就利用市民打电话的这个地点和频度,通过大数据来解决这个问题,他就是按照把首尔分为若干个相类似我们这种叫做网格式的,分成若干个六角形,半径是一公里,一共分成了1252个,然后他分析每一个六角形里头,这个市民打电话、发短信的那个信息,以及通过这个来判断夜间市民出行的这个路线和范围,然后根据这个来设定夜间开公交的路线和频度。

这样的话,既节约了这个公交的投资,然后又满足了市民夜间出行通过公交的要求,所以这是很精准。

其实我们看到,我们国家也可以借鉴这个,比如说我们这个城市里公交有的时候你就会发现,大家都要上公交的时候,他车很少,等到你不怎么要上公交的时候,你看那公交空着车来回跑,这就是我们现在需要解决的。

类似的,比如说我们查航班是不是准点,有了很多的办法,比如说大家手机上的APP里头非常准、航旅纵横、航空管家这些东西,还有直接可以查航空公司。

但是过去是没有的,就是因为没有开放出民航的数据。

这个应该说是借鉴了美国的一些地区经验。

美国是首先把全美的航班延误的数据,甚至道路交通的数据开放出来,这样的话,很快一些个企业就开发了航班延误的查询系统和公共交通最优路线的查询,类似我们现在大家也常用的导航,所以这个也是解决老百姓出行中间很方便的问题。

我们国家这方面,特别是在民航的这些开放之后,应该说给大家提供了很多的方便。

当然我们说大数据还不止这个,更重要的它可以促进我们经济的发展,催生新的业态,对扶助商业的决策、降低运营成本、精准市场的营销,可以说都能够发挥作用,进一步提升了企业的竞争力。

我们研究了解的情况看,当前全球大数据和它的应用发展性能,正在推动新一轮信息技术革命的到来,特别是新的大数据的应用,进一步改变了我们整个经济社会管理的面貌,在宏观决策方面,还是在微观管理方面都发挥了重要的作用。

今天,大数据已经成为具有商业价值的一种宝贵的资源,所以有人称它为是“新世纪未来的石油”,因为这些大数据资源的利用,对于各行各业都是非常宝贵的,关于医疗健康,下面还要展开给大家说。

正是由于信息技术的这种发展,包括特别是以信息资源作为关键资源的这样一个知识经济的出现,应该成为我们国家改革开放30多年来,迅速发展一个很大的动力,所以在我们国家的发展中间,它是功不可没,特别是我们说,以信息资源作为关键资源的知识经济的出现,这个是一个非常大的,所以今后它的发展前景也非常看好。

正是在这样的一个背景下,我们很高兴的看到十二五以来,我们国家在信息化的发展中间取得了很大的成就,呈现了六大亮点。

第一个是信息基础设施取得了长足的进步。

大家都知道,我们现在的宽带中国战略,我们的村村通,包括广播电视的村村通,发挥了很重要的作用,这些信息化的基础设施,为我们信息化建设的发展提供了重要的支撑和保障。

第二,这些年来,我们电子信息产业规模越来越大,他对我们国民经济的带动作用、支撑作用、保障作用进一步增强。

在近几年来,我们的经济进入新常态,总体的发展速度有所趋缓的这样一个背景下,电子信息产业一直保持了10%以上的年增长速度,成为我们国民经济各个领域中间的佼佼者。

其中两化融合进一步推动了我们传统产业与信息化的融合发展,应该说成为我们当前工业时代、工业化进行进一步创新、进行转型升级的一个重要的支撑保障。

尤其让我们感到非常振奋的是,这些年来电子商务异军突起,这个大家都知道,我们现在的互联网企业中间有几个做电商,特别做涉及到我们民生的这种面向消费者的,我们常说的B2C的这种网络零售发展非常迅速,规模每年都翻好几番,这个我们现在不管是阿里的淘宝,还是京东,还是一号店、苏宁都有了很大的发展,同时,电子商务还不仅仅是面向网络零售,在我们的企业之间,我们常说的B2B,我们常说的垂直电商,还有跨境电商都有了很大的进步。

另外在民生服务领域,信息化的水平也有了很大的提高,比如说我们社保卡的发放力和使用,已经在中国覆盖了7亿多人,这个给我们现在看病难,应该说解决了不少问题。

另外电子政务的应用也走向了融合,这几年来,我们一些重大电子政务工程都取得了很显着的成绩,包括比如说金关工程、金税工程、金盾工程,都取得了非常显着的成绩。

所以我们可以看到,新一代的信息技术,正像我们说的像润物细无声,它悄然的改变了我们的生活方式、工作方式和思维方式,也加快了人才的培养,改变了我们中国社会发展的这种新的模式。

就现在大家购物,我们上这种大的网站,而且它还带动了一个很大的就业队伍,你看这快递小哥,各个快递公司,这个发展也非常的迅速。

政府的服务也进一步通过互联网开展互联网+政务服务,通过网上的一站式的服务大厅,可以说给大家解决了很多的问题。

包括比如说我们现在出行,大家买火车票,很多人都通过12306这个网站,解决了很多的问题。

特别是4G移动互联网在中国的推广应用,应该说为我们互联网的发展作出了重要的贡献。

我们明显的看到,我们的互联网的用户数在剧烈的增长,到去年年底,我们的网民的人数已经超过了7亿,现在新增的网民中间,大多数是通过移动互联网来上网。

在这样的一个背景下,智能终端发挥了更好的作用,每一个智能终端都是一个服务的入口,而且都是和每一个人密切相关,我们国家现在手机的拥有量超过了13亿,有相当多的人有两部手机,所以中国的IT产业呈现了更加丰富的内容,也提供了更好的服务。

所以我们信息产业呈现了一个高速发展的态势,有利于进一步推动我们经济的转型升级,也恰逢我们现在改革开放深化的这样一个天时,我们也有我们巨大的市场,所以有我们的地利,同时,应该说我们的产业部门也在积极的创新,像我们的华为这些企业,都在世界上成为最著名的IT企业。

所以我们说,今后发展我们的电子信息产业,就是要以应用为导向,同时要深入挖掘我们的信息资源,以大数据作为我们业务的发展的引擎,通过云计算的支撑,通过移动互联网的带动,通过把社交网络作为纽带,我们在电子政务和电子商务都会取得很大的进步。

所以我们说在今后,到2020年这5年期间,我们的IT市场应该说,会呈现一个持续高速发展的新阶段,其中云计算大数据,他们将发挥最重要的作用。

在看到我们国家和整个世界信息技术发展的新的形式的同时,我们必须看到,我们的信息化发展还存在着一些不容忽视的问题。

信息化发展还不够均衡。

这个大家都知道,我们东、中、西部沿海发达地区和内地欠发达地区,少数民族地区,城市和农村之间都有很大的差距。

传统产业跟互联网的全面融合发展明显不足。

我们的传统的体制束缚了信息生产力的发展。

数据资源开放共享不够。

我们现在很多的数据资源,特别是用政府公共财政采集的数据资源,往往没有得到充分利用,就睡大觉。

而大家知道,数据资源有一个很大的特点,它还是需要及时的利用,一旦过时之后,当然有的还是有价值,但它的价值就会发生重大的变化,而且也不利于解决我们当前各个领域所面对的紧迫的必须解决的棘手的问题。

当前网络和信息安全的形势依然严峻,我们怎么样来处理好数据共享的安全问题,怎么样来解决数据资源的保护问题,仍然是我们必须面对的一些尖锐的课题。

二、大数据与云计算相向而行、发展迅速

(一)大数据的产生与发展

第二点我想还是跟各位领导和同志们介绍一下大数据的基本概念,以及大数据和云计算相向而行、共同发展一个重大的机遇,这里头还会提到我们医疗健康大数据的定位和主要内容。

大家知道,我们当今信息化特别是在我国,经历了从上个世纪90年代到现在,我们21世纪已经进入了第二个10年。

这20年在历史上时间很短,但是在我们国家信息化发展历程中间,是一个非常不平凡的20年,应该说起了非常大的变化,发生了非常令人鼓舞的振奋。

我们从过去的单机应用到联网应用,到现在的大数据时代,表明了我们当今的信息化建设已经进入了一个叫做广泛感知、深度分析和智慧决策新时期。

这就是基于当今我们万物互联,前面我们说了,我们有人和人相连的互联网,有物物相连的物联网,而且有人物一起相连的这种泛在的泛联网,这个给我们带来了非常大的发展机遇,所以网络化的数据也进入了指数膨胀的阶段,发展的非常快。

我们今天来到的是一个大数据的时代,就是我们现在对数据的认识,对跟它相关的信息技术的认识,有了更加清晰、准确、合理的认识。

简单的说是什么呢?

就是大家逐步的认识到真正的信息系统,或者我们说的计算机系统里头最宝贵的不是你购买那些硬件的设备,比如说服务器、计算机,也不是这个网络,最重要的是我们计算机里头采集的、处理的、存储的这些数据资源,以及通过网络进行传输的这些资源和它的传输能力、处理能力,这才是最重要的。

这就是我们为什么说我们来到大数据时代的主要的理由。

我们现在来到了大数据时代,就是因为我们从信息的被动的接收者,变成了主动的创造者,大家可以回忆,我们每天每个人都发多少短信,发多少微信,发多少邮件,这些个都是我们是作为当今这个网络时代大数据的信息创造者之一,这是一个人人都在创造信息、创造数据的时代,所以这个大家可以看到,就是我们现在常说,我们的手机每天离我们的距离不超过30公分,也不在你兜里,就在你的桌子上、床边,或者你手上拿着,所以这个信息量是非常巨大的。

大数据时代,数据量呈着爆炸式增长。

从2006年,我们个人所用的数据已经平均到达了叫TB时代,那时候全球才产生180个EB的数据,一个EB是2乘的60次方。

人们预测到2020年,整个世界的数据量将达到35.2个ZB,而一个ZB等于10亿个TB,就可以想象这个数据量之大。

我们回顾大数据这个名词是怎么来的呢?

其实它是来源于最早在20世纪90年代的时候,作为数据仓库之父的一个著名的科学家叫比尔•恩门,提到叫大数据,但真正的把大数据这个名字提出来,是在2011年的云计算与大数据的这个EMC的一个年会上,提出了叫大数据。

大数据这个定义是什么呢?

它就是指的是需要新处理模式,才能具有更强的决策力、洞察发现力和流程优化能力的海量高增长率和多样化的信息资产。

这句话什么意思呢?

大家一看就知道,就是主语是大数据,最后大数据是信息资产,所以它这个资产就重要,有价值。

它这个有三个特征,量大、高增长率和多样化,所以我们说大数据现在有人说3个V,有的说4个V,也可以说5个V。

总的来说是一个多V,但是一般常说的,现在是按照4个V数,就是它量大,第二是变化快,第三个就是多样化,另外一个常说的,具有价值,但现在也有的把它提出,叫做真实性。

这就是我们对大数据的定义和特征的一个基本的理解。

在这里头,大家可以看到,它就是一个数量很大的数据集合。

我们之所以称它叫于大数据,一个就是数据量大,第二是变化快,第三是构成复杂,第四是蕴含着大的价值。

就是我们常说,大数据里头有大的智慧、大的价值和大的发展,为什么呢?

就是因为大数据不仅仅是一个数据的这种堆积,更重要的它是一种思维方式和管理治理路径的变化,所以我们高度重视大数据,更加强调的是后者,就是怎么样用好大数据。

所以我们看大数据和传统的小数据是可以比较的,就是由于你现在有了互联网出现了更多的数据创造者,也有了更多的消费者,由于你现在互联网实现了高速、宽带、移动,所以更多的影像这种多媒体的数据,你可以通过手机,通过移动互联网进行传播。

第三个就是社交网络可以促进它的发展。

第四个就是我们看到怎么样来保障我们数据的安全、数据的真实、数据的不被篡改,不被非法的人获取,是一个大的问题。

所以我们看到大数据,指的就是规模巨大、复杂,用现有的数据处理工具,难以获取整理、管理以及处理的数据。

所以我们再展开说一下,大数据有4个V,第一个是量大;第二是类型复杂,既有结构化的,也有半结构化,还有非结构化;第三,沙里淘金,价值密度低;第四,实时获取,需要变化的快,因为它变化快,就需要实时获取。

这里我特别强调一下,大数据有大,但不仅仅是大,更重要的是它的复杂性、全面性。

大数据里的一条微博,有的时候就透露出具有颠覆性的信息,所以这个价值可不能忽略。

比如大家都知道,前几年微博上发了这个郭美美炫富,一下子影响到红十字会的声誉。

她自称是什么红会的干部,当然她不是,但是这给红会造成的恶劣的影响,至今还没有完全消除。

所以大数据的四大,除了我们讲的4个V之外,它还有一个特点,就是处理是复杂的,因为大数据的采集、存储、分析,是一个很复杂的一个过程,是一个很周密的环节。

所以这一点包括我们说在医疗健康领域里头,它就会向医疗健康服务这个链条里头,每一个环节来采集和获取数据。

当今我们对大数据高度的重视,其中医疗健康领域就是当今搞大数据的企业和各行各业从事大数据最关注的一个领域,就是医疗健康行业。

大数据很大的一个特点是由于我们不同看数据的方式和规模是不一样的。

经过大致的统计,在所有的数据中间,结构化的也就是说各位领导经常能够看到表格化的,能够画成表格来管理这种二维表的数据,大部分是结构化的,大概仅仅占到目前我们数据的15%左右。

而非结构化的,不能够排成这种二维表的,比如说我们影像的数据,视频的数据,地图的这类数据,占到整个数据的85%,所以我们目前没有大数据给各级领导看到的一些个辅助决策的数据,往往是不够完整。

由于大数据,你在不同看数据的方式和规模不一样,有的时候我们看到的一些数据很难加以扩充,很难加以利用。

一旦处理起来时间过长,或者成本也过高,特别是对这种非结构化的数据怎么样来做处理,这是很难的事情。

正是在这样的背景下,我们仍然要跟大家说,大数据实际是什么。

大家注意,大数据就是信息资源和数据资源,从资源的角度来看,大数据和信息资源之间没有不同的含义。

所以大数据是我们当今重要的生产力要素,它是除了劳动土地和资本之外,以及劳动者的智能之外最重要的一个生产要素。

大家一定要注意,大数据不等于传统的数据库建设,也不等于传统我们搞的抽样调查,或者传统的普查,大数据也不等于说是我们搞数据中心建设就是大数据。

大数据需要云计算,但大数据不等云计算建设。

大数据和传统数据库存在着重大的和原则的差别。

当然我们说,大数据是在传统的数据库和数据仓库数据挖掘的基础上发展起来的,但是他们两者有很大的不同。

传统的数据库保存的都是结构化和半结构化的数据,就是能够用表格实现,以两为表,或者是标准的XLM文件。

这些由于它结构简单,处理就相对简单,大数据面向的是一切可以用计算机来存储的数据,那当然就复杂,包括我们说网页、图片、音频、视频,各种的文档,包括我们搜索引擎上你输入那些关键词,你社交网里的留言,你体现你的爱好,包括我们现在用物联网的各种传感器,收集起来的监控的结果。

比如说视频监控,视频监控的图像,这些个都不是结构化的,处理起来难度还是很大。

第二个就是对噪声是怎么处理,所谓噪声就是在过去数据结合里头异常的数据,不正常的。

过去传统的数据库怎么处理?

就是把这些异常数据剔除掉,删除掉,不要它。

但是大数据之所以大,它讲的是全,它是允许你在这数据里头有正常的数据,也有非正常的数据,这个保留下来有什么好处呢?

就是在进一步的研究中间,能够找到这种异常数据和正常数据之间的关联关系,看它有没有关联关系,有没有隐藏的关联关系,来加强你对系统的保护。

(二)大数据如何工作

大数据是怎么样工作的呢?

这个环节很多。

一个是我们大家都在制造数据。

大家知道,我们每个人都发微信、发微博,甚至于你每天的一举一动都是数据,你带上计步器,戴上手环,你每天走多少步,这个也是数据,也是留下来。

所以我们每个人每天都在制造数据,每个单位也不例外,这就是我们说大数据之所以巨大的由来。

而正因为这样,所以你遍布世界的传感器,大家对数据的搜集都是很热情的,但是归集起来,整理到哪里,这个是有争议的。

我们现在国家银监会和人民银行前不久发表的文件,就要求在中国服务的外国的银行,包括这些外国的数据处理机构,他对中国客户的数据,原则上应该在本地,就是在国内存储,不能够放到国外去,但是这个具体实施和检查还有难度,但这必须指明了这个方向。

大数据大了就会有价值,所以它潜力很大。

因为少量的数据,你看不出它之间的关联关系,当数据大了之后,找到的全体数据时候就可以从中根据蛛丝马迹,找出他们之间的规律。

以大数据的利用过程最后就是它的利用过程。

一般来说,这个过程要经过四个主要的环节,第一个是数据采集;第二个是导入和预处理;第三个是进行统计和分析;第四,再进行深度的挖掘。

大家注意,统计分析都是有预

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1