1、大数据安全,大数据是当前学术界和产业界的研究热点,正影响着人们日常生活方式、工作习惯及思考模式。但目前,大数据在收集、存储和使用过程中面临着诸多安全风险,大数据所导致的隐私泄露为用户带来严重困扰,,大数据4V,大数据中的用户隐私保护,大数据的可信性,如何实现大数据的访问控制,大数据带来的安全挑战,大数据带来的安全挑战,用户隐私保护,大数据的可信性,如何实现大数据访问控制,不仅限于个人隐私泄漏,还在于基于大数据对人们状态和行为的预测。目前用户数据的收集、管理和使用缺乏监管,主要依靠企业自律,威胁之一是伪造或刻意制造数据,而错误的数据往往会导致错误的结论。威胁之二是数据在传播中的逐步失真。,(1)
2、难以预设角色,实现角色划分;(2)难以预知每个角色的实际权限。,大数据安全与隐私保护关键技术,大数据安全与隐私保护,大量事实表明,大数据未被妥善处理会对用户的隐私造成极大的侵害。根据需要保护的内容不同,隐私保护又可以进一步细分为位置隐私保护、标识符匿名保护、连接关系匿名保护等。人们面临的威胁其实并不仅仅限于个人隐私泄露。从单个信息来看,其实可能会让你不爽,或许你的体重作为隐私被人知道了,这其实无关痛痒。但是比较恐怖的是基于大数据对人们的状态和行为的预测。典型的例子就是刚才说过的零售商通过历史记录分析,比家长更早的知道自己的女儿已经怀孕的消息,并向其有机相关的广告信息。大家之前收到过推送,或者以
3、后将收到类似保胎什么的消息就是类似情况,大数据安全现状,我们现在用户数据的收集、存储、管理与使用等均缺乏规范、更加缺乏监管,主要依靠企业的自律。例如说,很多游戏现在都要求实名制,目的是防止未成年人沉迷游戏。,数据发布匿名保护技术,数据发布匿名保护技术是对大数据中结构化数据实现隐私保护的核心关键与基本技术手段典型例子:K匿名方案 k-匿名技术要求发布的数据中存在一定数量(至少为k)的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的具体个体,从而保护了个人隐私社交网络中典型的匿名保护:1、用户标识匿名与属性匿名,在数据发布时隐藏了 用户的标识与属性信息2、用户间关系匿名,在数据发布时隐藏了用户间的关系,角色挖掘技术,角色挖掘:根据现有“用户-对象”授权情况,设计算法自动实现角色的提取与优化。典型工作,数据溯源技术,数据溯源技术目标是帮助人们确定数据仓库中各项数据的来源,也可用于文件的溯源与恢复基本方法:标记法,比如通过对数据进行标记来记录数据在数据仓库中的查询与传播历史,面临的挑战,大数据服务与信息安全,基于大数据的威胁发现技术,基于大数据,企业可以更主动的发现潜在的安全威胁相较于传统技术方案,大数据威胁发现技术有以下优点:,1、分析内容的范围更大,2、分析内容的时间跨度更长,3、攻击威胁的预测性,4、对未知威胁的检测,谢 谢!,