1、完整版银行数据脱敏项目实施方案数据脱敏项目实施方案(计划)VS-SDM测试数据管理与隐私数据保护平台2016年月日中安威士(北京)科技有限公司项目背景银行股份有限公司于2009年3月经中国银监会批准成立,总行位于市。2011年,成功引入国电集团、杭州银行两大战略投资者,资本实力及整体抗风险能力显著增强。截止2015年3月末,资产总额362亿元,各项存款230.49亿元,各项贷款余额165亿元,已在市、银川市、中卫市、吴忠市设立分行,分支机构达45家,并相继在宁夏、安徽、山东、重庆等地发起设立了7家村镇银行。随着银行业务的快速发展,业务生产系统积累了大量包含客户账户等敏感信息的数据。而这些数据,
2、在银行的很多工作场景中都会得到使用,例如,业务分析、开发测试、审计监管,甚至是一些外包业务等方面,使用的都是真实的业务数据和信息。如果这些数据发生泄露、损坏,不仅会给银行带来经济上的损失,更重要的是会大大影响用户对于银行的信任度。如何保证信息安全已经成为银行必须面对的一个重要的问题。面临挑战:确保敏感信息安全防止敏感数据泄露银监会发布的中国银行业十二五信息科技发展规则监管指导意见文件中明确提出“完善敏感信息存储和传输等高风险环节的控制措施,对数据、文档的访问应建立严格的审批机制。对用于测试的生产数据要进行脱敏处理,严格防止敏感数据泄露”。 银监会信息科技风险现场检查指南中也强调“测试中如需使用
3、生产数据,应对相应数据进行脱敏、变形处理,当使用生产数据测试时是否得到高级管理层的审批并采取相关限制及进行脱敏处理”。2014发布的第317号文件中也指出对要保护外包环境的数据安全,严格防止敏感数据泄露。但随着业务发展,更多新应用已经完全不适合利用这些老旧数据进行测试,同步生产环境中的核心数据迫在眉睫。银行希望在将最新的生产数据导入开发测试环境前,能够对敏感信息进行符合安全原则的变形及脱敏。他们拟引入适合银行现状及未来发展的数据脱敏产品,在保存数据原始特征的同时改变它的数值,使数据依旧可以被用并与业务相关联,在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集,从而避免数据泄
4、露的风险。解决之道:采用成熟数据脱敏工具配以完善安全管理流程项目概况银行过去一直使用真实数据进行开发、测试用途。这样处理的好处是迅速、有效。但考虑到客户信息的重要性,为了提高对银行客户的服务水平和信息安全保障,银行决定对开发、测试等非生产环境的数据使用环节进行整改,引入数据脱敏技术对客户信息进行保护。项目目标银行考虑开展数据脱敏项目,在保障客户信息安全的基础上,无论是从项目范围,还是功能、效果上,都将成为一个先进和完善的系统。脱敏系统必须要求满足在数据上安全合规、技术上的可靠、有效、稳定和先进。在各环节上都要求能够更多的自动化功能,减少不必要的人机交互过程,大幅降低人力成本投入。实现整个流程的
5、批量化、自动化、智能化处理。项目需求本次项目对脱敏系统产品的基本要求有:1.在不了解数据库结构设计的情况下,能够自动发现和定位任意系统的客户信息所在的表、字段和相应的类型,以便于该系统在多系统范围内推广;2.脱敏数据要求能满足跨数据库种类、跨业务系统的数据关联性要求;3.脱敏效率更为高效;4.使用更为便捷,利于大范围推广;5.脱敏数据必须为高仿,能够满足数据原有的编码规则和特征,并能仿造原有数据的数据质量问题,达到高仿测试的要求。项目范围系统范围本次计划实施脱敏的业务系统包括:核心系统前置系统信贷系统网银手机银行系统隐私数据类型考虑到为客户提供最基本的信息安全保障,以及开发、测试中的各种实际应
6、用需求,例如制卡等问题,现将此次项目实施中进行脱敏的隐私数据类型规定如下:1.客户名称:a)对私:姓名b)对公:企业单位名称2.证件号码:a)对私:居民身份证号、护照号、港澳通行证、户口簿号、军官证等b)对公:组织机构代码、工商注册号、纳税人识别号;3.电话号码:a)固定电话b)移动电话c)传真4.EMAIL5.地址信息6.密码(仅在需要大量账号进行压力测试时)7.客户编号(仅在客户编号中包含证件号码时)系统架构图系统流程说明根据架构图所示的流程如下:1.首先从生产的备份恢复到一台中间数据库服务器上,获得一份完整且真实的数据库镜像,考虑到操作系统的差异和资源的重复利用,这里需要准备两台中间服务
7、器,一台为AIX系统一台为Linux系统,根据生产数据库的实际情况进行分别使用;2.脱敏系统对此数据库进行隐私数据发现,进行隐私数据模型梳理工作;3.从中间数据库服务器上进行数据抽取,这里只需要抽取含有客户信息的表即可;4.数据在VS-SDM平台上进行数据漂白脱敏;5.经过脱敏后的数据回写到中间服务器上,这样中间服务器上的数据库即为一套完整的经过脱敏的数据库;6.将中间服务器上的数据库通过备份或者拷贝等手段送到开发网段;7.在开发网段将数据库进行恢复即可使用。方案优势:将由于本方案采用回写方式,脱敏系统无须抽取完整的数据库数据,只需要抽取含有客户信息的表进行脱敏处理并且回写即可。此方案只处理含
8、有敏感信息的表,处理量小,速度快。VS-SDM系统配置1.隐私数据模型建立;a)使用VS-SDM的发现作业对备份恢复出来的业务数据库进行自动化、智能化的扫描,并生成报告;b)人工对每个系统的自动发现报告进行隐私数据梳理工作,建立正式的隐私数据模型;c)每个业务系统数据库单独建立一个发现作业,共计5个发现作业;2.对上述建立的环境进行数据抽取a)仅抽取包含隐私数据的表,在此可以根据需要设置子集抽取;b)每个业务系统数据库单独建立一个抽取作业,共计5个抽取作业;3.数据漂白脱敏:a)对上述抽取的所有表进行脱敏b)自动配置脱敏规则c)脱敏作业:i.每个业务系统数据库单独建立一个脱敏作业,共计5个漂白
9、作业。所有作业共享同一个漂白种子值以保证跨数据库系统的数据关联性,且种子值每季度更换一次,由管理员保管;ii.在有条件的情况下,将多个数据库共用一个脱敏作业,种子值由系统自动管理每次更换,一来能够保证所有系统的数据关联性,二来提高算法安全性。4.数据装载a)将所有隐私数据表全量装载b)装载作业回写至上述建立的临时环境或者测试环境数据库,以此用脱敏数据替换原来的真实数据,形成完整的脱敏数据库。项目人员阶段人员配置阶段参与人员职责需求调研乙方项目经理就项目的需求和范围与用户进行商讨甲方安全负责人从安全角度提出项目脱敏范围甲方测试开发人员从数据使用方角度提出脱敏的可行性范围系统设计乙方项目经理根据用
10、户的实际环境,与行方人员进行商讨脱敏系统架构与逻辑流程甲方安全负责人参与商讨合理可行的系统架构甲方数据库管理员参与商讨合理可行的系统架构甲方系统管理员参与商讨合理可行的系统架构甲方网络管理员参与商讨合理可行的系统架构实施准备甲方安全负责人负责协调各方资源甲方数据库管理员进行中间数据服务器上的数据库恢复工作甲方系统管理员提供足够的虚拟化资源甲方网络管理员负责网络配置系统安装甲方脱敏负责人负责协调各方资源与项目跟踪乙方实施工程师负责产品安装、调试系统实施甲方脱敏负责人负责协调各方资源与项目跟踪乙方项目经理项目跟踪与监控乙方实施工程师根据项目实施要求进行各系统的脱敏实施产品培训乙方项目经理项目跟踪与
11、监控乙方培训讲师产品培训甲方学员产品使用技术学习项目验收项目经理项目实施成果检验甲方安全负责人项目实施成果检验甲方开发测试人员项目实施成果检验脱敏算法基本要求实现多表关联脱敏,包括同一数据库和不同数据库之间,同样字段的关联变化,VS-SDM产品提供两种技术实现关联脱敏:1.将所有需要保持关联关系的表,包括不同数据库之间的表,同时加入一个“漂白作业”选择列表中,即可实现关联脱敏;2.若因故无法将所有需要关联的不同数据库或者表一次性在一个“漂白作业”中进行处理,可以在不同的“漂白作业”中页面,将“漂白种子值(SEED)”设定为同一个固定值,即可实现多表、多数据库的关联脱敏;脱敏规则实现所有隐私数据
12、信息都可以使用固定字符串方式替换或者部分替换进行脱敏,但是为了保证脱敏数据的仿真度和测试开发项目组的使用效果,建议使用专用的脱敏算法。客户名称对公客户名:将企业单位名划分为4部分:行政区划、商号、行业特征、组织方式,脱敏规则允许独立配置4部分是否需要变化,缺省变换商号,其余3部分不变;对私客户:将姓名划分为姓氏和名字两部分,脱敏规则允许独立配置两部分是否需要变化,缺省两部分同时变换。提供百家姓字库和中国名字字库进行脱敏处理。客户证件号码证件号码支持中国居民身份证号、护照号、港澳通行证、户口簿号码、军官证等中国地区所有的证件号码,且能保证脱敏后的证件号码能保持该种证据号码的编码规则和校验规则。地
13、址信息地址脱敏使用中国任意地址进行替换,使用内置中国地址库进行处理。电话信息对移动电话和固定电话号码均采用同一算法,变换号码右边5位,变换位数可根据实际需求设定修改。EMAIL地址信息将EMAIL地址分为地址主体和域名两部分,两部分均可单独配置是否需要脱敏。地址主体在保证唯一性前提下进行随机变换,域名变换成常用公共域名,缺省情况下域名不变换。密码信息密码信息根据实际需求分两种脱敏:1.在开发或压力测试时需要用到客户的登录密码:此时可以将密码统一修改成同一个值,例如“888888”,然后将888888的加密值直接替换所有账号的密码;2.在不需要使用登录密码的其它测试开发场景,为了保密,建议使用随
14、机算法进行脱敏;客户编码中身份证号客户编码中的身份证号,这里稍微扩展一下,变成客户编码中的证件号码,脱敏规则为保留客户编码中的前缀和后缀不变,单纯变换当中的证件号码,且算法与证件号码保持一致,保证脱敏后数据关联性。账户号账户号脱敏,首先程序自动判断原账户号的末位是否满足LUHN校验算法,如果不满足,直接变化账号右边6位(位数可调整),如果末尾满足LUHN校验算法,则末尾采用LUHN算法生成。中安威士产品典型配置名称参数配置数量中安威士测试数据管理与隐私数据漂白平台VS-SDM-1000基本要求国产自主可控自主知识产权软硬件一体化平台,提供计算机软件著作权相关证明文件1系统兼容性具备良好的兼容性
15、,在运行过程中应对数据库主机的正常运行、数据库服务的正常访问无影响1具备良好的容错能力,对于偶然出现的网络中断、主机宕机等异常情况恢复后,测试数据管理与隐私数据漂白平台产品针应能自动恢复正常工作状态,设备及软件本身在发生故障时应不影响数据库服务的正常访问支持以下种类的数据库作为源或目标数据源,包括Oracle(9i, 10G, 11G, 12c)、 Microsoft SQL Server (2005, 2008,2012)、IBM DB2 UDB(9.5, 9.7, 10.1, 10.5 )、MySQL (5.x)、Informix (11.7,12.1,12.5)数据库产品的部署和实施应对数据库主机操作系统及数据库的配置不造成任何影响系统功能支持元数据发现功能。测试数据管理与隐私数据漂白平台产品必须能够访问和获取所兼容的数据库系统当
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1