脱敏解决方案V111008终结版.docx
《脱敏解决方案V111008终结版.docx》由会员分享,可在线阅读,更多相关《脱敏解决方案V111008终结版.docx(19页珍藏版)》请在冰豆网上搜索。
脱敏解决方案V111008终结版
数据脱敏解决方案
第1章:
关于本方案第2章:
概述
2.1背景
2.2目标第3章:
脱敏方法介绍第4章:
脱敏涉及系统和脱敏规则制定
4.1系统间对应的关联关系
4.2系统脱敏规则
4.3各个系统脱敏处理字段
图表一:
TA系统和网站
图表二:
订单系统
图表三:
清算系统
图表四:
网上交易、
FUNDAP、I前置机和APPserver
10
图表五:
直销系统
10
图表六:
微信系统
10
图表七:
KM系统
10
图表八:
交易系统
11
第5章:
脱敏方案实施
15
5.1脱敏工具开发使用
16
5.2脱敏方案实施
16
示例一:
客户姓名”脱敏
16
示例二:
密码”脱敏
16
示例三:
电话号码”脱敏
17
示例四:
银行卡号”脱敏
17
示例五:
地址”脱敏
17
第1章:
关于本方案
本方案主要是为了解决生产系统数据向测试系统迁移过程中其中关于敏感信息的处理方式方法,其中包括针对不同生产系统脱敏数据的分类、脱敏规则的制定以及脱敏方案的实施。
第2章:
概述
2.1背景
随着基金业务的快速发展,业务生产系统积累了大量包含账户等敏感信息的数据,如果这些数据发生泄露、损坏,不仅会给基金公司带来经济上的损失,而且会给基金公司的声誉带来负面影响。
目前,在业务分析、开发测试、审计监管等使用过程中如何保证生产数据安全已经成为一个重要的问题。
同时在加强金融行业监管的大背景下,随着数据安全要求的不断提高以及银监会《银行金融机构信息系统风险管理指引》等明确要求金融机构规避信息风险,对客户等资产安全,敏感信息提供完善的保护,需要对客户资料信息等敏感信息进行脱敏、变形、实现有效保护。
数据脱敏是指对某些敏感信息(如:
客户账号、身份证号、电话、地址、密码)通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。
这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。
2.2目标
首先依据客户敏感信息屏蔽规则屏蔽业务数据中的敏感信息,保障生产数
据在非生产环境中的安全使用,防止敏感信息泄露。
脱敏后的数据主要用于测试、
开发、培训、外包、数据挖掘/研究等不同的使用场景。
其次在借助数据脱敏技术,屏蔽敏感信息的同时,还应使屏蔽的信息保留其原始数据的格式和属性,确保应用程序在使用脱敏数据的开发与测试过程中正常运行。
第3章:
脱敏方法介绍
数据脱敏是为了确保在非生产环境下使用生产数据更加安全,但是其又与纯
粹的数据加密同,数据加密可能是将数据库中有意义的字符通过加密后转变成了
无意义字符,而脱敏是将数据通过一定的算法变成另一种样式,而这种样式是可读的,并且与元数据是同一类的。
例如:
“IBM5100”数据加密会得到“w%(Jt#v!
”而数据脱敏后会得到“IBN73O0'
一个好的数据脱敏过程必须具备以下特点:
可用性、数据关联关系、业务规则关系、数据分布、易用性和可定制。
从而在针对不同系统进行数据脱敏时,制定良好的脱敏方法,是整个数据脱敏关键所在,而常用的实施脱敏方法有如下几种方式:
1.替换:
如统一将女性用户名替换为F,这种方法更像障眼法”,对内部人员可以完全保持信息完整性,但易破解。
2.重排:
序号12345重排为54321,按照一定的顺序进行打乱,很像替换”,可以在需要时方便还原信息,但同样易破解。
3.加密:
编号12345加密为23456,安全程度取决于采用哪种加密算法,
一般根据实际情况而定。
4.截断:
截断为138,舍弃必要信息来保证数据的模糊性,是比较常用的脱敏方法,但往往对生产不够友好。
5.掩码:
123456->1XXXX6保留了部分信息,并且保证了信息的长度不变性,对信息持有者更易辨别,如火车票上得身份信息。
6.日期偏移取整:
2013052012:
30:
45->2013052012:
00:
00,舍弃精度来保证原始数据的安全性,一般此种方法可以保护数据的时间分布密度。
但是不管哪种手段都要基于不同的应用场景,遵循下面两个原则:
1.remainmeaningfulforappiicationlogic(尽可能的为脱敏后的应用,保留脱敏前的有意义信息)
2.sufficientlytreatedtoavoidreverseengineer(最大程度上防止黑客进行破解)
II
—I-
1
強二
■
1
tn
37007^197010217016
tutt
雹吓优X
II
tut
艸川術鐵那血冬咛区
«7砧工31
II
4liX
*•**21?
^
837294
111X11
一
-■-—.r.——
章:
脱敏涉及系统和脱敏规则制定
本次数据脱敏范围涉及的生产系统主要有:
TA系统、订单系统、交易系统、
清算系统、网上交易、FUNDAP、前置机、APPserve、微信系统、直销系统、KM
系统等。
4.1系统间对应的关联关系
为了保证脱敏后各个系统之间的数据关联关系,制定相应的对应关系如下:
1、
TA系统:
为了保证本系统各个数据表之间的关联关系,所以对“证件号码”
字段进行不脱敏处理,后期在使用表与表之间的关联特性时,可以使用本字
段进行对应关系的关联操作
2、
订单系统:
为了保证本系统各个数据表之间的关联关系,所以对“银行名称”、
“证件号码”字段进行不脱敏处理,后期在使用表与表之间的关联特性时,
可以使用本字段进行对应关系的关联操作
3、
清算系统:
脱敏处理后,可以使用“投资人证件号码”字段来保证表与表之
间的关联性
4、
网上交易系统、FUNDAPI直销系统:
脱敏处理后,都使用“证件号码”字
段来作为相关联表的关联字段
4.2系统脱敏规则
在保证了各个系统之间表与表的数据关系相关性的条件下,制定合适的脱敏
规则,是完成脱敏工作的必要前提,所以脱敏规则制定如下:
1、TA系统脱敏规则
1.客户姓名:
把原来三个字(四个字)修改为富富+最后一个字或者(富富
富+最后一个字),原来两个字修改为富+最后一个字;2.证件号码:
不脱敏3.手机号码:
统一修改为4.联系地址:
宝地大厦5.密码:
2、订单系统脱敏规则
1.银行账号:
未4位统一更新9999
2.银行名称:
不脱敏
3.银行户名:
把原来三个字(四个字)修改为富富+最后一个字或者(富富
富+最后一个字),原来两个字修改为富+最后一个字;
4.证件号码:
不脱敏
5.手机号码:
统一修改为
6.联系地址:
宝地大厦7.邮箱:
3、清算系统脱敏规则
1.银行账号:
未4位统一更新99992.证件号码:
不脱敏
3.证件类型:
不脱敏
4、网上交易、FUNDAP、I前置机、appserver脱敏规则
1.网上交易、FUNDAPI的客户名称:
把原来三个字(四个字)修改为富富+
最后一个字或者(富富富+最后一个字),原来两个字修改为富+最后一个字;
2.前置机、appserver系统由于系统无数据库所以对其不做脱敏处理
5、直销系统脱敏规则
1•客户姓名:
把原来三个字(四个字)修改为富富+最后一个字或者(富富富+最后一个字),原来两个字修改为富+最后一个字;
6交易系统脱敏方法规则
方法一:
如果测试业务,跟历史数据无关,使用清库脚本,把涉及上述的信息清库,保留
基本的配置,以便测试使用。
清库后,可以根据情况手工增加某个基金的资金或者持仓,供测试使用。
并配合
模拟成交工具,可以完成大部分测试。
方法二:
"如果测试业务,要历史数据支撑,可以通过交易系统中的批量业务来脱敏,先把真实数据中的重仓股及可用批量调减,而后使用制造的测试数据批量调增。
这样做的好处是系统中数据的逻辑关系不会乱,可以保证数据的完整及合规性。
方法三:
以数据库字段为单位,对整个数据库进行相应处理
首先使用的是历史数据,由于交易系统中的数据对当前一段时间敏感,如果是半
年前的数据,作用也不会很大。
但为了安全按下列方法处理一下:
方法四:
通过上述方法脱敏后,如果可能还可以通过权限控制相关测试人员的权限,
例如对测试账户不能有打印及导出的权限,对数据库由专人负责,其余人员没有
权限。
4.3各个系统脱敏处理字段
图表一:
TA系统和网站
脱敏表和相关字段
字段描述
tcustomerinfo.c_custname
客户姓名
TACCOREQUEST_HIS.C_CUSTNAME
客户姓名
TACCOREQUEST.C_CUSTNAME
客户姓名
TCONFIRMRIGHT.C_CUSTNAME
客户姓名
TGDACCOSHARES.C_CUSTNAME
客户姓名
网站
无需脱敏
图表二:
订单系统
脱敏表和相关字段
字段描述
TYEBACCOBANK.C_BANKNO
银行编号(账户银行信息表)
TYEBACCOBANK.VC_BANKACCO
银行账号
TYEBACCOBANK.VC_BANKNAME
银行名称
TYEBACCOBANK.VC_NAMEINBANK
银行户名
TYEBBANKACCO.C_BANKNO
银行编号(基金公司银行账户表)
TYEBBANKACCO.VC_BANKACCO
银行账号
TYEBBANKACCO.VC_BANKNAME
银行名称
TYEBBANKACCO.VC_NAMEINBANK
银行户名
TYEBACCOINFO.C_IDENTITYTYPE
证件类型(账户信息表)
TYEBACCOINFO.VC_IDENTITYNO
证件号码
TYEBACCOINFO.VC_CUSTOMNAME
客户名称
TYEBACCOINFO.C_CUSTTYPE
客户类型
TYEBACCOINFO.VC_ADDRESS
地址
TYEBACCOINFO.VC_MOBILENO
手机号码
TYEBACCOINFO.VC_FAXNO
传真
TYEBACCOINFO.VC_EMAIL
邮箱
TYEBACCOINFO.VC_PHONE
电话
TYEBACCOREQUEST.C_IDENTITYTYPE
证件类型(账户申请表)
TYEBACCOREQUEST.VC_IDENTITYNO
证件号码
TYEBACCOREQUEST.VC_CUSTOMNAME
客户名称
TYEBACCOREQUEST.C_CUSTTYPE
客户类型
TYEBACCOREQUEST.VC_ADDRESS
地址
TYEBACCOREQUEST.VC_MOBILENO
手机号码
TYEBACCOREQUEST.VC_FAXNO
传真
TYEBACCOREQUEST.VC_EMAIL
邮箱
TYEBACCOREQUEST.VC_PHONE
电话
THYEBACCOREQUEST.C_IDENTITYTYPE
证件类型(账户申请历史表)
THYEBACCOREQUEST.VC_IDENTITYNO
证件号码
THYEBACCOREQUEST.VC_CUSTOMNAME
客户名称
THYEBACCOREQUEST.C_CUSTTYPE
客户类型
THYEBACCOREQUEST.VC_ADDRESS
地址
THYEBACCOREQUEST.VC_MOBILENO
手机号码
THYEBACCOREQUEST.VC_FAXNO
传真
THYEBACCOREQUEST.VC_EMAIL
邮箱
THYEBACCOREQUEST.VC_PHONE
电话
TTRANSFERSPECACCOUNT.VC_TRADEACC
C垫资户交易账号(垫资方账户表)
TYEBPAYOUTREQUEST.C_BANKNO
银行编号(转出流水表)
TYEBPAYOUTREQUEST.VC—BANKACCO
银行账号
TYEBPAYOUTREQUEST.VC_BANKNAME
银行名称
TYEBPAYOUTREQUEST.VC_NAMEINBANK
银行户名
THYEBPAYOUTREQUEST.C_BANKNO
银行编号(转出流水历史表)
THYEBPAYOUTREQUEST.VC—BANKACCO
银行账号
THYEBPAYOUTREQUEST.VC_BANKNAME
银行名称
THYEBPAYOUTREQUEST.VC_NAMEINBANK
银行户名
图表二:
清算系统
脱敏表和相关字段
字段描述
QSCustomer.FBankAccount
投资人银行账号
QSCustomer.CertID
投资人证件号码
QSCustomer.CertType
证件类型
图表四:
网上交易、FUNDAPI前置机和APPserver
脱敏表和相关字段
字段描述
taccoreqwizard_web.vc_customname
(fundapi系统)taccoreqwizard_web.vc_customname
前置机
无数据库
APPserver
无数据库
图表五:
直销系统
脱敏表和相关字段
字段描述
tcustinfo.vc_customname
tcustinfo_net.vc_customname
taccoinfo.vc_acconame
taccoinfo_net.vc_acconame
taccobank.vc_nameinbank
taccobanknet.vcnameinbank
taccorequest.vc_customname
taccorequest_net.vc_customname
脱敏表和字段
字段描述
无
无
说明:
微信系统客户资料表只有客户微信的open_id、昵称,没有客户联系方式等,也
没有客户交易记录数据,不涉及敏感信息,所以该系统无需进行脱敏处理。
图表七:
KM系统
脱敏表和字段
字段描述
无
无
说明:
暂未提供
图表八:
交易系统
脱敏表
表描述
基础类表
Tbankaccount
银行账户信息表
TENTRUSTSTOCKHOLDER
交易股东表
Tseat
席位信息表
TSTOCKHOLDER
股东信息表
指令交易类
TASSET
资产单元基本信息表
TAUTODISPENSE
自动分发规则表
TCOMBI
投资组合表
TETFBASICINFO
ETF基本参数表
THISATSCHEMA
自动交易方案历史表
THISATSCHEMAINS
自动交易方案证券历史表
THISINSTRUCTION
指令历史表
THISINSTRUCTIONDEPOSITDETAIL
存款指令明细历史表
THISINSTRUCTIONFLOW
指令流程历史表
THISINSTRUCTIONHGMORTAGAGE
银行间指令质押信息历史表
THISINSTRUCTIONMARKETINFO
指令行情信息历史表
THISINSTRUCTIONSTOCK
指令证券历史表
THISPREINSTRUCTION
预置指令历史表
THISPREINSTRUCTIONSTOCK
预置指令证券历史表
TINSTRUCTION
指令表
TINSTRUCTIONHGMORTAGAGE
银行间指令质押信息表
TINSTRUCTIONMARKETINFO
指令行情信息表
TINSTRUCTIONSTOCK
扌曰令证券表
TOPINSTRUCTIONSTOCK
乂勿贝扌曰令证券表
TOPPROJECTSTOCK
操作员指令方案证券表
TPREINSTRUCTION
预置指令表
TPREINSTRUCTIONSTOCK
预置指令证券表
TENTRUSTS
委托表
财务清算类
TAPPLYREDEEM
开放式基金申购赎回表
TASSETDAY
资产单元日信息表
TBANKREALDEAL
银行间成交回报
TCASHBUSINESS
资金类业务表
TCASHFROZENDETAIL
资金冻结解冻明细表
TDEALHGMORTAGAGE
银行间成交回报回购质押表
TDEPOSITRECEIPT
在途存单信息表
TFUNDASSET
基金资产信息表
TFUNDSTOCK
基金证券表
THGMORTAGAGE
在途回购质押债券表
THGREGISTER
在途回购表
THISASSETDAY
资产单元日信息历史表
THISBUSINESSSUMMARY
成交业务汇总历史表
THISCASHFROZENDETAIL
资金冻结解冻明细历史表
THISENTRUSTS
委托历史表
THISFADATA
财务科目数据历史表
THISFUNDASSET
基金资产信息历史表
THISFUNDSTOCK
基金证券历史表
THISHGREGISTER
在途回购历史表
THISHOLDINGDETAIL
持仓明细历史表
THISINTERESTLOG
权益流水历史表
THISLIQUIDATEDETAIL
清算配对历史表
THISPENDSETTLE
待交割历史表
THISREALDEAL
实时成交流水历史表
THISSPECSTOCK
投资单元特殊证券历史表
THISSTOCKBUSINESS
证券类业务历史表
THISUNITSTOCK
投资单元证券历史表
TINTERESTLOG
权益流水表
TLIQUIDATEDETAIL
清算配对表
TPENDSETTLETMP
临时待交割表
TREALDEAL
实时成交流水表
TSPECSTOCK
投资单元特殊证券表
TSTOCKBUSINESS
证券类业务表
TSTOCKFROZENDETAIL
证券冻结解冻明细表
TSUBJECTDATA
系统科目数据
TUNCOMPLETELOG
未完成业务表
TUNITSTOCK
投资单元证券表
TSHANGJSGH
上交所清算GH表
TSHANGJSTZXX
上交所通知信息TZXX表
TSHANGJSZQBD
上交所证券变动ZQBD表
TSHANGJSZQY
上交所结算ZQY表
TSHENJSDZ
深交所股份结算对帐表
TSHENJSFX
深交所发行信息表
TSHENJSGF
深交所结算GF表
TSHENJSHB
深交所清算HB表
风控类
TCHECKRISKCONTROL
风险控制复核表
TDYNAMICCONDITION
动态维度条件表
TETFFUNDINFOSERVER
ETF基金属性表发行端
TETFPREPCFINFOSERVER
PrePCF结果表_发行端
TETFPREPCFINFOSERVER
PrePCF结果表_发行端
TETFPREPCFINFOSERVER
PrePCF结果表_发行端
TETFPREPCFINFOSERVER
PrePCF结果表_发行端
THISETFSPECIFICSERVER
ETF权重数据历史表_发行端
THISRATIOLOG
风控预警记录历史表
THISRISKCONTROL
风险控制历史表
THISSHANGJSZGH
固定收益盘后成交数据接口历史表
THISSHANGJSZQBD
上交所证券变动ZQBD历史表
THISSHENJSDZ
深交所股份结算对帐历史表
THISSHENJSFX
深交所发行信息历史表
THISSTHISSHENJSHB
深交所清算HB历史表
THISSHENJSHB
深交所清算HB历史表
THISSTATICRISKRESULT
静态风控检查结果历史表
THISTRADESTOCK
维度证券历史表
TPCFCHECKRESULT
PCF核查触警表
TSTATICRISKRESULT
静态风控检查结果
第5章:
脱敏方案实施
在确定了第4章中列出的需要脱敏的系统以及需要脱敏的字段和脱敏规则后,接下来就是要对具体系统的具体字段的脱敏规则使用不同的脱敏方法的实施过程。
在实际操作数据脱敏中,操作人员应该保证在不影响生产系统的前提下进行数据的脱敏工作,同时按照不同的脱敏规则,采用不同的脱敏方法以保证脱敏后的数据的原本属性。
5.1脱敏工具开发使用
通过整体脱敏规则可知,以上涉及相关需脱敏系统在对数据库数据进行脱敏
处理时存在许多通用性,例如对“客户名称”字段的修改规则基本一致,所以针对这种情形为开发出具有一定通用性的脱敏工具提供了有利条件,脱敏工具开发使用可使用脱敏工作变得的简单易行,并同时可以减少在脱敏时大量重复性工作。
但是作为支持多系统的脱敏工具,由于可能各个系统的数据源不尽相同(例如:
Oracle、SqlServer、mysql等),所以脱敏工具应该具有支持多种数据源的特性
5.2脱敏方案实施
示例一:
对“客户姓名”脱敏
采用方法:
替换脱敏规则:
把原来三个字(四个字)修改为富富+最后一个字或者(富富富+最后
一个字),原来两个字修改为富+最后一个字;
实施代码:
(可以使用pl/sql存储过程实现)
createorreplaceprocedurename_tuomingbeginend
示例二:
对“密码”脱敏
采用方法:
加密脱敏规则:
原来:
123456加密后:
321654(可以使用随机算法或哈希算法)实施代码:
示例三:
对“电话号码”脱敏
采用方法:
掩码脱敏规则:
防止号码泄露,但保留运营商和地区信息(唯一性,由前端绑定或者
注册时约束)
实施代码:
示例四:
对“银行卡号”脱敏
采用方法
替换+加密
脱敏规则
剔除或替换前几位表示所在开户银行的有关信息其余全部使用随机算法
实施代码
脱敏规则
地址要分为省、直辖市,然后将对应的新省里的市进行随机抽取
实施代码