数据标准管理实践白皮书.docx

上传人:b****3 文档编号:2986568 上传时间:2022-11-16 格式:DOCX 页数:16 大小:76.70KB
下载 相关 举报
数据标准管理实践白皮书.docx_第1页
第1页 / 共16页
数据标准管理实践白皮书.docx_第2页
第2页 / 共16页
数据标准管理实践白皮书.docx_第3页
第3页 / 共16页
数据标准管理实践白皮书.docx_第4页
第4页 / 共16页
数据标准管理实践白皮书.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

数据标准管理实践白皮书.docx

《数据标准管理实践白皮书.docx》由会员分享,可在线阅读,更多相关《数据标准管理实践白皮书.docx(16页珍藏版)》请在冰豆网上搜索。

数据标准管理实践白皮书.docx

数据标准管理实践白皮书

 

数据标准管理实践白皮书

 

前言

数据标准(DataStandards)是保障数据的内外部使用和交换的一致性和准确性的规范性约束。

数据标准管理是规范数据标准的制定和实施的一系列活动,是数据资产管理的核心活动之一,对于政府和企业提升数据质量、厘清数据构成、打通数据孤岛、加快数据流通、释放数据价值有着至关重要的作用。

但是目前,各行业缺少数据标准管理的理论指导和行业实践案例,企业在标准建立、标准审核、标准落地、标准评估等方面仍存在诸多困难。

本白皮书结合了国内外数据管理相关理论知识的最新成果,以及国内数据标准管理的实践经验,对数据标准管理进行了深入探讨。

重点辨析了数据标准以及相关内涵,梳理了数据标准分类及体系,概括了数据标准管理的组织架构和制度体系,总结了企业开展数据标准管理面临的挑战,并提出了相关实践建议。

相信本白皮书对国内各行业从事数据治理工作的管理者、实践者和研究者都将具有一定参考意义。

 

一、数据标准概述

数据标准是进行数据标准化的主要依据,构建一套完整的数据标准体系是开展数据标准管理工作的良好基础,有利于打通数据底层的互通性,提升数据的可用性。

本章从数据标准的概念入手,多角度探讨数据标准的内涵,构建数据标准分类体系,并阐述了数据标准作为数据资产管理核心要素的重要性。

(一)数据标准的内涵

数据标准(DataStandards)是指保障数据的内外部使用和交换的一致性和准确性的规范性约束1。

在数字化过程中,数据是业务活动在信息系统中的真实反映。

由于业务对象在信息系统中以数据的形式存在,数据标准相关管理活动均需以业务为基础,并以标准的形式规范业务对象在各信息系统中的统一定义和应用,以提升企业在业务协同、监管合规、数据共享开放、数据分析应用等各方面的能力。

“数据标准”并非是一个专有名词,而是一系列“规范性约束”的抽象。

但是,数据标准的具体形态通常是一个或多个数据元的集合,即数据元是数据标准的基本单元。

《信息技术数据元的规范与标准化第1部分数据元的规范与标准化框架》(GB/T18391.1-2002)将数据元定义为用一组属性描述定义、标识、表示和允许值的数据单元2。

表1以《银行间市场基础数据元》(JR/T0065-2019)标准为例,展示了银行间市场基础数据元属性及

1《数据资产管理实践白皮书4.0》,中国信息通信研究院,2019.

2JR/T0065-2019,《银行间市场基础数据元》

其描述:

每一个数据元应由数据元中文名称、数据元英文名称、数据元标识符、说明、数据类型、取值、IMIX域名七个属性组成,每一个数据元属性的描述包括该属性的注释以及相关标准规则。

表1数据元示例-银行间市场基础数据元属性及其描述(JR/T0065-2019)

数据元属性

数据元属性描述

数据元中文名称

数据元的中文名称,应按照GB/T18391.5-2009中规定的数

据元命名规则进行命名

数据元英文名称

用英文表示的数据元名称

数据元标识符

数据元在本标准中的唯一标识符,按照数据元的类目分组进

行顺序编号,并适当留有一定的扩展空间

说明

数据元含义的文字描述

数据类型

用于定义数据域的取值类型,本标准由文本、数值、日期和

时间四个基本的数据类型组成

取值

取值范围可以是一个集合,任何在此集合外的取值都被认为是非法取值,取值若未“无”,则表示本标准中该数据元的

取值无限制

IMIX域名

JR/T0066中基本的数据元素,每个域有其域号、业务含义

和确定的取值范围。

(二)数据标准分类

数据标准是进行数据标准化、消除数据业务歧义的主要参考和依据。

对数据标准进行分类,将有利于数据标准的编制、查询、落地和维护。

数据标准有多种分类方式,对于不同的分类方式,均可采用以数据元为数据标准制定的基本单元构建数据标准体系。

本白皮书以银行业、电信业的数据标准分类为例,说明在这种分类方式下的数据标准。

数据可以分为基础类数据和指标类数据。

基础类数据指业务流程中直接产生的,未经过加工和处理的基础业务信息。

指标类数据是指具备统计意义的基础类数据,通常由一个或以上的基础数据根据一定的统计规则计算而得到。

相应地,数据标准也可以分为基础类数据标准或指标类数据标准。

基础类数据标准是为了统一企业所有业务活动相关数据的一致性和准确性,

解决业务间数据一致性和数据整合,按照数据标准管理过程制定的数据标准。

指标类数据标准一般分为基础指标标准和计算指标(又称组合指标)标准。

基础指标具有特定业务和经济含义,且仅能通过基础类数据加工获得,计算指标通常由两个以上基础指标计算得出3。

并非所有基础类数据和指标类数据都应纳入数据标准的管辖范围。

数据标准管辖的数据,通常只是需要在各业务条线、各信息系统之间实现共享和交换的数据,以及为满足监控机构、上级主管部门、各级政府部门的数据报送要求而需要的数据。

在基础类数据标准和指标类数据标准这个框架下,可以根据各自的业务主题进行细分。

细分时应尽可能做到涵盖企业的主要业务活动,且涵盖企业生产系统中产生的所有业务数据。

以银行业的基础类数据标准和指标类数据标准分类为例(见图1),基础类数据标准分为客户数据标准、产品数据标准、协议数据标准、渠道数据标准、交易数据标准、财务数据标准、资产数据标准、公共代码数据标准、机构和员工数据标准、地域和位置数据标准等。

指标类数据标准包括监管合规指标、客户管理指标、风险管理指标、资产负债指标、营销管理指标、综合经营指标等。

基础类数据标准和指标类数据标准通过分别建立基础类数据元和指标类数据元,并将基础类数据元和指标类数据元与数据映射,实现基础类数据标准和指标类数据标准的落地。

具体来说,对于结构化数据中的任意一个字段,当其不具备指标特征时,可直接将其与某一业务类别下的基础类数据元

(如包含命名规则、数据类型和值域等属性)映射,实现该字段的标准化(符

3在企业结构化数据中,还存在标签数据。

标签数据是主要反映客观对象的概括性特征,一般由客观对象的基础或指标数据按一定规则加工而成,因此通常被当作一种指标类数据来管理,但由于标签数据具有多变性、周期性、时效性且数量非常大,从管理实践上看与指标类数据还存在一定的差异。

合命名规则、数据类型和值域的规定);当其具备指标特征时,可直接将其与某一业务类别下的指标类数据元(如命名规则、约束规则、数据类型和值域等)映射,实现该字段的标准化(符合命名规则、约束规则、数据类型和值域的规定)。

图1银行业典型基础类数据标准和指标类数据标准

下面以银行业的数据标准分类为例进行数据元及其属性的说明。

1.银行间市场基础数据分类及数据元

银行间市场基础数据分类为参与方、产品、事件、公共数据、条件、风险控制,其类别及描述如表2所示。

表2银行间市场基础数据分类

基础数据分类

基础数据分类描述

参与方

与机构、用户等有关的数据元

产品

与市场、产品有关的数据元

事件

与交易、交易后相关的数据元

公共数据

与交易工具(包括货币、货币对、债券、

资产支持证券等)有关的数据元

条件

与交易时间段、节假日、起息日等有关的

数据元

风险控制

与限额、授信等有关的数据元

 

银行间市场基础数据的数据元具备相同的数据元属性,包括数据元中文名称、数据元英文名称、数据元标识符、说明、数据类型、取值、IMIX域名,数据元属性描述见表1。

以每一基础数据类别为例,在各类别下展示部分数据元。

如表3所示。

其中,可以注意到部分数据元属性的值包含数据元属性标准(如“基础数据类别”为“产品”时的“取值”,直接注明取值范围),部分数据元属性的值需引用其他标准(如“基础数据类别”为“产品”时的“说明”)。

表3银行间市场基础数据类别及数据元示例

 

基础数据类别

 

数据元

数据元属性

数据元中文名称

数据元英文名称

数据元标识符

 

说明

数据类

 

取值

 

IMIX域名

 

参与方

 

统一

社会

信用代码

 

统一社会信用代码

 

UnifiedSocialCredit:

Identifier

 

1218

按照GB32100-

2015规定,赋予每个法人和其他组织在全国范围内唯一的,终审不变的18位法定身份识别码

 

文本

 

PartySubID(JR/T00665一般以“Party”组件描述机构实体,以“Party”下的子组件“SubID”描述机构实体详细

信息)

 

产品

 

市场名称

 

市场名称

 

MarketName

 

0595

 

市场的名称

 

文本

债券市场、货币市场、衍生品市场、外汇市

 

 

事件

交易

模式名称

交易模式名称

TradingModeName

 

0760

 

交易模式的名称

文本

指令驱动、报价驱动、协商交易、

拍卖

 

公共数据

计算

方法

计算方

Calculation

Method

0177

即利息分配方式,

债券或其他证券

天数、频率

InterstAllocation

Method

利息或收益率的

计算规则

条件

交易

时段类型

交易时段类型

TradingSession

Type

0861

对交易时段的分类

文本

开市、开盘、停盘、复盘、

收盒、闭市

TradSesStatus

风险控制

检查

类型

检查类

CheckType

1051

系统进行授信关

系检查的方式

单向检查、

双向检查

2.银行经营管理指标数据分类及数据元

《银行经营管理指标数据元》(JR/T0137-2017)将银行经营管理指标数据分为基本信息、统计信息、口径信息、管理信息。

银行经营管理指标数据的数据元具备相同的数据元属性,包括名称、定义、约束规则、数据类型、值域、备注(见表4)。

表4银行经营管理指标数据元属性及其描述

数据元属性

数据元属性描述

名称

赋予数据元的单个或多个中文字词的指称,应按照GB/T18391.1-

2009中规定的数据元命名规范进行命名

定义

表达一个数据元的本质特性并使其区别于所有其他数据元的陈述

约束规则

数据元构成的应有或可有要求及其遵循规则

数据类型

用于表示数据元的符号、字符或其他表示的类型和格式需求,按照

JR/T0105给出的银行数据标准的数据类型进行定义

值域

数据元允许值的集合

备注

与该数据元相关的其他说明

以每一指标数据类别为例,在各类别下展示部分数据元,如表5所示。

表5银行经营管理指标数据类别及数据元示例

指标数据

类别

数据元

数据元属性

名称

定义

约束规则

数据类型

值域

备注

 

基本信息

 

指标编号

 

指标编号

指标的唯一识别编号,一经分配,不可变更

应有。

不可重复,宜定义统一的指标编号规

则,包括

 

编码类

 

 

编号的长度、编号的构成、各组成部分的业务含义、字符编码大小写敏感

要求等

 

统计信息

 

指标维度

 

指标维度

说明指标在统计时使用的机构、时间、币种等维度,可以是一个或

多个维度

应有。

列举维度名称,多个维度时用“,”分隔。

 

文本类

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 调解书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1