元数据管理项目工程实施方案.docx

上传人:b****6 文档编号:3834833 上传时间:2022-11-25 格式:DOCX 页数:19 大小:389.14KB
下载 相关 举报
元数据管理项目工程实施方案.docx_第1页
第1页 / 共19页
元数据管理项目工程实施方案.docx_第2页
第2页 / 共19页
元数据管理项目工程实施方案.docx_第3页
第3页 / 共19页
元数据管理项目工程实施方案.docx_第4页
第4页 / 共19页
元数据管理项目工程实施方案.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

元数据管理项目工程实施方案.docx

《元数据管理项目工程实施方案.docx》由会员分享,可在线阅读,更多相关《元数据管理项目工程实施方案.docx(19页珍藏版)》请在冰豆网上搜索。

元数据管理项目工程实施方案.docx

元数据管理项目工程实施方案

 

xx移动

元数据管理项目工程实施方案

 

2012年5月

 

1建设目标

依据《中国移动通信集团xx经营分析系统元数据管理项目采购书》所制定的项目目标,本项目致力于解决现有经分系统中元数据管理的问题,即经营分析系统核心元模型的建立、两级经营分析系统元数据互通、扩充元数据服务接口、提升基础元数据支撑能力,并能满足移动集团总部NG2-BASS3.5元数据管理相关标准的要求。

具体而言,通过本次项目实现如下目标:

●实现元数据基本管理功能

提供方便、友好的图形化元数据管理工具,实现对元数据的获取、维护、查询、变更、统计、导入等基本功能。

●实现一二级元数据互通功能

生成一级经营分析系统重点接口的数据处理过程元数据的管理,基于互通元数据接口标准实现重点接口元数据的下发和重点接口数据处理过程元数据的上传,促进两级系统对重点接口统一理解和数据处理过程标准化。

●实现元数据的分析功能

实现元数据的血缘分析及影响分析功能,实现元数据的数据地图展现功能,以拓扑图的形式对经营分析系统的各类数据实体、数据处理过程元数据进行分层次的图形化展现,并通过不同层次的图形展现粒度控制,满足开发、运维或者业务上不同应用场景的图形查询和辅助分析需要。

2系统环境配置

系统环境配置包括客户端和服务器端的平台软件、硬件配置和网络配置要求。

这些配置要求与系统负荷有关。

2.1客户端环境配置

配置项

配置要求

硬件配置

客户端主机

业界主流CPU/2GB内存/20GB剩余硬盘空间/100M网卡

软件配置

操作系统

Windows2000/Windows2003/WindowsXP/

WindowsVista/Windows7

浏览器

IE6/IE7/IE8/IE9

2.2服务器端环境配置

配置项

数量

配置要求

硬件配置

数据库服务器主机〔1台〕

1

4CPU/8GB内存/500GB硬盘/

100M网卡以上

应用服务器主机〔1台〕

1

4CPU/8GB内存/100GB硬盘/

100M网卡以上

元数据管理终端

1

2CPU/4GB内存/20GB硬盘/

100M网卡以上

软件配置

应用服务器操作系统

1

〔以下任选其一,推荐使用Unix系统〕

Unix、Linux;

MicrosoftNT4.0SP6/2000ServerSP3/2003Server

应用服务器

1

Tomcat及以上版本

JDK

1

JDK及以上版本

数据库

1

〔以下任选其一,推荐使用Oracle10g〕

Oracle9i/10g/11g

DB28.2及以上版本

元数据管理终端操作系统

1

MicrosoftNT4.0SP6/2000ServerSP3/2003Server

注:

1、数据库服务器和应用服务器可共用一台主机

2、元数据管理终端用于进行MIB-Client、MOConsole等元数据管理客户端的操作

2.3网络配置

以下是元数据管理系统的网络配置图,其中的服务器是按逻辑功能划分的,可以分别部署在两台主机上,或者共用一台主机。

3元数据管理范围

在项目建设过程中,我们将针对xx移动现场情况。

管理技术,业务,管理类3大类元数据。

●技术元数据主要包括:

外部数据源接口,数据仓库DB〔Teradata/Oracle〕,ETL,存储过程,建模元数据等。

●业务元数据包括:

维度,基础编码,指标,业务术语,业务规则,业务描述等。

●管理元数据包括:

系统资源、人员管理,任务管理,需求流程管理、文档管理等。

详细范围分类如下表:

应用模块

具体功能分类

子功能

备注

建设阶段

元数据

实体管理

技术元数据

数据源接口

按业务源系统分类组织

模板整理,批量导入

数据仓库DB

按照现有系统组织

自动获取

ETL应用程序〔作业〕

按作业用途分类

自动获取,视现场情况部分模板导入

逻辑模型

按数据流向的层次分类

自动获取,视现场情况部分模板导入

业务元数据

维度元数据

根据业务梳理

模板整理,批量导入

基础编码

根据业务梳理

模板整理,批量导入

指标元数据

根据业务梳理

模板整理,批量导入

业务术语、业务规则、业务描述

根据业务梳理

模板整理,批量导入

管理元数据

管理流程定义

按需梳理

模板整理,批量导入

项目团队〔部门〕人员、角色定义

按需梳理

模板整理,批量导入

系统、主机、运行环境管理

按需梳理

模板整理,批量导入

元数据

关系梳理

技术元数据

数据库表DB实体间字段级关系梳理

按数据流关系梳理

解析sql日志工具接口解析

ETL映射关系梳理

根据工具解析,或者约定解析sql日志。

自动解析或者日志解析,或者手工整理

接口与库表之间关系梳理

按照数据流关系梳理

自动解析或者日志解析,或者手工整理

业务元数据

各类业务元数据关系梳理

按照业务数据流向梳理

自动解析或者模板整理导入

管理元数据

管理流程定义关系梳理

按照管理关系梳理

模板整理导入

项目团队〔部门〕人员、角色关系梳理

按照实际关系梳理

模板整理导入

运行环境管理关系梳理

按照实际关系梳理

模板整理导入

元数据

应用

基础功能应用

图形分析功能

血缘分析、影响分析、数据地图展现、主机拓扑、关联分析、一致性分析

元数据查询

查询功能

元数据导入导出

导入导出功能

元数据质量管理

元数据质量管理功能

两级元系统互通

两级经营分析系统元数据互通功能

应用扩展能力

XMI格式的接口

REST风格接口

MOI接口

4项目实施计划

4.1建设规划

xx移动元数据项目建设,按照项目分4个阶段进行:

⏹第一阶段:

需求调研阶段,预计10个工作日;

⏹第二阶段:

建设阶段,预计40个工作日;

⏹第三阶段:

上线阶段,预计15个工作日;

⏹第四阶段:

运维阶段,预计200个工作日。

项目规划及人员安排列表

需求调研阶段

建设阶段

上线阶段

运维阶段

工作量估算

10个工作日

40个工作日

15个工作日

200个工作日

工作内容

需求调研

元数据建设规划

元模型规划

系统搭建

元数据梳理

导入元数据

系统测试

系统试用

用户培训

系统维护

系统运行维护

元数据更新

元数据定制开发

阶段性成果

需求调研说明文档

元数据建设规划文档

元数据模型说明文档

元数据项目计划文档

元数据说明文档

元数据源文件介质

元数据应用系统

用户使用培训

用户使用手册

系统维护手册

系统运行情况报告

元数据更新报告

定制开发功能文档

xx

移动

项目经理1人

-管理协助

项目经理1人

-管理协助

项目经理1人

-管理协助

项目经理1人

-管理协助

皓竹

公司

项目经理1人

需求调研人员1人

项目经理1人

实施人员1-2人

项目经理1人

实施人员1-2人

实施人员1人

开发人员1-4人

4.2时间安排

⏹第一阶段:

2012年6月11日至6月22日;

⏹第二阶段:

2012年7月2日至8月24日;

⏹第三阶段:

2012年8月27日至9月14日;

⏹第四阶段:

2012年9月17日至2013年6月21日;

备注:

时间安排以项目启动时间为准

4.3产品部署

项目正式启动后,皓竹公司安排工程师到场按照产品模式进行产品部署、产品介质交付。

根据产品安装步骤进行完整部署。

对部署好的产品进行现场基础数据导入,参数配置,联调,启动运行,确保产品正常运行。

4.4元模型定制

xx移动元数据项目建设前期,根据系统需求文档以及前期与客户进行的需求调研来确定各类信息资源标准,然后根据确定的信息资源标准来进行分类,并确定各类标准的元模型。

相关调研过程由厂商,客户协助,元模型的定制由皓竹主导完成。

元模型,即定义元数据的模型,元模型的定义遵循标准化、国际化的CWM模型〔CommonWarehouseMetamodel〕,并且元模型具有可完全扩展、主流开放性〔100%JAVA)的特点,最终形成《xx移动元数据模型设计》,需由xx移动、厂商、皓竹三方最终评审确定。

元模型基本包括以下几大类:

●管理类〔包括系统资源、人员管理、任务管理、需求流程管理、运行环境管理、文档管理〕;

●技术类〔关系型数据库、OLAP、接口模型、ETL模型、erwin模型〕;

●业务类:

指标、KPI、报表等元模型;

●编码模型:

信息分类及编码模型

视建设过程中如有需要扩展的,可进行元模型的扩展。

最终形成由皓竹元数据软件生成的符合CWM标准的XML元数据模型。

4.5元数据存储

按照标准项目实施步骤,在需求调研后,皓竹根据与集成商、客户协商约定的元模型标准定制好元模型后,接下来的工作是现场各类元数据的存储。

元数据存储过程流图

4.5.1技术类元数据存储

对于元数据的存储,皓竹目前成熟的方式为:

●工具接口自动抽取;

●模板整理批量导入;

技术元数据包括:

关系型数据库DB、OLAP、接口模型、ETL模型、erwin模型。

4.5.1.1关系型数据库元数据

皓竹已经有对主流数据库元数据的自动获取方式,此部分元数据可以直接获取。

皓竹能自动获取的数据库为:

Oracle,DB2,Teredata,Sqlserver,sybase等库。

●实现前提:

ØRDB元模型制定完成;

Ø相关厂商提供读取数据库或者表结构的视图权限,提供相关的连接方式。

Ø皓竹对MIB工具相应接口进行读取参数配置。

●实现方式:

通过MIB配置数据源,作业,执行作业自动抽取即可生成数据仓库DB实体元数据。

4.5.1.2OLAP元数据

皓竹已经有对主流OLAP工具的自动获取方式,如Cognos工具的OLAP元数据,此部分元数据可以自动获取实现。

●实现前提:

ØOLAP元模型制定完成;

Ø相关厂商提供读取Cognos数据源链接方式,相关权限。

Ø皓竹对MIB工具相应接口进行读取参数配置。

●实现方式:

通过MIB配置数据源,作业,执行作业自动抽取即可生成OLAP相关元数据。

●备注:

如现场使用的是Cognos之外的多维分析工具,皓竹采用导出模板,指导厂商按照整理模板梳理OALP元数据,批量导入元数据库。

●以上方式除存储元数据实体外,关系维护也同时生成。

4.5.1.3ETL元数据

皓竹能提供对ETL主流工具datastage,Informatica的自动解析获取元数据功能。

1.ETL工具元数据实现部分

●实现前提:

ØETL元模型制定完成;

Ø相关厂商提供读取数据源的链接方式,或者提供ETL工具转换生成的xml格式的设计文件。

Ø皓竹对MIB工具相应接口进行读取参数配置。

●实现方式:

通过MIB配置数据源,作业,执行作业自动抽取即可生成ETL元数据。

实体以及关系同步生成。

●如果自动解析实现效果不佳,根据现场情况考虑模板补充整理,批量导入的方式实现。

2.数据处理过程ETL元数据实现部分〔存储过程〕

●实现前提:

ØETL元模型制定完成;

Ø皓竹与相关厂商约定存储过程执行Sql日志,厂商按照要求给出。

Ø皓竹对MIB工具相应接口进行读取参数配置。

●实现方式:

通过MIB配置数据源,作业,执行作业自动抽取即可生成ETL元数据。

实体和关系同步生成。

4.5.1.4模型元数据

皓竹能提供对建模主流工具Erwin,PowerDesigner建模元数据的自动获取元数据功能。

1.Erwin或者PowerDesigner工具元数据实现部分

●实现前提:

ØER元模型制定完成;

Ø相关厂商提供通过以上提到的两类建模工具建模后,通过工具转换导出的xml格式文件。

Ø皓竹对MIB工具相应接口进行读取参数配置。

●实现方式:

通过MIB配置数据源,作业,执行作业自动抽取即可生成建模元数据。

4.5.2业务元数据存储

对于业务元数据的存储,皓竹目前成熟的方式为:

●工具接口自动抽取;

●模板整理批量导入;

业务元数据包括:

业务类指标、维度、基础编码,业务规则,术语等。

自动获取的业务指标工具:

皓竹支持arcplan,Cognos_Report,MSTR等报表工具元数据自动获取。

说明:

由于业务指标,以及业务类的规则,维度,编码,术语等业务元数据都是跟业务紧密相连,都是在建设和业务提升中不断积累所得,所以此块的元数据一般都不规则化,一般都是使用根据调研确定的信息资源分类,提炼出特定的元模型,然后皓竹提供导入模板。

厂商按照模板整理相关元数据,然后批量导入元数据库中。

实体和关系同步生成。

4.5.2.1业务指标元数据

业务指标工具设计类的存储实现方式如下:

●实现前提:

Ø指标元模型制定完成。

Ø皓竹从元数据系统生成指标整理模板。

Ø皓竹对对应系统厂商进行整理培训。

Ø厂商按照要求梳理指标元数据。

●实现方式:

通过MIB配置XLS数据源,作业,执行作业将梳理好的指标元数据批量导入系统。

其他工具〔不支持自动提取〕实现的报表指标,都采用模板批量整理,批量导入元数据库。

实体和关系同步生成。

4.5.2.2业务规则&术语元数据

业务规则,术语元数据存储实现方式如下:

●实现前提:

Ø根据调研信息资源分类规则,业务规则、术语元模型制定完成。

Ø从元数据系统导出整理模板。

Ø相关厂商按照模板要求梳理业务规则,术语元数据。

Ø皓竹对MIB工具XLS接口进行读取参数配置。

●实现方式:

通过MIB配置数据源,作业,执行作业自动抽取即可生成业务规则,术语相关元数据。

4.5.2.3维度&基础编码元数据

维度,基础编码元数据存储实现步骤如下:

●实现前提:

Ø根据调研信息资源分类规则,维度,基础编码元模型制定完成。

Ø从元数据系统导出整理模板。

Ø相关厂商按照模板要求梳理维度,基础编码元数据。

Ø皓竹对MIB工具XLS接口进行读取参数配置。

●实现方式:

通过MIB配置数据源,作业,执行作业自动抽取即可生成维度,基础编码相关元数据。

4.5.3管理类元数据存储

由于管理类元数据都是根据每个企业自身管理制度以及管理方式产生的元数据,所以此块的元数据一般都是文档化的,一般都是使用根据调研确定的信息资源分类,提炼出特定的元模型,然后皓竹提供导入模板。

厂商按照模板整理相关元数据,然后批量导入元数据库中。

实体和关系同步生成。

管理类元数据包括系统资源、人员管理,任务管理,需求流程管理、文档管理等。

此块元数据的存储实现步骤为:

●调研定制元模型,与客户确认。

●在元数据中生成元数据整理模板。

●厂商和客户根据模板要求整理相关元数据和关系。

●皓竹将相应元数据通过MIB工具批量导入。

4.6建立日常管理流程

项目在初期进行了产品部署,元数据的存储后。

在试运行稳定的情况下,需要根据客户项目的管理制度流程以及实际情况,摸索出一套符合xx移动的日常元数据管理流程方法。

在本章节中提供一套皓竹实施的元数据维护流程方案供参考。

元数据的日常管理流程,主要结合客户的管理习惯结合元数据系统中用户的使用权限以及元数据中变更影响管理的功能,来实现对元数据管理系统中,元数据的增加,删除,修改等操作的维护流程。

4.6.1元数据权限管理

元数据管理系统中的用户,在元数据的操作都有严格的的限制,这个是通过创建用户的时候,赋予不同的角色,来实现对不同用户的权限的限制,例如:

当一个用户的登录元数据的管理系统的角色是系统浏览者的时候,那么此用户对系统只有浏览的权限,而没有修改的权限等等。

又如:

当此用户只有对指标部分的操作权限的时候,他只能对元数据管理系统中的指标部分数据进行操作,而对其他接口等部分数据就没有操作权限。

通过这种赋予不同权限,来实现对元数据的维护的一个管理。

4.6.2通过元数据变更流程进行维护管理

元数据管理系统中,除了可以使用权限来控制元数据的维护之外,还有通过元数据管理系统中的变更影响功能来进行元数据维护管理。

其主要实现步骤如下:

首先,元数据管理系统中,已经分配了相关的主要维护人。

如果需要修改元数据管理系统中的元数据,必须得到这些维护人的审核才可以进行,当操作者需要对元数据管理系统中的某个元数据进行修改的时候,会提交一个申请给相关的维护人,维护人通过元数据管理系统中的血统分析,影响分析等功能,来判断所提交的申请变更的元数据,是否会对别的元数据产生重大的影响。

然后,根据判断结果,返回给操作者,是否可以对此元数据进行修改。

4.6.3元数据同步维护

4.6.3.1业务元数据同步维护

业务元数据的同步,主要指手工录入的方式,对元数据管理系统的业务元数据,例如:

KPI指标,业务规则等数据进行更新。

通过我们提供的规定的业务元数据整理模板,然后根据模板来填写相应的数据,可以批量的对指标的数据的录入与更新。

当数据仓库中的相关业务元数据发生变化的时候,那么元数据管理系统中的数据也要随之同步更新。

建议分以下步骤走:

Ø业务人员提出业务元数据发生变化。

Ø需求评审,确认,设计。

Ø厂商在生产系统中实现。

Ø厂商相关人员提交元数据变更申请。

Ø局方确认。

Ø元数据梳理,客户对梳理内容确认。

Ø变更元数据入库。

业务元数据同步维护流程图

4.6.3.2管理元数据同步维护

管理元数据同步,与业务元数据的同步过程很一样,也是从通过填写导入模板来实现接口文件的数据的批量的录入。

当相关的管理元数据发生变化的时候,那么元数据管理系统中的数据也要随之同步更新。

4.6.3.3元数据同步维护

ETL程序的同步,工具部分的ETL发生变化后,此部分元数据可以通过集成商或者客户确认更新后,元数据维护工程师接到变更要求后,由维护工程师执行MIB,将相应变更元数据通过MIB自动解析入库。

数据处理过程中的相关ETL〔存储过程〕,此部分在元数据建设调研期,就需要和厂商约定好存储过程执行时输出符合解析要求的sql日志。

然后皓竹配置MIB数据源,作业,定期执行即可保持与生产系统的元数据同步。

ETL元数据变更维护流程图

4.6.3.4库表结构元数据同步维护

库表结构元数据的同步维护,我们实现的主要的方式是通过我们的库表抽取程序,来对库表中的结构进行抽取,而且也是可以根据实际的需要,自动的对数据库表中的结构进行抽取。

当数据仓库中的相关库表结构发生变化的时候,可以以定期同步的方式,通过自动调度任务来实现库表结构元数据的同步维护。

4.6.3.5Erwin元数据同步维护

Erwin数据同步,主要是通过向元数据管理系统中导入Erwin工具生成的xml文件,从而实现对元数据的Erwin的数据的更新。

4.7元数据交付、培训

在项目完成产品部署,以及现场客户使用需求完成元模型定制,元数据的基础存储后。

按照项目产品稳定运行要求后。

皓竹进行元数据项目实施后的交付。

项目交付包括以下工作:

●元数据项目实施阶段成果汇报。

●元数据产品培训,功能培训。

●元数据日常维护培训。

4.8元数据管理应用定制

根据xx移动前期元数据的建设和使用情况,进行元数据应用定制开发,使得元数据融入xx移动项目开发生产过程。

促使元数据项目与数据仓库项目结合更紧密,充分发挥元数据建设价值。

说明:

具体的元数据管理应用定制开发,视项目情况和现场应用需求而定。

5元数据建设中需要的配合工作

为保证元数据项目建设过程中的效率,以及实施质量,需要集成商以及移动进行以下配合工作。

元数据建设相关配合说明

主要任务

细节要求

负责方

协调方

备注

项目调研

项目建设整体要求调研

厂商负责人

移动

皓竹主导元数据建设前期建设需求调研,移动协调相关厂商负责人参与。

管理范围

元数据管理范围确定

厂商负责人

移动

经三方确定下元数据管理范围。

元模型

定制

各类元模型定制

厂商负责人

移动

皓竹在调研后主导元模型定制,移动相应负责人需与厂商相应负责人参与定制并确认元模型定制的合理性。

元数据存储

DB元数据数据源链接方式,权限提供

厂商负责人

移动

厂商负责人提供要抽取的数据库的数据源链接方式,权限。

建模元数据提供

厂商负责人

移动

厂商提供建模工具生成的xmi格式文件。

接口文件元数据梳理

厂商工程师

移动

皓竹指导整理过程,厂商梳理相关元数据。

OLAP元数据获取信息提供

厂商工程师

移动

厂商提供数据源信息。

ETL元数据数据源信息提供

厂商工程师

移动

厂商提供数据源信息。

数据处理过程输出日志改造

厂商工程师

移动

厂商按照皓竹的要求改造输出sql日志。

数据处理过程元数据整理

厂商工程师

移动

不符合自动解析要求部分,厂商需要按照标准模板整理。

业务类元数据整理

厂商工程师

移动

业务元数据,厂商按照模板要求梳理,皓竹指导梳理。

管理类元数据整理

厂商工程师

移动

对管理类元数据,厂商按照模板要求梳理,皓竹指导梳理。

6备份策略

元数据管理系统有单独的存储库,存储库类型为oracle。

为确保数据安全,防止数据丧失,元数据管理系统每周日自动备份存储库,将存储库数据全备为dmp文件。

导出oracle数据库文件的同时,将文件多备份一份到其它服务器。

为节约磁盘空间,每半年系统自动清理dmp文件,只保留最新的备份文件。

当发生数据误删或灾难性事故,通过最近的dmp文件来恢复元数据管理系统的数据。

导出dmp文件命令:

expuser/password@db_namefile=xxx/metaone.dmp;

导入dmp文件命令:

impuser/password@db_name file=xxx/metaone.dmp;

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1