利用数据仓储实现数据智能查询.docx
《利用数据仓储实现数据智能查询.docx》由会员分享,可在线阅读,更多相关《利用数据仓储实现数据智能查询.docx(6页珍藏版)》请在冰豆网上搜索。
利用数据仓储实现数据智能查询
利用数据仓储实现数据智能查询
地质大队
王瑞
2010年9月
利用数据仓储实现数据智能查询
王瑞
(大庆油田第八采油厂地质大队)
摘要:
油田开发的数据来源多且不规范,在一些互不联系的系统分析、设计人员在分散独立的开发应用系统时,由于数据库的不统一性,使得不同的应用部分之间的信息共享专门难进行。
如此就阻碍了数据的共享应用。
因此要对数据源进行整合,规范尽量向PCEDM模型靠近,使各系统之间能够快速共享数据,方便查询。
主题词:
数据仓储信息域数据泵出
1问题在提出
随着油田信息化的不断深入,数据资源的累积越来越多,由于数据库的分散和不统一,使得一些互不联系的数据库访问查询时,系统查询速度特不缓慢,如此就阻碍了数据的共享应用,阻碍了信息化进程的开展。
而数据仓储概念在提出和应用,将油田各个专业的数据库集中到一个平台上共享应用。
再结合油田正在应用在PCEDM数据模型和往常在用的数据库逻辑结构的特点,进行数据查询智能开发,使得油田各专业岗位业务人员能够依照不同的业务需要,在不了解数据库结构的情况下通过简单的鼠标拖动快速进行数据库查询、统计。
2什么是数据仓储
数据仓储是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,数据仓储技术定义了能够使该数据更容易访问的策略。
2.1数据仓储在特点
1)数据仓储是面向主题的;
2)数据仓储是集成的,数据仓储的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出;
3)数据仓储是可更新的,数据仓储要紧是为决策分析提供数据,所涉及的操作要紧是数据的查询;
4)数据仓储是随时刻而变化的,传统的关系数据库系统比较适合处理格式化的数据;
2.2数据仓储实现方式
数据仓储是一个过程而不是一个项目。
数据仓储系统是一个信息提供平台,他从业务处理系统获得数据,要紧以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中猎取信息和知识。
从功能结构化分,数据仓储系统至少应该包含数据猎取(DataAcquisition)、数据存储(DataStorage)、数据访问(DataAccess)三个关键部分。
企业数据仓储的建设,是以现有业务系统和大量业务数据的积存为基础。
数据仓储不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。
而把信息加以整理归纳和重组,并及时提供给相应的治理决策人员,是数据仓储的全然任务。
因此,数据仓储建设是一个工程,是一个过程。
2.3数据仓储与数据库的区不
数据仓储的出现,并不是要取代数据库。
目前,大部分数据仓储依旧用关系数据库治理系统来治理的。
能够讲,数据库、数据仓储相辅相成、各有千秋。
数据库是面向事务的设计,数据仓储是面向主题设计的。
数据库一般存储在线交易数据,数据仓储存储的一般是历史数据。
数据库设计是尽量幸免冗余,一般采纳符合范式的规则来设计,数据仓储在设计是有意引入冗余,采纳反范式的方式来设计。
数据库是为捕获数据而设计,数据仓储是为分析数据而设计,它的两个差不多的元素是维表和事实表。
3实现数据仓储之间关联
3.1石油信息共享数据源
油田开发的数据来源多且不规范,同时各路的数据填写标准也不近相同,要对数据源进行整合,规范尽量向PCEDM模型靠近。
3.2建立信息域
1)结合用户专业需求创建用户信息域,将表中的各数据项按用户适应进行数据组合和数据关联。
业务人员基于信息域构建查询和报表就不需要明白得数据库的结构和表关联;
2)能按用户适应,对数据库信息进行分类治理;
3)预建表关联(以后做查询、报表不必再建)依照PCEDM数据结构和油田开发业务特点,建立了以well_id为主键的所有单井各类数据表之间的关联关系,并通过实体与well_id之间的隶属关,建立了各单井表与所有含矿、队、站、油田、区块等实体的表之间的关联关系。
为油田开发技术人员创建一个简单直观的数据应用界面,用户只需要拖动数据项不需要关怀数据数据库内部结构;
4)将复杂统计表达式作为单个对象,象使用字段一样方便查询和做报表;
5)实现单点更新,修改一处,更新全部.
6)代码转换
PCEDM数据库在创建过程中大量用到随机码做主键同时也用到了专门多代码项这些用户专门难看明白,对所有代码进行转换,在系统中为最终用户展示的完全是转换后的信息。
4利用数据仓储实现智能查询及实例
4.1定时数据泵出
依照源数据更新时刻,定时将更新的数据泵到数据仓储中。
4.2数据注释
按照油田的技术术语对关于200多个数据表中的几千个英文数据项都转译为汉字名称。
创建油田开发语义层
结合用户专业需求创建用户信息域,将表中的各数据项按用户适应进行数据组合和数据关联。
业务人员基于信息域构建查询和报表就不需要明白得数据库的结构和表关联。
4.3智能查询
智能查询是指依照实际业务需要,定义查询对象并从数据库中检索出需要的数据的过程.同时在查询过程中完成对数据的清洗过滤转换等,得到用户最终需要的数据.
1)可基于数据源、信息域、SQL语句、已生成的查询、文件、Excel和数据库存储多种方式进行查询,无需编程;
2)一个查询能同时跨多个数据源如Oracle、SQL、DB2、Informix、Progress、Sybase等RDBMS;(此功能一般来讲适合与IT或信息部有数据库使用权限的人员使用,业务人员通常是差不多信息域(或业务视图)做查询)
3)在查询内支持脚本编写;
4)可视化编辑查询条件,条件编辑过程使用自然语言;
5)查询数据结果包括查找、过滤器、输入参数、升降排序等;
6)查询结果的数据格式设置;
7)查询结果界面可灵活设计其界面美工,用户可完全DIY
8)设置查询参数功能,不同参数刷新不同数据,同时参数界面能够自定义设计,能满足所有查询参数界面的设计;
9)具有强大的示警功能,能基于预定条件发出预警e-mail、windowsmessage、启动其它系统等示警功能,
10)设有独立打印机,查询结果导出打印时可不能变形;
11)查询结果可输出为MicrosoftExcel、Pdf、Html和Txt等常用格式;
12)能在Web界面中调用其它ActiveX控件,例如WinFax、WindowsMediaPlayer等等,大大加强了展示和系统功能,已远超于一般查询的功能范围。
13)减少查询交互,关于<5000行数据的查询,将一次从服务器返回全部数据,减少前后端交互,近一步提升性能。
4.4构建智能查询的方式
基于智能查询构造器建立查询
基于智能查询构造器建立查询是最常用的查询方式,操作方法简单,只要通过简单的鼠标拖拉方式即可完成各种简单或复杂的查询。
4结论
建立数据仓储是为了填补现有数据存储形式差不多不能满足信息分析的需要。
数据仓储给组织带来了巨大的变化。
数据仓储的建立也给我们带来了一些新的工作流程,通过构造一种体系化的数据存贮环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、统一的信息。
通过数据仓储建立数据库的整合平台,实现数据的智能查询。
提供5万集治理视频课程下载,详情查看:
...../zz/
提供2万GB高清治理视频课程硬盘拷贝,详情查看:
...../shop/
2万GB高清治理视频课程目录下载:
...../12000GB.rar
高清课程可提供免费体验,如有需要请于我们联系。
咨询电话:
020-.
值班手机:
.
网站网址:
....