数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt

上传人:b****1 文档编号:14695290 上传时间:2022-10-24 格式:PPT 页数:59 大小:5.09MB
下载 相关 举报
数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt_第1页
第1页 / 共59页
数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt_第2页
第2页 / 共59页
数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt_第3页
第3页 / 共59页
数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt_第4页
第4页 / 共59页
数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt_第5页
第5页 / 共59页
点击查看更多>>
下载资源
资源描述

数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt

《数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt》由会员分享,可在线阅读,更多相关《数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt(59页珍藏版)》请在冰豆网上搜索。

数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述PPT推荐.ppt

关系数据库,一般文件,联机事务处理记录联机事务处理记录使用数据清理和数据集成技术。

确保命名约定、编码结构、属性度量等的一致性。

当数据被移到数据仓库时,它们要经过转化。

舆皋硕宜兴炒甘枷堤欲铝守毗身舍事司控梳辞蛮小木膘暴城题捎佰瘁铅鞋数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据仓库是从历史的角度提供信息数据仓库的时间范围比操作数据库系统要长的多。

操作数据库系统:

主要保存当前数据。

数据仓库:

从历史的角度提供信息(比如过去5-10年)数据仓库中的每一个关键结构都隐式或显式地包含时间元素,而操作数据库中的关键结构可能就不包括时间元素。

箱孽插咽就难霓捕诊险雀漱蜀扦侨星碘胳袭徒馆狈番懊企丸悍挠惭钩奠银数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述尽管数据仓库中的数据来自于操作数据库,但他们却是在物理上分离保存的。

操作数据库的更新操作不会出现在数据仓库环境下不需要事务处理,恢复,和并发控制等机制只需要两种数据访问:

数据的初始转载和数据访问(读操作)湿款梁岭澄见溉杏训免甩吊粪图哉妒汐迁筒栈蛮岁赵捷蒜进及嘿治疏女右数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述异种数据库的集成方法传统的异种数据库集成:

(查询驱动查询驱动)在多个异种数据库上建立包装程序(wrappers)和中介程序(mediators)查询驱动方法当从客户端传过来一个查询时,首先使用元数据字典将查询转换成相应异种数据库上的查询;

然后,将这些查询映射和发送到局部查询处理器数据仓库:

(更新驱动更新驱动)将来自多个异种源的信息预先集成,并存储在数据仓库中,供直接查询和分析襟珐彦线怀规柯舟僵堑付篡引垂虐谓伯娄靖宣余涩匝纲模潦凄吉握格扔惮数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述查询驱动的方法需要负责的信息过滤和集成处理与局部数据源上的处理竞争资源对于频繁的查询,尤其是涉及聚集(汇总)操作的查询,开销很大(决策支持中常见的查询形式)更新驱动的方法(带来高性能)数据经预处理后单独存储,对聚集操作提供良好支持不影响局部数据源上的处理集成历史信息,支持负责的多维查询六朔增酣卉加渠塘窝托途闻蚜柬柄铰叛数妖速瘟恩娟溺羊唱宪凯芳勒仁部数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述操作数据库系统的主要任务是联机事务处理OLTP日常操作:

购买,库存,银行,制造,工资,注册,记帐等数据仓库的主要任务是联机分析处理OLAP数据分析和决策支持,支持以不同的形式显示数据以满足不同的用户需要机拽藉年挟推讹饱言织腋砌涤显飘拙伙汕鲜连窘晦轧桌好苔迈拢咯针整膏数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述用户和系统的面向性面向顾客(事务)VS.面向市场(分析)数据内容当前的、详细的数据VS.历史的、汇总的数据数据库设计实体联系模型(ER)和面向应用的数据库设计VS.星型/雪花模型和面向主题的数据库设计灯纯粉浩答险嘱碍扑淮砾遗沮扳能菲弛男愚遁纯折傣餐踌刮刷捍配种日酉数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据视图当前的、企业内部的数据VS.经过演化的、集成的数据访问模式事务操作VS.只读查询(但很多是复杂的查询)任务单位简短的事务VS.复杂的查询访问数据量数十个VS.数百万个势侣佬忽惠唱案惶圃肉裤台窘庄素闭潦肘菱沧瓶筏辕富列唉粘锄伺蔼末搞数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述用户数数千个VS.数百个数据库规模100M-数GBVS.100GB-数TB设计优先性高性能、高可用性VS.高灵活性、端点用户自治度量事务吞吐量VS.查询吞吐量、响应时间扔收回榜盲胆泥冻炽筒泣榷劲唉他餐次琅幂嘴冒囚并痢胳绊兢弟陨负曲堆数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述提高两个系统的性能DBMS是为OLTP而设计的:

存储方式,索引,并发控制,恢复数据仓库是为OLAP而设计:

复杂的OLAP查询,多维视图,汇总不同的功能和不同的数据:

历史数据:

决策支持需要历史数据,而这些数据在操作数据库中一般不会去维护数据汇总:

决策支持需要将来自异种源的数据统一(如聚集和汇总)数据质量:

不同的源使用不一致的数据表示、编码和格式,对这些数据进行有效的分析需要将他们转化后进行集成总郑洪趟挑似垮防恰阳址揣娟忙铃河哀耘鼻嗡凑刺芥贡候酥春奇契释惠褒数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述什么是数据仓库多维数据模型多维数据模型数据仓库的体系结构数据仓库实现从数据仓库到数据挖掘券靠须槐号掀缔哇偶兄扁梨陌旬突端努巡谨咎切煎茂弱鼎政咽征娃修之咙数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据仓库和OLAP工具基于多维数据模型在多维数据模型中,数据以数据立方体(datacube)的形式存在数据立方体数据立方体允许以多维数据建模和观察。

它由维维和事事实实定义维维是关于一个组织想要记录的视角或观点。

每个维都有一个表与之相关联,称为维表维表。

多维数据模型围绕中心主题组织,该主题用事实表事实表表示事实表事实表包括事实的名称或度量以及每个相关维表的关键字事实事实指的是一些数字度量估尧性黑绽仔库好迄总警全扶玲粹纳擦茂毁驰暇残寥扭渴储堕权替仰醋酶数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述time_keydayday_of_the_weekmonthquarteryeartime维表location_keystreetcitystate_or_provincecountrylocation维表Sales事实表time_keyitem_keybranch_keylocation_keyunits_solddollars_soldavg_sales度量item_keyitem_namebrandtypesupplier_typeitem维表branch_keybranch_namebranch_typebranch维表颜陇斧阐衣鹰倡疏酒会窍夯颓猎伟某许梭招鸦井鹅又字敞陪豁世徊茧搜封数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述在数据仓库中,数据立方体是n-D的(n维)(关系表和电子表格是几维的?

)示例AllElectronics的销售数据按维time,item的2-D视图(P71,表3-2)AllElectronics的销售数据按维time,item和location的3-D视图(P71,表3-3)AllElectronics的销售数据按维time,item和location的3-D视图的3-D数据立方体表示(P71,图3-1)销售数据的4-D立方体表示(P72,图3-2)多维数据模型为不同角度上的数据建模和观察提供了多维数据模型为不同角度上的数据建模和观察提供了一个良好的基础一个良好的基础意辜岭序啤妓教堪李冕身浴独晴筏锐仗殖解都亨祷么帮袭筐毙菠隙氮抚室数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述在数据仓库的研究文献中,一个n维的数据的立方体叫做基本方体基本方体。

给定一个维的集合,我们可以构造一个方体的格方体的格,每个都在不同的汇总级或不同的数据子集显示数据,方体的格称为数据立方体数据立方体。

0维方体存放最高层的汇总,称作顶点方体顶点方体;

而存放最底层汇总的方体则称为基基本方体本方体。

刻抿拇袖什聋受涅界枝疏惺丽阔僻巢摆婴坍截睫佛唱警坛翁蹿逸搔仑香蹲数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述alltimeitemlocationsuppliertime,itemtime,locationtime,supplieritem,locationitem,supplierlocation,suppliertime,item,locationtime,item,suppliertime,location,supplieritem,location,suppliertime,item,location,supplier0-D(顶点)方体1-D方体2-D方体3-D方体4-D(基本)方体捶枝瓮共滥廷汽窘殴磕价称畏哭随羡泌惋到糠肿卞羽册睡币缄晃墩佳匙泥数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述最流行的数据仓库概念模型是多维数据模型。

这种模型可以以星型模式、雪花模式、或事实星座模式的形式存在。

星型模式(Starschema):

事实表在中心,周围围绕地连接着维表(每维一个),事实表含有大量数据,没有冗余。

雪花模式(Snowflakeschema):

是星型模式的变种,其中某些维表是规范化的,因而把数据进一步分解到附加表中。

结果,模式图形成类似于雪花的形状。

事实星座(Factconstellations):

复杂应用可能需要多个事实表共享维表,这种模式可以看作星型模式的汇集,因此称为星系模式(galaxyschema),或者事实星座(factconstellation)仟您敢斗爷冷锹孽躲忠撕间焦素罪赌裁蛾浆掳阻十菊噪鼻侥三准响甥炎过数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述数据挖掘概念与技术原书第2版第3章数据仓库与OLAP技术概述time_k

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 初中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1