dm3-数据仓库和OLAP概述PPT推荐.ppt
《dm3-数据仓库和OLAP概述PPT推荐.ppt》由会员分享,可在线阅读,更多相关《dm3-数据仓库和OLAP概述PPT推荐.ppt(39页珍藏版)》请在冰豆网上搜索。
面向主题):
数据仓库总是围绕一些主题,如:
顾客,供应商,产品和销售组织。
数据仓库关注决策者的数据建模与分析,而不是集中于组织机构的数据仓库关注决策者的数据建模与分析,而不是集中于组织机构的日常操作和事务处理。
数据仓库排除对于决策无用的数据,提供特日常操作和事务处理。
数据仓库排除对于决策无用的数据,提供特定主题的简明视图。
定主题的简明视图。
integrated(集成)集成)数据仓库一般是将多个异种数据源,如关系数据库、一般文件和联数据仓库一般是将多个异种数据源,如关系数据库、一般文件和联机事务处理纪录,集成在一起。
使用数据清理和数据集成技术,确机事务处理纪录,集成在一起。
使用数据清理和数据集成技术,确保命名约定、编码结构、属性度量等的一致性。
保命名约定、编码结构、属性度量等的一致性。
time-variant(时变的)时变的)数据存储从历史的角度(例如过去数据存储从历史的角度(例如过去5-105-10年)提供信息,其中的关键年)提供信息,其中的关键结构,隐式或显式地包含时间元素。
结构,隐式或显式地包含时间元素。
nonvolatile(非易失的)非易失的)数据仓库总是物理地分离存放的数据;
这些数据源于操作环境下的数据仓库总是物理地分离存放的数据;
这些数据源于操作环境下的应用数据。
由于这种分离,数据仓库通常只需两种数据访问:
数据应用数据。
数据的初始化装入和数据访问。
的初始化装入和数据访问。
DataWarehousevs.OperationalDBMSOLTP(on-linetransactionprocessing)MajortaskoftraditionalrelationalDBMSDay-to-dayoperations:
purchasing,inventory,banking,manufacturing,payroll,registration,accounting,etc.OLAP(on-lineanalyticalprocessing)MajortaskofdatawarehousesystemDataanalysisanddecisionmakingDistinctfeatures(OLTPvs.OLAP):
Userandsystemorientation:
customervs.marketDatacontents:
current,detailedvs.historical,consolidated(统一)统一)Databasedesign:
ER+applicationvs.star+subjectView:
current,localvs.evolutionary,integratedAccesspatterns:
updatevs.read-onlybutcomplexqueriesOLTPvs.OLAP多维数据模型FromTablesandSpreadsheetstoDataCubesAdatawarehouseisbasedonamultidimensionaldatamodelwhichviewsdataintheformofadatacube(由维和事实定义由维和事实定义)Adatacube,suchassales,allowsdatatobemodeledandviewedinmultipledimensionsDimensions:
time,item,branch,locationDimensiontables,suchasitem(item_name,brand,type),ortime(day,week,month,quarter,year)Facttable(事实表事实表)containsmeasures(suchasdollars_sold销售销售款项款项)andkeystoeachoftherelateddimensiontables(事实是数事实是数值度量的值度量的,根据他们可以分析维之间的关系根据他们可以分析维之间的关系)Indatawarehousingliterature,ann-Dbasecubeiscalledabasecuboid(基本方体基本方体).Thetopmost0-Dcuboid,whichholdsthehighest-levelofsummarization,iscalledtheapexcuboid(顶点方体顶点方体).Thelatticeofcuboidsformsadatacube(数据立方体数据立方体).2-D数据立方体示例Vancouver每季度销售的商品维维time(按季度组织按季度组织)维维Item(按照所售商品的类型组织按照所售商品的类型组织)所显示的事实或者度量所显示的事实或者度量是是dollars_sold(单单位位:
$1000).Location=“Vancouver”Item(类型)家庭娱乐计算机电话安全Time(季度)Q1Q2Q3Q46056808129278259521023103814313038400512501580销售数据按照维销售数据按照维Time,item的的2-D视图视图3-D数据立方体示例Vancouver每季度销售的商品维维time(按季度组织按季度组织)维维Item(按照所售商品的类型组织按照所售商品的类型组织)维维Location(城市城市Chicago,Newyork,Toronto,Vancouver)所显示的事实或者度量是所显示的事实或者度量是dollars_sold(单单位位:
$1000).Time(季度)Q1Q2Q3Q4Location=“Vancouver”item家庭计算娱乐机电话安全6056808129278259521023103814313038400512501580销售数据按照维销售数据按照维Time,item,location的的3-D视图视图Location=“NewYork”item家庭计算娱乐机电话安全1087113010341142968102410481091384145548729251002984销售数据按销售数据按维维Time,item,location的的3-D立方立方体表示体表示Item(类型类型)LocationVancouverChicagoTorontoNewyork家庭娱乐计算机电话安全Time(季季度度)Q1Q2Q3Q460568081282595210231038927311430385808181087854591872623销售数据按照维销售数据按照维Time,item,location,supplier的的4-D数据立方体表示数据立方体表示Item(类型类型)LocationVancouverChicagoTorontoNewyork家庭娱乐计算机电话安全Time(季季度度)Q1Q2Q3Q460568081282595210231038927311430385808181087854591872623Item(类型类型)家庭娱乐计算机电话安全Supplier=“sup1”Supplier=“sup2”方体格研究文献中研究文献中,上面的所示的每个数据立方上面的所示的每个数据立方体称为一个体称为一个“方体方体(cuboid)”给定一个维的集合给定一个维的集合,可以构造方体的可以构造方体的格格(lattice),每个方体在不同的汇总级显每个方体在不同的汇总级显示数据示数据方体的格称为方体的格称为“数据立方体数据立方体”Cube:
ALatticeofCuboids(方体格)time,item,location,supplieralltimeitemlocationsuppliertime,itemtime,locationtime,supplieritem,locationitem,supplierlocation,suppliertime,item,locationtime,item,suppliertime,location,supplieritem,location,supplier0-D(apex)cuboid1-Dcuboids2-Dcuboids3-Dcuboids4-D(base)cuboidConceptualModelingofDataWarehouses(多维数据库模式)Modelingdatawarehouses:
dimensions&
measuresStarschema:
AfacttableinthemiddleconnectedtoasetofdimensiontablesSnowflakeschema:
Arefinementofstarschemawheresomedimensionalhierarchyisnormalizedintoasetofsmallerdimensiontables,formingashapesimilartosnowflakeFactconstellations:
Multiplefacttablessharedimensiontables,viewedasacollectionofstars,thereforecalledgalaxyschema(星系模式星系模式)orfactconstellation(事实星座事实星座)ExampleofStarSchemalocation_keystreetcityprovince_or_streetcountrylocationitem_keyitem_namebrandtypesupplier_typeitemtime_keydayday_of_the_weekmonthquarteryeartimeSalesFactTabletime_keyitem_keybranch_keylocation_keyunits_solddollars_soldavg_salesMeasuresbranch_keybranch_namebranch_typebranchExampleofSnowflake