ImageVerifierCode 换一换
格式:PPT , 页数:51 ,大小:2.46MB ,
资源ID:14647424      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/14647424.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据仓库解决方案概述电信业PPT资料.ppt)为本站会员(b****1)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据仓库解决方案概述电信业PPT资料.ppt

1、,信 息,INFORMATION,DW/BI 在电信行业的应用-小结什么是数据仓库(Data Warehouse)?,决策支持应用,数据仓库的实际构造示意图,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,Sybase数据仓库相关产品的技术构成,Relational,Package,Legacy,Externalsource,DataCleanTool,Source Data,DataStaging,WareHouseAdmin.Tools,Enterprise DataWa

2、rehouse,Data Extraction,Transformationand load,Datamart,Datamart,Enterprise/Central DataWarehouse,RDBMSROLAP,RDBMS,RDBMS,Star Schema,ArchitectedDatamarts,CentralMetadata,Local Metadata,Local Metadata,Sybase数据仓库相关产品介绍,一个集成化的产品集,集成的主要产品,IntegrateEnterprise ConnectReplication ServerPowerMart,DesignWare

3、house Architect,ManageSybase ASIQ,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,设计:成功的关键,数据库的设计对数据仓库系统的整体性能、装载和建立索引的时间以及数据量的增长等的影响超过任何其它方面。,数据仓库设计工具WarehouseArchitect,为数据仓库的设计提供三大功能:多维建模度量、维、属性事实表,维表维层次表,事实层次表设计向导聚合(Aggregation Wizard)分区(Partitioning Wizard)逆向工程

4、数据源优化代码生成目标数据仓库引擎(IQ,RDBMS)OLAP分析环境,设计:WarehouseArchitect,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,数据抽取、转换、清洗、集成,挑战多个、多种异构数据源硬件,OS,RDBMS,文件数据不规范,需要做大量的清洗和整合转换规则复杂,繁多繁琐的日常性工作,占80%工作量数据质量保证数据增量抽取抽取工作过程化,自动化,数据抽取、转换、清洗、集成,成功的关键支持多个、多种异构数据源轻松方便地设计数据的清洗,转换和整合规则日

5、常事务性工作自动化完成有完善的数据质量保证体系有完备的数据增量抽取直观,面向过程化设计;自动化的执行开放性,可扩展性,易于实施和维护,数据抽取、转换、清洗、集成,解决的方案手工编程实现使用工具设计和实施PowerMart/PowerCenter开发环境,一系列工具用于设计、执行和维护数据的抽取、转换和装载流程抽取转换引擎(服务器),自动执行,集成:PowerMart,MappingDesigner,TransformationDeveloper,SybaseInformixOracleMicrosoftIBM/UDBODBCDB2SAPPeopleSoftVSAMFlat FilesWeb L

6、ogsXMLIBM MQ Gateways,SybaseInformixOracleMicrosoftODBCIBM/UDBSAP BWPeopleSoft EPMFlat FilesGateways,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,数据存储、管理,挑战数据规模查询性能装载速度易于管理存取访问,成功的关键快速,高效数据存储技术出色的查询性能-特殊的索引技术,并行查询可伸缩性-GB 到 TB 级易于管理-方便,灵活,GUI存取访问-数据随时可用,数据管理,解决的

7、方案通用的关系数据库系统专门的数据仓库服务器Sybase IQ专门为数据仓库/数据集市设计的关系型数据库专门针对OLAP/DSS而优化的索引和查询处理技术,Adaptive Server IQ,数据存储:Adaptive Server IQ,无处不索引(Index EVERYWHERE)数据压缩(通常达到原始数据的 70-75%)垂直存储技术(Vertical Partitioning)专利的Bit Wise索引技术跨越Bitmap的限制多种索引类型:FP,LF,HNG,HG低级数的限制从100扩充到1000预连接的索引提供额外的显著提高性能手段(Join Index)支持任意设计模式星型、雪

8、花、雪暴、星座模式普通关系模式支持任意加载方式文件、内部数据、外部数据库直接加载开放的接口,计算“NY”州A类商店的平均销售额,当表的记录数从几万条变为千万和上亿条时,传统RDBMS技术面对的问题:表扫描的性能极端低下冗余设计代价高昂、查询读取的无效字段过多低级数类型数据上索引的失效普通索引加载和空间代价,造成不能任意建造即席查询的SQL顺序对性能有显著影响数值型比较和运算,无恰当手段加速处理,传统RDBMS不适合数据仓库,IQ的特殊存储方式-垂直存储(按列存储),Sybase IQ:数据是按列存储的,而不是按行存储,好处:只存取查询所需的数据数据类型是一致的,因而可以很容易被压缩数据库易于修

9、改和管理,Sybase IQ:只读完成查询所 涉及到的列,计算在纽约的“A”类商店的平均销售额,IQ的特殊存储方式-垂直存储(按列存储),“How many MALES are NOT INSURED in CALIFORNIA?,GenderMMFMM-,800 Bytes/Row,10MROWS,StateNYCACTMACA-,RDBMS,InsuredYYNYN,10M Bits x 3 col/816K Page,=235 I/Os,800 Bytes x 10M 16K Page,=500,000 I/Os,基本上只能使用表扫描查询过程读取了太多的无效数据,IQ,Example:I

10、/O 的明显减少,IQ的索引特点,索引即是数据没有索引和数据的分别任何一列可以建立多个索引系统保证至少会存在一个索引(FP)索引的选择和设计主要基于:数据的级数(离散值的个数)在查询中的使用方式和SQL语句的顺序无关,索引的种类,Fast Projection(FP)数据压缩存储根据数据的特点会自动使用三种方式中的一种Low Fast(LF)Bit map 索引High Non Group(HNG)Bit-wise 索引High Group(HG)G-Array(包括一个改进的B-tree),FP Index normal FP,级数(取值个数)65536数据被压缩存储,Color,Red,B

11、lue,Green,Red,FP Index-FFP,级数 256内建一个1-byte的参照表,Lookup Table,Data,LF Index,传统的 Bit Map 索引级数小于1000 可以唯一使用的可能性JoinsGroup byMIN,MAX,SUM,AVG functionsWhere clause predicatesEquality/Inequality,Ranges,IN lists,.,冗余设计时数据量比想象中要小得多每一个取值都有一个相应的位可以适应新的取值出现和行的增加查询:select count(*)from customers where state=AL,L

12、F Index,HNG Index,Bit-Wise Index数据按照二进制存储垂直分布和处理Sybase的专利技术cannot be used with certain data types使用最佳范围range searches for high cardinality columns运算(sum and average functions),适合大量二进制的存储数据垂直分片 即每一个位都可以在内部被独立操作由于肯定存在大量的位同时为1或0,因此IQ在内部处理时会自动做数据压缩,HNG-High Card Bit-Wise Index,HG Index,在Bit-Wise的基础上增加一个

13、B-Tree,并保证树在加载时不会重建最佳使用场合:JoinsSelect Distinct,Count DistinctGroup By,10001001,突破性的速度 闪电般的快速查询 快速装载无限的灵活性 任何查询 任何模式非常经济 压缩的数据存储 支持多用户查询,Sybase IQ,Adaptive Server IQ 12:专门设计的数据仓库服务器,IQ12的技术参数,Column limit-now 16,000 per table(up from 255-Great for SAS&SPSS customers)Row limit-now 281,474,976,710,700(

14、thats 281 Trillion Rows and change)Device size-up to 128GB(depending on OS)Device limit-now 65,524(up from 2,000)Database Size limit-8.4 Petabytes,Sybase IQ 真正的数据仓库,Andyne,Brio,BusinessObjects,Gentia,InformationAdvantage,InformationDiscovery,InfoSpace,LinguisticTechnology,TeleranTechnology,SeagateSo

15、ftware,Mathsoft,Any Data,Any Time,Anywhere,Cognos,AdaptiveServerIQ,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,信息生产者,信息消费者,Brio.Insight,Brio.Quickview,客户机服务器,Web/Intranet,高级用户,活跃的分析人员,报表查阅者,信息技术人员,Brio.Enterprise 6.0 产品家族,Brio Enterprise 功能服务,功能服务,BrioQuery查询OLAP 查询在线分析(OLAP)报表EIS/脚本制图审核两层安全防护,Broadcast Server信息发布作业调度批处理查询/报表事件

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1