大数据分析存储解决方案.pptx

上传人:b****1 文档编号:1726641 上传时间:2022-10-23 格式:PPTX 页数:41 大小:7.02MB
下载 相关 举报
大数据分析存储解决方案.pptx_第1页
第1页 / 共41页
大数据分析存储解决方案.pptx_第2页
第2页 / 共41页
大数据分析存储解决方案.pptx_第3页
第3页 / 共41页
大数据分析存储解决方案.pptx_第4页
第4页 / 共41页
大数据分析存储解决方案.pptx_第5页
第5页 / 共41页
点击查看更多>>
下载资源
资源描述

大数据分析存储解决方案.pptx

《大数据分析存储解决方案.pptx》由会员分享,可在线阅读,更多相关《大数据分析存储解决方案.pptx(41页珍藏版)》请在冰豆网上搜索。

大数据分析存储解决方案.pptx

IBM存储解决方案数据分析的存储,IBMSTG谢文华,从企业数据向大数据的扩展,TraditionalApproachStructured,analytical,logicalSystemsofRecord,NewApproachCreative,holisticthought,intuitionSystemsOfEngagement,Multimedia,SystemsofInsightEnterpriseIntegrationandContextAccumulation,StructuredRepeatableLinear,UnstructuredExploratoryDynamic,DataWarehouse,WebLogs,SocialData,TextData:

emails,Sensordata:

images,RFID,InternalAppData,TransactionData,MainframeData,OLTPSystemData,HadoopandStreams,TraditionalSources,NewSources,ERPdata,对新式基础架构的需求,在可靠和安全的环境中处理关键业务应用存取和处理海量数据包括结构化和非结构化数据速度及时响应随时可能出现的商业机会,这就需要灵活、实时性的基础架构ThedynamicsofSoRandSoE:

通过负载及资源部署的优化,来增强灵活性和效益通过采用包括基于开放标准的技术等新技术来改善ITeconomics,SystemofRecord(SoR),SystemsofEngagement(SoE),对的决策对的地方对的时间点,BigData&Analytics,大数据分析的新型架构解决方案,IBMBigData&AnalyticsInfrastructure,DataZone,ApplicationZone,5,SmartMetering,GridOperations电网管理,FieldService外勤现场服务,ResourcePlanning资源规划,CustomerService/CustomerOperations,实现真正的有效的法规遵从,及时发现能源损耗问题、以及偷电和欺诈行为,提高客户满意度,电量使用预测更为精确,电网运维优化,减少停电次数和时间,案例:

SmartMetering智慧电力计费大数据分析应用可以带来真正的业务价值,法规遵从,案例:

用大数据分析来加强SmartMetering,数据分析的高可用性,以确保随时了解用户喜好,跨应用的TB级的数据需求通用虚拟化存储平台,实时收集、存储并分析数据,最快可达50,000datapoints/sec,历史用电状态数据的复杂查询处理,数据在加载到数据仓库前的清洗、验证,这些数据可能来自很多的用户、收费系统或断电保护系统,关系掌控构建和维护电网的唯一试图,对整个企业的结构化和非结构化数据t做全局导览Navigation,从中发现Discover价值,分析用户用电情况,侦测偷电、改表等行为,预测哪些用户适合于哪些分时时段电价或需求/响应服务,分时时段电价的实时定价或提供及时的需求/响应服务,IBMBigData&AnalyticsReferenceArchitecture,BigDataPlatformCapabilities,InformationIngestReal-timeAnalyticsWarehouse&DataMartsAnalyticAppliances,AllDataSources,AdvancedAnalytics/NewInsights,New/EnhancedApplications,NewInfrastructureLeveragesDataTypes,DatainMotion,DataatRest,DatainManyForms,InformationIngestionandOperationalInformation,DecisionManagement,BIandPredictiveAnalytics,NavigationandDiscovery,IntelligenceAnalysis,Video/AudioNetwork/SensorEntityAnalyticsPredictive,Real-timeAnalytics,Exploration,IntegratedWarehouse,andMartZones,DiscoveryDeepReflectionOperationalPredictive,StreamProcessingDataIntegrationMasterData,Streams,InformationGovernance,SecurityandBusinessContinuity,Streams,Warehouse,InfoSphereBigInsightsHadoop-based低延迟分析,针对多样化的、海量静态数据Data-At-Rest,NetezzaHighCapacityAppliance基于结构化数据的可查询归档,Netezza1000基于结构化数据的BI+定制化分析Data,SmartAnalyticsSystem基于结构化数据的运营分析,InformixTimeseriesTime-structuredanalytics,InfoSphereWarehouse基于结构化数据的大容量数据分析,InfoSphereStreams低延迟流数据分析Velocity,Variety&VolumeData-In-Motion,MPPDataWarehouse,StreamComputing,InformationIntegration,Hadoop,InfoSphereInformationServer海量数据集成和转化,IBMBigDataPlatform大数据平台,What:

一种开源软件,将数据计算分布到整个集群的常见商用服务器和存储上Why:

传统的计算架构是一种沿纵向扩展模式,通过更快的SAN、大容量内存和多级缓存将数据加载到CPU上,成本比较高。

What:

Hadoop把大数据集合拆分区划为小数据集合,再把小数据集合分发到多台普通服务器上,是一种横向扩展模式。

Why:

Scalable,Flexible,CostEffective,FaultTolerentComponents:

MapReduce,HDFS,WhatisHadoop?

IBMValueforHadoop!

HDFS把数据分散存储在多个存储节点Node上HDFS设计时就假设存储节点有失效的可能,所以HDFS会把一份数据复制3份以上,分散存储在多个节点上,从而实现系统整体上的可靠性HDFS文件系统是由服务器节点集群组成的,每台服务器依照HDFS的特有block协议支持网络化block数据HDFSNameNode有发生单点故障的危险IBM在改善文件系统的性能同时消除了单点故障ElasticStorage-SNC(availableasbetacode),Hadoop说明,MapReduce,HDFS,HadoopStack,Whatdoesitlooklike?

典型Hadoop存储的PainPoints,在选择HDFS的组件(如软件、服务器、网络和存储等)时很难选对在从测试环境迁移到生产环境时,需要做的调优和调整工作太繁复了长期持续不断的运维保障过于繁重,比如老要更换失效组件(尤其是硬盘),这使得保证期望的SLA非常难,CPU和存储去耦本来用户的CPU和内存已经满足计算需求,但为了存储容量需要安装更多的硬盘不得不买更多的、不必要的CPU和内存Storageoptionsavailablehavecleargaps本地存储的利用率低(25%),每次需要扩容的时候就要添加更多的服务器,而一旦硬盘失效后需要重建,服务器越多,失效的几率越高,性能也就越差,IBMStorageforHadoop,传统的Hadoop集群使用的是服务器内置硬盘存储。

如果用作测试或科学研究还好,可作为业务运行的存储就要采用企业存储Hadoop集群要负责数据保护和复制重建(就是copy)失效的数据集到不同节点上严重影响CPU性能,无法实现企业级的RASReplicatedata问题同上扩展的时候同时增加处理器/网络/存储,无法做到物尽其用(nowaytoseparatethese3evenifexcesscapacityexistinginone(e.g.NeededmorestoragebuthadtoaddComputeandNetwork))使用外部存储可以将存储负载和Hadoop计算节点分离,同时还获得了企业存储的好处。

SellthevalueofXIV,V7000,SVC,etc.用户一般会随HadoopFileSystem部署;采用ElasticStorage可以有很多好处,15,数据加速ExperiencetheinstantresultsthatcomefromIBMFlashSystemDriveasmuchas45Xfasteranalyticsresultsoncertainworkloads数据负载的多样性和灵活性XIVdeliverspredictableperformancethatscaleslinearlywithouthotspotsdeliveringinsightsfromanalyticsfasterwithtuning-freedatadistributionScale-out,parallelprocessingofElasticStoragesoftwareandintegrationwithFlashSystemdramaticallyacceleratesperformanceofAnalyticsclustersVirtualStorageCenterwithSVCautomaticallyoptimizesdatawarehouseperformanceandcostacrossFlashandDiskMainframeDataEnvironmentsIntegrationwithDB2&specialtyanalytics“engines”leveragingDS8870delivers4xreductioninbatchtimeswithnewHighPerformanceFlashEnclosuresHighspeedencryptiononeverydrivetypesecuresdata数据保护和保留LTFSEEw/tapeprovidesreducedTCObyupto90%overdiskforlongtermretentionofdataatrestwithalargeopenformattaperepositoryReducetheamountofdatatobestoredbyupto25timeswithProtecTIERde-duplication,12x更快IBMFlashSystemincreasedSPLUNK&SASapplicat

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > IT认证

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1