云计算与云数据管理陆嘉恒.ppt

上传人:b****2 文档编号:2247774 上传时间:2022-10-28 格式:PPT 页数:51 大小:1.84MB
下载 相关 举报
云计算与云数据管理陆嘉恒.ppt_第1页
第1页 / 共51页
云计算与云数据管理陆嘉恒.ppt_第2页
第2页 / 共51页
云计算与云数据管理陆嘉恒.ppt_第3页
第3页 / 共51页
云计算与云数据管理陆嘉恒.ppt_第4页
第4页 / 共51页
云计算与云数据管理陆嘉恒.ppt_第5页
第5页 / 共51页
点击查看更多>>
下载资源
资源描述

云计算与云数据管理陆嘉恒.ppt

《云计算与云数据管理陆嘉恒.ppt》由会员分享,可在线阅读,更多相关《云计算与云数据管理陆嘉恒.ppt(51页珍藏版)》请在冰豆网上搜索。

云计算与云数据管理陆嘉恒.ppt

云数据管理技术与挑战陆嘉恒中国人民大学中国人民大学主要内容2云计算与云数据管理概述云计算与云数据管理概述各大公司的云数据管理技术各大公司的云数据管理技术人民大学研究团队的工作人民大学研究团队的工作云数据管理的研究挑战云数据管理的研究挑战云数据管理的新思维云数据管理准则

(1)PartitionEverythingandkey-valuestorage切分万物以治之切分万物以治之数据库的第一范式无法满足云数据管理准则

(2)EmbraceInconsistency容不同乃成大同容不同乃成大同数据库的ACID的属性无法满足云数据管理准则(3)Backupeverythingwiththreecopies狡兔三窟方高枕狡兔三窟方高枕每个数据都有三个备份,达到99.999999%的保障度云数据管理准则(4)Scalableandhighperformance运筹沧海量兼容运筹沧海量兼容提供一个可伸缩的,处理和分析海量数据的平台拨云见日切分万物以治之切分万物以治之容不同乃成大同容不同乃成大同狡兔三窟方高枕狡兔三窟方高枕运筹沧海量兼容运筹沧海量兼容主要内容11云计算与云数据管理概述云计算与云数据管理概述各大公司的云数据管理技术各大公司的云数据管理技术人民大学研究团队的工作人民大学研究团队的工作云数据管理的研究挑战云数据管理的研究挑战主要内容Google文件系统(GFS)适用于大规模数据密集型应用程序的可扩展分布式文件系统多个部署GFS的集群已经建成目前最大的集群为:

10000多个存储节点300+PB的存储容量可供不同机器上的上百用户同时读取介绍:

观察1控件的故障时常发生系统集成了实时监控、错误检测、容错性和自动恢复等功能超大文件(与普通文件相比)GB大小的文件很正常介绍:

观察2大部分文件修改都是添加新的内容需要考虑优化性能和保证原子性协同设计应用程序和API有利于增加整个系统的灵活性设计集群包含一个master和多个chunkservers,并且可供多个用户读取GAEWeb应用GAEWeb服务基础设施分布式存储服务应用程序运行时环境应用开发套件管理控制台GoogleAppEngine分布式存储服务GAE提供的分布式存储服务基于BigTable技术通过JavaJDO/JPA接口或Python数据库标准接口访问和操作数据库优势:

成本低、支持伸缩、并发性好、易管理采用乐观的并发控制应用程序运行时环境GAE的应用程序运行时环境是一个可伸缩的Web程序运行平台目前支持Python和Java可以使用Google提供的丰富的应用服务,如分布式存储服务、网页抓取、邮件、图像、Google账户等云端应用GoogleDocs是基于Web的文字处理和电子表格程序,支持在线协作、文档恢复、文档检索Gmail是有效的电子邮件工具,支持即时消息、视频聊天、会话检索等IBMEnsemblesIBMTSAMIBMWebSphereCloudBurstIBMLotusLiveIBMRC2云环境管理解决方案IBMTSAMIBMTivoliServiceAutomationManager(TSAM)管理应用服务生命周期的方案IBMWebSphereCloudBurstIBMWebSphereCloudBurstApplication(WCA)帮助用户创建和管理面向服务的私有云平台有效整合了云基础设施层和云平台层Web控制台基础设施管理虚拟化解决方案部署用户合格组管理虚拟器件镜像模板管理监控、审计和计费脚本包管理数据中心资源管理CRM系统ERP系统网上银行WebSphereApplicationServerWebSphereProcessServerWebSpherePorialDB2数据中心管理员应用系统SOA环境WebSphereCloudburstApplianceIBMLotusLive通过Web方式交付的服务会议服务LotusLiveMeetingsLotusLiveEvents办公协作服务LotusLiveEngageLotusLiveConnections电子邮件服务LotusLiveNotesIBMRC2IBMResearchComputeCloud东京北京新德里海法苏黎世纽约奥斯丁阿尔玛登AmazonWebServiceAmazonS3AmazonEC2AmazonSimpleDBAmazonSQSAmazonS3AmazonSimpleStorageService(S3)云计算平台提供的可靠的网络存储服务通过互联网访问和管理安全性账户认证访问控制列表查询字符串认证可靠性冗余备份的存储机制AmazonSimpleDBAmazonSimpleDB是一种支持结构化数据存储和查询操作的轻量级数据库服务存储模型:

域(Domain)、项(Item)、属性(Attribute)现有不足延迟较大不能保证顺序执行用户更新与关系型数据库兼容有限AmazonEC2AmazonEC2是一种云基础设施服务用户根据业务的需求自由地申请或者终止资源使用优势可伸缩性节省成本使用灵活安全可靠容错基础服务数据库服务应用开发服务应用打包服务基础服务F基础服务为上层服务和应用提供了安全、可靠的支撑环境三个关键技术多租户元数据安全架构数据库服务F数据库服务数据模型数据对象持久化采用关系属性定义数据对象间的关系数据操作Web页面接口编程接口访问控制管理安全记录安全WindowsAzure.NET服务SQLAzureLive服务MicrosoftWindowsAzureAzureFabric控制器存储服务计算服务开发环境WindowsLiveOfficeLiveExchangeOnlineSharePointOnlineDynamicCRMOnlineLive服务.NET服务SQL服务SharePoint服务DynamicCRM服务应用Azure服务平台WindowsAzureMicrosoftSQLAzure云环境的数据管理系统不支持CLR、空间数据及一些系统管理功能(如启动、停止SQLServer)优势无需对数据库进行定期备份提供统一数据访问接口提供更健壮的服务主要内容36云计算与云数据管理概述云计算与云数据管理概述各大公司的云数据管理技术各大公司的云数据管理技术人民大学研究团队的部分工作人民大学研究团队的部分工作云数据管理的研究挑战云数据管理的研究挑战人大阿里巴巴云项目简介:

由人大多个学院和教授共同合作针对淘宝阿里巴巴海量的交易数据进行分析和挖掘研究任务适合研究任务:

宏观经济指数分析-参照人大三大发布项目开发指数平台,集成多种统计算法模型,提供横向对比分析设计周期性自动指数计算系统,可以按月、周、天自动计算指数,发布类似K线图的动态指数38人民大学新开的分布式系统与云计算课程(2010年教育部IBM精品课程)39分布式系统概述分布式系统概述分布式云计算技术综述分布式云计算技术综述分布式云计算平台分布式云计算平台分布式云计算程序开发分布式云计算程序开发已编写教材介绍分布式系统及云计算概论清华大学出版社Hadoop实战机械工业出版社Comingsoon课程网站网址:

云计算与云数据管理概述云计算与云数据管理概述各大公司的云数据管理技术各大公司的云数据管理技术人民大学研究团队的工作人民大学研究团队的工作云数据管理的研究挑战云数据管理的研究挑战基于云上的数据管理的特点计算资源是可伸缩的数据具有备份数据存储在大量分布的结点之上基于云上的数据管理的挑战

(一)数据的自我管理和自调优基于云上的数据管理的挑战

(二)基于大量节点的查询优化算法基于大量节点的索引结构基于云上的数据管理的挑战(三)资源调度和负载均衡多租户情况中总结47海量数据管理:

新的挑战和机遇;海量数据管理:

新的挑战和机遇;企业和学企业和学术界共同面对的课题术界共同面对的课题云数据管理技术方兴未艾云数据管理技术方兴未艾国产数据库企业发展的一个新的机遇和挑战国产数据库企业发展的一个新的机遇和挑战FurtherReadingF.Changetal.Bigtable:

Adistributedstoragesystemforstructureddata.InOSDI,2006.J.DeanandS.Ghemawat.MapReduce:

Simplifieddataprocessingonlargeclusters.InOSDI,2004.G.DeCandiaetal.Dynamo:

Amazonshighlyavailablekey-valuestore.InSOSP,2007.S.Ghemawat,H.Gobioff,andS.-T.Leung.TheGoogleFileSystem.InProc.SOSP,2003.D.Kossmann.Thestateoftheartindistributedqueryprocessing.ACMComputingSurveys,32(4):

422469,2000.FurtherReadingEfficientBulkInsertionintoaDistributedOrderedTable(SIGMOD2008)AdamSilberstein,BrianCooper,UtkarshSrivastava,ErikVee,RamanaYerneni,RaghuRamakrishnanPNUTS:

Yahoo!

sHostedDataServingPlatform(VLDB2008)BrianCooper,RaghuRamakrishnan,UtkarshSrivastava,AdamSilberstein,PhilBohannon,Hans-ArnoJacobsen,NickPuz,DanielWeaver,RamanaYerneniAsynchronousViewMaintenanceforVLSDDatabases,ParagAgrawal,AdamSilberstein,BrianF.Cooper,UtkarshSrivastavaandRaghuRamakrishnanSIGMOD2009CloudStorageDesigninaPNUTShellBrianF.Cooper,RaghuRamakrishnan,andUtkarshSrivastavaBeautifulData,OReillyMedia,2009FurtherReadingF.Changetal.Bigtable:

Adistributedstoragesystemforstructureddata.InOSDI,2006.J.DeanandS.Ghemawat.MapReduce:

Simplifieddataprocessingonlargeclusters.InOSDI,2004.G.DeCandiaetal.Dynamo:

Amazonshighlyavailablekey-valuestore.InSOSP,2007.S.Ghemawat,H.Gobioff,andS.-T.Leung.TheGoogleFileSystem.InProc.SOSP,2003.D.Kossmann.Thestateoftheartindistributedqueryprocessing.ACMComputingSurveys,32(4):

422469,2000.谢谢!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > 财会金融考试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1