ImageVerifierCode 换一换
格式:DOCX , 页数:21 ,大小:23.47KB ,
资源ID:12535400      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12535400.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Hadoopspark开发.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

Hadoopspark开发.docx

1、Hadoopspark开发 关于举办“Hadoop与Spark大数据平台开发与案例分析 ”高级工程师 实战培训班的通知地点北京上海时间12月20-231月09-12 一、 课程介绍1. 需求理解Hadoop 设计之初的目标就定位于高可靠性、高可拓展性、高容错性和高效性,正是这些设计上与生俱来的优点,才使得Hadoop 一出现就受到众多大公司的青睐,同时也引起了研究界的普遍关注。对电信运营商而言,用户上网日志包含了大量用户个性化需求、喜好信息,对其进行分析和挖掘,能更好地了解客户需求。传统经营分析系统小型机加关系型数据库的架构无法满足对海量非结构化数据的处理需求,搭建基于X86的Hadoop 平

2、台,引入大数据处理技术的方式,实现高效率、低成本、易扩展的经营分析系统混搭架构成为电信运营商最为倾向的选择。本课程将全面介绍Hadoop平台开发和运维的各项技术,对学员使用该项技术具有很高的应用价值。2. 培训课程架构与设计思路(1)培训架构:本课程分为三个主要部分:第一部分:重点讲述大数据技术在的应用,使学员对大数据技术的广泛应用有清晰的认识,在这环节当中会重点介绍Hadoop技术在整个大数据技术应用中的重要地位和应用情况。第二部分:具体对hadoop技术进行模块化分拆,从大数据文件存储系统技术和分布式文件系统平台及其应用谈起,介绍Hadoop技术各主要应用工具和方法,以及在运维维护当中的主

3、流做法,使学员全面了解和掌握Hadoop技术的精华。第三部分:重点剖析大数据的应用案例,使学员在案例当中对该项技术有更深入的感观印象(2)设计思路:本课程采用模块化教学方法,以案例分析为主线,由浅入深、循序渐进、由理论到实践操作进行设计。(3)与企业的贴合点:本课程结合企业转型发展及大数据发展战略,围绕企业大数据业务及行业应用市场拓展发展目标,重点讲授Hadoop的应用技术,提升企业IT技术人员的开发和运维能力,有很强的贴合度。2、培训对象各地企事业单位大数据产业相关人员,运营商 IT信息化和运维工程师相关人员,金融业信息化相关人员,或对大数据感兴趣的相关人员。三、培训目标掌握大数据处理平台(

4、Hadoop、Spark、Storm)技术架构、以及平台的安装部署、运维配置、应用开发;掌握主流大数据Hadoop平台和Spark实时处理平台的技术架构和实际应用;利用Hadoop+Spark对行业大数据进行存储管理和分析挖掘的技术应用;讲解Hadoop生态系统组件,包括Storm,HDFS,MapReduce,HIVE,HBase,Spark,GraphX,MLib,Shark, ElasticSearch等大数据存储管理、分布式数据库、大型数据仓库、大数据查询与搜索、大数据分析挖掘与分布式处理技术四、培训大纲(1)课程框架时间培训内容教学方式第一天上午第一部分:移动互联网、大数据、云计算相

5、关技术介绍第二部分:大数据的挑战和发展方向理论讲授+案例分析下午第三部分:大数据文件存储系统技术和分布式文件系统平台及其应用第四部分:Hadoop文件系统HDFS最佳实战理论讲授+案例分析+小组讨论第二天上午第五部分:Hadoop运维管理与性能调优第六部分:NOSQL数据库Hbase与Redis理论讲授+案例分析+实战演练下午第七部分:类SQL语句工具Hive第八部分:数据挖掘SPARK建模基础介绍理论讲授+案例分析+实战演练第三天上午第九部分:Kafka基础介绍第十部分:大数据典型应用与开发案例分析:互联网数据运营理论讲授+案例分析下午第十一部分:当前数据中心的改造和转换分析-以国内外运营商

6、、互联网公司为例第十二部分:课程总结与问题答疑评估培训理论讲授+案例分析+小组讨论第四天学员考试与业界交流详细培训内容介绍课程模块课程主题主要内容及案例和演示模块一移动互联网、大数据、云计算相关技术介绍1、 数据中心与云计算技术应用2、 智慧城市与云计算技术应用3、 移动互联网、大数据与云计算关联技术4、 移动云计算的生态系统及产业链5、 大数据技术在运营商、金融业、银行业、电子商务行业、零售业、制造业、政务信息化、互联网、教育信息化等行业中的应用实践6、 国内外主流的大数据解决方案介绍7、 当前大数据解决方案与传统数据库方案的剖析比较8、 Cloudera Hadoop 大数据平台方案剖析9

7、、 开源的大数据生态系统平台剖析模块二大数据的挑战和发展方向1、 大数据时代的挑战 战略决策能力 技术开发和数据处理能力 组织和运营能力2、 大数据时代的发展方向 云计算是基础设施架构 大数据是灵魂资产 分析、挖掘是手段 发现和预测是最终目标3、 大数据挖掘在各行业应用情况 电信行业应用及案例分析 互联网行业应用及案例分析 金融行业应用及案例研究 销售行业应用案例分析模块三大数据文件存储系统技术和分布式文件系统平台及其应用1、 Hadoop的发展历程 Hadoop大数据平台架构 基于Hadoop平台的PB级大数据存储管理与分析处理的工作原理与机制 Hadoop 的核心组件剖析2、 分布式文件系

8、统HDFS 概述、功能、作用、优势 应用范畴、应用现状 发展趋势3、 分布式文件系统HDFS架构及原理 核心关键技术 设计精髓 基本工作原理 系统架构 文件存储模式 工作机制 存储扩容与吞吐性能扩展4、 分布式文件系统HDFS操作 SHELL命令操作 I/O流式操作 文件数据读取、写入、追加、删除 文件状态查询 数据块分布机制 数据同步与一致性 元数据管理技术 主节点与从节点工作机制 大数据负载均衡技术 HDFS大数据存储集群管理技术5、 Hadoop生态系统组件 Storm HDFS MapReduce HIVE HBase Spark GraphX MLib Shark模块四Hadoop文

9、件系统HDFS最佳实战1、 HDFS的设计2、 HDFS的概念 数据块 namenode和datanode 联邦HDFS HDFS的高可用性3、 命令行接口4、 Hadoop文件系统5、 Java接口 从Hadoop URL读取数据 通过FileSystem API读取数据 写入数据 目录 查询文件系统 删除数据6、 数据流 剖析文件读取 剖析文件写入 一致模型7、 通过Flume和Sqoop导入数据8、 通过distcp并行复制9、 Hadoop存档 使用Hadoop存档工具 不足模块五Hadoop运维管理与性能调优1、 第二代大数据处理框架 Yarn的工作原理及 DAG并行执行机制 Yar

10、n大数据分析处理案例分析 Yarn 框架并行应用程序实践2、 集群配置管理 Hadoop集群配置 Hadoop性能调优与参数配置 Hadoop机架感知策略与配置 Hadoop压缩机制 Hadoop任务负载均衡 Hadoop 集群维护 Hadoop监控管理3、 HDFS的静态调优技巧 HDFS 的高吞吐量I/O性能调优技巧 MapReduce/Yarn的并行处理性能调优技巧 Hadoop集群的运行故障剖析,以及解决方案 基于Hadoop大数据应用程序的性能瓶颈剖析与提 Hadoop 大数据运维监控管理系统 HUE 平台的安装部署与应用配置 Hadoop运维管理监控系统Ambari平台的安装部配置

11、 Hadoop 集群运维系统 Ganglia, Nagios的安装部署与应用配置模块六NOSQL数据库Hbase与Redis1、 NOSQL基础 CAP理论 Base与ACID NOSQL数据库存储类型 键值存储 列存储 文档存储 图形存储2、 HBase分布式数据基础3、 安装Hbase4、 Hbase应用 HBase的逻辑数据模型,HBase的表、行、列族、列、单元格、版本、row key排序 HBase的物理模型,命名空间(表空间)、表模式(Schema)的设计法则 HBase 主节点HMaster的工作原理,HMaster的高可用配置,以及性能调优 HBase 从节点RegionSer

12、ver(分区服务节点)的工作原理,表分区及存储I/O高并发配置,以及性能调优 HBase的存储引擎工作原理,以及HBase表数据的键值存储结构,以及HFile存储结构剖析 HBase表设计与数据操作以及数据库管理操作 HBase集群的安装部署、参数配置和性能优化5、 HBase分布式数据库简介、发展历程、应用场景、工作原理、以及应用优势与不足之处 HBase分布式数据库集群的主从式平台架构和关键技术剖析 HBase伪分布式和物理集群分布式的控制与运行配置 HBase从节点RegionServer(分区服务节点)的工作原理,表分区及存储I/O高并发配置,以及性能调优 HBase的存储引擎工作原理

13、,以及HBase表数据的键值存储结构,以及HFile存储结构剖析 HBase表设计与数据操作以及数据库管理操作 HBase集群的安装部署、参数配置和性能优化 ZooKeeper分布式协调服务系统的工作原理、平台架构、集群部署应用实战 ZooKeeper集群的原理架构,以及应用配置6、 Redis内存数据库介绍,以及业界应用案例 Redis内存数据库集群架构以及核心技术剖析 Redis 集群的安装部署与应用开发实战模块七类SQL语句工具Hive1、 安装Hive2、 示例3、 运行Hive 配置Hive Hive服务 Metastore4、 Hive与传统数据库相比 读时模式vs.写时模式 更新

14、、事务和索引5、 HiveQL 数据类型 操作与函数6、 表 托管表和外部表 分区和桶 存储格式 导入数据 表的修改 表的丢弃7、 查询数据 排序和聚集 MapReduce脚本 连接 子查询 视图8、 用户定义函数 写UDF 写UDAF模块八数据挖掘SPARK建模基础介绍1、 Spark简介 Spark是什么 Spark生态系统BDAS2、 Spark架构 Spark分布式架构与单机多核架构的异同 3、 Spark集群的安装与部署 Spark的安装与部署 Spark集群初试4、 Spark硬件配置 Spark硬件 Spark硬件配置流程模块九Kafka基础介绍1、 Kafka介绍2、 kafk

15、a体系结构3、 kafka设计理念简介4、 kafka通信协议5、 kafka的伪分布安装、集群安装6、 kafka的shell操作、java操作7、 kafka设计理念*8、 kafka producer和consumer开发9、 Kafka分布式消息订阅系统的应用介绍、平台架构、集群部署与配置应用实战10、 Flume-NG数据采集系统的数据流模型、平台架构、集群部署与配置应用实战11、 Hadoop与DBMS之间数据交互工具Sqoop的应用实践,12、 Sqoop导入导出数据以及Sqoop集群部署与配置13、 Kettle 集群的平台架构、核心技术、部署配置和应用实战14、 利用Sqoo

16、p实现 MySQL 与 Hadoop 集群之间模块十大数据典型应用与开发案例分析:互联网数据运营1、 案例1:贵州数据交易中心 交易所交易形式:电子交易 交易所服务:大数据交易、大数据清洗建模分析、大数据定向采购、大数据平台技术开发 大数据交易安全性探讨分析 数据交易中心商业模式探讨分析2、 案例2:大数据应用案例:公共交通线路的智能规划 UrbanInsights:为公交公司提供基于订阅访问的大数据工具以及大数据咨询服务 Urban Insights数据源、数据收集、数据仓库、数据分析设计运营线路 Urban Insights通过互联网数据的运营3、 讨论:浙江移动大数据应用与开发方向模块十

17、一当前数据中心的改造和转换分析-以国内外运营商、互联网公司为例1、 流商业大数据解决方案比较 2、 主流开源云计算系统比较 3、 国内外代表性大数据平台比较 4、 各厂商最新的大数据产品介绍5、 案例分析 Facebook的SNS平台应用 Google的搜索引擎应用 Rackspace的日志处理 Verizon成立精准市场营销部 TelefonicaDynamicInsights推出的名为“智慧足迹”的商业服务 中国联通的“移动通信用户上网记录集中查询与分析支撑系统” 五、师资介绍张老师:阿里大数据高级专家,国内资深的Spark、Hadoop技术专家、虚拟化专家,对HDFS、MapReduce

18、、HBase、Hive、Mahout、Storm、spark和openTSDB等Hadoop生态系统中的技术进行了多年的深入的研究,更主要的是这些技术在大量的实际项目中得到广泛的应用,因此在Hadoop开发和运维方面积累了丰富的项目实施经验。近年主要典型的项目有:某电信集团网络优化、中国移动某省移动公司请账单系统和某省移动详单实时查询系统、中国银联大数据数据票据详单平台、某大型银行大数据记录系统、某大型通信运营商全国用户上网记录、某省交通部门违章系统、某区域医疗大数据应用项目、互联网公共数据大云(DAAS)和构建游戏云(Web Game Daas)平台项目等。六、颁发证书参加相关培训并通过考试的学员,可以获得:工业和信息化部颁发的-大数据应用开发工程师证书。该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。注:请学员带一寸彩照2张(背面注明姓名)、身份证复印件一张。七、培训费用及须知6800元/人(含教材、培训费、考证费以及学习用具等费用) 食宿统一安排,费用自理。八、报名回执“大数据实战培训班”报名回执表单位名称详细地址联系人电话传真邮箱姓 名性别身份证号码手机邮箱户 名: 开 户 行: 账 户: 参会单位签字或盖章注:1. 此表复印有效 报名回执邮件至 联 系 人: 联系电话: 微 信:

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1