ImageVerifierCode 换一换
格式:DOCX , 页数:10 ,大小:18.67KB ,
资源ID:27709780      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/27709780.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(大数据技术与应用基础教学大纲.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

大数据技术与应用基础教学大纲.docx

1、大数据技术与应用基础教学大纲大数据技术与应用基础教学大纲时:60码:适用专业:定:核:准:、课程的地位、性质和任务大数据技术的发展,已被列为国家重大发展战略。而在过去的几年里,无论是聚焦大 数据发展的促进大数据发展行动纲要 ,还是“十三五”规划中都深刻体现了政府对 大数据产业和应用发展的重视。目前国内大数据发展还处于加速期、转型期,数据与传统 产业的融合还处于起步阶段,各行业对大数据分析和挖掘的应用还不理想。但随着市场竞 争的加剧,各行业对大数据技术研究的热情越来越高,在未来几年,各领域的数据分析都 将大规模应用。本课程在注重大数据时代应用环境前提下,考虑大数据处理分析需求多样复杂的基本 情况

2、,从初学者角度出发,以轻量级理论、丰富的实例对比性地介绍大数据常用计算模式的各种系统和工具。考虑到当前大数据发展处于起步并逐步赶超先进的阶段,其应用领域丰富广泛,在教学过程中应注重掌握大数据分析的实践操作。本课程通过丰富简单易上手的实例,让学生能够切实体会和掌握各种类型工具的特点和应用。、课程教学基本要求1.了解大数据的发展和基本概念,理解并掌握大数据的特征及主要技术层面。2.掌握 Scrapy 环境的搭建,了解网络爬虫获取数据的过程,熟悉爬虫项目的创建。3.深刻了解hadoop的基础理论,理解并掌握 Hadoop单机及集群环境的部署方法。4.掌握HDFS的基本概念和HDFS在hadoop中的

3、作用,理解并识记 HDFS勺使用,了解HDFS的 JAVA API接口及数据流原理;让学生明白 Map过程与Reduce过程这两个独立部 分各自的原理及合作途径,知道如何独立编写满足自己需求的 Map Reduces序。5.理解HBase中涉及的基本概念,掌握 HBase的简单应用;让学生了解数据仓库的基础概念,熟悉 Hive与HDFS Map Reduced接的关心。6.熟悉Spark和RDM基本概念,熟悉spark接口的使用,解决实战时的步骤及思路。7.明白Hadoop和Storm之间的差别,掌握对Storm的使用。理解Apex的工作过程并 能简单应用。8. 了解 Druid 的基本概念、

4、应用场景以及集群架构,掌握批量数据加载、流数据加载的操作。了解 Flink 的重要概念和基本架构,掌握 Flink 简单的使用实例。9. 理解 Elasticsearch 的基本架构,掌握 Elasticsearch 的一些入门操作。了解并基 本掌握怎样利用所学的工具对目标实例进行数据分析。三、课程的内容1大数据概述了解大数据的产生和发展,识记大数据的特征、数据类型和系统,大数据的计算模式和技术层面间的关联。2数据获取识记基本概念,识记各功能应怎样用 Scrapy 爬虫实现,了解采集目标数据项定义,领 会并掌握爬虫运行和数据存储技术。3. Hadoop基础领会 Hadoo P 的主要特点,识记

5、 Hadoop HDFS Hadoop Map Reduce Hadoop YARN勺原 理,了解其生态系统中重要组成的原理,熟悉 Hado op的配置。4. HDFS基本应用HDFS勺接口。熟悉HDFS所需的API接口,了解数据流的工作过程,能简单操作5. MapReduce应用开发了解所需的开发环境eclipse,领会Map过程与Reduce过程的工作原理,了解使用map reduce解决实际问题时的步骤和思路,识记 Map Reduce代码的不同功能。6分布式数据库 HBase识记HBase的基本概念,熟悉安装 HBase集群的步骤,了解HBaseAPI的基本步骤。7数据仓库工具 Hiv

6、e领会 Hive 的作用,掌握 Hive 接口的使用,会利用Hive 解决实战问题。8开源集群计算环境 Spark了解 Spark 的基本思想,熟悉 Spark 所需的环境及 作过程,领会其所需的代码。API 等,熟悉 Spark 实战的完整工9流实时处理系统 Storm识记Storm相关概念,掌握Storm环境的安装配置,了解 Storm 的基本使用10企业级、大数据流处理 Apex识记Apex的基本概念,掌握 Apex的环境配置过程,理解常见组件的原理和特点,会 简单的应用Apex解决问题。11 .事件流 OLAP之Druid了解 Druid 的概念及其应用场所,掌握 Druid 单机环境

7、的安装方法和步骤,并能利用Druid 进行加载流数据处理数据查询等。12事件数据流引擎 Flink识记 Flink 的基本概念, 明白 Flink 的基本架构, 能够安装 Flink 的单机和集群环境。13分布式文件搜索 Elasticsearch了解 Elasticsearch 包含重要部分的基本概念, 掌握 Elasticsearch 重要的安装过程, 掌握简单的操作。14实例电商数据分析能够通过已经学习了解过的环境和工具等,有条理有步骤的对实例进行数据挖掘、数 据处理和数据分析等,进而得出相关的结论。四、课程的重点、难点1大数据概述重点:大数据的概念和特征。难点:大数据的计算模式和技术层

8、面间的关联。2数据获取重点: Scrapy 环境的搭建。难点:网络爬虫获取数据的过程。3. Hadoop基础重点:Hadoop的基础理论及安装。难点:Hadoop单机及集群环境的部署方法。4. HDFS基本应用重点:掌握HDFS勺两种使用方法。5. MapReduce应用开发重点:明白Map过程与Reduce过程的原理。难点:独立编写满足自己需求的 Map Reduce程序。6.分布式数据库 HBase重点:HBase所包含的3个重要组件的工作方式。难点:如何通过 HBase shell 和 HBase API 访问 HBase。7.数据仓库工具 Hive重点:熟悉简单的 Hive 命令。8.

9、开源集群计算环境 Spark重点:理解 Spark 的工作机制。难点:解决实战时的步骤及思路。9流实时处理系统 Storm重点: Storm 的实时处理。难点:利用 Storm 的特点对数据进行合适的处理。10企业级、大数据流处理 Apex重点: Apex 的流处理功能。11 .事件流 OLAP之Druid重点:使用 Druid 进行加载和查询数据。12事件数据流引擎 Flink重点:明白 Flink 的基本架构。难点: Flink 系统中进程间处理信息的原理。13分布式文件搜索 Elasticsearch重点: Elasticsearch 的基本架构。14实例电商数据分析难点:怎样利用所学的

10、工具对目标实例进行数据分析。五、课时分配表序号课程内容总学时讲课实验习题课机动1大数据概述2222数据获取4223Hadoop基础4224HDFS基本应用4225Map Reduce应用开发6426分布式数据库HBase4227数据仓库丄具 Hive4228开源集群计算环境Spark8449流实时处埋糸统Storm42210企业级、大数据流处理Apex42211事件流OLAF之Druid42212事件数据流引擎Flink42213分布式文件搜索42214实例电商数据分析422合计603228六、实验项目及基本要求实验一通过爬虫获取数据要求:能安装爬虫所需环境,创建简单的爬虫项目。成功完成爬虫核

11、心实现。实验二Hadoop安装与配置要求:HadooP单机和集群模式的配置。实验三实战HDFS的接口要求:能自主操作 Java 和命令行接口。实验四编写简单的Mapreduce程序要求:完成Map Reduces需环境的配置,完成 Ma preduce应用实例实验五 分布式数据库 HBase要求:安装HBase集群模式,能简单使用 HBase shell和Hbase API。实验六 Hive 的使用要求:会进行简单的 Hive 命令使用,熟悉 Hive 的复杂语句。实验七 Spark 简单编程与聚类实战要求:了解Spark简单的RDD创建,了解各个实战的编程实现及解决过程。实验八 Storm

12、安装与配置要求:了解Storm的概念及原理,了解Storm的安装和基本使用。实验九 Spark 的使用和配置要求:掌握Apex的使用,了解Apex的基本配置。实验十 Druid 环境配置要求:了解 Druid 的概念和使用,理解 Druid 的作用。实验十 事件数据流引擎 Flink 的使用要求:了解 Flink 的概念和部署过程,理解 Flink 的使用。七、考核办法1考试采用统一命题,闭卷考试,考试时间为 120 分钟。2本大纲各部分所规定基本要求、 知识点及知识点下的知识细目, 都属于考核的内容。考试命题覆盖到各部分,并适当突出重点部分,加大重点内容的覆盖密度。3不同能力层次要求的分数比

13、例大致为:识记占 20%,领会占 30%,简单应用占 30%,综合应用占 20%4题的难度可分为易、较易、较难和难四个等级。试卷中不同难度试题的分数比例一般为 2:3:3:25试题主要题型有:填空、单项选择、多选、简答、及综合应用等。八、使用说明在本课程学习中,应从“了解” 、“识记”、“领会”、“简单应用”、“综合应用”五个能 力层次去把握:1. 了解:要求概念的基本掌握,是最基本要求。2. 识记:要求能够识别和记忆本课程有关知识点的主要内容, 并能够做出正确的表达、 选择和判断。3.领会:在识记的基础上,要求能够领悟和理解本课程中有关知识点的内涵与外延, 熟悉其内容要点和它们之间的区别与联系。 并能够根据考核的不同要求, 做出正确的解释、 说明和论述。4.简单应用:在领会的基础上,要求能够运用本课程中少量知识点,分析和解决一般 的应用问题。5.综合应用:在简单应用的基础上,要求能够运用本课程中多个知识点,综合分析和 解决复杂的应用问题。九、教材及参考书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1