《大数据导论》配套教学教案Word文档格式.docx
《《大数据导论》配套教学教案Word文档格式.docx》由会员分享,可在线阅读,更多相关《《大数据导论》配套教学教案Word文档格式.docx(38页珍藏版)》请在冰豆网上搜索。
教学难点
熟悉大数据的4V特征
教学设计
1、 教学思路:
(1)阐释人类信息文明的发展历程及其对人类生活产生的影响;
(2)
讲解信息技术主要解决的4个核心问题的具体发展表现;
(3)理论阐述了数据生
产方式的变革历程,以及各个阶段的具体发展情况;
(4)从数据、技术特征两个
方面分析大数据的主要特征;
(5)大数据的社会价值体现在哪些方面。
2、 教学手段:
(1)通过课堂讨论提出问题,活跃课堂气氛并激发学生的学习兴趣;
(2)从系统的角度出发,全面介绍了大数据技术的基础知识,作为大数据技术的
基础教材,以提升读者对大数据的认知,每章结束都配有习题,帮助老师进行考查。
教学内容
一、导入新课:
“大数据”的横空出世
半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸己经积累到一个开始引发变革的
程度。
它不仅使世界充斥着以往更多的信息,而且其增长速度也在加快。
信息爆炸的学科如天文学
和基因学,创造出了“大数据”这个概念。
这个概念几乎应用到所有人类智力与发展的领域中。
“大数据”带来的影响
当人们还在津津乐道云计算、物联网等主题时,一个崭新的概念“大数据”横空出世。
大数据
是继云计算、物联网之后IT产业又一次颠覆性的技术革命,对国家治理模式、企业决策、组织和业
务流程,以及个人生活方式等都将产生巨大的影响。
大数据的挖掘和应用可创造出超万亿美元的价
值,将是未来IT领域最大的市场机遇之一,其作用堪称是又一次工业革命。
“大数据”产生的背景
随着网络和信息技术的不断普及,人类产生的数据量正在呈指数级增长。
大约每两年翻一番,
根据监测,这个速度在2020年之前会继续保持下去。
这意味着人类在最近两年产生的数据量相当于
之前产生的全部数据量。
大量新数据源的出现则导致了非结构化、非结构化数据爆发式的增长。
信
息数据的单位由TB、PB、EB,再到ZB的级别,这些由我们创造的信息背后产生的这些数据早己
远远超越了目前人力所能处理的范畴。
如何管理和使用这些数据,逐渐成为一个新的领域,于是大
数据的概念应运而生。
从三个层面认知“大数据”
大数据(BigData)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程
优化能力的海量、高增长率和多样化的信息资产。
²
第一层面:
理论
理论是认知的必经途径,也是被广泛认同和传播的基线。
从大数据的特征定义理解行业对大数
据的整体描绘和定性,从对大数据价值的探讨来深入解析大数据的珍贵所在,洞悉大数据的发展趋
势。
从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面:
技术
技术是大数据价值体现的手段和前进的基石。
可以从云计算、分布式处理技术、存储技术和感
知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
第三层面:
实践
实践是大数据的最终价值体现,我们从互联网的大数据,政府的大数据,企业的大数据
个人的大数据四个方面来描绘大数据己经展现的美好景象及即将实现的蓝图。
二、内容大纲:
具体可结合本章的PPT课件进行配合讲解。
1.1 人类信息文明的发展
1.2 大数据时代的来临
1.2.1信息技术的发展
1.2.2数据产生方式的变革
1.3 大数据的主要特征
1.3.1 大数据的数据特征
1.3.2 大数据的技术特征
1.4 大数据的社会价值
三、讨论问题
1-1简述人类信息文明的发展过程并展望未来的发展方向。
1-2大数据的技术特点和技术优势在哪里?
1-3简单描述大数据的主要特征。
1-4结合实际谈谈大数据的社会价值。
思考及作
业
一、 归纳小结
随着社交网络、物联网、云计算的飞速发展,大量非结构化数据呈指数级快速增长,数据样式高度复杂,为人类认识世界,改造世界提供了重要的资源,企业和个通过网络可以大规模的收集和分析数据,也可以产生和发布数据,个体在互联的网络中既是数据的消费者又是数据的生产者。
大规模生产、分享、应用数据的大数据时代己经来临。
与此同时,数量巨大,种类繁多的数据给传统的数据获取、分析、处理、存储、检索技术带来了挑战,大数据成为广泛关注且急需解决的热点问题,并已经开始影响社会的发展与人们的日常生活。
大数据时代已经来临,各国将在这一新的领域展开新一轮的竞争,我国应当与时俱进,及时转型,适应大数据时代的到来,可以借鉴各国的做法,抓住大数据时代关键点,从国家战略制定、人才培养、基础技术研究、信息安全保障体系建设等方面展开相应的工作。
二、 拓展延伸:
(1) 大数据时代是在什么背景环境下产生的,它对我们的现实生活产生了哪些方面的
影响?
(2) 大数据时代的个人隐私如何保护?
(3) 结合实际生活,谈一谈大数据的社会价值主要体现在哪些方面。
(4) 大数据要解决的核心问题是什么?
第2章大数据技术基础
大数据技术基础 授课时间90分钟 课时 2
本章课程在注重大数据时代应用环境前提下,从初学者角度出发,以轻量级理论、
丰富的实例对应性地介绍了大数据常用计算模式的各种系统和工具。
将经典和核心的
行业技术作为本章的主要内容,讲解计算机操作系统的基本知识,帮助读者建立对大数据技术基础的整体印象。
掌握计算机操作系统的基础知识
理解和掌握编程语言
掌握数据库的主要数据类型
理解算法的涵义
掌握大数据系统
熟悉大数据应用开发流程
理解什么是大数据技术基础
熟悉Linux操作系统经历的3个发展阶段
熟悉编程语言的发展和种类
掌握Python语言自身的优点和在实际应用方面的便捷性
了解数据库技术是信息技术的核心技术
重点关注传统算法和大数据时代算法的区别
Hadoop平台和Spark平台的基本构成和特征
掌握大数据的3种主要数据类型
熟悉典型的大数据应用开发流程
了解典型的数据科学算法应用流程
1、教学思路:
(1)通过本章的学习,使读者掌握计算机操作系统的基本知识,建立
对大数据技术基础的整体印象;
(2)介绍Linux操作系统经历的3个主要发展阶段和
目前Linux的主要应用场景;
(3)回顾编程语言的发展,详细介绍编程语言的种类,
并讲解了当前流行的一门编程语言Python语言的特点和优势;
(4)简述传统SQL数
据库的发展历程,讲解其技术特点;
(5)比较NoSQL和NewSQL数据库的技术特色
和特点;
(6)分别讲述Hadoop和Spark大数据平台的基本构架和工作原理;
(7)简述大数据应用开发的一般流程及典型数据科学算法的应用流程。
2、教学手段:
(1)通过课堂讨论提出问题,活跃课堂气氛并激发学员的学习兴趣;
(2)深入讲解知识点内容,理论与案例相结合,在教学过程中掌握大数据分析的实践
操作,通过丰富简单易上手的实例,让学生能够切实体会和掌握各种类型工具的特点和应用。
一、 导入新课:
大数据行业经过最近几年跨越式的发展,产生了一批与之相关的核心行业技术,我们将其统称为“大数据技术”。
这些经典的、核心的行业技术就是本书的主要内容。
计算机作为促进当代信息技术发展的重要工具,对社会、经济发展的影响越来越显著,越发受到人们的重视,其操作系统也越来越庞大和复杂。
因此,理解计算机操作系统的基础知识是学习并掌握大数据技术知识的前提,熟悉各种操作系统经历的发展阶段对于更好的理解其理论和知识架构奠定了基础。
大数据有几个特性,最著名的是数据量(volume),速度(velocity),多样性(variety)。
除此以外,还有就是准确性(veracity),连通性(valence),和价值(value)。
从操作系统的概念入手,简要分析了操作系统程序和一般的应用程序有什么区别和联系,然后讲解了诞生于网络、成长于网络且成熟于网络的Linux操作系统,并分别讲述其经历的3个发展阶段所具有的特点和目前Linux的主要应用场景。
随着计算机技术的不断发展和完善,编程语言已经得到了长足的发展,并被广泛地应用于实际,已经成为人们与计算机进行深入“交流”的必需工具。
总结介绍了目前市场上所用的主要编程语言种类及其特点,重点讲解编写简单,应用广泛,功能强大和更新速度最快的Python语言。
SQL涵盖数据的查询、操作、定义和控制,是一个综合的、通用的且简单易懂的数据库综合管理语言,同时又是一种高度非过程化的语言,数据库管理者只需要指出做什么而不需要指出怎么做,即可完成对数据库的管理。
SQL可以实现对数据库的全生命周期的全部操作,所以自产生之日起就成了检验关系型数据库管理能力的试金石,并且SQL标准的每一次变更和完善都指导着关系型数据库产品的发展方向,并分述NoSQL数据库、NewSQL数据库的技术特色和特点。
算法(Algorithm)是数学处理的灵魂和核心,也是实现现实事务数学化、公式化和逻辑化处理的桥梁,可以说算法是信息时代连通现实社会和虚拟世界的立交桥。
本章内容重点关注传统算法和大数据时代算法的区别,系统阐述两种算法的本质区别在于数据分析和数据科学。
简要介绍大数据系统目前最为著名和流行的Hadoop平台和Spark平台,分别介绍其主要模块,平
台基本特征和典型技术特点等。
随着大数据时代的到来,我们不得不承认如今数据量的激增越来越明显,各种各样的数据铺天
盖地的砸下来,企业选择相应工具来存储、分析与处理它们。
那么在大数据时代中,都有哪些数据类型?
结构化数据:
能够用数据或统一的结构加以表示,人们称之为结构化数据,如数字、符号。
传统的关系数据模型,行数据,存储于数据库,可用二维表结构表示。
半结构化数据:
所谓半结构化数据,就是介于完全结构化数据(如关系型数据库,面向对象数
据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,XML、HTML文档就属于半结构化数据。
它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
非结构化数据库是指其字段长度可变,并且每隔字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本,图像,声音,影视,超媒体等信息)。
现实中,大数据的数据类型渗透在日常生活中的各个方面。
现如今大数据更接近于某个群体行为数据,它是全面的数据、准确的数据、有价值的数据。
这些新类型数据相信大家都很熟悉,它们已经比传统数据类型更深入地走进了我们生活。
1、 一些记录是以模拟形式方式存在的,或者以数据形式存在但是存贮在本地,不是公开数据资源,没有开放给互联网用户,例如音乐、照片、视频、监控录像等影音资料。
现在这些数据不但数据量巨大,并且共享到了互联网上,面对所有互联网用户,其数量之大是前所未有。
2、 移动互联网出现后,移动设备的很多传感器收集了大量的用户点击行为数据,它们每天产生了大量的点击数据,这些数据被某些公司所有拥有,形成用户大量行为数据。
3、 电子地图生了大量的数据流数据,这些数据不同于传统数据,传统数据代表一个属性或一个度量值,但是这些地图产生的流数据代表着一种行为、一种习惯,这些流数据经频率分析后会产生。
4、 进入了社交网络的年代后,互联网行为主要由用户参与创造,大量的互联网用户创造出海量的社