大学生mooc大数据技术原理与应用(林子雨)章节测验期末考试答案.docx
《大学生mooc大数据技术原理与应用(林子雨)章节测验期末考试答案.docx》由会员分享,可在线阅读,更多相关《大学生mooc大数据技术原理与应用(林子雨)章节测验期末考试答案.docx(30页珍藏版)》请在冰豆网上搜索。
青春须早为,岂能长少年。
前言:
建议Word原版,使用“查找”功能查题
大数据技术原理与应用(林子雨)
作者:
解忧书店JieYouBookshop
第1章大数据概述
1单选(2分)
第三次信息化浪潮的标志是:
A.个人电脑的普及
B.云计算、大数据、物联网技术的普及C.虚拟现实技术的普及
D.互联网的普及
正确答案:
B你选对了
2单选(2分)
就数据的量级而言,1PB数据是多少TB?
A.2048
B.1000C.512D.1024
正确答案:
D你选对了
3单选(2分)
以下关于云计算、大数据和物联网之间的关系,论述错误的是:
A.云计算侧重于数据分析
B.物联网可以借助于云计算实现海量数据的存储C.物联网可以借助于大数据实现海量数据的分析
D.云计算、大数据和物联网三者紧密相关,相辅相成正确答案:
A你选对了
4单选(2分)
以下哪个不是大数据时代新兴的技术:
A.SparkB.HadoopC.HBaseD.MySQL
正确答案:
D你选对了
25
5单选(2分)
每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:
A.MapReduceB.DremelC.StormD.Pregel
正确答案:
A你选对了
6单选(2分)
每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:
A.GraphXB.S4
C.ImpalaD.Hive
正确答案:
B你选对了
7单选(2分)
每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:
A.PregelB.StormC.CassandraD.Flume
正确答案:
A你选对了
8单选(2分)
每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:
A.HDFSB.S4
C.DremelD.MapReduce
正确答案:
C你选对了
9多选(3分)
数据产生方式大致经历了三个阶段,包括:
A.运营式系统阶段B.感知式系统阶段
C.移动互联网数据阶段
D.用户原创内容阶段
正确答案:
ABD你选对了
10多选(3分)
大数据发展的三个阶段是:
A.低谷期B.成熟期
C.大规模应用期D.萌芽期
正确答案:
BCD你选对了
11多选(3分)
大数据的特性包括:
A.价值密度低B.处理速度快C.数据类型繁多D.数据量大
正确答案:
ABCD你选对了
12多选(3分)
图领奖获得者、著名数据库专家JimGray博士认为,人类自古以来在科学研究上先后经历了哪几种范式:
A.计算科学
B.数据密集型科学C.实验科学
D.理论科学
正确答案:
ABCD你选对了
13多选(3分)
大数据带来思维方式的三个转变是:
A.效率而非精确B.相关而非因果C.精确而非全面D.全样而非抽样
正确答案:
ABD你选对了
14多选(3分)
大数据主要有哪几种计算模式:
A.流计算B.图计算
C.查询分析计算D.批处理计算
正确答案:
ABCD你选对了
15多选(3分)
云计算的典型服务模式包括三种:
A.SaaSB.IaaSC.MaaSD.PaaS
正确答案:
ABD你选对了
第2章大数据处理架构Hadoop
1单选(2分)
启动hadoop所有进程的命令是:
A.start-dfs.shB.start-all.shC.start-hadoop.shD.start-hdfs.sh
正确答案:
B你选对了
2单选(2分)
以下对Hadoop的说法错误的是:
A.Hadoop是基于Java语言开发的,只支持Java语言编程
B.Hadoop2.0增加了NameNodeHA和Wire-compatibility两个重大特性
C.HadoopMapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
D.Hadoop的核心是HDFS和MapReduce
正确答案:
A你选对了
3单选(2分)
以下哪个不是Hadoop的特性:
A.成本高
B.支持多种编程语言
C.高容错性D.高可靠性
正确答案:
A你选对了
4单选(2分)
以下名词解释不正确的是:
A.Zookeeper:
针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
B.HBase:
提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
C.Hive:
一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D.HDFS:
分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现正确答案:
B你选对了
5多选(3分)
以下哪些组件是Hadoop的生态系统的组件:
A.HBaseB.OracleC.HDFS
D.MapReduce
正确答案:
ACD你选对了
6多选(3分)
以下哪个命令可以用来操作HDFS文件:
A.hadoopfs
B.hadoopdfs
C.hdfsfs
D.hdfsdfs
正确答案:
ABD你选对了
第3章分布式文件系统HDFS
1单选(2分)
HDFS的命名空间不包含:
A.字节
B.文件C.块
D.目录
正确答案:
A你选对了
2单选(2分)
对HDFS通信协议的理解错误的是:
A.客户端与数据节点的交互是通过RPC(RemoteProcedureCall)来实现的
B.客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互
C.名称节点和数据节点之间则使用数据节点协议进行交互D.HDFS通信协议都是构建在IoT协议基础之上的
正确答案:
D你选对了
3单选(2分)
采用多副本冗余存储的优势不包含:
A.保证数据可靠性B.容易检查数据错误C.加快数据传输速度D.节约存储空间
正确答案:
D你选对了
4单选(2分)
假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是:
A.start-dfs.sh,stop-hdfs.sh
B.start-hdfs.sh,stop-hdfs.shC.start-dfs.sh,stop-dfs.shD.start-hdfs.sh,stop-dfs.sh正确答案:
C你选对了
5单选(2分)
分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据叫 ,另一类存储具体数据叫 :
A.名称节点,主节点B.从节点,主节点
C.名称节点,数据节点D.数据节点,名称节点正确答案:
C你选对了6单选(2分)
下面关于分布式文件系统HDFS的描述正确的是:
A.分布式文件系统HDFS是GoogleBigtable的一种开源实现
B.分布式文件系统HDFS是谷歌分布式文件系统GFS(GoogleFileSystem)的一种开源实现
C.分布式文件系统HDFS比较适合存储大量零碎的小文件
D.分布式文件系统HDFS是一种关系型数据库正确答案:
B你选对了
7多选(3分)
以下对名称节点理解正确的是:
A.名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问B.名称节点用来负责具体用户数据的存储
C.名称节点通常用来保存元数据D.名称节点的数据保存在内存中正确答案:
ACD你选对了
8多选(3分)
以下对数据节点理解正确的是:
A.数据节点通常只有一个
B.数据节点用来存储具体的文件内容C.数据节点的数据保存在磁盘中
D.数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作正确答案:
BCD你选对了
9多选(3分)
HDFS只设置唯一一个名称节点带来的局限性包括:
A.集群的可用性B.性能的瓶颈
C.命名空间的限制D.隔离问题
正确答案:
ABCD你选对了
10多选(3分)
以下HDFS相关的shell命令不正确的是:
A.hadoopdfsmkdir:
创建指定的文件夹
B.hdfsdfs-rm:
删除路径指定的文件
C.hadoopfs-copyFromLocal:
将路径指定的文件或文件夹复制到路径
指定的文件夹中
D.hadoopfs-ls:
显示指定的文件的详细信息正确答案:
AC你选对了
第4章分布式数据库HBase
1单选(2分)
HBase是一种数据库
A.行式数据库B.关系数据库C.文档数据库D.列式数据库
正确答案:
D你选对了
2单选(2分)
下列对HBase数据模型的描述错误的是:
A.每个HBase表都由若干行组成,每个行由行键(rowkey)来标识
B.HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳
C.HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本
D.HBase列族支持动态扩展,可以很轻松地添加一个列族或列正确答案:
C你选对了
3单选(2分)
下列说法正确的是:
A.如果不启动Hadoop,则HBase完全无法使用
B.HBase的实现包括的主要功能组件是库函数,一个Master主服务器和一个Region服务器
C.如果通过HBaseShell插入表数据,可以插入一行数据或一个单元格数据
D.Zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等正确答案:
D你选对了
4单选(2分)
在HBase数据库中,每个Region的建议最佳大小是:
A.2GB-4GBB.100MB-200MBC.500MB-1000MBD.1GB-2GB
正确答案:
D你选对了
5单选(2分)
HBase三层结构的顺序是:
A.Zookeeper文件,.MEATA.表,-ROOT-表B.-ROOT-表,Zookeeper文件,.MEATA.表C.Zookeeper文件,-ROOT-表,.MEATA.表D..MEATA.表,Zookeeper文件,-ROOT-表正确答案:
C你选对了
6单选(2分)
客户端是通过 级寻址来定位Region:
A.三
B.二
C.一
D.四
正确答案:
A你选对了
7单选(2分)
关于HBaseShell命令解释错误的是:
A.create:
创建表B.put:
向表、行、列指定的单元格添加数据C.list:
显示表的所有数据
D.get:
通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值正确答案:
C你选对了
8多选(3分)
下列对HBase的理解正确的是:
A.HBase是针对谷歌BigTable的开源实现
B.HBase是一种关系型数据库,现成功应用于互联网服务领域C.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件D.HBase多用于存储非