1、完整版hadoop习题册第一章 大数据概述1.互联网的发展分为 个阶段。A一 B.三 C.二 D.四2.D.价值密度高下列不属于大数据特点的是( )。A.种类和来源多样化 B.数据量巨大 C.分析处理速度快3.互联网发展的第 个时代为智能互联网。A.3.0 B.4.0 C.1.0 D.2.04.关于大数据叙述不正确的一项是( )。A.大数据 =“海量数据” +“复杂类型的数据”B.大数据是指在一定时间对内容抓取、管理和处理的数据集合C.大数据可以及时有效的分析海量的数据D.数据包括结构化数据、半结构化数据、结构化数据。5.下列数据换算正确的一项为( )。A.1YB=1024EBB.1TB=10
2、24MBC.1PB=1024EBD.1024ZB=1EB6.结构化数据的表现形式为 。A.文本 B.视图 C.二维表 D.查询7.结构化的数据,先有 ,再有 .A.数据 结构B.结构 数据C.内容 结构D.结构 内容8.结构化的数据,先有 ,再有 .A.数据 结构B.结构 数据C.内容 结构D.结构 内容9.软件是大数据的 。A.核心 B.部件 C.引擎D.集合10. 大数据技术不包括 ()。A.数据计算 B.数据存储C.数据冗余D.数据采集11.大数据的特点不包括()。A.数量大 B.类型少C.速度快D.价值高第二章Hadoop 简介1.下列对云栈架构层数不正确的一项为 A.三层云栈架构B.
3、四层云栈架构C.五层云栈架构D.六层云栈架构2.下列 不是云计算三层架构的概括。A.IaaS B.PaaS C.SaaP D.SaaS3.IaaS 基础设施及服务可以称为 。A.弹性计算B.效用计算C.有效计算D.随需应用4.四层云栈模式,是将三层模式中的 进行分解,分为两层,一层为硬件层,一层为虚拟资源层。A.硬件部分B.虚拟化部分C.基础设施D.平台5.五层云栈模式,第五层为 。A.固件 /硬件层 B.云基本资源层 C.云应用程序层 D.云软件环境层6.大数据是 的应用。A.人工智能 B.云计算 C.物联网 D.互联网7.hadoop 中第一阶段的输出可以作为下一阶段的输入。A.应用场景
4、B.分布式计算 C.分阶段计算 D.高效处理8.hadoop 中将海量数据分割于多个节点,由每个节点并行计算,将得到的结果归并到输出。A.应用场景 B.分布式计算 C.分阶段计算 D.高效处理9.下列选项中不是 hadoop 特点的是 。A.可靠性 B.扩容能力 C.高效率 D.成本高10.hadoop 能可靠地存储和处理 字节数据。A.TB B.PB C.YB D.ZB11.hadoop 集群可以用 _种模式进行。A.四 B.三 C.五 D.二12.hadoop 集群不可以在 进行。A.联机模式 B.单机模式 C.虚拟分布模式 D.完全分布模式13.模式: hadoop 安装时的默认模式,不
5、对配置文件进行修改。A.联机 B.单机 C.虚拟分布 D.完全分布14.模式:在一台机器上用软件模拟多节点集群。A.联机 B.单机 C.虚拟分布 D.完全分布15.模式: Hadoop 安装运行在多台主机上,构成一个真实的 hadoop 集群,在所有的节点上都安装 JDK和 hadoop ,相互通过高速局域网连接。A.联机 B.单机 C.虚拟分布 D.完全分布16.完全分布式,各节点之间设置 ,将各个从节点生成的公钥添加到主节点的信任列表。A.SSH B.JDK C.hadoop D.HDFS17.完全分布式,不需要修改的配置文件为 。A.core-site.xml B.hdfs-site.x
6、ml C.hadoop-env.sh D.mapred -site.xml18.HDFS架构中有两个 。A.DataNodes B. JobTracke C.NameNode D.SecondayNameNode19.下列不是 hadoop 核心组件的是 。A.JobTracker B.TaskTracker C.HDFS D.Hbase20.存储 Hadoop 集群中所有存储节点上的文件,为海量提供存储。A.JobTracker B.TaskTracker C.HDFS D.HBase第四章 HDFS文件系统1.是指跨多台计算或服务器的文件或文件夹,数据存储在多台机器而不是单台机器上。A.分
7、布式存储 B.分页式存储 C.链式存储 D.顺序存储2.下列关于 hadoop 系统架构叙述不正确的一项为 。A.由一台 Intel x86 处理器的服务器或 PC机组成。B.部署在低成本 Intel/linux 硬件平台上。C.通过高速局域网构成一个计算集群。D.各个节点上运行 Linux 操作系统。3.主节点程序 。A.NameNode B.DataNode C.SecondaryNameNode D.Jobtracker4.从节点程序 。A.NameNode B.DataNode C.SecondaryNameNode D.Jobtracker5.HDFS结构不包括 。6.D.支持一个应
8、用程序并发访问HDFS分布式文件系统的特点为 。A.半透明性 B.低可用性 C.可扩展性7.HDFS中的 block 默认保存 份。A.3 B.2 C.1 D.不确定8.下列 通常与 NameNode 在一个节点启动。A.SecondaryNameNodeB.DataNodeC.TaskTrackerD.Jobtracker9.HDFS每个文件被划分成 大小的多个 block,属于同一个文件的 blocks 分散存储在不同 DataNode 上。A.32MBB.64MBC.128MBD.无法确定10.下面哪个程序负责 HDFS 数据存储?( ) A.NameNodeB.JobTrackerC.
9、DataNodeD.SecondaryNameNodeE.tasktracker11.NameNode 是 HDFS系统中的管理局节点, 它管理文件系统的命名空间, 记录每个文件数 据块在 DataNode 上的位置和副本信息、协调客户端对文件的访问、记录命名空间内的改动 和空间本身属性的改动。A.错误 B.正确12.HDFS 是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠行、 高扩展性、高吞吐率等特征,适合的读写任务是 。A.一次写入,少次读取B.多次写入,少次读取C.多次写入,多次读取D.一次写入,多次读取13.关于 HDFS的文件写入,正确的是 。A.支持多用户对同
10、一文件的写操作B.用户可以在文件任意位置进行修改C.默认将文件复制成三份存放D.复制的文件块默认存在同一机架上14.Client 在 HDFS 上进行文件写入时, namenode 根据文件大小和配置情况,返回部分 datanode 信息,谁负责将文件划分为多个 Block,根据 DataNode 的地址信息,按顺序写入到每一个 DataNode 块A.Client第五章 MapReduce 原理与编程1.MapReduce 应用于 的数据处理。A.小规模 B.中小规模 C.大规模 D.超大规模2.MapReduce 能处理的海量数据大于 。A.1TB B.10GB C.10TB D.1PB3
11、.下列关于 MapReduce 说法不正确的是 。A.MapReduce 是一种计算框架B.MapReduce 的核心思想是“分而治之”C.MapReduce 是一个串行的编程模型D.MapReduce 来源于 Google 的学术论文4.下列关于 MapReduce 的特性叙述正确的一项是 。A.自动实现分布式串行计算B.自动实现分页式并行计算C.容错,提供状态监控工具D.不容错 ,提供状态监控工具5.在分布式并行计算体系中, 采用一个指令流处理单个数据流。A.SISD B.SIMD C.MISD D.MIMD6.在分布式并行计算体系中, 采用多个指令流同时处理多个数据流。A.SISD B.
12、SIMD C.MISD D.MIMD7.关于集群的特点下列叙述正确的一项是 。A.系统吞吐量小 B.可靠性高 C.扩展性弱 D.性价比低8.下列关于 MapReduce 的基本思想叙述不正确的一项是 。A.对相互间具有计算机以来关系的大数据进行分而治之。B.用 Map 和 Reduce 两个函数提供了高层并行编程抽象模型。C.提供了同一框架D.为程序员隐藏系统细节9.下列关于 MPI 叙述不正确的一项是 。A.MPI 是一个信息传递应用程序的接口B.MPI 程序经常在共享内存的机器上使用C.MPI并行计算增加高层并行编程模型D.MPI 缺少统一的计算框架支持10.下列关于 MapReduce
13、计算原理叙述不正确的一项是 。A.将大数据集划分为小数据集,小数据集划分为更小数据集B.将最终划分的小数据分发布到集群节点上C.以串行的方式完成计算处理D.将计算结果递归融汇,得到最后的结果11.下列关于 Map/Reduce 并行计算模型叙述正确的一项为 。A.Map/Reduce 把待处理的数据集分割成许多大的数据块B.大数据块经 Map() 函数并行处理后输出新的中间结果C.reduce()函数把多任务处理后的中间结果进行汇总D.reduce 阶段的作用接受来自输出列表的迭代器12.在 MapReduce 计算架构中, 组件属于 hadoop 的软件模块。A.Client B.JobTr
14、acker C.TaskTracker D.Task13.在 MapReduce 计算架构中, 组件运行在 NameNode 节点上,提供集群资源的分配和工作调度管理。A.Client B.JobTracker C.TaskTracker D.Task14.在 MapReduce 计算架构中, 组件运行在 DataNode 上,具体管理本节点计算任务的执行。A.Client B.JobTracker C.TaskTracker D.Task15.下列关于 JobTracker叙述不正确的一项为 。A.MapReduce 框架的使用者B.协调 MapReduce 作业C.分配任务D.监控任务16.下列关于 Map/Reduce 计算流程叙述不正确的一项为 。A.Mapper 读取分派给它的输出 Split,并生成相应的本地缓存。B.Mapper 执行计算处理任务,将中间结果输出保存在本地缓存。C.Application Master 调度 Reducer 读取 Mapper 的中间输出文件,执行 Reduce 任务。D.Reducer 将最后结果写入输出文件保存到 HDFS。17.MapReduce 流程有 各阶段。A.三 B.二 C.四 D.五18.在 MapReduce 中, 阶段, Mapper 执行 map task,将输出结果写入中间文件。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1