hadoop例题.docx

上传人:b****6 文档编号:4332376 上传时间:2022-11-29 格式:DOCX 页数:8 大小:17.78KB
下载 相关 举报
hadoop例题.docx_第1页
第1页 / 共8页
hadoop例题.docx_第2页
第2页 / 共8页
hadoop例题.docx_第3页
第3页 / 共8页
hadoop例题.docx_第4页
第4页 / 共8页
hadoop例题.docx_第5页
第5页 / 共8页
点击查看更多>>
下载资源
资源描述

hadoop例题.docx

《hadoop例题.docx》由会员分享,可在线阅读,更多相关《hadoop例题.docx(8页珍藏版)》请在冰豆网上搜索。

hadoop例题.docx

hadoop例题

选择题

1、关于MapReduce的描述错误的是()

A、MapReduce框架会先排序map任务的输出

B、通常,作业的输入输出都会被存储在文件系统中

C、通常计算节点和存储节点是同一节点

D、一个Task通常会把输入集切分成若干独立的数据块

2、关于基于Hadoop的MapReduce编程的环境配置,下面哪一步是不必要的()

A、安装linux或者在Windows下安装Cgywin

B、安装java

C、安装MapReduce

D、配置Hadoop参数

3、关于基于Hadoop的MapReduce编程的环境配置,下面哪一步是不必要的()

A、配置java环境变量

B、配置Hadoop环境变量

C、配置Eclipse

D、配置ssh

4、下列说法错误的是()

A、MapReduce中maperconbinerreducer缺一不可

B、在JobConf中InputFormat参数可以不设

C、在JobConf中MapperClass参数可以不设

D、在JobConf中OutputKeyComparator参数可以不设

5、下列关于mapreduce的key/value对的说法正确的是()

A、输入键值对不需要和输出键值对类型一致

B、输入的key类型必须和输出的key类型一致

C、输入的value类型必须和输出的value类型一致

D、输入键值对只能映射成一个输出键值对

6、在mapreduce任务中,下列哪一项会由hadoop系统自动排序()

A、keysofmapper'soutput

B、valuesofmapper'soutput

C、keysofreducer'soutput

D、valuesofreducer'soutput

7、关于mapreduce框架中一个作业的reduce任务的数目,下列说法正确的是()

A、由自定义的Partitioner来确定

B、是分块的总数目一半

C、可以由用户来自定义,通过JobConf.setNumReducetTask(int)来设定一个作业中reduce的任务数目

D、由MapReduce随机确定其数目

8、MapReduce框架中,在Map和Reduce之间的combiner的作用是()

A、对Map的输出结果排序

B、对中间过程的输出进行本地的聚集

C、对中间结果进行混洗

D、对中间格式进行压缩

9、MapReduce框架分为Map和Reduce,下列对Reduce阶段叙述正确的是()

A、主要分为shuffle和sort这2个阶段

B、这个阶段过程中,key的分组规则是不可更改的

C、其中的shuffle和sort是同时进行的

D、Reduce数目的增加不会增加系统的开销

10、Hadoop中,Reducer的三个阶段是()

A、Shuffle——Sort——Reduce

B、Shuffle——Reduce——Sort

C、Reduce——Shuffle——Sort

D、Sort——Shuffle——Reduce

11、请问在Hadoop体系结构中,按照由下到上顺序,排列正确的是()

PigHiveCrunch都是运行在MapReduce,Spark,或者Tez之上的处理框架

Avro是一个克服了Writable部分不足的序列化系统

A、CommonHiveHDFS

B、CommonMapReducePig

C、HDFSMapReduceHBase

D、HDFSAvroHBase

12、关于Hadoop下列说法错误的是()

A、HDFS采用了Master/Slave的架构模型

B、Namenode负责维护文件系统的命名空间

C、Datanode执行比如打开、关闭、重命名文件操作

D、HDFS暴露了文件系统的命名空间,允许用户以文件的形式在上面存储数据

13、下面哪个选项不是我们需要Hadoop的主要原因()

A、我们需要处理PB级别的数据

B、为每个应用建立一个可靠的系统是很昂贵的

C、几乎每天都有结点坏掉

D、把一个任务分割成多个子任务的方式是不好的

14、hadoop中下面哪项操作是不需要记录进日志的()

A、打开文件

B、重命名

C、编译文件

D、删除操作

15、hadoop中,下面关于向文件系统中添加一个文件的过程,错误的是()

A、需要创建路径的父目录

B、需要创建一个新的INode文件

C、将新的INode文件加入到namespace中去

D、将所有操作记录到EditLog中去

16、在安装配置好Hadoop集群后,查看Namenode节点的端口是以下哪个()

A、50030

B、50070

C、60010

D、60030

17、下面哪个不是Hadoop的输出数据格式()

A、文本输出

B、二进制输出

C、单一输出

D、多输出

18、要在HDFS的根目录中建立一个叫hadoo的目录,下面哪一条命令是正确的()

A、mkdirhadoo

B、mkdir/hadoo

C、hadoopmkdirhadoo

D、hadoopfs–mkdir/hadoo

19、下面有关NameNode安全模式(safemode)说法错误的是()

A、namespace处于安全模式时只能被读取

B、NameNode启动时自动进入安全模式

C、调用setSafeMode()函数能够打开或关闭安全模式

D、安全模式下不能够复制或删除文件中的数据块

20、以下情况除哪项发生时balancer便会自动退出()

A、集群平衡或者没有数据块可以移动

B、在连续三次迭代中没有块移动

C、与namenode传输时发生异常

D、另一个balancer在运行

21、下列说法错误的是()

A、Partitioner负责控制map输出结果key的分割

B、Reporter用于MapReduce应用程序报告进度

C、OutputCollector收集Mapper或Reducer输出数据

D、Reduce的数目不可以是0

22、下列说法错误的是()

A、JobServer是用户作业和JobTracker交互的主要接口

B、JobClient为用户提供提交作业功能

C、JobClient提供访问子任务报告和日志功能

D、JobClient提供获取MapReduce集群状态信息功能

23、Hadoop的哪个包的功能是表示层,将各种数据编码/解码,方便在网络上传输()

A、fs

B、ipc

C、io

D、net

24、Hadoop的哪个包的功能是根据DDL(数据描述语言)自动生成他们的编解码函数()

A、record

B、metrics

C、util

D、tool

25、hadoop中什么类提供了连接到HDFS系统并执行文件操作的基本功能()

A、FSDirectory

B、DFSClient

C、ClientProtocol

D、FSInputStream

26、MapReduce程序最基本的组成部分不包括()

A、Mapper类

B、Reducer类

C、创建JobConf的执行程序

D、Conbiner类

27、下列关于Hadoop中Shell类说法错误的是()

A、Shell类是一个继承类

B、Shell类定义了如何在当前文件系统环境中,通过命令进行交互

C、Shell类定义了静态的字符串命令

D、Shell类定义了与实现命令的执行相关的属性

28、如果想在hadoop文件系统中通过键盘输入来创建一个文件,你应该使用下列哪种方法()

A、copy()

B、copyFromStdin()

C、printToStdout()

D、copyFromLocal()

29、关于FsShell的说法,下面哪一项是正确的()

A、FsShell和UNIX系统中的shell一样功能强大

B、FsShell实际上是一个Java应用程序

C、可以在FsShell中执行HDFS文件系统中的可执行文件

D、FsShell实际上是调用UNIX的shell命令来实现复制操作

30、当__时,HDFS启动balancer()

A、threshold=

B、threshold=

C、threshold

D、threshold>=|ratio(Datanode)-ratio(Rack)

31、执行数据块复制的任务时,是什么和什么在进行通信()

A、clientandnamenode

B、clientanddatanode

C、namenodeanddatanode

D、datanodeanddatanode

32、关于NameNode和SecondaryNameNode的说法错误的是()

A、NameNode上实现的NamenodeProtocol用于二者命令通信

B、数据的通信使用的是ftp协议(http协议)

C、数据通信使用的是http协议

D、协议的容器是jetty

33、关于SecondaryNameNode的说法错误的是()

A、main方法是SecondaryNameNode的入口,它启动线程执行run

B、启动前的构造过程主要是创建和NameNode通信的接口和启动HTTP服务器

C、run方法每隔一段时间执行doCheckpoint()

D、main方法从NameNode上取下FSImage和日志,和本地合并再传回NameNode(应该是run方法完成)

34、Hadoop中节点之间的进程通信是通过什么协议来实现的()

A、HTTP

B、SMTP

C、SSH

D、RPC

35、下面有关NameNode和secondaryNameNode通信协议说法错误的是()

A、secondaryNameNode使用NamenodeProtocol协议与NameNode进行通信

B、如果文件系统处于安全模式,那么关闭当前日志并打开新的日志操作会失败

C、如果旧的编辑日志丢失了,那么滚动fsImage日志会失败

D、secondaryNameNode可以从NameNode中得到任何datanode的块及其位置

36、下面有关NameNode和DataNode之间的Hearbeat说法错误的是()

A、DataNode通过发送Heartbeat告诉NameNode自己还"活着",并且工作正常

B、HeatBeat包含DataNode状态相关信息

C、NameNode回复HeartBeat一些DatanodeCommand

D、如果NameNode在某一固定时间内没有收到Datanode的Heatbeat,那么它会要求DataNode发送Heartbeat

37、下面哪个协议用于Datanode和Namenode之间的通信()

A、DatanodeProtocol

B、NamenodeProcotol

C、ClientProtocol

D、ClientDatanodeProtocol

38、下面哪个协议用于SecondaryNamenode和Namenode之间的通信()

A、DatanodeProtocol

B、NamenodeProcotol

C、ClientProtocol

D、ClientDatanodeProtocol

39、在Hadoop上提交Job时不涉及哪个实体()

A、客户端

B、HDFS

C、SecondaryNode

D、JobTracker

40、MapReduce处理流程中Reduce如何获取Map端结果()

A、Map端发送

B、Reduce端获取

C、Map端发送到中间管理节点,Reduce统一获取

D、随机发送

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 初中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1