HCIA题库268道.docx
《HCIA题库268道.docx》由会员分享,可在线阅读,更多相关《HCIA题库268道.docx(80页珍藏版)》请在冰豆网上搜索。
HCIA题库268道
HCIA
1、下列选项中无法通过大数据技术实现的是。
()[单选题]——[单选题]
A商业模式发现
B信用评估
C商品推荐
D运营分析
正确答案:
A
2、假设每个用户最低资颜保设置为yarn,scheduler,capacity,root,QueueAminimun-user-limit-percent=24则以下说法错误的是?
()[单选题]——[单选题]
A第3个用户提交任务时,每个用户最多获得33、
B第2个用户提交任务时,每个用户最多获得50%的资源
C第4个用户提交任务时,每个用户最多获得25%的资源
D第5个用户提交任务时,每个用户最多获得20%的资源
正确答案:
D
3、Spark自带的资源管理框架是?
()[单选题]——[单选题]
AStandal
BMesos
CYARN
DDocker
正确答案:
B
4、关于RDD,下列说法错误的是?
()[单选题]——[单选题]
ARDD具有血统机制(Lineage)
BRDD默认存储在磁盘
CRDD是一个只读的,可分区的分布式数据集
DRDD是Spark对基础数据的抽象
正确答案:
B
5、关于Hive在FusionInsightHD中的架构描述错误的是?
()[单选题]——[单选题]
A只要有一个HiveServer不可用,整个Hive
BMotaStore用于提供元数据服务,依赖于DBService
C在同一时间点,HiveServer只要一个处于Active状态,另一个则处于Standby
DHiveServer负责接收客户端请求,解析执行HQL命令并返回查询结果
正确答案:
A
6、通常情况下,Hire以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsightHive中,可以指定表数据的输入和输出格式处理。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
7、Topology在任务完成后会自动结来运行。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
B
8、在FusionInsightManater界面中,对Loader的操作不包括下列个选项?
()[单选题]——[单选题]
A切换Loader主备节点
B启动Loader实例
C配置Loader参数
D查看Loader服务状态
正确答案:
A
9、创建Loader作业中,可以在以下哪个步骤中设过滤器类型?
()[单选题]——[单选题]
A输入设置
B转换
C基本信息
D输出
正确答案:
A
10、Kafka日志的清理方式有两种:
delete和compact。
默认值是delete。
()[单选题]——[单选题]
ATRUS
BBALSE
正确答案:
A
11、karka-clustermirroring工具可以实现以下那些功能?
()[单选题]——[单选题]
Akafka集群数据同步方案
Bkafka单集群内数据备份
Ckafka单集群内数据恢复
D以全部不对
正确答案:
A
12、fusioninsightHD产品中,一个典型的kafka集群包含若干个producer若干个consummer和一个zookeeper集群。
()[单选题]——[单选题]
Atrue
Bfalse
正确答案:
B
13、以下关于KafkaPatition偏移的描述不正确的是?
()[单选题]——[单选题]
A每条消息在文件中的位置称为offtet(偏移量)
B消费者通过(offset、partition、topic)跟踪记录
C唯一标记一条消息
DOffset是一个Strine型字符串
正确答案:
D
14、Channe1的作用类似队列,用于临时缓存进来的数据,当Sink成功地将数据发送到下一跳的Channe1或最终目的,数据会从Chabne1移除。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
15、HDFS存储数据时,关键数据根据实际业务需要保存在具有高度可靠性的节点中,通过修改DataNode的存储策略,系统可以将数据强制保存在指定的节点组中。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
16、RDD有Transforeation和Action算子、下列属于Action算子的是。
()单选题——[单选题]
Amap
BsaveAsTextFile
CFilter
DreduceByKey
正确答案:
B
17、SparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
B
18、以下关于HiveSQL基本操作描述正确的是?
()[单选题]——[单选题]
A创建外部表必须要指定location
B创建外部表使用external
C加教数据到Hive时源数据必须是HDFS的一个路径
D创建表时可以指定列分割符、
正确答案:
D
19、在Streaming中,消息可靠性级别中精确一次是通过ACK机制来实现的。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
B
20、在Zookeeper和Yarn的协同工作中,当ActiveResourcelanager产生故障时,StandbayResourceMangger会从以下哪些目录中获取Application相关信息?
()[单选题]——[单选题]
Ametastore
BStatestore
CStoreage
DWarehouze
正确答案:
B
21、ZooKeeper所有节点都可处理该请求。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
22、HDFS的副本放置策略中,同一机架不同的服务器之间的距离是。
()[单选题]——[单选题]
A3;
B2;
C1;
D4;
正确答案:
B
23、Zookeeper的Scheme认证方式不包括以下哪项?
()[单选题]——[单选题]
Adigest
Bsas1
Cauth
Dwor1d
正确答案:
B
24、下列选项中适合MapReduce的场景有哪些。
()单选题]——[单选题]
A实时交互计算
B迭代计算
C流式计算
D离线计算
正确答案:
D
25、HDFS联邦机制下,各NameNode间元数据是不共享的。
()[单选题]——[单选题]
ATEUE
BFALSE
正确答案:
A
26、AppicationMaster、采用轮询的方式通过RPC协议向ResourceWanaer、申请和领取资源。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
27、在YARN的任务调度中,一旦App1icationMaster申请到资源后,使与对应的ResourceManager通信,要求它启动任务。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
B
28、HFS的出现解决了需要在HDPS中存储大的小文件(10MB以下),同时也要存储一些大文件(10MB以上)的混合的场景。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
B
29、下列哪个命令是从HDFS下载目录/文件到本地的?
()[单选题]——[单选题]
Adfs-put
Bdfs-cat
Cdfs-get
Ddfs-mkdir
正确答案:
C
30、HBase的主HMaster是如何选举的?
()[单选题]——[单选题]
A由RegionServer进行裁决
BHMaster,为双主模式,不需要进行裁决
C通过ZooKeeDer进行裁决
D随机选举
正确答案:
C
31、关于Hive与Hadoop其他组件的关系。
以下描述错误的是?
()[单选题]——[单选题]
AHive最终将数据存储在HDFS中
BHive是Hadoop平台的数据仓库工具
CHQL可以通过MapReduce执行任务
DHive对HBase有强依赖
正确答案:
D
32、Hive不支持超时重试机制。
()[单选题]——[单选题]
ATEUE
BFALSE
正确答案:
B
33、FusionInsight中,HiveSerrer将用户提交的HQL语句进行编译,解析成对应的Yarn任务,Spark任务或者HDFS操件,从而完成数据转换,分析。
()[单选题]——[单选题]
Atrue
BFalse
正确答案:
B
34、HBase的Region是由哪个服务进程来管理的?
()[单选题]——[单选题]
AHRegionSerrer
BZooKeeper
CHMaster
DDataNode
正确答案:
A
35、Flume传输的可靠性是指Flume在传输数据过程中,当下一跳的Flume节点故障或者数据接收异常时,可以自动切换到另外一路上继续传输?
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
36、假设HDFS在写入数据是只存2份,那么在写入过程中,HDFSClient先将数据写入,DeataNode1,再将数据写入DateNiode2。
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
37、容力量调度器在尽心资源分配,现有同级的2个队列Q1和Q2,他们的容均为30,期中Q1已使用8,Q2已使用14,则会优先将资限分配Q1、()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
38、server、chanmelschltransactionCapacity表示事务大小,即当前chamel支持事务处理的事件个数,可和source的batchsize设置为同样大小:
但不能小于batchsize。
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
39、Flume架构中,一个sink可以连接多个channei。
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
B
40、以下关于Flink关键特性描述不正确。
()[单选题]——[单选题]
ASparkStreaming与Flink相比,时延更低
BFlink流式处理引擎能够同时提供支持流处理和批处理应用的功能
C与PusionInghtHD 中的streaming相比,flink具有更高的吞吐量
Dcheckapoint实现了F1ink的容错,
正确答案:
A
41、FusionInsiebt是华为企业安大数期字体,查询,分析的统一平台,能够帮助企业快速构建海量数据信息处理系统,通过对海量信息数据实时与非实时的分析挖掘,发现全新价值点和企业商机。
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
42、KafcaClusterMIrrorine工具可以实现以下项功能?
()[单选题]——[单选题]
AKafiks跨集群数据同步方式
BKafka单集群内数据备份
CKafks单集群内数据恢复
D以上全不正确
正确答案:
A
43、FusionInsishtTool是为技术支持工程师和维护工程师提供的一套健康检查工具,能够检查集群相关节点,服务的健康状态,中潜在的问题并生成健康检查报告。
方便技术支持工程和维护工程师快速了解系统的健康状况。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
44、FusionInsigi产品中,关手Kafka说法不正确的是?
()[单选题]——[单选题]
AKafka强依赖于Zookeper
BKafka的服务可以产生消息
CKafka部署的实例个数不得小于2
DCanstumar作为Kafka的客户端角色专门进行消息的消费。
正确答案:
C
45、为了提高Kafka的客错性,Kafka支持Partition的复制策略。
以下关于LeaderPartitio和FoltcorerPartition的描述错误的是。
()[单选题]——[单选题]
AKafla针对Partition的复制需要选出一个Leader、由该Leader负责Partstia的读写操作。
其他的副本节点只是负费数据同步
B由于LeaderServer承载了全部的请求压力。
因此从集群的整体考虑,Kafka会将Leader均衡的分散在每个实例上,来确保数据均衡
C一个Kafka使群每个节点间不可能互为Ltader和Flower
D如果Leader失效。
那么将会有其他fol1ower来接管(成为新的Leaer)
正确答案:
C
46、Kafka是一个高吞吐.分布式.基于发布订阅的消息系统,利用Kafka技术可在廉价PCServer上搭建起大规模消息系统。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
47、flink是一个批处理和流处理结合的统一计算根框架,其核心是一个数据分发以及并行计算的流数据处理引擎。
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
48、下列关于Flinkbarrier描述错误的是?
()[单选题]——[单选题]
A一个barrier将本周期快照的数据与下一个周期快照的数据分隔开来
Bbarrier是Flink快照的核心
C在插入barrier的时候,会暂时阻断数据流
Dbarrier周期性插入到数据流中,并作为数据流的一部分随之流动
正确答案:
C
49、关于FusionInsightHDStreaming的Supervisor描述正确的是?
()[单选题]——[单选题]
ASupervisor是在Topology中接受数据然后执行处理的组件
BSupervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的Worker进程
CSupervisor负责资源分配和任务调度
DSupervisor是运行具体处理逻辑的过程
正确答案:
B
50、Hadoop中,如果yarnscheduler、capacityroot、QueueA.minimm-user-limit-percent设置为50,下面说法错误的是?
()[单选题]——[单选题]
A一个用户提交任务,可以使用QueueA的100%的资源,
B如果QueueA中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源
CQueueA中必须保障每个用户至少得到50%的资源
DQueueA中的每个用户最多只能获得50%的资源,
正确答案:
D
51、Streaming主要过zookeeper提供以下的哪项实现事件侦听?
()[单选题]——[单选题]
A分布式锁机制
BWatcher
CCheckpoint
DACK
正确答案:
B
52、Zookeeper在分布式应用中的主要作用不包括一下哪些选项?
()[单选题]——[单选题]
A选举Master节点
B保证各节点上数据的一致性
C分配集群资源
D存储及群中服务器储息
正确答案:
C
53、下图展示了文件A、B、C的存放位置其有文件A和D具有关探线,它们的存储位置符合colocation同分布策略。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
B
54、HEDPS中Namenode的主备仲裁,是由哪个组件控制的。
()[单选题]——[单选题]
AHDFSClient
BNodeManager
CResourceManger
DZooKeeperFailoverController
正确答案:
D
55、SparkStreaming计算基于DStream将的式计算分解成一系列短小的批处理作业。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
56、导入数据到Hive表时,不会查效据合法性,只会在读取数据时候检查。
()[单选题]——[单选题]
ATRLE
BFALSE
正确答案:
A
57、Topology的处理逻辑都在Bolt中()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
58、安装FusionInsightHD的Srerming组件是Nimbus角色要求安装几个节点?
()[单选题]——[单选题]
A4
B3
C2
D1
正确答案:
C
59、Flume的propertiesprotertises配置文件中可以配置多个channel以米传有数据。
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
60、驱动型source是flume周期性主动去获取数据().[单选题]——[单选题]
ATrue
BFalse
正确答案:
B
61、FusionInsightHD系统中计日志不可以记录下而哪些操作?
()[单选题]——[单选题]
A手动清除告警
B启停服务实例
C查询历史监控
D删除服务实树
正确答案:
C
62、HBase的数据文件HFile中的一个KeyValue格式包含Key、Value,TimeStap,KeyType等内容()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
63、在有N个节点FusionInsightHD集群中部署HBase时,推荐部署()个HMaster进程,()个RegionServer进程?
()[单选题]——[单选题]
A3、N
BN、N
C2、N
D2、2
正确答案:
C
64、Flink的数据转换操作在以下哪些环节中完成?
()[单选题]——[单选题]
Achannel
BTransformation
Csink
Dsource
正确答案:
B
65、KafkaLogssegment文件命名规则是ptipou全局的第一个sement从0开始,后续每个sement文件名为上一个全局partion事务最大offset(偏移message数)。
()[单选题]——[单选题]
ATRUE
BFALSE
正确答案:
A
66、Hive中“Groupby"指的是通过一定的规则将每一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理。
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
67、Flink适用于高并发处理数据、毫秒级时延的应用。
()[单选题]——[单选题]
ATrue
BFalse
正确答案:
A
68、当zgokeeper集群的节点数为5节点时,请问集群的容灾能力和多少节点是等价的?
()——[单选题]
A3
B4
C5
D以上全不正确
正确答案:
B
69、FusionInsightManager用户权限管理不支持哪个配置?
()单选题]——[单选题]
A给用户配置角色
B给用户组配置角色
C给角色配置权限
D给用户组配置权限
正确答案:
D
70、Yarn调度器分配资源的顺序,下面哪一个描述的正确?
()[单选题]——[单选题]
A任意机器->本地资源->同机架
B任意机器->同机架->本地资源
C本地资源->同机架->任意机器
D同机架->任意机器->本地资源
正确答案:
C
71、以下哪个不属于Hadoop中MapReduce组件的特点?
()[单选题]——[单选题]
A高容错
B良好的扩展性
C实时计算
D易于编程
正确答案:
C
72、Hbase的最小存储单元是Region。
()单选题]——[单选题]
ATRUE
BPALSE
正确答案:
A
73、Hbase的某张表的RorKe划plitkes为9.E.a.z.请问表里面有几个Region?
()[单选题]——[单选题]
A6
B3
C5
D4
正确答案:
C
74、为了保障流应用的快照存储的可靠性,快照主要存储在哪里?
()[单选题]——[单选题]
AjobManager的内存中
B可靠性高的单机数据库中
C本地文件系统中
Dhdfs中
正确答案:
D
75、在fusion1nsieht产品中,关于kafka的topic.以下描述不正确的是?
()[单选题]——[单选题]
Atopic的partition数量可以创建时配置
B每个topic只能被分成一个partition区
C每条发布到kafike的消息都有一个类别,这个类别被称为topic.也可以理解为--个存储消息的队列
D每个partition在存储层面对应--个1oe文件,1oe文件中记录了所有的消息数据
正确答案:
B
76、Kafa集群在运行期间,直接依赖于下面哪些组件?
()[单选题]——[单选题]
Aspark
Bzookeeper
Chdfs
Dhbase
正确答案:
B
77、关于fusioninsightmanege(界面hive日志收集的描述中,哪个不对?
()[单选题]——[单选题]
A可指定实例进行日志收集,比如指定收集metaStore的日志
B可指定节点ip进行日记收集,例如仅下载某个ip的日志
C可指定特定用户进行日志收集,例如仅下载user用户的日志
D可指定时间或进行日志收集,不如只收集2016-1-1到2016-1-10的日志
正确答案:
C
78、fusioninshshtoaner对于管理操作,下列错误的是?
()[单选题]——[单选题]
A可对服务进行启停重启
B可添加和卸载服务
C可设置不常用服务隐藏或显示
D可查看服务当前状态
正确答案:
C
79、为减少写入磁盘的数据量,m