华为大数据测试题及答案.docx-资源下载

华为大数据测试题及答案.docx

1、华为大数据测试题及答案华为大数据测试题及答案下列关于 GaussDB 200 的局部聚簇技术说法正确的是（） ? A 、局部聚簇技术可以应用在 GaussDB 200 的所有表中B 、局部聚簇在某些场景下可以提交检索效率，所以在创建表时根据业务场景应创建多个 PCKC 、 PCK 对应的列尽量不要为空值D 、 PCK 通过 min/max 稀疏索引实现事实表快速过滤扫描 ( 正确答案 ) 从数据库架构设计来看，主要有以下哪些设计思路 ? A 、 Shard-DiskB 、 Shard-EveryingC 、 Shard-NothingD 、以上都是 ( 正确答案 ) 关于 Schema 和

2、 Database ，下面说法正确的是（）。 A 、二者都能实现资源隔离B 、 schema 和用户强相关的，通过权限控制语法可以实现不同用户对各 Schema 的权限 ( 正确答案 )C 、 Database 之间无法直接访问，但通过权限授予可以访问数据D 、相比于 Database ， Schema 的隔离更加的彻底下面哪个数据类型不是 GaussDB 200 支持的数据类型（）。 A 、 XML 类型 ( 正确答案 )B 、数值类型C 、 JSON 类型D 、货币类型 GaussDB 200 在创建表时，需要注意以下哪个事项（） ? A 、创建列存表时压缩级别默认为 LOW (

3、正确答案 )B 、创建列存表时压缩级别默认为 HIGHC 、创建列存表时压缩级别默认为 NOD 、创建列存表之后，后续可以修改为行存表下列关于存储过程的特点说法正确的是（） ? A 、编写的 SQL 存储在数据库中，因此执行速度快B 、创建时编译，执行时调用，因此开发效率高C 、用户创建的存储过程或自定义函数可以重复调用，因此数据传输量少D 、通过指定存储过程的访问权限，因此安全系数高 ( 正确答案 ) 语句 number = 0 的意思是（） ? A 、修改变量 number 的值为 0B 、判断 number 的值是否为 0C 、比较 number 和 0 的大小D 、声明一个变量

4、number ，并初始化值为 0 ( 正确答案 ) GaussDB 200 支持几种数据并行导入策略 ? A 、 4B 、 3 ( 正确答案 )C 、 2D 、 1 ElasticSearch 架构中包含哪些？ A 、 A. 以上说法全都正确 ( 正确答案 )B 、 ClientC 、 ESMasterD 、 ESNode . 以下哪个不是 RDD 的创建方式？ A 、从子的 RDD 转换到新的 RDD ( 正确答案 )B 、从数据集合转换而来C 、从 HDFS 输入创建D 、从父的 RDD 转换的到新的 RDD 以下哪个不是 SparkSQL 的使用场景？ A 、 A. 需要处理 PB 级的

5、大容量数据B 、对数据处理的实时性要求不高的场景C 、实时数据查询 ( 正确答案 )D 、结构化数据处理以下哪个不是离线批处理的核心诉求？ A 、处理数据量巨大B 、处理数据格式多样C 、处理时间要求不高 ( 正确答案 )D 、支持 SQL 类作业和自定义作业 HBase 架构中包含哪些？ A 、 ZookeeperB 、以上说法全都正确 ( 正确答案 )C 、 HmasterD 、 HRegionServer 某项目小组接到一个大数据实时分析项目，且对实时性要求很高。请问以下哪种大数据计算框架最合适？ A 、 HbaseB 、 MapReduceC 、 SparkD 、 Flink (

6、正确答案 ) 以下关于 Hive 内置函数描述正确的是？ A 、 desc functions upper ：查看系统自带的函数B 、 trim（）：去除空字符串 ( 正确答案 )C 、 to_date（）：获取当前日期D 、 substr（）：求字符串长度 Gremlin 中查询单个点的信息该用什么命令？ A 、 g.V(13464736).valueMap（） ( 正确答案 )B 、 g.V（）.hasLabel(test).values(age)C 、 g.V（）.hasLabel(test)D 、 g.V（）.hasLabel(test).valueMap(Stri

7、ng_list,age) 考虑以下场景，当公安人员需要根据某犯罪人员发现其犯罪同伙时，最适合使用下列哪个工具？ A 、 ElasticSearchB 、 GraphBase ( 正确答案 )C 、 HbaseD 、 HDFS HBase 使用 get 方法读取数据时，下列哪个选项是需要的？ A 、 Delete delete = new Delete(rowKey)B 、 scan.setCaching(1000)C 、 byte rowKey = Bytes.toBytes(012005000201) ( 正确答案 )D 、 List puts = new ArrayList（） Fli

8、nk 不包含以下哪些数据处理场景？ A 、高并发B 、毫秒级低时延C 、高可靠性D 、图形分析 ( 正确答案 ) 关于 GaussDB 200 的逻辑架构，下列说法正确的是（）？ A 、 DN 是实际数据节点，所以只负责存储数据。B 、 CM 是集群的管理模块，那么负责集群的日常管理和运维。C 、 CN 是协调节点，协助 CM 管理整个集群。D 、 GTM 是全局事务控制器，负责生成和维护全局事务 ID 等全局唯一信息。 ( 正确答案 ) 用户 Region 和 Region Server 之间的路由信息 , 保存在哪个模块中 ? A 、 ZookeeperB 、 B HDFSC 、 Mas

9、terD 、 Meta 表 ( 正确答案 ) Hbase 的物理存储单元是什么 ? A 、 RegionB 、 Columnfamily ( 正确答案 )C 、 ColumnD 、 Row Redis 中适合存储对象的数据类型是 ? A 、 Hash ( 正确答案 )B 、 ListC 、 StringD 、 Set GAUSSDB200 数据并行导入 Shared 策略支持的数据格式是 ? A 、 CSVB 、 Text ( 正确答案 )C 、 FIXEDD 、 seq Flume 支持第三方过滤器对数据进行过滤操作。判断题对 ( 正确答案 )错多个 Flume 可以连接起来从部署节点

10、上采集数据。判断题对 ( 正确答案 )错 Flume 传输数据时， sink 如果出现下一跳故障，可以将数据发给其他的下一跳。判断题对 ( 正确答案 )错 Kafka 集群中， Kafka 服务端角色是 Consumer 。判断题对错 ( 正确答案 ) Kafka 集群中， Kafka 部署的实例个数不得小于 2 。判断题对 ( 正确答案 )错 Checkpoint 机制是 Flink 运行过程中容错的重要手段。判断题对 ( 正确答案 )错 Flink 程序是由 DataSet 和 DataStream 组成。判断题对错 ( 正确答案 ) Structured Stre

11、aming 的外部存储系统的 Append Mode 方式表示只有在 Result Table 中被更新的数据才会被写入到外部存储系统。判断题对错 ( 正确答案 ) Redis 可以做排行榜的应用场景。判断题对 ( 正确答案 )错 Redis 的 flushall 命令表示清空 Redis 实例下所有数据库的数据。判断题对 ( 正确答案 )错数据库架构设计 Shard-Everying 是指服务器的所有资源（包括磁盘、 CPU 、显卡、网络）都共享。判断题对错 ( 正确答案 ) CTID 的值是增量增加的。判断题对 ( 正确答案 )错物理集群包含逻辑集群。判断题对

12、( 正确答案 )错 SQL on Anywhere 的意思是 SQL 可以在任何地方使用。判断题对错 ( 正确答案 ) GaussDB 200 的自适应调度和大数据的 Yarn 调度是类似的，都是根据作业的所耗资源，按照作业优先级，并优先满足损耗资源少的作业，保证资源的充分利用。判断题对错 ( 正确答案 ) 创建数据库时默认支持的字符集是 UTF-8 。判断题对错 ( 正确答案 ) Flink 程序是由 DataSet 和 DataStream 组成。判断题对错 ( 正确答案 ) Structured Streaming 的外部存储系统的 Append Mode 方式表示只有

13、在 Result Table 中被更新的数据才会被写入到外部存储系统。判断题对错 ( 正确答案 ) .Hive 从本地加载数据需要加关键字： “local” 。判断题对 ( 正确答案 )错大数据技术，是指伴随大数据的采集、存储、处理和分析的相关技术判断题对 ( 正确答案 )错针对不同的数据来源，需要先分析其数据特征，例如一般网站产生的日志特点是数据量大，价值密度高，数据的业务种类多且涵盖之前的数据。判断题对错 ( 正确答案 ) Kafka 中的 Broker 在收到新消息后会立即存入磁盘。判断题对错 ( 正确答案 ) GaussDB 200 的自适应调度和大数据的 Y

14、ARN 调度是类似的，都是根据作业的所耗资源，按照作业优先级，并优先满足损耗资源少的作业，保证资源的充分利用。判断题对错 ( 正确答案 ) Hbase 是一种分布式数据库 , 不依赖 HDFS 也可以运行。判断题对 ( 正确答案 )错 GAUSSDB200 在内部使用行标识符 (CTID) 记录数据在表中的逻辑位置。判断题对错 ( 正确答案 ) Redis 默认支持 14 个数据库。判断题对错 ( 正确答案 ) 关于 Kafka 组件说法正确的是 ?A 、删除 topic 时，必须确保 kafka 的服务配置 delete.topic.enable 配置为 true ( 正确

15、答案 )B 、 Kafka 安装及运行日志保存路径为 /srv/Bigdata/kafka/C 、 ZooKeeper 服务不可用会导致 Kafka 服务不可用 ( 正确答案 )D 、必须使用 admin 用户或者 kafkaadmin 组用户进行创建 topic ( 正确答案 ) 下面哪些是 Flume 的 sink 支持的类型 ?A 、 Kafka Sink ( 正确答案 )B 、 Storm SinkC 、 Hbase Sink ( 正确答案 )D 、 Spark Sink ( 正确答案 ) Redis 的写命令同步的时机有哪几种 ?A 、 appendfsync yesB 、 appe

16、ndfsync always ( 正确答案 )C 、 appendfsync everysec ( 正确答案 )D 、 appendfsync no ( 正确答案 ) 关于 Redis 的描述，下列正确的是 ?A 、 Redis 支持多数据库 ( 正确答案 )B 、可以使用 exists key 判断键是否存在 ( 正确答案 )C 、 Redis 可以为任何键增减字段而不影响其他键D 、 Redis 的命令区分大小写 ( 正确答案 ) 下面哪些是属于 Flink 的窗口类型 ?A 、 Tumbling Window ( 正确答案 )B 、 countWindow ( 正确答案 )C 、 Sli

17、ding Window ( 正确答案 )D 、 timeWindow ( 正确答案 ) 以下哪些情况下采用 Replication 方式存储数据（） ?A 、存储的表的数据量较小 ( 正确答案 )B 、需要较高的并发分析能力 ( 正确答案 )C 、对数据的完整性要求较高D 、以上都是一般在什么时候会采用数据分区（） ?A 、当表中数据量比较多（千万级别以上）的时候 ( 正确答案 )B 、需要执行大量的数据删除操作的时候 ( 正确答案 )C 、需要执行大量的热点数据查询操作的时候 ( 正确答案 )D 、需要执行大量的数据更新操作的时候 ( 正确答案 ) GaussDB 200 的高可靠主要

18、体现在（） ?A 、提供集群管理和数据节点 HA ( 正确答案 )B 、事务支持 ACID 特性 ( 正确答案 )C 、支持故障切换、单节点故障恢复 ( 正确答案 )D 、支持标准 SQL 和标准 JDBC 特性下面关于 GaussDB 200 的逻辑集群说法正确的是（） ?A 、逻辑集群的意思就是通过物理服务器的隔离来达到数据的分离处理B 、在逻辑集群上实现多租户管理，达到 CPU 、内存等计算资源的控制隔离 ( 正确答案 )C 、逻辑集群的最终目的是实现资源隔离及资源弹性能力 ( 正确答案 )D 、一个物理节点对应一个逻辑集群 ( 正确答案 ) 对于 Gremlin 描述正确的是？A

19、、支持客户端操作和 Java API 操作 ( 正确答案 )B 、每一步操作都在数据流（ data stream ）上执行一个原子操作 ( 正确答案 )C 、语句比较复杂D 、函数式数据流语言 ( 正确答案 ) HDFS 的系统结构中包含哪些模块？A 、 DataNode ( 正确答案 )B 、 Client ( 正确答案 )C 、 RegionServerD 、 NameNode ( 正确答案 ) 以下哪些是 Hive 自带的系统函数？A 、 sum ( 正确答案 )B 、 count ( 正确答案 )C 、 like ( 正确答案 )D 、 Dwg 大数据场景化解决方案包含以下哪些选项？

20、A 、离线检索B 、离线批处理 ( 正确答案 )C 、实时检索 ( 正确答案 )D 、实时流处理 ( 正确答案 ) 在金融领域的大数据批量离线处理平台中，以下描述准确的是？A 、在数据集成模块，可以分为数据采集、数据操控和数据加载 3 个阶段。 ( 正确答案 )B 、金融领域的外部数据来源可以是征信信息、社交网络和电商等。 ( 正确答案 )C 、金融领域的内部数据来源均是结构化数据，包括信贷数据、信用卡数据和收单数据等。D 、金融领域的数据应用层面均是面向金融机构内部的，如监管报表系统，精准营销、 BI 应用等，完全不对外或对其他下属机构开放。大数据离线批处理场景中常见的数据源包括？A 、

21、流式数据 Socket 流 ( 正确答案 )B 、网页日志流 ( 正确答案 )C 、批量文件数据 ( 正确答案 )D 、数据库 ( 正确答案 ) 以下哪些选项是实时检索适用的场景？A 、高并发的场景 ( 正确答案 )B 、查询速度要求高的场景 ( 正确答案 )C 、图片查询场景 ( 正确答案 )D 、查询条件比较复杂的场景下列哪些措施，可以显著提升 ElasticSearch 的性能？A 、减少 EsMasterB 、禁用 swap ( 正确答案 )C 、修改副本数量 ( 正确答案 )D 、增加 EsMaster Flink 中的计算时间包含以下哪几种？A 、 Ingestion Time

22、( 正确答案 )B 、 Event Time ( 正确答案 )C 、 Delay TimeD 、 Processing Time ( 正确答案 ) Structured Streaming 中通过什么机制，解决数据的无序和滞后问题？A 、持续查询B 、事件时间 ( 正确答案 )C 、 watermark 机制 ( 正确答案 )D 、流连接下列关于 GaussDB 200 的 TOAST 机制说法正确的是（）？A 、支持变长 (varlena) 表现形式的数据类型。 ( 正确答案 )B 、存储超过 2KB 的字段时，会触发 TOAST 机制。 ( 正确答案 )C 、存储超过 1KB 的字段时

23、，会触发 TOAST 机制。D 、存储超过 1/2KB 的字段时，会触发 TOAST 机制。数据仓库数据分层的优点包括？A 、把复杂问题简单化 ( 正确答案 )B 、减少数据仓库存储空间C 、隔离原始数据 ( 正确答案 )D 、减少重复开发 ( 正确答案 ) GaussDB 200 的高可靠主要体现在（）？A 、提供集群管理和数据节点 HA 。 ( 正确答案 )B 、 GTM 采用 Active-Standby 模式。 ( 正确答案 )C 、 CN 支持多 CN Active-Active 模式 HA 。 ( 正确答案 )D 、支持标准 SQL 和标准 JDBC 特性。对 Hbase B

24、loomfilter 描述不正确的是 ?A 、判断结果一定正确 ( 正确答案 )B 、用于优化随机写的场景 ( 正确答案 )C 、用于优化 Scan 场景 ( 正确答案 )D 、误判率由哈希函数个数 k 、位数组大小 m 、数据量 n 共同确定实时场景的典型特点是 ?A 、数据格式多 ( 正确答案 )B 、交互式查询 ( 正确答案 )C 、数据量大D 、时延要求高 ( 正确答案 ) 实时检索解决方案支持的数据采集有哪些 ?A 、 Loader ( 正确答案 )B 、 Spark ( 正确答案 )C 、 Sparkstreaming ( 正确答案 )D 、 Graphbase 导入工具 ( 正

25、确答案 ) Kafka 的应用场景有哪些 ?A 、行为监控 ( 正确答案 )B 、数据处理C 、元信息监控 ( 正确答案 )D 、流处理 ( 正确答案 )Flume 支持采集静态目录下数据的 source 类型是 ? A 、 http sourceB 、 spooling directory source ( 正确答案 )C 、 exec sourceD 、 syslog source 关于 Kafka 磁盘容量不足的告警，对于可能的原因以下不正确的是 ? A 、用于存储 Kafka 数据的磁盘配置（如磁盘数目磁盘大小等），无法满足当前业务数据流量，导致磁盘使用率达到上限B 、数据保存时间配

26、置过长，数据累积达到磁盘使用率上限C 、业务规划不合理，导致数据分配不均，使部分磁盘达到使用率上限D 、 Broker 节点故障导致 ( 正确答案 ) 查看 Kafka 某 Topic 的 Partition 详细信息时，使用如下哪个命令 ? A 、 bin/kafka-topics.sh -createB 、 bin/kafka-topics.sh listC 、 bin/kafka-topics.sh deleteD 、 bin/kafka-topics.sh describe ( 正确答案 ) 关于 Kafka 组件部署说法不正确的是 ? A 、 Kafka 强依赖于 ZooKeeper ，安装 Kafka 必须安装 ZooKeeperB 、 Kafka 部署的实例个数不得小于 2C 、 Kafka 服务端可以产生消息 ( 正确答案 )D 、 Consumer 作为 Kafka 的客户端角色专门进行消息的消费在 redis 中，下面哪个是操作 Hash 数据类型的命令 ? A 、 strlenB 、 hexists ( 正确答案 )C 、 smembersD 、 Ltrim

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？