ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:20.86KB ,
资源ID:3494909      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3494909.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(华为大数据测试题及答案.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

华为大数据测试题及答案.docx

1、华为大数据测试题及答案华为大数据测试题及答案 下列关于 GaussDB 200 的局部聚簇技术说法正确的是( ) ? A 、局部聚簇技术可以应用在 GaussDB 200 的所有表中B 、局部聚簇在某些场景下可以提交检索效率,所以在创建表时根据业务场景应创建多个 PCKC 、 PCK 对应的列尽量不要为空值D 、 PCK 通过 min/max 稀疏索引实现事实表快速过滤扫描 ( 正确答案 ) 从数据库架构设计来看,主要有以下哪些设计思路 ? A 、 Shard-DiskB 、 Shard-EveryingC 、 Shard-NothingD 、以上都是 ( 正确答案 ) 关于 Schema 和

2、 Database ,下面说法正确的是( )。 A 、二者都能实现资源隔离B 、 schema 和用户强相关的,通过权限控制语法可以实现不同用户对各 Schema 的权限 ( 正确答案 )C 、 Database 之间无法直接访问,但通过权限授予可以访问数据D 、相比于 Database , Schema 的隔离更加的彻底 下面哪个数据类型不是 GaussDB 200 支持的数据类型( )。 A 、 XML 类型 ( 正确答案 )B 、数值类型C 、 JSON 类型D 、货币类型 GaussDB 200 在创建表时,需要注意以下哪个事项( ) ? A 、创建列存表时压缩级别默认为 LOW (

3、正确答案 )B 、创建列存表时压缩级别默认为 HIGHC 、创建列存表时压缩级别默认为 NOD 、创建列存表之后,后续可以修改为行存表 下列关于存储过程的特点说法正确的是( ) ? A 、编写的 SQL 存储在数据库中,因此执行速度快B 、创建时编译,执行时调用,因此开发效率高C 、用户创建的存储过程或自定义函数可以重复调用,因此数据传输量少D 、通过指定存储过程的访问权限,因此安全系数高 ( 正确答案 ) 语句 number = 0 的意思是( ) ? A 、修改变量 number 的值为 0B 、判断 number 的值是否为 0C 、比较 number 和 0 的大小D 、声明一个变量

4、number ,并初始化值为 0 ( 正确答案 ) GaussDB 200 支持几种数据并行导入策略 ? A 、 4B 、 3 ( 正确答案 )C 、 2D 、 1 ElasticSearch 架构中包含哪些? A 、 A. 以上说法全都正确 ( 正确答案 )B 、 ClientC 、 ESMasterD 、 ESNode . 以下哪个不是 RDD 的创建方式? A 、从子的 RDD 转换到新的 RDD ( 正确答案 )B 、从数据集合转换而来C 、从 HDFS 输入创建D 、从父的 RDD 转换的到新的 RDD 以下哪个不是 SparkSQL 的使用场景? A 、 A. 需要处理 PB 级的

5、大容量数据B 、对数据处理的实时性要求不高的场景C 、实时数据查询 ( 正确答案 )D 、结构化数据处理 以下哪个不是离线批处理的核心诉求? A 、处理数据量巨大B 、处理数据格式多样C 、处理时间要求不高 ( 正确答案 )D 、支持 SQL 类作业和自定义作业 HBase 架构中包含哪些? A 、 ZookeeperB 、以上说法全都正确 ( 正确答案 )C 、 HmasterD 、 HRegionServer 某项目小组接到一个大数据实时分析项目,且对实时性要求很高。请问以下哪种大数据计算 框架最合适? A 、 HbaseB 、 MapReduceC 、 SparkD 、 Flink (

6、正确答案 ) 以下关于 Hive 内置函数描述正确的是? A 、 desc functions upper :查看系统自带的函数B 、 trim( ) :去除空字符串 ( 正确答案 )C 、 to_date( ) :获取当前日期D 、 substr( ) :求字符串长度 Gremlin 中查询单个点的信息该用什么命令? A 、 g.V(13464736).valueMap( ) ( 正确答案 )B 、 g.V( ).hasLabel(test).values(age)C 、 g.V( ).hasLabel(test)D 、 g.V( ).hasLabel(test).valueMap(Stri

7、ng_list,age) 考虑以下场景,当公安人员需要根据某犯罪人员发现其犯罪同伙时,最适合使用下列哪个工 具? A 、 ElasticSearchB 、 GraphBase ( 正确答案 )C 、 HbaseD 、 HDFS HBase 使用 get 方法读取数据时,下列哪个选项是需要的? A 、 Delete delete = new Delete(rowKey)B 、 scan.setCaching(1000)C 、 byte rowKey = Bytes.toBytes(012005000201) ( 正确答案 )D 、 List puts = new ArrayList( ) Fli

8、nk 不包含以下哪些数据处理场景? A 、高并发B 、毫秒级低时延C 、高可靠性D 、图形分析 ( 正确答案 ) 关于 GaussDB 200 的逻辑架构,下列说法正确的是( )? A 、 DN 是实际数据节点,所以只负责存储数据。B 、 CM 是集群的管理模块,那么负责集群的日常管理和运维。C 、 CN 是协调节点,协助 CM 管理整个集群。D 、 GTM 是全局事务控制器,负责生成和维护全局事务 ID 等全局唯一信息。 ( 正确答案 ) 用户 Region 和 Region Server 之间的路由信息 , 保存在哪个模块中 ? A 、 ZookeeperB 、 B HDFSC 、 Mas

9、terD 、 Meta 表 ( 正确答案 ) Hbase 的物理存储单元是什么 ? A 、 RegionB 、 Columnfamily ( 正确答案 )C 、 ColumnD 、 Row Redis 中适合存储对象的数据类型是 ? A 、 Hash ( 正确答案 )B 、 ListC 、 StringD 、 Set GAUSSDB200 数据并行导入 Shared 策略支持的数据格式是 ? A 、 CSVB 、 Text ( 正确答案 )C 、 FIXEDD 、 seq Flume 支持第三方过滤器对数据进行过滤操作。 判断题 对 ( 正确答案 )错 多个 Flume 可以连接起来从部署节点

10、上采集数据。 判断题 对 ( 正确答案 )错 Flume 传输数据时, sink 如果出现下一跳故障,可以将数据发给其他的下一跳。 判断题 对 ( 正确答案 )错 Kafka 集群中, Kafka 服务端角色是 Consumer 。 判断题 对错 ( 正确答案 ) Kafka 集群中, Kafka 部署的实例个数不得小于 2 。 判断题 对 ( 正确答案 )错 Checkpoint 机制是 Flink 运行过程中容错的重要手段。 判断题 对 ( 正确答案 )错 Flink 程序是由 DataSet 和 DataStream 组成。 判断题 对错 ( 正确答案 ) Structured Stre

11、aming 的外部存储系统的 Append Mode 方式表示只有在 Result Table 中被更新的数据才会被写入到外部存储系统。 判断题 对错 ( 正确答案 ) Redis 可以做排行榜的应用场景。 判断题 对 ( 正确答案 )错 Redis 的 flushall 命令表示清空 Redis 实例下所有数据库的数据。 判断题 对 ( 正确答案 )错 数据库架构设计 Shard-Everying 是指服务器的所有资源(包括磁盘、 CPU 、显卡、网络)都共享。 判断题 对错 ( 正确答案 ) CTID 的值是增量增加的。 判断题 对 ( 正确答案 )错 物理集群包含逻辑集群。 判断题 对

12、( 正确答案 )错 SQL on Anywhere 的意思是 SQL 可以在任何地方使用。 判断题 对错 ( 正确答案 ) GaussDB 200 的自适应调度和大数据的 Yarn 调度是类似的,都是根据作业的所耗资源, 按照作业优先级,并优先满足损耗资源少的作业,保证资源的充分利用。 判断题 对错 ( 正确答案 ) 创建数据库时默认支持的字符集是 UTF-8 。 判断题 对错 ( 正确答案 ) Flink 程序是由 DataSet 和 DataStream 组成。 判断题 对错 ( 正确答案 ) Structured Streaming 的外部存储系统的 Append Mode 方式表示只有

13、在 Result Table 中被更新的数据才会被写入到外部存储系统。 判断题 对错 ( 正确答案 ) .Hive 从本地加载数据需要加关键字: “local” 。 判断题 对 ( 正确答案 )错 大数据技术,是指伴随大数据的采集、存储、处理和分析的相关技术 判断题 对 ( 正确答案 )错 针对不同的数据来源,需要先分析其数据特征,例如一般网站产生的日志特点是数据量大, 价值密度高,数据的业务种类多且涵盖之前的数据。 判断题 对错 ( 正确答案 ) Kafka 中的 Broker 在收到新消息后会立即存入磁盘。 判断题 对错 ( 正确答案 ) GaussDB 200 的自适应调度和大数据的 Y

14、ARN 调度是类似的,都是根据作业的所耗资源,按 照作业优先级,并优先满足损耗资源少的作业,保证资源的充分利用。 判断题 对错 ( 正确答案 ) Hbase 是一种分布式数据库 , 不依赖 HDFS 也可以运行。 判断题 对 ( 正确答案 )错 GAUSSDB200 在内部使用行标识符 (CTID) 记录数据在表中的逻辑位置。 判断题 对错 ( 正确答案 ) Redis 默认支持 14 个数据库。 判断题 对错 ( 正确答案 ) 关于 Kafka 组件说法正确的是 ?A 、删除 topic 时,必须确保 kafka 的服务配置 delete.topic.enable 配置为 true ( 正确

15、答案 )B 、 Kafka 安装及运行日志保存路径为 /srv/Bigdata/kafka/C 、 ZooKeeper 服务不可用会导致 Kafka 服务不可用 ( 正确答案 )D 、必须使用 admin 用户或者 kafkaadmin 组用户进行创建 topic ( 正确答案 ) 下面哪些是 Flume 的 sink 支持的类型 ?A 、 Kafka Sink ( 正确答案 )B 、 Storm SinkC 、 Hbase Sink ( 正确答案 )D 、 Spark Sink ( 正确答案 ) Redis 的写命令同步的时机有哪几种 ?A 、 appendfsync yesB 、 appe

16、ndfsync always ( 正确答案 )C 、 appendfsync everysec ( 正确答案 )D 、 appendfsync no ( 正确答案 ) 关于 Redis 的描述,下列正确的是 ?A 、 Redis 支持多数据库 ( 正确答案 )B 、可以使用 exists key 判断键是否存在 ( 正确答案 )C 、 Redis 可以为任何键增减字段而不影响其他键D 、 Redis 的命令区分大小写 ( 正确答案 ) 下面哪些是属于 Flink 的窗口类型 ?A 、 Tumbling Window ( 正确答案 )B 、 countWindow ( 正确答案 )C 、 Sli

17、ding Window ( 正确答案 )D 、 timeWindow ( 正确答案 ) 以下哪些情况下采用 Replication 方式存储数据( ) ?A 、存储的表的数据量较小 ( 正确答案 )B 、需要较高的并发分析能力 ( 正确答案 )C 、对数据的完整性要求较高D 、以上都是 一般在什么时候会采用数据分区( ) ?A 、当表中数据量比较多(千万级别以上)的时候 ( 正确答案 )B 、需要执行大量的数据删除操作的时候 ( 正确答案 )C 、需要执行大量的热点数据查询操作的时候 ( 正确答案 )D 、需要执行大量的数据更新操作的时候 ( 正确答案 ) GaussDB 200 的高可靠主要

18、体现在( ) ?A 、提供集群管理和数据节点 HA ( 正确答案 )B 、事务支持 ACID 特性 ( 正确答案 )C 、支持故障切换、单节点故障恢复 ( 正确答案 )D 、支持标准 SQL 和标准 JDBC 特性 下面关于 GaussDB 200 的逻辑集群说法正确的是( ) ?A 、逻辑集群的意思就是通过物理服务器的隔离来达到数据的分离处理B 、在逻辑集群上实现多租户管理,达到 CPU 、内存等计算资源的控制隔离 ( 正确答案 )C 、逻辑集群的最终目的是实现资源隔离及资源弹性能力 ( 正确答案 )D 、一个物理节点对应一个逻辑集群 ( 正确答案 ) 对于 Gremlin 描述正确的是?A

19、 、支持客户端操作和 Java API 操作 ( 正确答案 )B 、每一步操作都在数据流( data stream )上执行一个原子操作 ( 正确答案 )C 、语句比较复杂D 、函数式数据流语言 ( 正确答案 ) HDFS 的系统结构中包含哪些模块?A 、 DataNode ( 正确答案 )B 、 Client ( 正确答案 )C 、 RegionServerD 、 NameNode ( 正确答案 ) 以下哪些是 Hive 自带的系统函数?A 、 sum ( 正确答案 )B 、 count ( 正确答案 )C 、 like ( 正确答案 )D 、 Dwg 大数据场景化解决方案包含以下哪些选项?

20、A 、离线检索B 、离线批处理 ( 正确答案 )C 、实时检索 ( 正确答案 )D 、实时流处理 ( 正确答案 ) 在金融领域的大数据批量离线处理平台中,以下描述准确的是?A 、在数据集成模块,可以分为数据采集、数据操控和数据加载 3 个阶段。 ( 正确答案 )B 、金融领域的外部数据来源可以是征信信息、社交网络和电商等。 ( 正确答案 )C 、金融领域的内部数据来源均是结构化数据,包括信贷数据、信用卡数据和收单数据等。D 、金融领域的数据应用层面均是面向金融机构内部的,如监管报表系统,精准营销、 BI 应用等,完 全不对外或对其他下属机构开放。 大数据离线批处理场景中常见的数据源包括?A 、

21、流式数据 Socket 流 ( 正确答案 )B 、网页日志流 ( 正确答案 )C 、批量文件数据 ( 正确答案 )D 、数据库 ( 正确答案 ) 以下哪些选项是实时检索适用的场景?A 、高并发的场景 ( 正确答案 )B 、查询速度要求高的场景 ( 正确答案 )C 、图片查询场景 ( 正确答案 )D 、查询条件比较复杂的场景 下列哪些措施,可以显著提升 ElasticSearch 的性能?A 、减少 EsMasterB 、禁用 swap ( 正确答案 )C 、修改副本数量 ( 正确答案 )D 、增加 EsMaster Flink 中的计算时间包含以下哪几种?A 、 Ingestion Time

22、( 正确答案 )B 、 Event Time ( 正确答案 )C 、 Delay TimeD 、 Processing Time ( 正确答案 ) Structured Streaming 中通过什么机制,解决数据的无序和滞后问题?A 、持续查询B 、事件时间 ( 正确答案 )C 、 watermark 机制 ( 正确答案 )D 、流连接 下列关于 GaussDB 200 的 TOAST 机制说法正确的是( )?A 、支持变长 (varlena) 表现形式的数据类型。 ( 正确答案 )B 、存储超过 2KB 的字段时,会触发 TOAST 机制。 ( 正确答案 )C 、存储超过 1KB 的字段时

23、,会触发 TOAST 机制。D 、存储超过 1/2KB 的字段时,会触发 TOAST 机制。 数据仓库数据分层的优点包括?A 、把复杂问题简单化 ( 正确答案 )B 、减少数据仓库存储空间C 、隔离原始数据 ( 正确答案 )D 、减少重复开发 ( 正确答案 ) GaussDB 200 的高可靠主要体现在( )?A 、提供集群管理和数据节点 HA 。 ( 正确答案 )B 、 GTM 采用 Active-Standby 模式。 ( 正确答案 )C 、 CN 支持多 CN Active-Active 模式 HA 。 ( 正确答案 )D 、支持标准 SQL 和标准 JDBC 特性。 对 Hbase B

24、loomfilter 描述不正确的是 ?A 、判断结果一定正确 ( 正确答案 )B 、用于优化随机写的场景 ( 正确答案 )C 、用于优化 Scan 场景 ( 正确答案 )D 、误判率由哈希函数个数 k 、位数组大小 m 、数据量 n 共同确定 实时场景的典型特点是 ?A 、数据格式多 ( 正确答案 )B 、交互式查询 ( 正确答案 )C 、数据量大D 、时延要求高 ( 正确答案 ) 实时检索解决方案支持的数据采集有哪些 ?A 、 Loader ( 正确答案 )B 、 Spark ( 正确答案 )C 、 Sparkstreaming ( 正确答案 )D 、 Graphbase 导入工具 ( 正

25、确答案 ) Kafka 的应用场景有哪些 ?A 、行为监控 ( 正确答案 )B 、数据处理C 、元信息监控 ( 正确答案 )D 、流处理 ( 正确答案 )Flume 支持采集静态目录下数据的 source 类型是 ? A 、 http sourceB 、 spooling directory source ( 正确答案 )C 、 exec sourceD 、 syslog source 关于 Kafka 磁盘容量不足的告警,对于可能的原因以下不正确的是 ? A 、用于存储 Kafka 数据的磁盘配置(如磁盘数目磁盘大小等),无法满足当前业务数据流量,导致磁盘使用 率达到上限B 、数据保存时间配

26、置过长,数据累积达到磁盘使用率上限C 、业务规划不合理,导致数据分配不均,使部分磁盘达到使用率上限D 、 Broker 节点故障导致 ( 正确答案 ) 查看 Kafka 某 Topic 的 Partition 详细信息时,使用如下哪个命令 ? A 、 bin/kafka-topics.sh -createB 、 bin/kafka-topics.sh listC 、 bin/kafka-topics.sh deleteD 、 bin/kafka-topics.sh describe ( 正确答案 ) 关于 Kafka 组件部署说法不正确的是 ? A 、 Kafka 强依赖于 ZooKeeper ,安装 Kafka 必须安装 ZooKeeperB 、 Kafka 部署的实例个数不得小于 2C 、 Kafka 服务端可以产生消息 ( 正确答案 )D 、 Consumer 作为 Kafka 的客户端角色专门进行消息的消费 在 redis 中,下面哪个是操作 Hash 数据类型的命令 ? A 、 strlenB 、 hexists ( 正确答案 )C 、 smembersD 、 Ltrim

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1