广东省公需课大数据考试.docx

上传人:b****5 文档编号:3150447 上传时间:2022-11-18 格式:DOCX 页数:8 大小:22.49KB
下载 相关 举报
广东省公需课大数据考试.docx_第1页
第1页 / 共8页
广东省公需课大数据考试.docx_第2页
第2页 / 共8页
广东省公需课大数据考试.docx_第3页
第3页 / 共8页
广东省公需课大数据考试.docx_第4页
第4页 / 共8页
广东省公需课大数据考试.docx_第5页
第5页 / 共8页
点击查看更多>>
下载资源
资源描述

广东省公需课大数据考试.docx

《广东省公需课大数据考试.docx》由会员分享,可在线阅读,更多相关《广东省公需课大数据考试.docx(8页珍藏版)》请在冰豆网上搜索。

广东省公需课大数据考试.docx

广东省公需课大数据考试

大数据体系结构

单选

·下面不是HDFS优点的是B.适合单线程处理

·下面不是HDFS缺点的是D.流式文件访问

·大数据处理框架Spark最大的集群来自B.腾讯

·大数据处理框架Spark诞生于A.伯克利大学AMPLab

·提供资源的网络被称为B.云

·以下不属于服务器及桌面虚拟化技术的是D. 虚拟SAN技术

多选

·前端数据中心虚拟化技术包括A.组件虚拟化B.交换系统虚拟化C.网络虚拟化D.网络服务器虚拟化ABCD

·能解决大数据存储效率的两方面有A.容量B.吞吐量AB

·Hadoop的缺点有A.延迟大B.相应缓慢C.运维复杂ABC

·分布式数据库的特点是A.是一个有序、稀疏、多维度的映射表B.有良好的伸缩性和高可用性C.用来将数据库存储或部署到各个计算节点上ABC

·云计算的优势包括A.数据在云端:

不怕丢失,不必备份,可以任意点的恢复B.软件在云端:

不必下载自动升级C.无所不在的计算:

在任何时间,任意地点,任何设备登录后就可以进行计算服务D.无线强大的计算:

具有无线空间的,无线速度ABCD

·SaaS模式的优点有A.不用承担软件项目定制、开发、实施费用B.不用支付软件许可费用C.不需要支付采购服务器等硬件设备费用D.不需要支付购买操作系统、数据库等平台软件费用ABCD

·大数据处理框架-Spark的优点是()A. Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合B. Spark不适用那种异步细粒度更新状态的应用D. Spark的适用面比较广泛且比较通用ABD

判断

·编程模型不适合用来处理大量数据的分布式运算,用于解决问题的程序开发模型,也是开发人员拆解问题的方法(错误)

·HDFS是一个不可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用(错误)

·目前大数据在互联网公司主要把Spark应用在广告、报表、推荐系统等业务上(正确)

·Hadoop主要的使用场景在于实时系统(错误)

·Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架(正确)

·政务云是为政府机构应用现代信息通信技术(正确)

·Spark与Hadoop无缝结合(正确)

·流计算关注的是数据多次处理一次写入(正确)

·云计算将所有的计算资源集中起来,并由软件实现自动管理,无需人为参与(正确)

大数据概述和基本概念

单选

·以下观点错误的是D.内部大数据与外部大数据的相对独立能保证企业的数据安全

·大数据技术的战略意义是C.对这些含有意义的数据进行专业化处理

·以下数据单位最大的是C.TB

·以下不属于推动大数据分析平台发展技术的是B.数据管理技术

·主要承担搭建大数据平台上层建筑任务的是B.数据开发技术

·下列单位不是数据单位的是B.NB

······信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。

凡涉及到这些过程和技术的工作部门,都可称作()部门C.信息

·下列不属于商业大数据类型的是()D. 电子商务数据

多选

·大数据技术的出现实现了巨大的社会价值,主要表现在A.能够推动实现巨大经济效益C.能够推动增强社会管理水平D.如果没有高性能的分析工具,大数据的价值就得不到释放ACD

·“大数据”的特点是A.数据体量大B.数据类别大C.数据处理速度快D.数据真实性高ABCD

·数据是一种未经加工的原始资料,下列属于数据的是A.数字B.符号C.文字D.图像ABCD

·云计算包括有三个部分,分别是A.基础设施服务B.平台服务C.软件服务ABC

·大数据处理流程可以概括为A.采集B.导入和预处理C.统计和分析D.数据挖掘ABCD

·互连网上出现的海量信息可以划分为三种,分别为()A. 结构化信息B. 非结构化信息C. 半结构化信息ABC

·企业大数据分析包括()A.内容B.关系C.时空ABC

·美国哈佛大学的研究小组给出了著名的资源三角形,分别是()A.信息C.物质D.能量ACD

判断

·大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合力时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯(正确)

·结构化数据是指不方便用数据库二维逻辑来表现的数据(错误)

·全球数据的90%产生于过去2年内(正确)

·信息资源的创造和管理,从以往以经营和运作为核心的中心化模式,转化为以分散创造、自由传播、灵活汇聚为特征的众创模式(正确)

·对企业而言,大数据实质上是一种管理手段(错误)

·除了传统的报表、图形之外,我们还可以结合现代化的可视化工具及人机交互手段(正确)

·信息是数据的表达,数据是信息的内涵(错误)

·可视化是给机器看的,数据挖掘就是给人看的(错误)

大数据应用案例

单选

·以下算法中,不属于分类预测的典型算法的是C.K-means算法

·英国发布《把握数据带来的机遇:

英国数据能力战略》的时间是B.2013年

·常应用于市场细分方面的数据挖掘是B.聚类分析

·在激烈竞争的市场中,()是一个可能根据服务质量、优惠条件等因素而不断流动的团体D. 客户

·美国治理警察超速行驶是通过()发现问题的B. 通过对不同高速口收费站的原始数据记录的比对挖掘分析

·拥有全球第一大互联网用户群体的国家是()A. 中国

多选

·以B.物联网C.云计算D.大数据为代表的信息时代,将逐步改变人类的传统工作生活方式BCD

·翼云平台主要研究内容包括A.Hadoop架构及源码分析B.HDFS文件存储和传输的机制C.NameNode的伸缩性问题D.负载均衡ABCD

·安全生产大数据当前面临的主要问题有A.缺乏标准B.部门协调能力不足C.企业信息化能力弱D.分析工具及大数据专业分析人员缺乏ABCD

·大数据时代的城市研究、规划与管理需要从()层面去挖掘大数据的学术及应用价值A.政府B企业C.居民ABC

·谷歌推出流感趋势监测系统是()产生作用的A. 美国人在去医院前,喜欢在谷歌搜索类似“流感症状”的词汇B.谷歌据此预测流感趋势,比美国疾病控制和预防中心(CDC)的流感通报提早一周到10天C.政府由此可提前准备应对措施ABC

判断

·翼云产品平台是一个机遇Hadoop架构进行开发的云存储系统(正确)

·聚类是指把一组个体按照相似性归成若干类别(正确)

·大数据的研究,能够更好底为智慧城市的建设提供条件(正确)

·通过大数据挖掘分析,探索舆情传播规律,构建舆情预警指标体系,可及时发现舆情危机苗头并预警(正确)

·2013年10月,澳大利亚政府发布又信息管理办公室成立的“大数据工作组”制定的公共服务大数据战略(正确)

·广州市教育异构资源整合平台是为了深化“广州市教育e时代”的工程建设(正确)

·大数据分析是对总体数据,尤其是针对传统手段捕捉到的数据之外的非结构化数据进行分析(正确)

·目前,我国已经有三分一的地级和三分二的县级安全监管机构接入安全生产专网(错误)

·中国已成为全球最大的大数据市场(错误)

大数据安全与存储

单选

·下面哪种不是数据库的分类B.开放式数据库

·B.数据结构是指数据的组织形式或数据之间的联系

·B.主存储器用于存放计算机运行期间的大量程序和数据

·下列哪条不属于隐私保护防护策略B.安全检查

·不属于基于大数据的威胁发现技术的优点是哪项()B. 对已知威胁的检测

·下面哪种不属于硬盘()D. 光盘

多选

·隐私保护关键技术有A.基于大数据的威胁发现技术B.基于大数据的认证技术C.基于大数据的数据真实性分析ABC

·现有的许多威胁分析技术的限制有A内存大小B无法应对持续性D潜伏性攻击ABD

·目前影响大数据产业发展主要大问题有A.大数据应用场景C.大数据隐私保护AC

·NoSQL数据库的分类有A.键值(Key-Value)存储数据库B.列存储数据库C.文档型数据库D.图形(Graph)数据库ABCD

·目前大数据存储面临的问题有A.存储数据的成本在不断地增加B.数据存储容量爆炸性增长且难以预估C.越来越复杂的环境使得存储的数据无法管理ABC

·建立数据仓库的基本条件A.该行业有较为成熟的联机事务处理系统,它为数据仓库提供客观条件B.该行业面临市场竞争的压力,它为数据仓库的建立提供外在的动力C.该行业为数据密集型行业ABC

·构造数据仓库的方式有()A. 自上而下B. 自下而上AB

·磁带存储技术的优点是()A. 每GB价格比磁盘便宜B. 扩展容易C. 存储时间长ABC

·属于光盘优点的是()A. 单位存储容量成本低,携带方便,数据查询时间短B. 容量大,保存时间长C. 数据读取、写入数据快,操作方便ABC

·数据库系统结构模型包括()A. 层次结构模型B. 网状结构模型C. 关系结构模型ABC

判断

·HBase是一个构建在HDFS上的分布式列存储系统(正确)

·NAS是一种专业的网络文件存储及文件备份设备,它是基于LAN(局域网)的,按照TCP/IP协议进行通信,以文件的I/O(输入/输出)方式进行数据传输(正确)

·基于大数据的认证技术是建立在大量用户行为和设备行为数据分析的基础上,而初始阶段不具备大量的数据。

因此,无法分析出用户行为特征,或者分析的结果不够准确(正确)

·存储虚拟化的核心工作是物理存储设备到单一逻辑资源池的映射,通过虚拟技术,为用户和应用程序提供了虚拟磁盘或虚拟卷(正确)

·光盘存储技术是一种光学信息存储技术,通过调制激光束在光学圆盘镀膜介质中把信息编码以光点的形式记录下来(正确)

·基于大数据的数据真实性分析技术能够提高垃圾信息的鉴别能力(正确)

·大规模并行分析数据库最擅长对大容量的主流结构化数据提供离线的分析(错误)

·数据结构又分为数据的逻辑结构和数据的物理结构(正确)

大数据技术与发展前景

单选

·作为老牌商业中心,吸引着短期来京者的重点地点是A.北京西单

B.流式计算是一种高实时性的计算模式

·数据的可用性取决于C.数据质量

·()是一种高实时性的计算模式B. 流式计算

·()是分布内存计算的一个典型的系统B. Spark

·批处理和复杂数据挖掘计算通常属于()D. 非实时计算

多选

·对大数据的使用者、研究者、开发者以及上级主管部门,提出如下建议由A.提高用户对大数据可用性的重要性的认识B.加强对大数据可用性评估和保证的关键技术的研究和开发C.注重大数据可用性的评估,加强数据质量保证软件的开发和推广D.尽快建立关于大数据可用性的标准,保证大数据的统一质量ABCD

·大数据时代企业对数据的管理、查询及分析的需求变化主要集中在A.数据规模的增长B.吞吐量的上升C.数据类型的变化D.应用多样性的变化ABCD

·实时流式大数据的处理的需求是A.大数据系统实现低延迟处理B.强大而又灵活的复杂事件处理引擎C.具有容错和去重能力D.对流量进行控制和动态节点增加和删除的能力ABCD

·大数据给存储系统带来的挑战有()A. 存储规模大B. 存储管理复杂C. 数据服务的种类和水平要求高ABC

·大数据查询分析计算的典型系统包括()A. Hadoop36下的HBase和HiveB. Facebook开发的CassandraC. Google公司的DremelD. Cloudera公司的实时查询引擎ImpalaABCD

·在科学大规模数据的并行可视化工作中,主要涉及基本技术有()A. 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 少儿英语

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1