精选最新版最新公需科目大数据考核题库含答案.docx

上传人:b****1 文档编号:1153078 上传时间:2022-10-18 格式:DOCX 页数:14 大小:24.51KB
下载 相关 举报
精选最新版最新公需科目大数据考核题库含答案.docx_第1页
第1页 / 共14页
精选最新版最新公需科目大数据考核题库含答案.docx_第2页
第2页 / 共14页
精选最新版最新公需科目大数据考核题库含答案.docx_第3页
第3页 / 共14页
精选最新版最新公需科目大数据考核题库含答案.docx_第4页
第4页 / 共14页
精选最新版最新公需科目大数据考核题库含答案.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

精选最新版最新公需科目大数据考核题库含答案.docx

《精选最新版最新公需科目大数据考核题库含答案.docx》由会员分享,可在线阅读,更多相关《精选最新版最新公需科目大数据考核题库含答案.docx(14页珍藏版)》请在冰豆网上搜索。

精选最新版最新公需科目大数据考核题库含答案.docx

精选最新版最新公需科目大数据考核题库含答案

2020年最新公需科目《大数据》考试题(含答案)

一、填空题

1.Map/Reduce框架由一个单独的master JbTracker 和每个集群节点一个slave TaskTracker共同组成。

二、单选题

2.下列关于网络用户行为的说法中,错误的是(C)。

(单选题)A.网络公司能够捕捉到用户在其网站上的所有行为

B.用户离散的交互痕迹能够为企业提升服务质量提供参考

C.数字轨迹用完即自动删除

D.用户的隐私安全很难得以规范保护

三、多选题

3.大数据系统体系建设规划包括以下哪些内容?

ABCD分

A.采数据

B.搭平台

C.编代码

D.建模型

4.由于有了现代信息技术的支撑,研制一个新型号的航天器,周期缩减到()以内。

■A.18个月

B.12个月

C.24个月D.6个月

5.大数据能帮助教师改进教学。

利用大数据方法,教师通过学生反馈回来的作业,就可以发现到底是哪些学生并没有真正听懂,进而有针对性地加以辅导。

6.宁家骏委员指出,大数据要与“互联网+”医疗健康紧密结合起来,国家明确支持“互联网+”医疗.“互联网+”健康。

7.信息社会经历的发展阶段包括()。

BCD分

A.云计算时代

B.大数据时代

C.计算机时代

D.互联网时代

8.从传播学角度解释,新兴的网络平台提供了非常大的开放空间,让人们更加有可能享有对信息的()等。

ABCD分

A.表达权

B.参与权

C.监督权

D.知情权

9.以下选项中,不属于大数据对人才能力的要求是(C)。

A.业务能力

B.数学统计能力

C.逻辑思维能力

D.IT技术能力

10.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。

11.()年,部分计算机专家首次提出大数据概念。

D

A.2010

B.2011

C.2005

D.2008

12.吴军博士认为在未来的社会里,利用大数据.利用机器智能来为人类服务的人在操控世界。

正确

错误

13.大数据的主要特征表现为()。

■A.数据容量大■B.商业价值高■C.处理速度快■D.数据类型多

14.宁家骏委员指出,()主导了21世纪。

■A.云计算

B.移动支付

■C.大数据■D.物联网

15.根据周琦老师所讲,高德交通信息服务覆盖全国高速()以上。

A.60%

■B.90%

C.70%D.50%3.根据周琦老师所讲,以下哪项不属于数据挖掘的内容?

A.补充与完善路网属性B.多维分析统计用户出行规律

■C.高德地图导航有躲避拥堵功能

D.建立道路拥堵概率与拥堵趋势变化模型4.2012年全国各城市支付宝人均支出排名中,位居第二位的是()

■A.杭州市

B.嘉兴市C.高雄市

D.嘉义市

16.根据涂子沛先生所讲,因为数据的内涵发生了改变,计算的内涵也发生了改变。

17.根据周琦老师所讲,以下哪项不属于数据挖掘的内容?

C

A.补充与完善路网属性

B.多维分析统计用户出行规律

C.高德地图导航有躲避拥堵功能

D.建立道路拥堵概率与拥堵趋势变化模型

18.下列关于脏数据的说法中,正确的是(ABCDE)。

A.格式不规范

B.编码不统一

C.意义不明确

D.与实际业务关系不大

E.数据不完整

19.根据周琦老师所讲,高德交通报告针对全国(D)个城市交通状态进行挖掘分析。

A.30

B.21

C.25

D.38

四、简答题

20.在HadpHDFS中,集群中的DataNde节点需要周期性地向NameNde发送什么信息?

答.在HadpHDFS中,DataNde需要周期性地向集群中的DataNdeMaster节点发送心跳信息和块报告。

接收到心跳信息,说明该DataNde节点工作正常;块报告包含了DataNde节点上所有块的列表以及块id与磁盘文件存储的映射关系。

五、论述题

21.《关于积极推进“互联网+”行动的指导意见》提出,要利用互联网提升农业生产.经营.管理和服务水平,培育一批(BCD)的现代“种养加”生态农业新模式。

(多选题3

A.高效化

B.智能化

C.精细化

D.网络化

22.数据清洗的方法不包括(D)。

A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理

23.(D)反映数据的精细化程度,越细化的数据,价值越高。

A.规模B.活性C.关联度D.颗粒度

24.下列各国大数据发展路径的描述中,对应关系正确的是(ACDE)

A.日本.走尖端IT路线B。

英国.视大数据为新的自然资源C。

韩国.重视基础.首都先行D。

印度.以IT外包转型为突破口若悬河E。

澳大利亚.原则先行.谨慎发展

25.1997年,1GB闪存的价格将近8000美元,现在是25美分。

√分

正确错误

26.具体来说,摩尔定律就是每(D)个月,产品的性能将提高一倍。

分)

A.6B.12C.16D.18

27.2000年,全国涉农网站超过6000家。

得分.0分

正确1错误

28.20世纪中后期至今的媒介革命,以(acd)的出现为标志。

(多选题3.得

3分

A.互联网B.自动化C.计算机D.数字化

29.2012年“中央1号文件”提出,要全面推进农业农村信息化,着力提高(abd)的信息服务水平。

(多选题3

A.农业生产经营

B.质量安全控制

C.文化交流

D.市场流通

30.大数据的价值重在挖掘,而挖掘就是分析。

√分

正确错误

31.贵州发展大数据的“八个一”建议包括(abcd)。

(多选题3

A.制定一个工作计划.建立一个领导机构

B.培养一批干部.出台一批政策

C.引入一批人才.聚集一批创客

D.谋划一批产业.引进一批项目

32.大数据时代的五个无处不在,具体指的是().服务无处不在。

(多选题3分)分

A.大数据无处不在√

B.软件无处不在√

C.网络无处不在√

D.计算无处不在√

33.20世纪50年代-80年代,第一代信息传输技术只能传输4380路信号。

√分.1分得

正确错误

34.在数据生命周期管理实践中,(B)是执行方法。

A.数据存储和备份规范B.数据管理和维护

C.数据价值发觉和利用D.数据应用开发和管理

35.下列关于大数据的分析理念的说法中,错误的是(D)。

A.在数据基础上倾向于全体数据而不是抽样数据

B.在分析方法上更注重相关分析而不是因果分析

C.在分析效果上更追究效率而不是绝对精确

D.在数据规模上强调相对数据而不是绝对数据

36.在网络爬虫的爬行策略中,应用最为基础的是(AB)。

A.深度优先遍历策略B.广度优先遍历策略

C.高度优先遍历策略D.反向链接策略E.大站优先策略

37.截至2013年底,我国宽带网络已覆盖到全国(C)的行政村。

A.61%B.71%C.91%D.81%

38.下列关于计算机存储容量单位换算关系的公式中,正确的是(BE)

A.1KB=1012ByteB。

1KB=1024ByteC。

1GB=1024KBD。

1GB=1012KBE。

1GB=1024MB

39.万维网的实施国家是(B)

A.英国B。

美国C。

德国D。

印度

40.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。

A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高

41.信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。

(F)是否

42.大数据人才整体上需要具备(ABE)等核心知识。

A.数学与统计知识B.计算机相关知识

C.马克思主义哲学知识D.市场运营管理知识

E.在特定业务领域的知识

43.下列关于聚类挖掘技术的说法中,错误的是(B)

A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B。

要求同类数据的内容相似度尽可能小C。

要求不同类数据的内容相似度尽可能小D。

与分类挖掘技术相似的是,都是要对数据进行分类处理

44.人与人之间沟通信息.传递信息的技术,这指的是(D)。

(单选题1分)

A.感测技术

B.微电子技术

C.计算机技术

D.通信技术

D18.在保护个人隐私方面,吴军博士并没有提到以下哪种方法?

(单选题1分)

A.法律的方法

B.双向监督的方法

C.技术的方法

D.文化的方法

45.下列各项表述中正确的有哪些?

(AD)(多选题3分)分

A.传统的“统治”或“管理”观念认为,公共事务的管理权只属于政府。

B.传统的“统治”或“管理”观念认为,公共事务的管理权只属于企业。

C.互联网时代最为典型的特征是扁平化.单一向度。

D.互联网时代最为典型的特征是扁平化.多元向度。

AD22.以下说法正确的有哪些?

(多选题3分)得分.0分

A.机器的智能方式是结果导向的

B.机器的智能方式和人的智能不同

C.机器的智能方式和人是完全一样的

D.机器产生智能的方式是通过数据.数学模型

AC23.信息技术的发展非常快,表现在()。

(多选题3分)得分.0分

A.集成电路的规模每18到24个月翻一倍

B.信息的存储能力每9个月翻一番

C.信息的存储能力每9个月翻一番

D.光通讯的速率和容量每年翻一番

46.在保护个人隐私方面,吴军博士并没有提到以下哪种方法?

(单选题1分)

A.法律的方法

B.技术的方法

C.文化的方法√

D.双向监督的方法

47.请简述Map-Reduce算法的原理?

Map-Reduce的目标是在面对节点失效的情况时能够保证大量的文件和数据依然可用。

初始化时数据被分割成许多分块的小数据,这些数据都是以的形式存储。

用户程序会分配一个Maser进程和许多wrker进程。

任务开始时,Maser将用户程序的工作分成两种类型的任务(map任务和reduce任务),并将这些任务分配给相应的工人(wrkers)。

Maser的责任如下.给map工人和reduce工人分配相应的任务,检测是否有工人进程死掉,将Map任务处理后的结果通知给Reduce任务。

得到Maser的Map工作任务的指令后,Map工人开始工作。

Map工人从input中获取分块的数据,并通过其中数据存储的方式对数据进行处理,并将处理的中间结果(形成的链表)存放在本地磁盘中。

得到Maser的有关Map处理结果的通知后,Reduce任务开始工作。

Reduce工人把每个map工人的本地磁盘中的内容进行整合,形成有序的最终结果,并将结果写入到输出文件中。

假如一个工人进程失败了,该工人的任务就被分配给其他的工人进程。

如果一个Maser进程失败了,那么整个Map-Reduce任务就会终止。

1.输入文件分成M块,每块大概16M~64MB(可以通过参数决定),接着在集群的机器上执行分派处理程序。

2.M个Map任务和R个Reduce任务需要分派,Maser选择空闲Wrker来分配这些Map或Reduce任务。

3.Wrker读取并处理相关输入块,Map函数产生的中间结果对暂时缓冲到内存。

4.中间结果定时写到本地硬盘,分区函数将其分成R个区。

中间结果在本地硬盘的位置信息将被发送回Maser,然后Maser负责把这些位置信息传送给ReduceWrker。

5.当Maser通知执行Reduce的Wrker关于中间对的位置时,它调用远程过程,从MapWrker的本地硬盘上读取缓冲的中间数据。

当ReduceWrker读到所

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 计算机软件及应用

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1