大数据时代试题综合题库.docx

上传人:b****3 文档编号:4131119 上传时间:2022-11-28 格式:DOCX 页数:18 大小:31.53KB
下载 相关 举报
大数据时代试题综合题库.docx_第1页
第1页 / 共18页
大数据时代试题综合题库.docx_第2页
第2页 / 共18页
大数据时代试题综合题库.docx_第3页
第3页 / 共18页
大数据时代试题综合题库.docx_第4页
第4页 / 共18页
大数据时代试题综合题库.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

大数据时代试题综合题库.docx

《大数据时代试题综合题库.docx》由会员分享,可在线阅读,更多相关《大数据时代试题综合题库.docx(18页珍藏版)》请在冰豆网上搜索。

大数据时代试题综合题库.docx

大数据时代试题综合题库

《大数据》题目

一、单选题

1)大数据的4V特点:

Volume、Velocity、Variety、Veracity,其中他们的含义分别是( 1DBCA )、( 2   )、(3 )、( 4)。

A.价值密度低ﻩﻩB.处理速度快ﻩC.数据类型繁多ﻩD.数据体量巨大

2)大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行(  5 B)。

A. 数据信息B.专业化处理C.速度处理ﻩD. 内容处理

3)随着谷歌(  6 )和(7 )的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的 (  8 )。

DCB

6:

A.MapB.DocsﻩﻩC.YouTubeﻩD. MapReduce

7:

 A.Google MobileﻩB. iGoogleﻩC.GoogleFileSystemﻩD. GoogleDocs

8:

A.质量B.速度ﻩC.精度ﻩD.进度

4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的2.5米口径望远镜进行的红移巡天项目,2012年4月发布的关于Quasarspectra的数据为(9 )。

A.932,891,133ﻩﻩB.228,468ﻩﻩC.1,457,002ﻩﻩD.668,054

5)下列哪一项不属于大数据的治理:

(10 )C

A.安全问题B.成本问题ﻩC. 针对大用户ﻩD.信息生命周期管理

6)IBM的大数据战略以其在2012年5月发布智慧分析洞察“3A5步”动态路线图作为基础,指的是在(  11)的基础上(12   )、,进而(13),优化决策策划能够救业务绩效。

CBA

A. 采取行动(Act)ﻩB.获取洞察(Anticipate)

C.掌握信息(Align)D. 应用管理(management)

7)在云生态环境中,用户需求相当于(14),云数据中心相当于(  15  ),云服务相当于( 16)。

DCB

A.降水B.水滴C.水库ﻩD.阳光

8)尿布啤酒是大数据分析的(   17 )C

A.A/B测试ﻩB. 分类ﻩﻩC. 关联规则挖掘ﻩﻩD.数据聚类

9)在GAPMINDER的Wealth &HealthofNations中,中国在什么区域(18)B

A.黄色B.红色ﻩC.绿色D.蓝色

10)舆情研判,信息科学侧重(19 ),社会和管理科学侧重突发群体事件管理中的群体心理行为及( 20 ),新闻传播学侧重对( 21)。

 CBA

A.舆论的本体进行规律性的探索和研究ﻩB.舆论控制研究ﻩC.互联网文本挖掘和分析技术

11)物联网是在计算机的( 22    )基础上,利用( 23)、(  24  )等技术,构造一个覆盖世界上万事万物的“InternetofThings”。

在这个网络中,物品(商品)能够彼此进行“交流”,而无需人的干预。

DCB

A.有线数据通信ﻩB.无线数据通信ﻩC.RFIDﻩﻩD.互联网

12)数据挖掘工作的四个阶段,数据挖掘占总时间的百分比%(25 ),对于成功重要性的百分比%(26 )CB

A. 50ﻩﻩB.20ﻩC.80D.60

13)MapReduce的Map函数产生很多的( 27  )C

A.key ﻩB. valueC.

14)PageRank是一个函数,它对Web中的每个网页赋予一个实数值。

它的意图在于网页的PageRank越高,那么它就(  28   )。

 D

A.相关性越高ﻩB.越不重要ﻩC.相关性越低ﻩD. 越重要

15)购物篮模型(market-basketmodel):

用于描述两类对象之间的一种常见形式的(29)关系。

A.一对一ﻩB.一对多ﻩC. 多对多ﻩD. 多对一

16)AdWords是一种快速简单的购买广告服务的方式,这种广告服务的针对性强,无论您的预算是多少,它都按( 30)。

B

A.每个广告计费ﻩB.每次点击计费

C.每显示一次计费ﻩD.每浏览一次计费

17)协同过滤分析用户兴趣,在用户群中找到指定用户的( 31 )用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(32 ),并将这些用户喜欢的项推荐给有相似兴趣的用户。

AD

A.相似ﻩﻩB.相同ﻩC.推荐ﻩD.预测

18)2012年12月28日,全国人大三次会议通过的(33)C

A.《互联网行业的自律公约》ﻩﻩﻩB.《治安管理处罚条例》

C. 《关于加强网络信息保护的决定》ﻩD.《信息安全保护条例》

19)Google收集的信息不包括( 34 )C

A. 日志信息ﻩﻩB.位置信息C.你的家庭成员D. Cookie和匿名标识符

20)大数据的取舍与(  35 )不相关。

A.易于提取ﻩB.家庭信息C.数字化ﻩD. 廉价的存储器

21)IBM智慧地球中Smart Work指( 36 )B

A.新锐洞察ﻩﻩB. 智慧运作C.动态架构  D.绿色未来

22)根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB,而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有的数据量( 37 ),增长近( 38 )倍。

CB

A.10ﻩB. 20ﻩC. 35ZBﻩﻩD.20ZB

23)2012年3月29日奥巴马政府公布了(39  )。

该计划的目标是改进现有人们从海量和复杂的数据中获取知识的能力,从而加速美国在科学与工程领域发明的步伐,增强国家安全,转变现有的教学和学习方式。

  首批共有6个联邦部门宣布投资(40  )美元,共同提高收集、储存、保留、管理、分析和共享海量数据所需核心技术的先进性,并形成合力;扩大大数据技术开发和应用所需人才的供给。

CD

A.全民健康计划ﻩB.5亿C.大数据研发计划ﻩD.2亿

24)大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并(41 )成为帮助企业经营决策更积极目的的信息。

B

A.收集ﻩB.整理ﻩC.规划D.聚集

25)大数据工程指大数据的(  42   )的系统工程。

A.大数据网络发展和运营过程 ﻩﻩﻩB.规划建设运营管理

C.规律和验证ﻩﻩﻩﻩﻩD.发现和验证

26)大数据科学关注大数据网络发展和运营过程中( 43)大数据的规律及其与自然和社会活动之间的关系。

D

A.大数据网络发展和运营过程ﻩﻩﻩB.规划建设运营管理

C.规律和验证ﻩﻩﻩﻩﻩﻩﻩD.发现和验证

27)大数据的价值是通过数据共享、( 44  )后获取最大的数据价值D

A.算法共享ﻩB.共享应用 ﻩC.数据交换ﻩD.交叉复用

28)社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的( 45 ),通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。

C

A.地址 ﻩB.行为 C.情绪D.来源 

29)IBM的“3A5步”除Align、Anticipate、Act外,还需要不断地( 46 )从每一次业务结果中获得反馈,改善基于信息的决策流程,从而实现(47)。

CB

A.CreateﻩﻩB.TransformﻩﻩC. LearnﻩD.Modify

30)IBM大数据平台和应用程序框架,(48   )以经济高效的方式分析PB级的结构化和非结构化信息B

A. 流计算ﻩB.HadoopﻩC.数据仓库ﻩﻩD.语境搜索

31)临床决策支持系统通过电子病历、医学指导的比较等提高手术质量,降低错误治疗和(   49 )。

C

A.医疗事故 B.病患投诉 ﻩﻩC.民事诉讼ﻩD.手术费用

32)《数据新闻学手册》的作者们认为,通过数据的使用,记者工作的重点从“第一个报道者”转化成为对特定事件的影响的( 50  )。

D

A.拍摄者ﻩB.知情者ﻩC.记录者ﻩﻩD.阐释者

33)通过(  51 )和展示数据背后的( 52),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。

BD

A.数据收集ﻩB. 数据挖掘ﻩﻩC.真相D.关联与模式

34)CRISP-DM模型中Evaluation表示对建立的模型进行评估,重点具体考虑得出的结果是否符合(  53 )的商业目的。

C

A. 第二步ﻩﻩB.第三步ﻩﻩC.第一步ﻩﻩD.最后一步

35)发现关联规则的算法通常要经过以下三个步骤:

连接数据,作数据准备;给定(54  )和(55 ),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则CD

54:

A. 最大兴趣度ﻩﻩB.最小置信度ﻩﻩC.最小支持度ﻩD.最大可信度

55:

A. 最小兴趣度 ﻩB. 最小置信度ﻩC.最大支持度ﻩD.最小可信度

36)规则I->j,“有可能”,等于所有包含I的购物篮中同时包含J的购物篮的比例,为(  56)。

B

A. 置信度ﻩB.可信度 ﻩC.兴趣度D.支持度

37)如果一个匹配中,任何一个节点都不同时是两条或多条边的端点,也称作( 57   )C

A.极大匹配 ﻩﻩB.二分匹配ﻩC完美匹配ﻩD.极小匹配

38)国防部高级研究计划局(DARPA)的网络内部威胁(CINDER)计划,旨在开发新的方法来检测军事计算机网络与(  58 )。

作为一种揭露隐藏操作的手段,CINDER将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。

A.内部网络活动B.网络间谍活动ﻩC.网络威胁检测ﻩD. 网络漏洞检测

39)只要具有适当的政策推动,大数据的使用将成为未来提高竞争力、生产力、创新能力以及(59  )的关键要素。

D

40)A.提高消费B.提高GDPC.提高生活水平ﻩﻩD. 创造消费者盈余

41)个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助( 60  )为其顾客购物提供完全个性化的决策支持和信息服务。

D

A.公司ﻩﻩB.各单位ﻩC.跨国企业D. 电子商务网站

 

二、多选题

42)大数据的治理包括(  1ABCD  )

A.容量问题B.延迟问题ﻩC.安全问题ﻩﻩD.成本问题

43)Hadoop项目包括(    2 ABD )

A.HadoopDistributed File System(HDFS)ﻩB. HadoopMapReduce编程模型

C.HadoopStreamingﻩﻩﻩﻩﻩD. Hadoop Common

44)基于“3A5步”动态路线图,IBM提出了“大数据平台”架构。

该平台的核心能力包括(3 ABCD )

A.Hadoop系统ﻩﻩB. 流计算(StreamComputing)

C.数据仓库(DataWarehouse)D. 信息整合与治理(Information IntegrationandGovernance)

45)大数据在医疗与健康的临床应用包括( 4 ABC )

A.疗效比较研究方案CERﻩB.临床决策支持系统ﻩﻩ

C.远程患者监测系统ﻩD.患者家庭情况分析

46)《数据新闻学手册》为我们提供了一些简单的搜索建议。

现在的网络技术允许我们进行精准搜索,比如(  5ABCD  )

A.电子数据表B.地理数据ﻩﻩC.数据库抽取ﻩD.PDF文件

47)物联网,2010年中国政府工作报告把物联网定义为通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行通信和信息交换,以实现智能化( 6ABCD)

A.识别ﻩB. 定位C.跟踪ﻩD.监控和管理的一种网络

48)数据挖掘的挖掘方法包括:

(7ABCD   )

A. 聚类分析ﻩB.回归分析ﻩﻩC.神经网络ﻩD. 决策树算法

49)Web内容挖掘实现技术(   8ABCD  )。

A.文本总结ﻩB. 文本分类C. 文本聚类ﻩD. 关联规则

50)基于内容的推荐生成推荐的过程主要依靠(  9ACD )

A.内容分析器B.推荐系统ﻩﻩC.文件学习器ﻩD.过滤部件

51)以下哪些管理规定对信息安全及个人隐私进行了保护( 10ABC   )

A. 《互联网行业的自律公约》ﻩﻩﻩB.《治安管理处罚条例》

C. 《关于加强网络信息保护的决定》ﻩﻩD. 《信息安全保护条例》

52)大数据可分成( 11ABD )、大数据应用等领域。

目前人们谈论最多的是大数据技术和大数据应用。

A.大数据技术ﻩB.大数据工程ﻩC.大数据收集ﻩD.大数据科学

53)云计算的服务方式有( 12 ACD )

A.IaaS B.RaasﻩﻩC.PaaSﻩﻩD. SaaS

54)大数据在社会管理能实现( 13ABCD )

A.提高社会管理的效能B.减少行政开支

C.创造新的价值D. 实现信息透明

55)产品设计的研究和开发包括( 14BCD  )

A.虚拟数字工厂ﻩB.产品生命周期管理ﻩC.评估设计ﻩD.开放创新

56)CRISP-DM模型为一个KDD工程提供了一个完整的过程描述.该模型将一个KDD工程分为几个不同的、但顺序并非完全不变的阶段,包括business understanding、data understanding、datapreperation、(  15ACD) 

A.deploymentﻩB.designﻩC.modelingﻩﻩD.evaluation

57)文本挖掘的工具有( 16BCD)

A.SPPTextMiningﻩﻩB.IBMDB2 intelligentMiner

C. SAS textminerﻩﻩD. SPSS Text Mining

58)数据和软件保护的开放科学(DASPOS)第一次尝试建立一个来自大型强子对接机和费米实验室的( 17ABCD)专家之间的正式合作。

A.理学家B.数字保管ﻩC.异构存储系统ﻩD.大规模计算机系统方面

59)长尾效应,新竞争力从人们需求的角度来看,大多数的需求会集中在头部,而这部分我们可以称之为流行,而分布在尾部的需求是个性化的,零散的小量的需求。

而这部分差异化的,少量的需求会在需求曲线上面形成一条长长的“尾巴”,而所谓长尾效应就在于它的( 18D)上,将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。

A.质量ﻩB.长度ﻩC.长期ﻩD.数量

60)为充分获取大数据潜力必须解决的主要问题是数据政策、技术和技能以及(  19ABC)

A.组织变革和人才ﻩB.数据访问权C.行业结构ﻩD.政府职能

61)推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(20D  ),推测客户将来可能的购买行为。

A.客户的朋友 ﻩﻩB.客户的个人信息

C.客户的兴趣爱好ﻩD.客户过去的购买行为和购买记录

一、单选题答案:

1-5

DBCAB

6-10

DCBBC

11-15

CBADC

16-20

BCBCB

21-25

ADCBC

26-30

BCDCB

31-35

ADCCB

36-40

BCBCD

41-45

BBDDC

46-50

CBBCD

51-55

BDCCD

56-60

BCBDD

二、多选题答案:

ABCD

ABD

3

ABCD

ABC

5

ABCD

6

ABCD

ABCD

8

ABCD

9

ACD

10

ABC

11

ABD

12

ACD

13

ABCD

14

BCD

15

ACD

16

BCD

17

ABCD

18

19

ABC

20

D

选择题

1.下列哪一项不是大数据提供的用户交互方式:

(C)

A.统计分析和数据挖掘

B.任意查询和分析

C.图形化展示

D.企业报表

2.与大数据密切相关的技术是(B)

A蓝牙B,云计算    C,博弈论 D,wifi

3.大数据应用需依托的新技术有(D)

A.大规模存储与计算

B.数据分析处理 

C.智能化 

   D.三个选项都是

4.与大数据密切相关的技术是(B)

A蓝牙B云计算    C博弈论 Dwifi

填空题

1.大数据最具潜能的三大应用领域分别为商业智能,公共服务和市场营销.

2.1pb=(1024)tb=(2e20)gb=(2e30)mb=(2e40)kb

3.大数据的特征是___、___、___、___。

答案:

大量化、多样化、快速化、价值密度低。

4.大数据的4v特征分别是大量化  多样化 快速化价值密度低

判断题

1.大数据的存储方案通常对一份数据在不同节点上存储三份副本,以提高系统容错性。

       (√)

2.大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。

(√)

3.数据可视化可以便于人们对数据的理解(√)

4.大数据技术和云计算技术是两门完全不相关的技术(X)

简答题

1.请简述大数据的结果展现方式。

答:

1)报表形式ﻫ基于数据挖掘得出的数据报表,包括数据表格、矩阵、图形和自定义格式的报表等,使用方便、设计灵活。

2.图形化展现ﻫ提供曲线、饼图、堆积图、仪表盘、鱼骨分析图等图形形式宏观展现模型数据的分布情况,从而便于进行决策。

2)KPI展现

提供表格式绩效一览表并可自定义绩效查看方式,如数据表格或走势图,企业管理者可根据可度量的目标快速评估进度。

ﻫ4.查询展现ﻫ按数据查询条件和查询内容,以数据表格来汇总查询结果,提供明细查询功能,并可在查询的数据表格基础上进行上钻、下钻、旋转等操作。

2.例举身边的大数据。

答:

i.QQ,微博等社交软件产生的数据

ii.天猫,京东等电子商务产生的数据

iii.互联网上的各种数据

3.简述大数据的数据管理方式。

答:

对于图像、视频、URL、地理位置等类型多样的数据,难以用传统的结构化方式描述,因此需要使用由多维表组成的面向列存储的数据管理系统来组织和管理数据。

也就是说,将数据按行排序,按列存储,将相同字段的数据作为一个列族来聚合存储。

不同的列族对应数据的不同属性,这些属性可以根据需求动态增加,通过这样的分布式实时列式数据库对数据统一进行结构化存储和管理,避免了传统数据存储方式下的关联查询。

4.什么是大数据?

答:

大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理的数据。

《大数据时代》试题

单选题

1、大数据的核心就是(B)【P26】

A、告知与许可

B、预测

C、匿名化

D、规模化

2、大数据不是要教机器像人一样思考。

相反,它是(A)【P26】

A、把数学算法运用到海量的数据上来预测事情发生的可能性。

B、被视为人工智能的一部分。

C、被视为一种机器学习。

D、预测与惩罚。

3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。

【P32】

A、降低

B、不变

C、提高

D、无关

4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法【P35】

A、所有数据

B、绝大部分数据

C、适量数据

D、少量数据

5、大数据的简单算法与小数据的复杂算法相比(A)【P40】

A、更有效

B、相当

C、不具备可比性

D、无效

6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。

【P46】

A、安全性

B、完整性

C、混杂性

D、完整性和混杂性

7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)【P61】

A、信息

B、数字

C、文字

D、方位

8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B)【P48】

A、原因

B、是什么

C、关联物

D、预测的关键

9、建立在相关关系分析法基础上的预测是大数据的(C)【P51】

A、基础

B、前提

C、核心

D、条件

10、(C)下列说法正确的是【P75-77】

A、有价值的数据是附属于企业经营核心业务的一部分数据;

B、数据挖掘它的主要价值后就没有必要再进行分析了;

C、所有数据都是有价值的;

D、在大数据时代,收集、存储和分析数据非常简单;

11、关于数据创新,下列说法正确的是(D)【P78-85】

A、多个数据集的总和价值等于单个数据集价值相加;

B、由于数据的再利用,数据应该永久保存下去;

C、相同数据多次用于相同或类似用途,其有效性会降低;

D、数据只有开放价值才能得到真正释放。

12、关于数据估值,下列说法错误的是(B)【P113】

A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴;

B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的;

C、数据的价值可以通过授权的第三方使用来实现

D、目前可以通过数据估值模型来准确的评估数据的价值评估

13、在大数据时代,下列说法正确的是(B)。

【P116】

A、收集数据很简单

B、数据是最核心的部分

C、对数据的分析技术和技能是最重要的

D、数据非常重要,一定要很好的保护起来,防止泄露

14、随着数据科学家的崛起,(C)的地位将发生动摇。

【P99】

A、国家领导人

B、大型企业

C、行业专家和技术专家

D、职业经理人

15、大数据公司的多样性表明了(B)【P97】

A、数据作用的体现

B、数据价值的转移

C、数据技术的发展

D、数据思维的创新

16、以下哪种说法是错误的(B)【P104-107】

A、将罪犯的定罪权放在数据手中,借以表达对数据和分析结果的崇尚,这实际上是一种滥用。

B、随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私。

C、采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,比如网页和智能手机应用程序。

D、预测与惩罚,不是因为所做,而是因为将做。

17、只要得到了合理的利用,而不单纯只是为了“数据”而“数据”,大数据就会变成(B)【P113】

A、强大的威胁

B、强大的武器

C、预测工具

D、分析工具

18、在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于(A)为

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1