ImageVerifierCode 换一换
格式:DOCX , 页数:18 ,大小:31.53KB ,
资源ID:4131119      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4131119.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(大数据时代试题综合题库.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

大数据时代试题综合题库.docx

1、大数据时代试题综合题库大数据题目一、单选题1)大数据的4V特点:Volue、Velci、ay、Veacty,其中他们的含义分别是( 1DBCA )、( 2 )、( 3 )、( 4 )。价值密度低 .处理速度快 C.数据类型繁多 D.数据体量巨大2)大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行( )。A.数据信息 B. 专业化处理 C.速度处理 D.内容处理3)随着谷歌( )和( )的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的( )。CB6: A.Ma BDocs C YTb Deduc:A. Googloie B.iooge C. glFile y

2、stem Google Dos8: A.质量 B 速度 C.精度 D 进度 4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的.5米口径望远镜进行的红移巡天项目,2012年月发布的关于Quaar pecr的数据为( 9 )。A93,891,133B. 228,468 C. 1,57,002D 668,45)下列哪一项不属于大数据的治理:( 0 )C. 安全问题 B. 成本问题 C.针对大用户 D. 信息生命周期管理6)IB的大数据战略以其在22年5月发布智慧分析洞察“35步”动态路线图作为基础,指的是在( 11 )的基础上( 12 )、,进而( 13 ),优化决策策划能够救业务绩效。CBA

3、A.采取行动(t) B. 获取洞察(Anicipat)C. 掌握信息(Align) D.应用管理(mnaemt)7)在云生态环境中,用户需求相当于( 14 ),云数据中心相当于( 15 ),云服务相当于( 6 )。DCBA. 降水 B. 水滴 水库 D. 阳光8)尿布啤酒是大数据分析的( 17 )CA. AB测试 B.分类C.关联规则挖掘D. 数据聚类9)在AMINER的Weath& ealth of ations 中,中国在什么区域( 1 )BA黄色 B.红色 C.绿色 . 蓝色10)舆情研判,信息科学侧重( 19 ),社会和管理科学侧重突发群体事件管理中的群体心理行为及( 2 ),新闻传播

4、学侧重对( 21 )。CB. 舆论的本体进行规律性的探索和研究 B.舆论控制研究C. 互联网文本挖掘和分析技术11)物联网是在计算机的( 2 )基础上,利用( 2 )、( 24 )等技术,构造一个覆盖世界上万事万物的“Intenet of igs”。在这个网络中,物品(商品)能够彼此进行“交流”,而无需人的干预。 DCB. 有线数据通信 . 无线数据通信 C. RFID 互联网12)数据挖掘工作的四个阶段,数据挖掘占总时间的百分比%( 25 ),对于成功重要性的百分比( 26 )CA.0. 20 C.80 D. 13)Mapeduc的Map函数产生很多的( 27 )C. key B.vle C

5、. key,vlue Das14)PgRank是一个函数,它对Web中的每个网页赋予一个实数值。它的意图在于网页的PageRan越高,那么它就( )。A. 相关性越高 B.越不重要 .相关性越低 .越重要15)购物篮模型(metaske mde):用于描述两类对象之间的一种常见形式的( 2 )关系。A.一对一 B一对多 C.多对多 D.多对一16)AWr 是一种快速简单的购买广告服务的方式,这种广告服务的针对性强,无论您的预算是多少,它都按( 30 )。BA.每个广告计费 . 每次点击计费C每显示一次计费 D. 每浏览一次计费17)协同过滤分析用户兴趣,在用户群中找到指定用户的( )用户,综合

6、这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( 3 ),并将这些用户喜欢的项推荐给有相似兴趣的用户。ADA. 相似B相同 C.推荐 . 预测18)2012年2月28日,全国人大三次会议通过的( 33 )C. 互联网行业的自律公约 B. 治安管理处罚条例C.关于加强网络信息保护的决定 D. 信息安全保护条例 19)Ggle 收集的信息不包括 ( 4 )A.日志信息B 位置信息 .你的家庭成员 D.ookie 和匿名标识符20)大数据的取舍与( 3 )不相关。A 易于提取 B.家庭信息 C. 数字化 .廉价的存储器21)IBM智慧地球中SrtWrk指( 36 ) BA. 新锐洞

7、察.智慧运作 C. 动态架构 . 绿色未来22)根据IDC(国际数据公司)的监测统计,201年全球数据总量已经达到1.ZB,而这个数值还在以每两年翻一番的速度增长,预计到200年全球将总共拥有的数据量( 37 ),增长近( 38 )倍。CBA. 10 .20 .35ZBD 2B23)2012年3月29日奥巴马政府公布了( 9 )。该计划的目标是改进现有人们从海量和复杂的数据中获取知识的能力,从而加速美国在科学与工程领域发明的步伐,增强国家安全,转变现有的教学和学习方式。首批共有6个联邦部门宣布投资( 0 )美元,共同提高收集、储存、保留、管理、分析和共享海量数据所需核心技术的先进性,并形成合力

8、;扩大大数据技术开发和应用所需人才的供给。A.全民健康计划 B 亿 . 大数据研发计划 . 2亿24)大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并( 41 )成为帮助企业经营决策更积极目的的信息。BA.收集 B. 整理 C.规划 D.聚集25)大数据工程指大数据的( 42 )的系统工程。A. 大数据网络发展和运营过程B. 规划建设运营管理. 规律和验证 D. 发现和验证26)大数据科学关注大数据网络发展和运营过程中( 43 )大数据的规律及其与自然和社会活动之间的关系。DA. 大数据网络发展和运营过程 . 规划建设运营管理C

9、 规律和验证 D. 发现和验证27)大数据的价值是通过数据共享、( 44 )后获取最大的数据价值A.算法共享 .共享应用 . 数据交换 D 交叉复用28)社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的( 45 ),通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。C.地址 B.行为 C情绪 D.来源29)IBM的“3A5步”除Align、Anticipate、ct外,还需要不断地( 46 )从每一次业务结果中获得反馈,改善基于信息的决策流程,从而实现( 4 )。BA. Creae B ransformC.Lear D. M

10、odify30)IB大数据平台和应用程序框架,( 8 )以经济高效的方式分析PB级的结构化和非结构化信息BA.流计算 B. Haoop 数据仓库.语境搜索31)临床决策支持系统通过电子病历、医学指导的比较等提高手术质量,降低错误治疗和( 4 )。C.医疗事故 B病患投诉C. 民事诉讼 D. 手术费用32)数据新闻学手册的作者们认为,通过数据的使用,记者工作的重点从“第一个报道者”转化成为对特定事件的影响的( 5 )。DA.拍摄者 B.知情者 C.记录者D. 阐释者33)通过( 5 )和展示数据背后的( 52 ),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒

11、体,即用数据报道新闻。.数据收集 B.数据挖掘 C.真相 D. 关联与模式34)CRISP-DM 模型中Evalation表示对建立的模型进行评估,重点具体考虑得出的结果是否符合( 53 )的商业目的。CA第二步B. 第三步C. 第一步D. 最后一步35)发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备;给定( 5 )和( 55 ),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则CD54:A最大兴趣度 B. 最小置信度C 最小支持度 D. 最大可信度55:.最小兴趣度 .最小置信度 C. 最大支持度 . 最小可信度36)规则I,“有可能”,等于所有包含的购

12、物篮中同时包含的购物篮的比例,为( 56 )。BA.置信度 B.可信度 C. 兴趣度 D. 支持度37)如果一个匹配中,任何一个节点都不同时是两条或多条边的端点,也称作( 57 )C. 极大匹配B.二分匹配 C完美匹配 D.极小匹配38)国防部高级研究计划局(DR)的网络内部威胁(CNDER)计划,旨在开发新的方法来检测军事计算机网络与( 5 )。作为一种揭露隐藏操作的手段,CINER将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。A. 内部网络活动 B. 网络间谍活动 C. 网络威胁检测 D.网络漏洞检测39)只要具有适当的政策推动,大数

13、据的使用将成为未来提高竞争力、生产力、创新能力以及( 59 )的关键要素。D40)A提高消费 B.提高GDP C.提高生活水平D.创造消费者盈余41)个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助( 60 )为其顾客购物提供完全个性化的决策支持和信息服务。 DA公司 B各单位 C.跨国企业 D电子商务网站二、多选题42)大数据的治理包括( 1 ABCD )A. 容量问题 延迟问题 C. 安全问题D. 成本问题43)Hadoo项目包括( 2AD )A. Hadop DistibuteFieSystm(DFS) B.dopMaeduc编程模型C. HaStremn DHao

14、opomon44)基于“3A5步”动态路线图,IB提出了“大数据平台”架构。该平台的核心能力包括( AC ). Haoo系统 流计算(StamCmputng)C数据仓库(Dat arehus) 信息整合与治理(normaonIntation and Governance)45)大数据在医疗与健康的临床应用包括( 4 AB )A. 疗效比较研究方案CER 临床决策支持系统C. 远程患者监测系统 D 患者家庭情况分析46)数据新闻学手册为我们提供了一些简单的搜索建议。现在的网络技术允许我们进行精准搜索,比如( BD )A 电子数据表 地理数据C. 数据库抽取 D PDF文件47)物联网, 010年

15、中国政府工作报告把物联网定义为通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行通信和信息交换,以实现智能化( 6 ABCD )A. 识别 B.定位 C 跟踪 D. 监控和管理的一种网络48)数据挖掘的挖掘方法包括:( AD )A.聚类分析 B. 回归分析 . 神经网络 D决策树算法49)Web内容挖掘实现技术( 8 BCD )。A. 文本总结 B.文本分类 C.文本聚类 D.关联规则50)基于内容的推荐生成推荐的过程主要依靠( 9 C ). 内容分析器 B 推荐系统C. 文件学习器 D. 过滤部件51)以下哪些管理规定对信息安全及个人隐私进行了保护( 10ABC )A.互联网

16、行业的自律公约 B. 治安管理处罚条例C.关于加强网络信息保护的决定D信息安全保护条例 52)大数据可分成( 1 ABD )、大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。A. 大数据技术 大数据工程 C 大数据收集 D. 大数据科学53)云计算的服务方式有( 2 D ).IaaS BRaas C.PaaS.Sa54)大数据在社会管理能实现( 13 ABCD ). 提高社会管理的效能 . 减少行政开支C. 创造新的价值 D.实现信息透明55)产品设计的研究和开发包括( 4 BCD )A. 虚拟数字工厂 . 产品生命周期管理 C. 评估设计 . 开放创新56)CSPDM 模型为一

17、个KD工程提供了一个完整的过程描述.该模型将一个KD工程分为几个不同的、但顺序并非完全不变的阶段,包括busiesudestadng、dataunderstadig、daa eeatin、( 5ACD )A eploment B.esign C. modelinD valuation57)文本挖掘的工具有( 1 BCD )A.PP Text Miin . M DB2ilgent MineC.ASet mne D.SPSTextMini58)数据和软件保护的开放科学(DPOS)第一次尝试建立一个来自大型强子对接机和费米实验室的( 17AC )专家之间的正式合作。A. 理学家 B. 数字保管 C.

18、 异构存储系统 D 大规模计算机系统方面59)长尾效应,新竞争力从人们需求的角度来看,大多数的需求会集中在头部,而这部分我们可以称之为流行,而分布在尾部的需求是个性化的,零散的小量的需求。而这部分差异化的,少量的需求会在需求曲线上面形成一条长长的“尾巴”,而所谓长尾效应就在于它的( 18 D )上,将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。A质量 B长度 C.长期 . 数量60)为充分获取大数据潜力必须解决的主要问题是数据政策、技术和技能以及( 1 C )A. 组织变革和人才 B. 数据访问权 . 行业结构 政府职能61)推荐系统为客户推荐商品,自动完成个性化选择商品的过程,

19、满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、( 0D ),推测客户将来可能的购买行为。A客户的朋友 B.客户的个人信息C.客户的兴趣爱好 D. 客户过去的购买行为和购买记录一、单选题答案: 1-BCA6-10DCBC11-CBAD16-20CBCB21-25ADC230BCD31-35DCB640BCBCD414BDC4650CBBCD5-55DCCD5660BDD二、多选题答案: ABCDBD3BCDC5BCD6ABCDABC8AC9ACD10AC1A12ACD13BCD4BD1ACD16BBC119ABCD选择题1.下列哪一项不是大数据提供的用户交互方式:(C)A.统计分析

20、和数据挖掘B.任意查询和分析C.图形化展示D.企业报表2.与大数据密切相关的技术是()A蓝牙 , 云计算 ,博弈论 ,wi大数据应用需依托的新技术有( D).大规模存储与计算 B.数据分析处理智能化 D三个选项都是4. 与大数据密切相关的技术是(B)A蓝牙 B 云计算 C 博弈论 wfi填空题1.大数据最具潜能的三大应用领域分别为 商业智能,公共服务和市场营销.2.1p=(04)t(2e)gb=(30)m=(24)kb3.大数据的特征是_、_、_、_。答案:大量化 、多样化、快速化、价值密度低。4.大数据的4v特征分别是大量化多样化 快速化 价值密度低判断题1.大数据的存储方案通常对一份数据在

21、不同节点上存储三份副本,以提高系统容错性。 ()2.大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。()3.数据可视化可以便于人们对数据的理解()4.大数据技术和云计算技术是两门完全不相关的技术(X)简答题1.请简述大数据的结果展现方式。 答:1)报表形式基于数据挖掘得出的数据报表,包括数据表格、矩阵、图形和自定义格式的报表等,使用方便、设计灵活。2.图形化展现提供曲线、饼图、堆积图、仪表盘、鱼骨分析图等图形形式宏观展现模型数据的分布情况,从而便于进行决策。2)PI展现提供表格式绩效一览表并可自定义绩效查看方式,如数据表格或走势图,企业管理者可根据可度

22、量的目标快速评估进度。4查询展现按数据查询条件和查询内容,以数据表格来汇总查询结果,提供明细查询功能,并可在查询的数据表格基础上进行上钻、下钻、旋转等操作。2.例举身边的大数据。答:i.QQ,微博等社交软件产生的数据ii.天猫,京东等电子商务产生的数据iii.互联网上的各种数据3.简述大数据的数据管理方式。答:对于图像、视频 、地理位置等类型多样的数据,难以用传统的结构化方式描述,因此需要使用由多维表组成的面向列存储的数据管理系统来组织和管理数据。也就是说,将数据按行排序,按列存储,将相同字段的数据作为一个列族来聚合存储。不同的列族对应数据的不同属性,这些属性可以根据需求动态增加,通过这样的分

23、布式实时列式数据库对数据统一进行结构化存储和管理,避免了传统数据存储方式下的关联查询。4.什么是大数据?答:大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理的数据。大数据时代试题单选题1、大数据的核心就是()【P6】A、告知与许可、预测C、匿名化D、规模化2、大数据不是要教机器像人一样思考。相反,它是(A)【26】A、把数学算法运用到海量的数据上来预测事情发生的可能性。B、被视为人工智能的一部分。C、被视为一种机器学习。D、预测与惩罚。3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。【P2】A、降低B、不变、提高D、无关4、大数据是指不用随机

24、分析法这样的捷径,而采用(A)的方法【P35】、所有数据、绝大部分数据C、适量数据、少量数据5、大数据的简单算法与小数据的复杂算法相比(A)【P0】A、更有效B、相当C、不具备可比性、无效、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。【P4】A、安全性B、完整性C、混杂性、完整性和混杂性7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)【P61】、信息B、数字C、文字D、方位8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B)【P48】A、原因B、是什么、关联物D、预测的关键9、建立在相关关系分析法基础上的预

25、测是大数据的(C)【P5】A、基础B、前提、核心、条件10、(C)下列说法正确的是【-7】A、有价值的数据是附属于企业经营核心业务的一部分数据;B、数据挖掘它的主要价值后就没有必要再进行分析了;C、所有数据都是有价值的;D、在大数据时代,收集、存储和分析数据非常简单;11、关于数据创新,下列说法正确的是(D)【78-85】A、多个数据集的总和价值等于单个数据集价值相加;B、由于数据的再利用,数据应该永久保存下去;C、相同数据多次用于相同或类似用途,其有效性会降低;D、数据只有开放价值才能得到真正释放。12、关于数据估值,下列说法错误的是(B)【P13】A、随着数据价值被重视,公司所持有和使用的

26、数据也渐渐纳入了无形资产的范畴;B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的;C、数据的价值可以通过授权的第三方使用来实现D、目前可以通过数据估值模型来准确的评估数据的价值评估13、在大数据时代,下列说法正确的是(B)。【16】、收集数据很简单、数据是最核心的部分C、对数据的分析技术和技能是最重要的D、数据非常重要,一定要很好的保护起来,防止泄露14、随着数据科学家的崛起,(C)的地位将发生动摇。【P99】A、国家领导人B、大型企业C、行业专家和技术专家D、职业经理人1、大数据公司的多样性表明了(B)【P97】、数据作用的体现、数据价值的转移、数据技术的发展D、数据思维的创新6、以下哪种说法是错误的(B)【P4-10】A、将罪犯的定罪权放在数据手中,借以表达对数据和分析结果的崇尚,这实际上是一种滥用。、随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私。C、采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,比如网页和智能手机应用程序。D、预测与惩罚,不是因为所做,而是因为将做。7、只要得到了合理的利用,而不单纯只是为了“数据”而“数据”,大数据就会变成(B)【P13】A、强大的威胁B、强大的武器C、预测工具、分析工具18、在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于(A)为

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1