探索大数据和人工智能最全试题.docx

上传人:b****7 文档编号:10730705 上传时间:2023-02-22 格式:DOCX 页数:24 大小:24.14KB
下载 相关 举报
探索大数据和人工智能最全试题.docx_第1页
第1页 / 共24页
探索大数据和人工智能最全试题.docx_第2页
第2页 / 共24页
探索大数据和人工智能最全试题.docx_第3页
第3页 / 共24页
探索大数据和人工智能最全试题.docx_第4页
第4页 / 共24页
探索大数据和人工智能最全试题.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

探索大数据和人工智能最全试题.docx

《探索大数据和人工智能最全试题.docx》由会员分享,可在线阅读,更多相关《探索大数据和人工智能最全试题.docx(24页珍藏版)》请在冰豆网上搜索。

探索大数据和人工智能最全试题.docx

探索大数据和人工智能最全试题

探索大数据和人工智能最全试题

1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。

A首席数据官

B.首席科学家

C首席执行官

D.首席架构师

2、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?

A.Reduce

B.Hash

C.Clean

D.Loading

3、在Spak的软件栈中,用于交互式查询的是

A.SparkSQL

B.Mllib

C.GraphX

D.SparkStreaming

4、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处()理时间是什么关系?

A数量越多处理时间越长

B.数量越多处理时间越短

C数量越小处理时间越短

D.没什么关系

5、下列选项中,不是kafka适合的应用场景是?

A.日志收集

B.消息系统

C业务系统

D.流式处理

6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之

一的是

A.结构化数据

B.非结构化数据

C半结构化数据

D.全结构化数据

7、下列选项中,不是人工智能的算法中的学习方法的是?

A.重复学习

B.深度学习

C迁移学习

D.对抗学习

8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是

A.机器性能

B.语言歧义性

C知识依赖

D.语境

9、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。

请问标签为离散的类型,称为分类,标签为连续的类型称为什么?

A.给定标签

B.离散

C分类

D.回归

10、中国移动自主研发、发布的首个人工智能平台叫做()

A九天

B.OneNET

C移娃

D.大云

11、HDFS中Namenodef的Metadata的作用是?

A.描述数据的存储位置等属性

B.存储数据

C调度数据

D.

12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的?

A大数据技术

B.互联网技术

C游戏技术

D.影像技术

13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?

A闭源

B开源

C独立

D.封闭

14、以下不是非结构化数据的项是?

A图片

B.音频

C数据库二维表数据

D视频

15、以下数据单位换算错误的是?

A.1KB=1024B

B.1GB=1024MB

C.1TB=1000GB

D.1MB=1024KB

16、下列选项中,不是Flume的特点的是?

A.可靠性

B.集中式架构

C可扩展性

D.可管理性

17、BP神经网络模型拓扑结构不包括

A输入层

B隐层

C翰出层

D显层

18、以下哪个不是语音识别的范畴?

A.语音听写

B.语音台成

C语音转写

D.语音唤醒

19、以下哪个场景可以称为大数据场景?

A.故宫游客人

B故宫门票收入

C美团APP的定位信息

D文章内容

20、2011年5月是哪家全球知名咨询公司在《Bigdata:

Thenextfrontierfor

innovation,competitionandproductivity》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?

A.比尔恩门

B.麦肯锡

C扎克伯格

D乔图斯

21、下列选项中,哪项是分布式文件存储系统?

A.HDFS

B.Flume

C.Kafka

D.Zookeeper

22、下列选项中,正确描述Flume对数据源的支持的是

A.只能使用HDFS数据源

B.可以配置数据源

C不能使用文件系统

D.不能使用目录方式

23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?

A模型

B.表结构

C结果

D报表

24、下列选项中,不是人工智能的算法中的学习方法的是

A.重复学习

B.深度学习

C迁移学习

D.对抗学习

25、语音识别产品体系有四部分,下列哪项不是体系之一?

A.语音合成

B.语音播放

C语音识别

D.语义理解

26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。

而哪项技术将继续成为大数据智能分析的核心技术

A机器学习

B智能物流

C脑科学

D智能终端

27、以下哪个不属于大数据在电信行业的数据商业化方面的应用

A精准广告

B.网络管理

C营销洞察

D.大数据检测和决策

28、RDD是由多个什么组成?

A.partition

B.computer

C.Action

D.Transformation

29、下列选项中,不是大数据的一部分的是?

A.海量计算

B.大量数据管理

C数据分析

D.单机计算

30、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工看能称为()

A高人工智能

B.低人工智能

C强人工智能

D.弱人工智能

31、mapreduce计算模型适用于哪种任务?

A多线程处理

B.有关联的行处理

C批处理

D.实时数据变化处理

32、当前世界产生的数据总量的单位是?

A.KB

B.ZB

C.GB

D.TB

33、IBM提出的大数据5V特征包括更大(Volume)、更快(Velocity)、更多Variety)、更值钱(Value)和()

A.更有效

B.更充分

C更真实(Veracity)

D.更直观

34、Spark是基于什么的迭代计算框架?

它适用于需要多次操作特定数据集的应用场合。

需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小

A内存

B硬盘

C磁带

D.显卡

35、下列选项中,不是kafka适合的应用场景是?

A.日志收集

B.消息系统

C业务系统

D.流式处理

36、数据采集的基本步骤(ETL中不包括哪项?

A扌由取转换

B加载

C计算

D.

37、以下哪种学习方法不属于人工智能算法?

A迁移学习

B对抗学习

C强化学习

D.自由学习

38、语音识别常用的应用有四个,下列不是常用应用的是?

A聊天

B拨号

C导航

D.设备控制

39、下列选项中,哪项是由谷歌开发的人工能箅法框架?

A.Kafka

B.Tensorflow

C.Caffe

D.Torch

40、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高増长率和多样化的信息资产。

A海量

B.少数

D.结构化

41、MPP是指

A.大规模并行处理系统

B.受限的分布式计算模型

C集群计算资源管理框架

D.分布式计算编程框架

42、Hadoop是()年诞生的?

A.1985-1985

B.1995-1996

C.2005-2006

D.2015-2016

43、在Spark的软件栈中,用于流计算的是?

A.GraphX

B.Mllib

C.SparkStreaming

D.SparkSQL

44、以下数据量可以称为大数据的是

A.100MB

B.100KB

C.100PB

D.100MB

45、人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?

A.图片识别

B.语音识别

C.自动驾驶

D消费金融

46、IBM的()是第一个在国际象棋上战胜人类人工智能计算机。

A.Alphago

B.深蓝

C图灵机模型

D.深度学习机器人

47、下列选项中,不是人工智能的基础设施的是?

A.CPU服务器

B.GPU服务器

C专用芯片

D.游戏显卡

48、以下哪个不属于大数据在电信行业的应用?

A数据商业化

B.物流网络

C企业运营管理

D.客户关系管理

49、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。

A.大数据技术

B.客户画像

C客户状态

D.客户心情

50、BM提出的大数据5V特征包括()、更快(velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)

A.更有效

B更大(Volume)

C更充分

D.更直观

51、Fume采用了三层架构,分别为agent,collector和()

A.Map

B.storage

C.Shuffle

D.Hash

52、Hadoop2系列版本中默认的HDFS的block是多大?

A32MB

B.64MB

C.128MB

D.16MB

53、工信部官网正式发布大数据产业“一三五“发展规划是在哪一年

A.1987

B.1997

C.2007

D.2017

54、BP神经网络的学习规则是?

A.梯度上升法

B梯度下降法

C梯度提升法

D.梯度曲线法

55、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。

A精灵

B阿尔法蛋

C小度

D移娃

56、对抗学习中两个网络互相竟争,一个负责生成样本,那么另一个负责做什么?

A判别样本

B.计算样本

C统计样本

D.生成样本

57、以下应用没有使用你的地理位置信息的是?

A美团

B.滴滴

C高德地图

D.word

58、下列选项中,不是大数据发展趋势的是

A.大数据分析的革命性方法出现

B.大数据与云计算将深度融合

C大数据一体机将陆续发布

D.大数据未来可能会被淘汰

59、在Spark的软件栈中用于图计算的是

A.SparkStreaming

B.Mllib

C.GraphX

D.SparkSQL

60、HBASE勺特点不包括哪些?

A.面向行

B稀疏性

C多版本

D.高可靠性

61、总体来说,人工智能发展的未来趋势是?

A.上升

B.下降

C不动

D.大幅度下降

62、以下数据单位从小到大排列的顺序是?

A.GB、B、KB

B.B、KB、MB

C.KB、ZB、PB

D.B、MB、KB

63、最初的大数据概念还比较模湖,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?

A谷歌

BXX

C.360

D.bing

64、下列选项中,哪个不是HBASE的特点?

A面向行

B多版本

C扩展性

D稀疏性

65、下列选项中,不是用于数据存储的技术是哪一个?

A.MongoDB

B.MySQL

C.HDFS

D.Java

二、多选题

1、在数据清洗的过程中,总共可以归为三个阶段,它们分别是?

A数据加工

B.数据质量检查

C数据校对

D.数据标准化

2、HBASE勺特点不包括哪些?

A.面向行

B稠密性

C多版本

D.高可靠性

3、麦肯锡全球研究所对大数据的定义是一种规模大到在获取、存储、管理、分

析方面大大超出了传统数据库软件工具能力范围的数据集合,具有以下哪些特

征?

A.海量的数据规模

B.快速的数据流转

C多样的数据类型

D.价值密度低

4、以下哪两项是人工智能发展的标志性产品?

A.深蓝

alphago

C智能门禁

D智能手机

5、在非电信领域,大数据可被应用到的以下哪些方面

A.公共安全

B.无明显应用

C智能运输

D智能建筑

6大数据应用领域成就有哪些?

A.金融

B.互联网电子商务

C工业生产

D.没有明显成就

7、以下属于计算机视觉的研究方向的有?

A.物体识别和检测

B.语音导航

C视觉问答(看图说话)

D.机器翻译

8、传统的机器学习算法可以分为哪三类?

A监督学习

B.无监督学习

C半监督学习

D.强化学习

9、在人工智能发展历程中有过多次低谷期,这些低谷期最主要的两项原因是什

么?

A.运算力不足

B.人员不足

C技术瓶颈

D.费用太高

10、HBASE勺应用场景有哪些?

A.半结构化或非结构化数据

B.记录非常稀疏

C结构化数据

D.超大数据量

11、使用有监督学习的问题可以被分为哪两类?

A.回归问题

B抽样问题

C聚类问题

D分类问题

12、下列选项属于人工智能的基本概念有

A.机器学习

B.深度学习

C.BP神经网络

D.卷积神经网络

13、HBASE勺应用场景有哪些?

A.半结构化或非结构化数据

B.记录非常稀疏

C结构化数据

D.超大数据量

14、下列选项中,是大数据发展趋势勺是

A.开源大数据商业化进一步深化

B.打包的大数据行业分析应用开拓新市场

C大数据细分市场规模进一步增大

D.大数据推动公司并购的规模和数量进一步提升

15、人工智能关键技术框架主要包括哪两层?

A.基础设施

B算法

C技术

D人员

16、2010年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了哪些大数据的重要组成技术?

A.海量数据存储

B.数据挖掘

C图像视频智能分析

D.python

17、世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?

A.推动经济发展

B.改善公共服务

C增进人民福祉

D.保障国家安全

18、下列选项中,哪两项是可以用于数据采集的技术?

A.Flume

B.Hive

C.Kafka

D.Mahout

19、关于RDD说法正确的两项是?

A.RDD不能由多个分区(partition)组成

B弹性、集中式内存集

C.RDD能生成ChildrenRDD

D.是一个容错的、并行的数据结构

20、以下用到语音识别技术的应用包括:

A.苹果手机siri

B微信

CXX地图

D.word

21、人工智能目前在以下哪三个领域有了长足的发展?

A健康

B教育

C探索太空

D理财

22、HDFS适用于什么样的应用场景?

A.存储和管理PB级别的数据

B.处理非结构化数据

C注重数据处理的吞吐量

D.大量小文件

23、Flume采用了三层架构,每一层均可以水平扩展,它们分别是?

A.agent

B.collector

C.storage

D.source

24、KAfak的总体数据流有三个关键角色,它们分别是

A.Producer

B.Message

C.Cluster

D.Consumer

25、业务运营监控,可以基于大数据分析从下列哪三个维度为运营商监控管道和客户运营情况?

A网络

B业务

C气候

D用户

26、自然语言处理的主要难点不包括以下哪两项

A.语言独立性

B.语言歧义性

C多国语言

D.语境

27.以下数据量不能说成大数据的是?

A.100MB

B.1000KB

C.100PB

D.1EB

28、以下哪些属于大数据在电信行业的应用?

A.网络管理和优化

B.数据商业化

C客户关系管理

D.企业运营管理

29、通过地理位置信息可以分析出哪些信息?

A颜值

B.家庭住址

C工作地址

D体重

30、人工智能技术的基础设施不包括哪两部分?

A系统应用

B.机器学习算法

C基础硬件

D.算法框架

31、自然语言处理需要解决的难点有哪些?

A.语言歧义性

B.语言鲁棒性

C知识依赖

D.语境

32、HDFS在哪些场景中表现很差?

A.大量小文件

B.随机读取

C修改文件

D.存储和管理PB级别数据

33、大数据的业务应用处理需要经过哪些流程?

A.数据采集

B.数据清洗

C数据建模

D.数据加工

34、HDFS适用于哪些场景?

A.大量小文件

B.存储和管理PB级别数据

C.一次写入,多次读取

D.低延迟读取

35、人工智能在哪些领域应用广泛?

A健康医疗

B智能投顾

C智能教育

D智能法务

36、以下哪两个属于大数据特征?

A.数据体量大

B.价值密度高

C数据种类多

分别是?

D.处理速度慢

37、数据建模目前有两种比较通用的方式

A.通用建模

B.专属建模

C范式建模

D.维度建模

38、以下应用使用了你的地理位置信息的是

A.滴滴

B.XX地图

C.word

D.excel

39、BP神经网络模型拓扑结构包括?

A输入层

B隐层

C输出层

D显层

它有哪些

40、HBase是在Hadoop之上构建的开源分布式结构化数据存储系统特点?

面向列存储

A.非关系型

B.面向列存储

C关系型

D.面向行存储

41、大数据可以被应用到的行业有?

A.电信

B.工业

C政府

D金融

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1