智慧树知到大数据工具应用章节测试答案.docx

上传人:b****7 文档编号:26079843 上传时间:2023-06-17 格式:DOCX 页数:32 大小:21.70KB
下载 相关 举报
智慧树知到大数据工具应用章节测试答案.docx_第1页
第1页 / 共32页
智慧树知到大数据工具应用章节测试答案.docx_第2页
第2页 / 共32页
智慧树知到大数据工具应用章节测试答案.docx_第3页
第3页 / 共32页
智慧树知到大数据工具应用章节测试答案.docx_第4页
第4页 / 共32页
智慧树知到大数据工具应用章节测试答案.docx_第5页
第5页 / 共32页
点击查看更多>>
下载资源
资源描述

智慧树知到大数据工具应用章节测试答案.docx

《智慧树知到大数据工具应用章节测试答案.docx》由会员分享,可在线阅读,更多相关《智慧树知到大数据工具应用章节测试答案.docx(32页珍藏版)》请在冰豆网上搜索。

智慧树知到大数据工具应用章节测试答案.docx

智慧树知到大数据工具应用章节测试答案

第一章

1、2011年麦肯锡研究院提出的大数据定义是:

大数据是指其大小超出了常规数据库工具获取、储存、管理和()能力的数据集。

A:

计算

B:

访问

C:

应用

D:

分析

答案:

分析

2、用4V来概括大数据的特点的话,一般是指:

Value、Velocity、Volume和()。

A:

Variety

B:

Vainly

C:

Vagary

D:

Valley

答案:

Variety

3、大数据分析四个方面的工作主要是:

数据分类、()、关联规则挖掘和时间序列预测。

A:

数据统计

B:

数据计算

C:

数据聚类

D:

数据清洗

答案:

数据聚类

4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。

A:

B:

答案:

5、目前的大数据处理技术只能处理结构化数据。

A:

B:

答案:

第二章

1、我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是()。

A:

mdf

B:

mdb

C:

dbf

D:

xls

:

mdb答案

、大多数日志文件的后缀名是(。

)2

A:

txt

B:

csv

C:

xml

D:

log

:

log答案

weka3、本课程重点介绍的软件的专有文件格式是()

A:

MongoDB

B:

ARFF

C:

value

D:

keymap

答案:

ARFF

4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和()。

A:

专业性

B:

排他性

C:

一致性

D:

共享性

答案:

一致性

5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个()来作为采集的目标。

A:

电话号码

B:

关键词

C:

网页地址

D:

用户名

答案:

网页地址

6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是()。

A:

otd

B:

jpg

C:

png

D:

gif

答案:

otd

可以通过“数据有效性”按钮操作来规范数据输入的范围。

Excel、7.

A:

B:

答案:

8、Excel不能导入txt或csv格式的文件。

A:

B:

答案:

9、八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。

A:

B:

答案:

10、八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。

A:

B:

答案:

第三章

1、使用DBSCAN算法对鸢尾花数据集(Iris.arff)进行聚类,将epsilon参数设置为0.2,

minPoints参数设置为5,忽略class属性,那么将形成()个簇。

A:

1

B:

2

C:

3

D:

4

答案:

3

2、使用EM算法对天气数据集(weather.numeric.arff)进行聚类,将numClusters设置为4,即簇数为4,其他参数保持默认值,忽略class属性,从结果中可知,下列选项中,()是错误的。

A:

模型的最大似然估计值是-7.18

B:

这组数据用算法迭代15次

C:

第四个簇的先验概率是0.14

D:

第四个簇的实例数为4

答案:

第四个簇的实例数为4

3、使用SimpleKMeans算法对天气数据集(weather.numeric.arff)进行聚类,保持默认参数,即3个簇以及欧氏距离。

选择play属性为忽略属性,从结果中可知,下列选项中,()是错误。

A:

这组数据用算法迭代四次

B:

产生了三个中心点

C:

聚合为3个簇,分别有7,3,4个实例

D:

平方和误差为8.928

答案:

这组数据用算法迭代四次

4、使用线性回归(LinearRegression)分类器和用M5P分类器对cpu.arff分别进行分类,由其输出的误差指标可知()。

A:

LinearRegression的标准误差比M5P的标准误差小

B:

LinearRegression的平均绝对误差比M5P的平均绝对误差小

C:

LinearRegression的相对误差比M5P的相对误差小

D:

LinearRegression的平均方根误差比M5P的平均方根误差大

答案:

LinearRegression的平均方根误差比M5P的平均方根误差大

分类器构建方案,在结果中,到达M5P属性后,使用CACH数据文件中的cpu.arff、删去5.

LM2的实例数有()个。

A:

165

B:

21

C:

23

D:

30

答案:

21

6、根据J48分类器训练weather.nominal.arff所生产的决策树,当outlook=sunny;temperature=cool;humidity=high;windy=TRUE时,分类的结果是()。

A:

Yes

B:

No

C:

没有结果

D:

无法分类

答案:

No

7、根据J48分类器训练iris.arff所生产的决策树,当sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2时,分类的结果是()。

A:

Iris-setosa

B:

Iris-versicolor

C:

Iris-virginica

D:

无法分类

答案:

Iris-setosa

8、关于Weka离散化说明正确的是()。

A:

离散化是将数值属性转换为字符串型属性

B:

有监督离散化有两种等宽和等频方法

C:

等宽离散化是使实例分布均匀的

D:

离散化包括无监督离散化和有监督离散化

答案:

离散化包括无监督离散化和有监督离散化

9、以下()不是Weka的数据类型。

A:

numeric

B:

nominal

C:

string

D:

decimal

答案:

decimal

10、关于Weka的文件类型描述错误的是()。

A:

Weka可以打开文件格式有.arff、.csv、.xlsx

B:

Weka处理的数据集类似于关系数据库横行实例,竖行属性

C:

arff是ASCII文件,可以用Word等文本编辑器打开查看

D:

@relation定义数据集名称,@data之后呈现实例,每一行就是一个实例

答案:

Weka可以打开文件格式有.arff、.csv、.xlsx

11、以下属于关联分析的是()。

A:

CPU性能预测

B:

购物篮分析

C:

自动判断鸢尾花类别

D:

股票趋势建模

答案:

购物篮分析

12、大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注)算重数据中的相关关系,而不是因果关系。

其中,数据之间的相关关系可以通过以下(.

法直接挖掘。

A:

K-means

B:

BayesNetwork

C:

C4.5

D:

Apriori

答案:

Apriori

13、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的()问题。

A:

关联规则发现

B:

聚类

C:

分类

D:

自然语言处理

答案:

关联规则发现

14、在进行自动选择属性时,必须设立两个对象,其中确定使用什么方法为每个属性子集分配一个评估值的对象是下面的()。

A:

搜索方法

B:

属性评估器

C:

元分类器

D:

规则挖掘

答案:

属性评估器

15、以下属于属性空间的搜索方法的是()。

A:

GainRatioAttributeEval

B:

BestFirst

C:

PrincipalComponents

D:

SymmetricalUncertAttributeEval

答案:

BestFirst

16、在weka软件探索者界面中,利用Visualize标签页通过更改各个参数来进行数据集的可视化属性设置后,需要单击以下()按钮,所有更改才会生效。

A:

SelectAttribute

B:

SubSample

C:

Update

D:

Fastscrolling

答案:

Update

17、给定关联规则AB,意味着:

若A发生,B也会发生。

A:

B:

答案:

18、支持度是衡量关联规则重要性的一个指标。

A:

B:

答案:

19、Ranker方法既可以用于单个属性评估器,又可以用于属性子集评估器。

A:

B:

答案:

如果类别属性用户可以选择类别属性对数据点着色,软件进行数据可视化时,weka利用、20.

是标称型,则显示为彩色条。

A:

B:

答案:

第四章

1、贝叶斯网络中的节点代表()。

A:

变量

B:

随机过程

C:

随机变量

D:

随机函数

答案:

随机变量

2、贝叶斯网络中,节点需给出概率分布描述,对于离散型随机变量而言,可以用()的形

式表示。

A:

条件概率密度函数

B:

正态分布

C:

条件概率表

均匀分布D:

条件概率表答案:

)。

3、贝叶斯网络中节点之间的边代表(

随机关系A:

B:

概率因果

组合关系C:

随机结果D:

答案:

随机关系

4、贝叶斯网络保存的文件格式是()。

A:

XMLBIF

B:

DOCX

C:

TXT

D:

XLS

答案:

XMLBIF

5、下面()不是反向传播神经网络的结构。

A:

输入层

B:

隐含层

C:

计算层

D:

输出层

答案:

计算层

6、神经网络中的节点代表()。

A:

激励变量

B:

激励函数

C:

随机变量

D:

随机函数

答案:

激励函数

7、下列()不是常见的激励函数。

A:

线性函数

函数B:

Sigmoid

C:

阈值函数

D:

正弦函数

答案:

正弦函数

8、在贝叶斯网络编辑界面时,如果节点的名称没法完全显示,需要从()菜单项进行调整。

A:

Tools|SetData

B:

View|ZoomOut

C:

View|ZoomIn

D:

Tools|Layout

答案:

Tools|Layout

9、WEKA中选择神经网络分类器操作时,应该选择()。

A:

rules条目下的PART

B:

functions条目下的SGD分类器

C:

functions条目下的MultilayerPerceptron分类器

D:

默认的分类器

答案:

functions条目下的MultilayerPerceptron分类器

10、下面关于PackageManager安装后的目录说明不正确的是()。

API文档A:

doc子目录存放

子目录存放包所需要的说明文件B:

lib

C:

sample-data子目录存放数据集文件

D:

src子目录存放源代码文件

答案:

lib子目录存放包所需要的说明文件

第五章.

1、Tableau是一款定位于数据可视化敏捷开发和实现()展现工具。

Tableau连续第6年在Gartner分析和商业智能魔力象限中蝉联领导者殊荣。

A:

商务智能

B:

商业行为

C:

商务计算

D:

商业统计

答案:

商务智能

2、以下()不是Tableau的数据类型?

A:

Boolean

B:

Date

C:

String

D:

Decimal

答案:

Decimal

3、Tableau可以用来实现交互的、()的分析和仪表板应用,从而帮助我们快速地认识和理解数据。

A:

连续性

B:

离散性

C:

智能化

D:

可视化

答案:

可视化

4、下列说法错误的是()。

A:

Tableau通过内存数据引擎,可以直接查询外部数据库同时动态的从数据仓库抽取实时数据,极大的提高了数据访问和查询效率

B:

用户仅需要通过轻点鼠标和简单拖放就可以迅速创建出智能、精美、直观和具有强交互性的报表和仪表盘

C:

Tableau允许从多个数据源访问数据,包括带分隔符的文本文件、Excel文件、SQL数据库、Oracle数据库和多维数据库等

D:

Tableau不提供应用编程接口

答案:

5、度量往往是()字段,度量是我们的指标。

度量常常是连续的,连续的字段在图表中形成轴.将其拖放到功能区时,Tableau默认会进行()。

A:

数值,聚合运算

B:

数值,混合运算

C:

分类,聚合运算

D:

分类,混合运算

答案:

数值,聚合运算

6、关于数据分层描述错误的是()。

A:

数据分层可以实现向上钻取

B:

数据分层可以实现向下钻取

C:

数据分层的层级结构由数据维度的上下顺序决定

D:

数据分层的层次结构可以手工调整

答案:

数据分层可以实现向上钻取

7、以下不属于集的创建方式的是()。

A:

[常规]创建

B:

[条件]创建

C:

[顶部]创建

创建]分组D:

[

答案:

[分组]创建

8、Tableau右边数据目录栏中,不能单击右键创建参数的纬度是()。

A:

纬度

B:

度量

C:

D:

参数

答案:

9、以下不是创建计算字段时的运算逻辑的是()。

A:

数字

B:

日期

C:

用户

D:

表结构

答案:

表结构

10、仪表板版面大小设计选项,()不属于大小设计选项。

A:

固定大小

B:

自动

C:

范围

D:

自定义

答案:

自定义

第六章

1、Logistic函数的定义域是()。

A:

(-INF,+INF)

B:

[0,1]

C:

(0,+INF)

D:

(-INF,1)

答案:

(-INF,+INF)

2、下列叙述错误的是()。

A:

逻辑回归是一种监督机器学习算法

B:

逻辑回归主要用于回归分析

C:

逻辑回归采用Sigmoid函数对样本数据进行拟合,以构建回归模型

D:

逻辑回归预测事件发生的概率并分析导致事件发生的因素

答案:

尺寸线用细点画线表示

3、使用IBk分类器和SMO分类器对vote.arff分别进行分类,由其输出的结果可知()。

A:

IBk正确分类百分比比SMO大

B:

IBk对republican的分类正确率比SMO大

C:

SMO对democrat的分类正确率比IBk小

D:

SMO对democrat和republican的分类正确率都比IBk大

答案:

SMO对democrat和republican的分类正确率都比IBk大

4、图片10.png

A:

0或1

B:

0或-1

C:

1或-1

D:

true或false

:

答案.

5、以下描述错误的是()。

A:

SVM对噪声不具备鲁棒性

B:

SVM寻找具有最小边缘的超平面,因此经常被称为最小边缘分类器

C:

k-最近邻算法(K-NN)是一种消极学习器

D:

聚类分析可以看作是一种非监督的分类

答案:

6、线性支持向量机的最大化间隔正确的描述是()。

A:

图片6.png

B:

图片7.png

C:

图片8.png

D:

图片9.png

答案:

7、以下计算距离的公式中,计算欧氏距离的是()。

A:

图片2.png

B:

图片3.png

C:

图片4.png

D:

图片5.png

答案:

第七章

1、一般情况下在作图时先不添加()区。

A:

坐标轴

绘图区B:

C:

标题区

D:

图例区

答案:

标题区

2、连续性单变量图不包括()。

A:

直方图

B:

箱线图

C:

P-P图

D:

条形图

答案:

条形图

3、两个定性变量可选择的作图不包括()。

A:

复式条形图

B:

散点图

C:

堆叠条形图

D:

马赛克图

答案:

散点图

4、堆叠条形图和马赛克图可以在图形属性中直接转换。

A:

B:

答案:

5、定性变量作定量变量的相应图形也是有意义的。

A:

错B:

答案:

6、多维度数据图形一般还是以二维的形式展示,只通过形状、颜色等要素扩展维度信息。

A:

B:

答案:

7、制作统计图有两个基本要求:

一是正确,二是简洁。

A:

B:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 法学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1