20春广东开放大学终结性大数据技术参考答案资料Word下载.docx

上传人:b****3 文档编号:13813791 上传时间:2022-10-13 格式:DOCX 页数:52 大小:39.55KB
下载 相关 举报
20春广东开放大学终结性大数据技术参考答案资料Word下载.docx_第1页
第1页 / 共52页
20春广东开放大学终结性大数据技术参考答案资料Word下载.docx_第2页
第2页 / 共52页
20春广东开放大学终结性大数据技术参考答案资料Word下载.docx_第3页
第3页 / 共52页
20春广东开放大学终结性大数据技术参考答案资料Word下载.docx_第4页
第4页 / 共52页
20春广东开放大学终结性大数据技术参考答案资料Word下载.docx_第5页
第5页 / 共52页
点击查看更多>>
下载资源
资源描述

20春广东开放大学终结性大数据技术参考答案资料Word下载.docx

《20春广东开放大学终结性大数据技术参考答案资料Word下载.docx》由会员分享,可在线阅读,更多相关《20春广东开放大学终结性大数据技术参考答案资料Word下载.docx(52页珍藏版)》请在冰豆网上搜索。

20春广东开放大学终结性大数据技术参考答案资料Word下载.docx

国务院于(B)年印发了《促进大数据发展行动纲要》,指出数据已成为国家基础性战略资源。

A.2014

B.2015

C.2016

D.2017

目前,我国互联网、移动互联网用户规模居全球第(A),拥有丰富的数据资源和应用市场优势。

A.一

B.二

C.三

D.四

NoSQL,泛指(A)

A.非关系型的数据库

B.关系型数据库

C.结构型数据库

D.大容量数据库

下列哪项不属于NoSQL(D)

A.键值数据库

B.文档型数据库

C.图形数据库

D.关系型数据库

以下哪个不属于大数据技术的特征D

A.全面分析数据

B.重视数据的复杂性

C.关注数据的相关性

D.随机抽样

数据的统计特征的分类包括(D)

A.集中趋势度量

B.离中趋势度量

C.数据分布形状

D.以上所有均是

(B)表示数据分布的集中位置,如Mean:

平均数、Median:

中位数、Mode:

众数等

A.数据属性

B.集中趋势度量

C.离中趋势度

D.数据分布形状

描述数据对象的特征的量叫做(A)

B.数据筛选

C.数据映射

D.数据分类

数据可视化中实现中数据映射指的是(B)

A.从数据源中选取有效数据

B.确定数据到标记和视觉通道的映射

C.视图的选择与用户交互控制的设计

D.概括现实生活中用户遇到的问题

可视化的分类包括(D)

A.科学可视化

B.信息可视化

C.可视分析学

D.包含以上所有选项

大数据可视化的含义是(D)

A.将不可见现象转换为可见的图形符号,并从中发现规律和获取知识

B.通过可视表达增强人们完成某些任务的效率

C.其实质是用大脑以外的资源增强大脑本身的认知能力

D.以上均是

(A)主要包括偏态和峰值,常见的有正态分布、偏态分布等。

A.数据分布形状

D.数据属性

可视化常见应用领域包括(D)

A.地理信息可视化

B.层次和网络数据可视化

C.文本和文档可视化

数据的不确定性的产生原因不包括(D)

A.数据采集与传输

B.数据精度转换

C.缺失值处理

D.数据特征描述

可视化实现时,根据可视化目标选择相应的图表形式,如果关注3个变量的分布情况,可选择(C)

A.折线直方图

B.柱状直方图

C.3D区域图

D.二维散点图

大数据分析就是数据挖掘。

对错

大数据分析包括可视化分析、数据挖掘、预测分析等方面。

朴素贝叶斯、决策树、K均值聚类等都是大数据分析常用的方法对

假设检验是传统统计学中的一种方法,已不适用于大数据领域。

聚类分析又称群分析,它是研究分类问题的一种统计分析方法对

聚类可基于欧几里得或者曼哈顿距离度量来决定。

进行大数据分析最佳的语言和工具是Java。

R语言是一种用于数据统计与分析的一种商用、收费的工具错

对错

用户画像建模的方法包括统计模型、机器学习算法等。

关系数据库不适用于大数据分析。

考试题型:

选择题

复习题

1、大数据的6V特征中,Volume表示()

A、大量

B、多样

C、低价值密度

D、高速

参考答案:

A

2、大数据的6V特征中,Variety表示()

B

3、大数据的6V特征中,Veracity表示()

D

4、大数据技术的()指的是数据量超大规模和增长,尤其是非结构化数据比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍。

A、大量性

B、多样性

5、大数据的(),指的是数据有很多不同形式(文本、图像、视频、机器数据),无模式或者模式不明显、且语法或句义不连贯。

6、大数据的()指数据能够被组织并呈现。

借助于图形化手段,清晰有效地传达和沟通信息。

基于数据,借助可视化手段提高大脑利用率。

C、可视化

D、低价值密度

C

7、Web内容挖掘实现技术不包括()

A、文本展示

B、文本聚类

C、文本分类

D、关联规则

8、()是在已知各种情况发生概率的基础上,通过构成树状结构来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。

A、生成树

B、决策树

C、哈夫曼树

D、文本树

9、以下哪个不是决策树的算法()

A、ID3

B、C4.5

C、CART

D、Prim

10、分类与回归树(ClassificationAndRegressionTree)是一种()

A、最小生成树

B、无向图

C、有向图

D、决策树

11、可用作数据挖掘分析中的关联规则算法有()

A、决策树

B、K均值法

C、Apriori算法

D、线性回归

12、分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题。

A、关联规则挖掘

B、分类与回归

C、聚类分析

D、时序预测

13、协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(),并将这些用户喜欢的项推荐给有相似兴趣的用户。

A、相似

B、相同

C、推荐

D、预测

14、以下说法不正确的是()

A、分类是预测数据对象的离散类别。

B、预测是用于数据对象的连续取值。

C、Apriori算法是一种典型的关联规则挖掘算法。

D、决策树方法通常用于关联规则挖掘。

15、以下说法正确的是()

A、原始数据集来自多个数据库或数据仓库,它们的结构和规则是相同的

B、孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。

C、可信度是对关联规则的准确度的衡量。

D、聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。

16、推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(),推测客户将来可能的购买行为。

A、客户的朋友

B、客户的个人信息

C、客户的兴趣爱好

D、客户过去的购买行为和购买记录

17、()是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。

A、边界点

B、质心

C、离群点

D、核心点

18、BIRCH是一种()。

A、分类器

B、聚类算法

C、关联分析算法

D、特征选择算法

19、预测建模任务主要包括哪几大类问题?

(AB)A.B.回归C.模式发现D.模式匹配

A、分类和回归

B、分类和模式匹配

C、模式发现和模式匹配

D、分类和模式发现

20、以下各项均是针对数据仓库的不同说法,不正确的有()。

A、数据仓库就是数据库

B、数据仓库是一切商业智能系统的基础

C、数据仓库是面向业务的,支持联机事务处理(OLTP)

D、数据仓库支持决策而非事务处理

21、以下哪些算法是基于规则的分类器()

A、C4.5

B、KNN

C、朴素贝叶斯

D、人工神经网络

22、以下哪些算法是分类算法()

A、DBSCAN

C、K-Means

D、EM

23、在统计计算中,()算法是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量。

A、K-Means算法

B、Apriori算法

C、最大期望算法

D、KNN算法

24、以下哪个不是无监督学习()

A、Apriori

B、K-means

C、PCA

D、KNN

25、以下哪个不属于有监督学习技术()

A、线性回归

B、CART

D、K-Means

26、以下哪个不属于大数据可视化的应用()

A、医学影像

B、天气云图

C、热点地图

D、响应式表单

27、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?

A、根据内容检索

B、建模描述

C、预测建模

D、寻找模式和规则

28、决策树中不包含一下哪种结点

A、根结点

B、内部结点

C、外部结点

D、叶结点

29、()是在掌握大量观察数据的基础上,利用数理统计方法建立变量与自变量之间的回归关系函数表达式。

A、指数分析

B、回归分析

C、预测分析

D、主成分分析

30、()是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。

31、以下哪些方法可用于预测分析()

A、指数平滑

B、周期变化分析

C、回归分析

D、其余选项均是

32、()是研究两个或两个以上处于同等地位的随机变量相关性的统计分析方法,包括变量之间是否存在依存关系,存在什么样的依存方向等等。

A、判别分析

B、主成分分析

D、相关分析

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 视频讲堂

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1