奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx

上传人:b****4 文档编号:16991271 上传时间:2022-11-27 格式:DOCX 页数:12 大小:18.37KB
下载 相关 举报
奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx_第1页
第1页 / 共12页
奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx_第2页
第2页 / 共12页
奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx_第3页
第3页 / 共12页
奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx_第4页
第4页 / 共12页
奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx

《奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx》由会员分享,可在线阅读,更多相关《奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx(12页珍藏版)》请在冰豆网上搜索。

奥鹏南开大学20春学期170918031809《大数据导论》在线作业参考答案Word格式.docx

A

3.数据清洗的方法不包括

A缺失值处理

B噪声数据清除

C一致性检查

D重复数据记录处理

D

4.下列哪个R语言扩展包可以创建带有点和边的网络图()

Aggplot2

Bnetwork

Cggmaps

Danimation

5.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()

6.GFS中的文件切分成()的块进行存储

A32MB

B64MB

C128MB

D1G

7.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。

A运营式系统阶段

B用户原创内容阶段

C感知式系统阶段

8.下列不属于商业大数据类型的是

A传统企业数据

B机器和传感器数据

C社交数据

D电子商务数据

9.用于描述相等时间间隔下连续数据随时间变化趋势的是()

A折线图

B散点图

C条形图

D饼图

10.数据仓库是随着时间变化的,下列不正确的是()

A数据仓库随时间变化不断增加新内容

B捕捉到的新数据会覆盖原来的快照

C数据仓库随事件变化不断删去旧的数据内容

D数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合

C

11.以下不是数据仓库基本特征的是()

A数据仓库是面向主题的

B数据仓库是面向事务的

C数据仓库的数据是相对稳定的

D数据仓库的数据是反映历史变化的

12.哪个选项不属于大数据4V特点?

AVolume

BValid

CVariety

DValue

13.以下哪项不是数据可视化工具的特性()

A实时性

B简单操作

C更丰富的展现

D仅需一种数据支持方式即可

14.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。

15.大数据的特点不包含

A数据体量大

B价值密度高

C处理速度快

D数据不统一

16.大数据在社交网络中的应用

A用户偏好、情感、社交网络结构

B用户画像、精准推荐

C舆情监控、突发事件预警

D预测外部趋势

A.B.C.D

17.离群点检测的应用包括()等。

A欺诈检测

B入侵检测

C故障检测

D疾病的不寻常模式

18.XX大数据引擎主要包含三大组件()

A开放云

B数据工厂

CXX大脑。

A.B.C

19.KNIME(KonstanzInformationMiner)是一个对用户友好的、智能、开源的平台。

该平台包括了##、##、##、##。

A数据集成

B数据处理

C数据分析

D数据挖掘

20.可视化工具包括()

AExcel

BGoogleChart

CGephi

Dppt

21.云计算是##,##,##的发展 

是虚拟化、效用计算、IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。

A流计算

B分布式计算

C并行计算

D网络计算

B.C.D

22.医疗领域如何利用大数据

A临床决策支持

B个性化医疗

C社保资金安全

D用户行为分析

23.可使用##,##,##进行光滑。

A最大值

B箱中位数

C箱边界

D箱均值

24.大数据智能感知层:

主要包括()及软硬件资源接入系统

A数据传感体系

B网络通信体系

C传感适配体系

D智能识别体系

25.下列属于传统统计学展示方法的是()

A柱状图

B饼状图

C曲线图

D网络图

26.层次方法可以分为()

AK均值算法

BK中心点算法

C凝聚法

D分裂法

C.D

27.一个HDFS集群由一个##和##构成。

此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。

A一个名字节点

B若干个名字节点

C一个数据节点

D若干个数据节点

A.D

28.交通数据分析可用于:

A交通流量实时分析

B合理进行道路规划

C信号灯智能调度

D实时路况查询播报

29.数据变换(DataTransformation)的方法有()

A光滑

B聚集

C数据泛化

D规范化

30.医疗大数据特点:

除了包含了大数据4个“V”的特点之外还有()

A多态性

B时效性

C不完整性

D冗余性

31.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据

T对

F错

32.Flume的数据流由RDD贯穿始终。

33.ID3算法的核心思想就是以信息增益度量属性选择

34.大数据数据量一定是PB,TB级的

35.网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。

36.规则性分析(PrescriptiveAnalysis)用于解决决策制定和提高分析效率

37.数据分析是大数据发展面临的挑战

38.直接拿Python输出的图片用于印刷效果很好

39.通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。

40.结构化数据是用excel结构表现的数据

41.多维数据指的是具有多个维度属性的数据变量。

42.时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析

43.BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。

44.基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。

45.利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。

46.数据分析是大数据价值链中最终和最重要的阶段,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。

通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。

47.数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据

48.数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。

49.大数据的挑战仅仅来自于数据的增长。

50.Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;

或者是从小数据开始,但数据每年增长速率至少为60%。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1