最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx

上传人:b****1 文档编号:14067525 上传时间:2022-10-17 格式:DOCX 页数:12 大小:18.40KB
下载 相关 举报
最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx_第1页
第1页 / 共12页
最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx_第2页
第2页 / 共12页
最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx_第3页
第3页 / 共12页
最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx_第4页
第4页 / 共12页
最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx

《最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx(12页珍藏版)》请在冰豆网上搜索。

最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx

C数据处理速度快

D数据价值密度高

A

3.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。

A运营式系统阶段

B用户原创内容阶段

C感知式系统阶段

C

4.下列哪个工具常用来开发移动友好地交互地图()

ALeaflet

BVisual.ly

CBPizzaPieCharts

DGephi

5.医疗健康数据的基本情况不包括以下哪项?

A诊疗数据

B个人健康管理数据

C公共安全数据

D健康档案数据

6.数据仓库是随着时间变化的,下列不正确的是()

A数据仓库随时间变化不断增加新内容

B捕捉到的新数据会覆盖原来的快照

C数据仓库随事件变化不断删去旧的数据内容

D数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合

7.IaaS是()的简称

A软件即服务

B平台即服务

C基础设施即服务

D硬件即服务

8.哪个选项不属于大数据4V特点?

AVolume

BValid

CVariety

DValue

B

9.第一个提出大数据概念的公司是()。

A麦肯锡公司

B谷歌公司

C微软公司

D脸谱公司

10.MapReduce中的Map和Reduce函数使用()进行输入输出

Akey/value对

B随机数值

C其他计算结果

11.数据清洗的方法不包括

A缺失值处理

B噪声数据清除

C一致性检查

D重复数据记录处理

12.以下不是数据仓库基本特征的是()

A数据仓库是面向主题的

B数据仓库是面向事务的

C数据仓库的数据是相对稳定的

D数据仓库的数据是反映历史变化的

13.下列不属于Google云计算平台技术架构的是()

A并行数据处理MapReduce

B分布式锁Chubby

C结构化数据表BigTable

D弹性云计算EC2

14.下列哪个R语言扩展包可以创建带有点和边的网络图()

Aggplot2

Bnetwork

Cggmaps

Danimation

15.基础设施即服务的英文简称是

AIaaS

BPaaS

CSaaS

16.大数据时代预测人类移动行为的数据特点是

A多样化

B数据量大

C维数高

D变化快

B|C|D

17.借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。

A消费能力

B趋势报告

C购物结果

A消费能力|B趋势报告|

18.关于R语言扩展包下列正确的是()

Anetwork可创建带有点和边的网络图

Banimation可制作一系列的图像并将它们串联起来做成动画

Cggmaps通过树图来可视化层次型数据

Dprotfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具

A|B

19.网络数据采集常用的是通过##或##等方式从网站上获取数据信息。

A网络爬虫

B网站公开API

C手动获取

A网络爬虫|B网站公开API|

20.数据分析的类型根据数据分析深度可以分为()

A描述性分析

B预测性分析s

C规则性分析

A|B|C

21.数据变换(DataTransformation)的方法有()

A光滑

B聚集

C数据泛化

D规范化

A|B|C|D

22.按照数据量的大小,可将数据分析分为()

A内存级数据分析

BBl级数据分析

C海量级数据分析

D巨量级数据分析

23.可使用##,##,##进行光滑。

A最大值

B箱中位数

C箱边界

D箱均值

24.常见的分类方法有

A决策树

B贝叶斯网络

C遗传算法

DFP算法

25.医疗大数据特点:

除了包含了大数据4个“V”的特点之外还有()

A多态性

B时效性

C不完整性

D冗余性

26.大数据在医疗中的应用有()

A流行性疾病预防

B慢性病健康管理

C临床决策支持

D医疗器械研发

27.一个HDFS集群由一个##和##构成。

此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。

A一个名字节点

B若干个名字节点

C一个数据节点

D若干个数据节点

A|D

28.主流分布式计算平台有()

Agoogle

BIBM

Cbaidu

DAmazon

A|B|D

29.大数据存储的特点与挑战有()

A容量问题

B延迟问题

C安全问题

D成本问题

30.XX大数据引擎主要包含三大组件()

A开放云

B数据工厂

CXX大脑。

31.减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。

T对

F错

T对|

32.广播变量在广播后可以修改

F错|

33.内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。

34.云存储中用户需要按需付费并使用存储服务

35.云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。

36.每个变量的最大值和最小值之差称为极差

37.数据变换(DataTransformation)就是把原始数据转化为适合于数据挖掘的数据形式

38.利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。

39.数据集成(DataIntegration)是将多个数据源中的数据合并存放到一个一致的数据存储中

40.美国《自然》(Nature)杂志专刊——Thenextgoogle,第一次正式提出“大数据”概念。

41.用一个函数拟合数据来光滑数据称为回归。

42.RDD是一种自定义的可并行数据容器,可以存放任意类型的数据

43.BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。

44.云存储是一个由网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等组成的复杂系统。

45.轨迹数据包含空间和时间属性,并且通常规模巨大且维度高

46.预测性分析(PredictiveAnalysis)用于预测未来事件发生的概率和演化趋势

47.数据存取和共享机制是大数据发展面临的挑战

48.21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。

49.交通数据集通常包括空间和时间特性而且跨越大范围的时间空间。

数据聚类可以有效的减小数据规模为随后的分析提供便利。

50.社交网络一一通常由通过一些特定类型的相互依赖关系(例如,亲属关系、友谊、共同兴趣、信念或金融交换)链接的社会实体(例如,个人、公司、集体社会单位或组织)组成。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 计算机软件及应用

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1