南开大学21春学期《大数据导论》在线作业.docx
《南开大学21春学期《大数据导论》在线作业.docx》由会员分享,可在线阅读,更多相关《南开大学21春学期《大数据导论》在线作业.docx(10页珍藏版)》请在冰豆网上搜索。
![南开大学21春学期《大数据导论》在线作业.docx](https://file1.bdocx.com/fileroot1/2023-4/2/4df1248c-a460-45e3-8d5c-551f8115b159/4df1248c-a460-45e3-8d5c-551f8115b1591.gif)
南开大学21春学期《大数据导论》在线作业
21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据导论》在线作业
大数据的特点不包含
A:
数据体量大
B:
价值密度高
C:
处理速度快
D:
数据不统一
答案:
D
数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
A:
运营式系统阶段
B:
用户原创内容阶段
C:
感知式系统阶段
答案:
C
下列哪个R语言扩展包可以创建带有点和边的网络图()
A:
ggplot2
B:
network
C:
ggmaps
D:
animation
答案:
B
数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。
A:
运营式系统阶段
B:
用户原创内容阶段
C:
感知式系统阶段
答案:
A
IaaS是()的简称
A:
软件即服务
B:
平台即服务
C:
基础设施即服务
D:
硬件即服务
答案:
C
以下不是数据仓库基本特征的是()
A:
数据仓库是面向主题的
B:
数据仓库是面向事务的
C:
数据仓库的数据是相对稳定的
D:
数据仓库的数据是反映历史变化的
答案:
B
基础设施即服务的英文简称是
A:
IaaS
B:
PaaS
C:
SaaS
答案:
A
哪个选项不属于大数据4V特点?
A:
Volume
B:
Valid
C:
Variety
D:
Value
答案:
B
SAN是一种()
A:
存储设备
B:
专为数据存储而设计构建的网络
C:
光纤交换机
D:
HBA
答案:
B
PaaS是()的简称
A:
软件即服务
B:
平台即服务
C:
基础设施即服务
D:
硬件即服务
答案:
B
下列不属于商业大数据类型的是
A:
传统企业数据
B:
机器和传感器数据
C:
社交数据
D:
电子商务数据
答案:
B
用于描述数据分散情况的是()
A:
分布图
B:
箱式图
C:
饼图
D:
折线图
答案:
B
DAS代表的意思是()
A:
两个异步存储
B:
数据归档软件
C:
连接一个可选的存储
D:
直连存储
答案:
D
数据仓库是随着时间变化的,下列不正确的是()
A:
数据仓库随时间变化不断增加新内容
B:
捕捉到的新数据会覆盖原来的快照
C:
数据仓库随事件变化不断删去旧的数据内容
D:
数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
答案:
C
数据清洗的方法不包括
A:
缺失值处理
B:
噪声数据清除
C:
一致性检查
D:
重复数据记录处理
答案:
D
常见的非结构化数据有()
A:
web网页
B:
即时消息
C:
富文本文档
D:
实时多媒体数据
答案:
A,B,C,D
网络数据采集常用的是通过##或##等方式从网站上获取数据信息。
A:
网络爬虫
B:
网站公开API
C:
手动获取
答案:
A,B
对于数值属性,我们使用()来评估一个属性的值如何随另一个属性变化。
A:
欧式距离
B:
相关系数
C:
协方差
答案:
B,C
传感器工作模式类别包括()
A:
基于位置
B:
基于活动
C:
基于设备
答案:
A,B,C
层次方法可以分为()
A:
K均值算法
B:
K中心点算法
C:
凝聚法
D:
分裂法
答案:
C,D
下列正确的是()
A:
D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用
B:
D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行
C:
D3采用的是SelectorsAPI的第一级标准
D:
基础R已经包含支撑包括协同图(Coplot)、拼接图(MosaicPlot)和双标图等多类图形的功能。
答案:
A,B,C,D
大数据在教育中的应用
A:
网上公开课
B:
慕课
C:
智慧校园
D:
翻转课堂
答案:
A,B,C,D
基于大数据的临床决策支持系统的架构包括
A:
支撑层
B:
大数据分析层
C:
网络层
D:
应用层
答案:
A,B,D
按照数据量的大小,可将数据分析分为()
A:
内存级数据分析
B:
Bl级数据分析
C:
海量级数据分析
D:
巨量级数据分析
答案:
A,B,C
医疗大数据特点:
除了包含了大数据4个“V”的特点之外还有()
A:
多态性
B:
时效性
C:
不完整性
D:
冗余性
答案:
A,B,C,D
借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A:
消费能力
B:
趋势报告
C:
购物结果
答案:
A,B
交通数据处理包括以下几个步骤()
A:
数据清洗
B:
数据映射
C:
数据组织
D:
数据聚类
答案:
A,B,C,D
统计图表的可视化方法主要包括()
A:
散点图
B:
折线图
C:
条形图
D:
饼图
答案:
A,B,C,D
##和##,它们把原数据变换或投影到较小的空间。
A:
小波变换
B:
中心化变换
C:
主成分分析
D:
对数变换
答案:
A,C
XX大脑包括()
A:
深度学习
B:
超大规模机器学习
C:
大规模GPU并行化平台
答案:
A,B,C
利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
A:
对
B:
错
答案:
B
结构化数据是用excel结构表现的数据
A:
对
B:
错
答案:
B
关联分析又称为关联规则学习
A:
对
B:
错
答案:
A
大数据处理的关键技术主要包括:
数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。
A:
对
B:
错
答案:
A
原始交通数据记录是离散样本点而且可能不能映射到城市的道路网络中。
A:
对
B:
错
答案:
A
饼图以二维或者三维的形式表示某一数据相对于数据总量的大小,用于数据之间比重的比较。
A:
对
B:
错
答案:
A
Pentaho是最流行的开源商业智能软件之一
A:
对
B:
错
答案:
A
数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
A:
对
B:
错
答案:
A
数据可根据作用方式的不同分为交互数据和交易数据
A:
对
B:
错
答案:
A
由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。
数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择
A:
对
B:
错
答案:
A
ID3算法的核心思想就是以信息增益度量属性选择
A:
对
B:
错
答案:
A
预测性分析(PredictiveAnalysis)用于预测未来事件发生的概率和演化趋势
A:
对
B:
错
答案:
A
交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。
A:
对
B:
错
答案:
A
每个变量的最大值和最小值之差称为极差
A:
对
B:
错
答案:
A
频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。
A:
对
B:
错
答案:
A
云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。
A:
对
B:
错
答案:
A
所有关系型数据中的数据全部为结构化数据。
半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
A:
对
B:
错
答案:
A
云存储中用户需要按需付费并使用存储服务
A:
对
B:
错
答案:
A
数据会吸引更多的潜在攻击者,成为更具吸引力的目标。
A:
对
B:
错
答案:
A
大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。
A:
对
B:
错
答案:
A