最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx
《最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《最新奥鹏南开大学20秋学期《大数据导论》在线作业参考答案Word格式文档下载.docx(12页珍藏版)》请在冰豆网上搜索。
C数据处理速度快
D数据价值密度高
A
3.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
A运营式系统阶段
B用户原创内容阶段
C感知式系统阶段
C
4.下列哪个工具常用来开发移动友好地交互地图()
ALeaflet
BVisual.ly
CBPizzaPieCharts
DGephi
5.医疗健康数据的基本情况不包括以下哪项?
A诊疗数据
B个人健康管理数据
C公共安全数据
D健康档案数据
6.数据仓库是随着时间变化的,下列不正确的是()
A数据仓库随时间变化不断增加新内容
B捕捉到的新数据会覆盖原来的快照
C数据仓库随事件变化不断删去旧的数据内容
D数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
7.IaaS是()的简称
A软件即服务
B平台即服务
C基础设施即服务
D硬件即服务
8.哪个选项不属于大数据4V特点?
AVolume
BValid
CVariety
DValue
B
9.第一个提出大数据概念的公司是()。
A麦肯锡公司
B谷歌公司
C微软公司
D脸谱公司
10.MapReduce中的Map和Reduce函数使用()进行输入输出
Akey/value对
B随机数值
C其他计算结果
11.数据清洗的方法不包括
A缺失值处理
B噪声数据清除
C一致性检查
D重复数据记录处理
12.以下不是数据仓库基本特征的是()
A数据仓库是面向主题的
B数据仓库是面向事务的
C数据仓库的数据是相对稳定的
D数据仓库的数据是反映历史变化的
13.下列不属于Google云计算平台技术架构的是()
A并行数据处理MapReduce
B分布式锁Chubby
C结构化数据表BigTable
D弹性云计算EC2
14.下列哪个R语言扩展包可以创建带有点和边的网络图()
Aggplot2
Bnetwork
Cggmaps
Danimation
15.基础设施即服务的英文简称是
AIaaS
BPaaS
CSaaS
16.大数据时代预测人类移动行为的数据特点是
A多样化
B数据量大
C维数高
D变化快
B|C|D
17.借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A消费能力
B趋势报告
C购物结果
A消费能力|B趋势报告|
18.关于R语言扩展包下列正确的是()
Anetwork可创建带有点和边的网络图
Banimation可制作一系列的图像并将它们串联起来做成动画
Cggmaps通过树图来可视化层次型数据
Dprotfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
A|B
19.网络数据采集常用的是通过##或##等方式从网站上获取数据信息。
A网络爬虫
B网站公开API
C手动获取
A网络爬虫|B网站公开API|
20.数据分析的类型根据数据分析深度可以分为()
A描述性分析
B预测性分析s
C规则性分析
A|B|C
21.数据变换(DataTransformation)的方法有()
A光滑
B聚集
C数据泛化
D规范化
A|B|C|D
22.按照数据量的大小,可将数据分析分为()
A内存级数据分析
BBl级数据分析
C海量级数据分析
D巨量级数据分析
23.可使用##,##,##进行光滑。
A最大值
B箱中位数
C箱边界
D箱均值
24.常见的分类方法有
A决策树
B贝叶斯网络
C遗传算法
DFP算法
25.医疗大数据特点:
除了包含了大数据4个“V”的特点之外还有()
A多态性
B时效性
C不完整性
D冗余性
26.大数据在医疗中的应用有()
A流行性疾病预防
B慢性病健康管理
C临床决策支持
D医疗器械研发
27.一个HDFS集群由一个##和##构成。
此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A一个名字节点
B若干个名字节点
C一个数据节点
D若干个数据节点
A|D
28.主流分布式计算平台有()
Agoogle
BIBM
Cbaidu
DAmazon
A|B|D
29.大数据存储的特点与挑战有()
A容量问题
B延迟问题
C安全问题
D成本问题
30.XX大数据引擎主要包含三大组件()
A开放云
B数据工厂
CXX大脑。
31.减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。
T对
F错
T对|
32.广播变量在广播后可以修改
F错|
33.内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。
34.云存储中用户需要按需付费并使用存储服务
35.云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
36.每个变量的最大值和最小值之差称为极差
37.数据变换(DataTransformation)就是把原始数据转化为适合于数据挖掘的数据形式
38.利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。
39.数据集成(DataIntegration)是将多个数据源中的数据合并存放到一个一致的数据存储中
40.美国《自然》(Nature)杂志专刊——Thenextgoogle,第一次正式提出“大数据”概念。
41.用一个函数拟合数据来光滑数据称为回归。
42.RDD是一种自定义的可并行数据容器,可以存放任意类型的数据
43.BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。
44.云存储是一个由网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等组成的复杂系统。
45.轨迹数据包含空间和时间属性,并且通常规模巨大且维度高
46.预测性分析(PredictiveAnalysis)用于预测未来事件发生的概率和演化趋势
47.数据存取和共享机制是大数据发展面临的挑战
48.21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。
49.交通数据集通常包括空间和时间特性而且跨越大范围的时间空间。
数据聚类可以有效的减小数据规模为随后的分析提供便利。
50.社交网络一一通常由通过一些特定类型的相互依赖关系(例如,亲属关系、友谊、共同兴趣、信念或金融交换)链接的社会实体(例如,个人、公司、集体社会单位或组织)组成。