奥鹏南开20春学期《大数据导论》在线作业1标准答案.docx
《奥鹏南开20春学期《大数据导论》在线作业1标准答案.docx》由会员分享,可在线阅读,更多相关《奥鹏南开20春学期《大数据导论》在线作业1标准答案.docx(12页珍藏版)》请在冰豆网上搜索。
![奥鹏南开20春学期《大数据导论》在线作业1标准答案.docx](https://file1.bdocx.com/fileroot1/2022-10/28/3f46354d-bf00-4d6f-bd84-0c8264862bff/3f46354d-bf00-4d6f-bd84-0c8264862bff1.gif)
奥鹏南开20春学期《大数据导论》在线作业1标准答案
南开大学
《大数据导论》在线作业
参考答案
19春学期(、1809、)《大数据导论》在线作业-0002
试卷总分:
100得分:
0
一、单选题(共15道试题,共30分)
1.IaaS是()的简称
A.软件即服务
B.平台即服务
C.基础设施即服务
D.硬件即服务
正确答案:
C
2.下面哪一项不是中国发展大数据产业的基础()。
A.信息化积累了丰富的数据资源
B.大数据技术创新取得明显突破
C.大数据应用推动势头良好
D.大数据产业支撑薄弱
正确答案:
D
3.用于描述数据分散情况的是()
A.分布图
B.箱式图
C.饼图
D.折线图
正确答案:
B
4.PaaS是()的简称
A.软件即服务
B.平台即服务
C.基础设施即服务
D.硬件即服务
正确答案:
B
5.GFS中的文件切分成()的块进行存储
A.32MB
B.64MB
C.128MB
D.1G
正确答案:
B
6.大数据的最显著特征是()。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
正确答案:
A
7.SAN是一种()
A.存储设备
B.专为数据存储而设计构建的网络
C.光纤交换机
D.HBA
正确答案:
B
8.用于描述相等时间间隔下连续数据随时间变化趋势的是()
A.折线图
B.散点图
C.条形图
D.饼图
正确答案:
A
9.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.ggplot2
B.network
C.ggmaps
D.animation
正确答案:
D
10.医疗健康数据的基本情况不包括以下哪项?
A.诊疗数据
B.个人健康管理数据
C.公共安全数据
D.健康档案数据
正确答案:
C
11.以下哪项不是数据可视化工具的特性()
A.实时性
B.简单操作
C.更丰富的展现
D.仅需一种数据支持方式即可
正确答案:
D
12.数据仓库是随着时间变化的,下列不正确的是()
A.数据仓库随时间变化不断增加新内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容
D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案:
C
13.DAS代表的意思是()
A.两个异步存储
B.数据归档软件
C.连接一个可选的存储
D.直连存储
正确答案:
D
14.大数据的特点不包含
A.数据体量大
B.价值密度高
C.处理速度快
D.数据不统一
正确答案:
D
15.下列哪个R语言扩展包可以创建带有点和边的网络图()
A.ggplot2
B.network
C.ggmaps
D.animation
正确答案:
B
二、多选题(共15道试题,共30分)
1.大数据的技术支撑有()
A.计算速度加快
B.存储成本下降
C.机器智能化
D.数据量增加
正确答案:
ABC
2.医疗领域如何利用大数据
A.临床决策支持
B.个性化医疗
C.社保资金安全
D.用户行为分析
正确答案:
ABCD
3.大数据时代预测人类移动行为的数据来源有
A.志愿者定位数据
B.装有导航设备的出租车轨迹数据
C.手机终端定位于通讯记录
D.社会网络签到数据
正确答案:
ABCD
4.互连网上出现的海量信息可以划分为三种,分别为()
A.结构化信息
B.非结构化信息
C.半结构化信息
D.特殊化信息
正确答案:
ABC
5.大数据在社交网络中的应用
A.用户偏好、情感、社交网络结构
B.用户画像、精准推荐
C.舆情监控、突发事件预警
D.预测外部趋势
正确答案:
ABCD
6.数据工厂包括
A.低能耗数据中心
B.超大规模讲分布式架构
C.新一代智能自动化运维
D.超强云安全
正确答案:
ABCD
7.可使用##,##,##进行光滑。
A.最大值
B.箱中位数
C.箱边界
D.箱均值
正确答案:
BCD
8.数据变换的常用方法有##,##,##,##
A.中心化变换
B.极差规格化变换
C.标准化变换
D.对数变换
正确答案:
ABCD
9.大数据采集主要包括()四种。
A.系统日志采集
B.网络数据采集
C.数据库采集
D.其他数据采集
正确答案:
ABCD
10.##和##,它们把原数据变换或投影到较小的空间。
A.小波变换
B.中心化变换
C.主成分分析
D.对数变换
正确答案:
AC
11.开放云()
A.价值呈现:
大数据应用价值呈现和创新不足
B.应用建设:
周期长、门槛高、多冗余、体验差
C.组织流程:
应用跨部门,缺乏流程贯串和使能业务生产
D.生态建设:
无法有效构建和融入新的数字生态圈
正确答案:
ABCD
12.XX大脑包括()
A.深度学习
B.超大规模机器学习
C.大规模GPU并行化平台
正确答案:
ABC
13.数据变换(DataTransformation)的方法有()
A.光滑
B.聚集
C.数据泛化
D.规范化
正确答案:
ABCD
14.医疗大数据的来源主要包括()
A.制药企业/生命科学
B.临床医疗/实验室数据
C.费用报销/利用率
D.健康管理/社交网络
正确答案:
ABCD
15.数据处理的两种方法是##,##
A.批处理
B.流处理
C.单个处理
D.交叉处理
正确答案:
AB
三、判断题(共20道试题,共40分)
1.离群点检测的任务是识别特征显著不同于其他数据的观测值,这样的点称为异常点、离群点或孤立点。
A.对
B.错
正确答案:
A
2.内存分析数据量比海量分析数据量大
A.对
B.错
正确答案:
B
3.Apriori算法扫描数据库的次数等于最大频繁项集的项数。
A.对
B.错
正确答案:
A
4.内存分析数据量比BI分析数据量大
A.对
B.错
正确答案:
B
5.关联分析又称为关联规则学习
A.对
B.错
正确答案:
A
6.利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
A.对
B.错
正确答案:
B
7.美国《自然》(Nature)杂志专刊——Thenextgoogle,第一次正式提出“大数据”概念。
A.对
B.错
正确答案:
A
8.NAS代表的意思是网络附加存储
A.对
B.错
正确答案:
A
9.数据可根据作用方式的不同分为交互数据和交易数据
A.对
B.错
正确答案:
A
10.云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
A.对
B.错
正确答案:
A
11.描述性分析(DescriptiveAnalysis)基于当前事件来描述发生的事件
A.对
B.错
正确答案:
B
12.大数据虽然拥有大量的价值信息,但是价值密度较低
A.对
B.错
正确答案:
A
13.数据的集中存储增加了数据泄露风险。
A.对
B.错
正确答案:
A
14.大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。
A.对
B.错
正确答案:
A
15.时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析
A.对
B.错
正确答案:
A
16.IDC给出的大数据定义是大数据(BigData)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
A.对
B.错
正确答案:
B
17.MapReduce则为海量的数据提供了并行计算,从而大大提高了计算效率;
A.对
B.错
正确答案:
A
18.大数据成为高级可持续攻击的载体
A.对
B.错
正确答案:
A
19.未来考验零售企业的是如何挖掘消费者需求
A.对
B.错
正确答案:
A
20.ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。
A.对
B.错
正确答案:
A