1、南开大学21春学期大数据导论在线作业21春学期(1709、1803、1809、1903、1909、2003、2009、2103)大数据导论在线作业大数据的特点不包含A:数据体量大B:价值密度高C:处理速度快D:数据不统一答案:D数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。A:运营式系统阶段B:用户原创内容阶段C:感知式系统阶段答案:C下列哪个R语言扩展包可以创建带有点和边的网络图()A:ggplot2B:networkC:ggmapsD:animation答案:B数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。A:运营式系统阶段B:用户原创内容阶段C:感知式
2、系统阶段答案:AIaaS是()的简称A:软件即服务B:平台即服务C:基础设施即服务D:硬件即服务答案:C以下不是数据仓库基本特征的是()A:数据仓库是面向主题的B:数据仓库是面向事务的C:数据仓库的数据是相对稳定的D:数据仓库的数据是反映历史变化的答案:B基础设施即服务的英文简称是A:IaaSB:PaaSC:SaaS答案:A哪个选项不属于大数据4V特点?A:VolumeB:ValidC:VarietyD:Value答案:BSAN是一种()A:存储设备B:专为数据存储而设计构建的网络C:光纤交换机D:HBA答案:BPaaS是()的简称A:软件即服务B:平台即服务C:基础设施即服务D:硬件即服务答
3、案:B下列不属于商业大数据类型的是A:传统企业数据B:机器和传感器数据C:社交数据D:电子商务数据答案:B用于描述数据分散情况的是()A:分布图B:箱式图C:饼图D:折线图答案:BDAS代表的意思是()A:两个异步存储B:数据归档软件C:连接一个可选的存储D:直连存储答案:D数据仓库是随着时间变化的,下列不正确的是()A:数据仓库随时间变化不断增加新内容B:捕捉到的新数据会覆盖原来的快照C:数据仓库随事件变化不断删去旧的数据内容D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合答案:C数据清洗的方法不包括A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理
4、答案:D常见的非结构化数据有()A:web网页B:即时消息C:富文本文档D:实时多媒体数据答案:A,B,C,D网络数据采集常用的是通过#或#等方式从网站上获取数据信息。A:网络爬虫B:网站公开APIC:手动获取答案:A,B对于数值属性,我们使用()来评估一个属性的值如何随另一个属性变化。A:欧式距离B:相关系数C:协方差答案:B,C传感器工作模式类别包括()A:基于位置B:基于活动C:基于设备答案:A,B,C层次方法可以分为()A:K均值算法B:K中心点算法C:凝聚法D:分裂法答案:C,D下列正确的是()A:D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用B:D3
5、也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行C:D3采用的是Selectors API的第一级标准D:基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能。答案:A,B,C,D大数据在教育中的应用A:网上公开课B:慕课C:智慧校园D:翻转课堂答案:A,B,C,D基于大数据的临床决策支持系统的架构包括A:支撑层B:大数据分析层C:网络层D:应用层答案:A,B,D按照数据量的大小,可将数据分析分为()A:内存级数据分析B:Bl级数据分析C:海量级数据分析D:巨量级数据分析答案:A,B,C医疗大数据特点:
6、除了包含了大数据4个“V” 的特点之外还有()A:多态性B:时效性C:不完整性D:冗余性答案:A,B,C,D借助于大数据提供的#和#,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A:消费能力B:趋势报告C:购物结果答案:A,B交通数据处理包括以下几个步骤()A:数据清洗B:数据映射C:数据组织D:数据聚类答案:A,B,C,D统计图表的可视化方法主要包括()A:散点图B:折线图C:条形图D:饼图答案:A,B,C,D#和#,它们把原数据变换或投影到较小的空间。A:小波变换B:中心化变换C:主成分分析D:对数变换答案:A,CXX大脑包括()A:深度学习
7、B:超大规模机器学习C:大规模GPU并行化平台答案:A,B,C利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。A:对B:错答案:B结构化数据是用excel结构表现的数据A:对B:错答案:B关联分析又称为关联规则学习A:对B:错答案:A大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。A:对B:错答案:A原始交通数据记录是离散样本点而且可能不能映射到城市的道路网络中。A:对B:错答案:A饼图以二维或者三维的形式表示某一数据相对于数据总量的大小,用于数据之间比重的比较。A:对B:错答案:APent
8、aho是最流行的开源商业智能软件之一A:对B:错答案:A数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。A:对B:错答案:A数据可根据作用方式的不同分为交互数据和交易数据A:对B:错答案:A由于数据变成资源,成为有价值的东西,数据私有化和独占问题就是客观存在的,成为关注的焦点。数据产权界定问题日益突出,在数据权属确定的情况下,数据商品化将成为必然选择A:对B:错答案:AID3算法的核心思想就是以信息增益度量属性选择A:对B:错答案:A预测性分析(Predictive
9、Analysis)用于预测未来事件发生的概率和演化趋势A:对B:错答案:A交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。A:对B:错答案:A每个变量的最大值和最小值之差称为极差A:对B:错答案:A频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。A:对B:错答案:A云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。A:对B:错答案:A所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。A:对B:错答案:A云存储中用户需要按需付费并使用存储服务A:对B:错答案:A数据会吸引更多的潜在攻击者,成为更具吸引力的目标。A:对B:错答案:A大数据需要对多种数据混合访问,催生出了新的、需要考虑安全性的问题。A:对B:错答案:A
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1