1、答案南开大学春大数据导论在线作业1.以下不是数据仓库基本特征的是()。答案:BA.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的2.第一个提出大数据概念的公司是()。答案:AA.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司3.基础设施即服务的英文简称是()。答案:AA.IaaSB.PaaSC.SaaS4.()是Microsoft Office的核心组件。答案:DA.SQLB.WORDC.PPTD.EXCEL5.MspReduce中的Map和Reduce函数使用()进行输入输出。答案:AA.key/value对B.随机数值C.其他计
2、算结果6.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?()答案:DA.ggplot2B.networkC.ggmapsD.animation7.GFS中的文件切分成()的块进行存储。答案:BA.32MBB.64MBC.128MBD.1G8.大数据的最显著特征是()。答案:AA.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高9.下列哪个R语言扩展包可以创建带有点和边的网络图?()答案:BA.ggplot2B.networkC.ggmapsD.animation10.大数据的特点不包含()。答案:DA.数据体量大B.价值密度高C.处理速度快D.数据不统一11.
3、下面哪一项不是中国发展大数据产业的基础?()答案:DA.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱12.数据仓库是随着时间变化的,下列不正确的是()。答案:CA.数据仓库随时间变化不断增加新内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合13.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?()答案:AA.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段14.购物篮问题是()的典型案例。答案:BA.数据变换B.关
4、联规则挖掘C.数据分类15.数据清洗的方法不包括()。答案:DA.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理16.统计图表的可视化方法主要包括()。答案:ABCDA.散点图B.折线图C.条形图D.饼图17.()和(),它们把原数据变换或投影到较小的空间。答案:ACA.小波变换B.中心化变换C.主成分分析D.对数变换18.常见的分类方法有()。答案:ABCA.决策树B.贝叶斯网络C.遗传算法D.FP算法19.传感器工作模式类别包括()。答案:ABCA.基于位置B.基于活动C.基于设备20.大数据智能感知层:主要包括()及软硬件资源接入系统。答案:ABCDA.数据传感体系B.网络
5、通信体系C.传感适配体系D.智能识别体系21.数据归约(Data Reduction)主要有()。答案:ABCDA.维度规约B.样本规约C.数据聚集D.离散化概念分层22.可视化工具包括()。答案:ABCA.ExcelB.Google ChartC.GephiD.ppt23.可使用(),(),()进行光滑。答案:BCDA.最大值B.箱中位数C.箱边界D.箱均值24.借助于大数据提供的()和(),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。答案:ABA.消费能力B.趋势报告C.购物结果25.离群点检测的应用包括()等。答案:ABCDA.欺诈检测B.
6、入侵检测C.故障检测D.疾病的不寻常模式26.下列属于传统统计学展示方法的是()。答案:ABCA.柱状图B.饼状图C.曲线图D.网络图27.大数据存储的特点与挑战有()。答案:ABCDA.容量问题B.延迟问题C.安全问题D.成本问题28.大数据时代预测人类移动行为的数据来源有()。答案:ABCDA.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据29.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()。答案:ABCDA.多态性B.时效性C.不完整性D.冗余性30.基于大数据的临床决策支持系统的架构包括()。答案:ABDA.支撑层B.大数据
7、分析层C.网络层D.应用层31.NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。()答案:AA.对B.错32.在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。()答案:AA.对B.错33.Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为60%。()答案:BA.对B.错34.Python是一种面向对象的解释型计算机程序设计语言。()答案:AA.对B.错35.
8、数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。()答案:AA.对B.错36.内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。()答案:AA.对B.错37.按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海量级数据分析。()答案:AA.对B.错38.美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。()答案:AA.对B.错39.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半
9、结构化数据和非结构化数据。()答案:AA.对B.错40.聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)。()答案:AA.对B.错41.大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。()答案:AA.对B.错42.居民通过健康云平台中的数据,了解健康情况,防患于未然; 医疗机构通过对远程监控系统中的数据分析,缩短住院时间,提高家庭护理比例和门诊医生预约量。()答案:AA.对B.错43.交通数据的来源包括车辆GPS数据,人类移动的GPS位
10、置信息或者单位站点记录,和监视设备的视频图像技术记录。()答案:AA.对B.错44.大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。()答案:AA.对B.错45.非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。()答案:AA.对B.错46.关联分析又称为关联规则学习。()答案:AA.对B.错47.Pentaho是最流行的开源商业智能软件之一。()答案:AA.对B.错48.我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。()答案:AA.对B.错49.每个变量的最大值和最小值之差称为极差。()答案:AA.对B.错50.数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID.射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。()答案:AA.对B.错
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1