南开《大数据导论》20春期末考核00001参考答案Word格式.docx
《南开《大数据导论》20春期末考核00001参考答案Word格式.docx》由会员分享,可在线阅读,更多相关《南开《大数据导论》20春期末考核00001参考答案Word格式.docx(9页珍藏版)》请在冰豆网上搜索。
C
4.购物篮问题是##的典型案例
A.数据变换
B.关联规则挖掘
C.数据分类
5.基础设施即服务的英文简称是
A.IaaS
B.PaaS
C.SaaS
A
6.数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
7.以下哪项不是数据可视化工具的特性()
A.实时性
B.简单操作
C.更丰富的展现
D.仅需一种数据支持方式即可
8.下列哪个工具常用来开发移动友好地交互地图()
A.Leaflet
B.Visual.ly
C.BPizzaPieCharts
D.Gephi
9.SAN是一种()
A.存储设备
B.专为数据存储而设计构建的网络
C.光纤交换机
D.HBA
10.GFS中的文件切分成()的块进行存储
A.32MB
B.64MB
C.128MB
D.1G
二、多选题(共10道试题,共20分)
11.数据预处理的过程主要是
A.数据清洗
B.数据集成
C.数据变换
D.数据规约
ABCD
12.大数据时代预测人类移动行为的数据特点是
A.多样化
B.数据量大
C.维数高
D.变化快
BCD
13.下列属于传统统计学展示方法的是()
A.柱状图
B.饼状图
C.曲线图
D.网络图
ABC
14.XX大数据引擎主要包含三大组件()
A.开放云
B.数据工厂
C.XX大脑。
15.去除噪声使得数据光滑的技术主要有:
A.分箱
B.回归
C.离群点分析
16.大数据存储的特点与挑战有()
A.容量问题
B.延迟问题
C.安全问题
D.成本问题
17.大数据在医疗中的应用有()
A.流行性疾病预防
B.慢性病健康管理
C.临床决策支持
D.医疗器械研发
18.医疗大数据的来源主要包括()
A.制药企业/生命科学
B.临床医疗/实验室数据
C.费用报销/利用率
D.健康管理/社交网络
19.数据分析的类型根据数据分析深度可以分为()
A.描述性分析
B.预测性分析s
C.规则性分析
20.数据处理的两种方法是##,##
A.批处理
B.流处理
C.单个处理
D.交叉处理
AB
三、判断题(共15道试题,共30分)
21.所有关系型数据中的数据全部为结构化数据。
半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
正确
22.关联分析是从有噪声的、模糊的、随机的海量数据中,挖掘出隐藏的、事先不知道、但是有潜在关联的信息或知识的过程。
23.数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率“。
24.数据隐私和安全是大数据发展面临的挑战
25.用户可以感知不同属性之间的相关性,过滤掉噪声和不相关的轨迹,用于进一步调查有趣的案例。
分析人员可以交互式地逐步优化设置以改进结果。
26.在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护。
只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。
27.频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。
28.Twitter作为主流社交网络平台,不仅仅是一个海量公共数据集,它还是一个带有时间刻度的海量公共数据集——用于捕捉特定时间中(在一些情况下,也是在特定空间中)数百万人关于所有主题事项的想法。
29.Spark的亮点是充分利用内存承载工作集,而且能保证容错。
30.Apriori算法扫描数据库的次数等于最大频繁项集的项数。
31.高质量的数据是能够满足应用需求的数据。
32.离群点检测的任务是识别特征显著不同于其他数据的观测值
33.数据分析是大数据发展面临的挑战
34.XX地图春节人口迂徙大数据.在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。
35.用一个函数拟合数据来光滑数据称为回归。
四、简答题(共2道试题,共12分)
36.简述云计算的体系架构分层及每层的含义。
云计算可以按需提供弹性资源,它的表现形式是一系列服务的集合。
<
br>
结合当前云计算的应用与研究,其体系架构可分为核心服务、服务管理、用户访问接口三层。
1)核心服务层将硬件基础设施、软件运行环境、应用程序抽象成服务,这些服务具有可靠性强、可用性高、规模可伸缩等特点,满足多样化的应用需求。
2)服务管理层为核心服务提供支持,进一步确保核心服务的可靠性、可用性与安全性。
3)用户访问接口层实现端到云的访问。
37.简述数据可视化的流程和步骤。
数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤。
1)数据获取<
数据获取的形式多种多样,大致可以分为主动式和被动式两种。
主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;
被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。
2)数据处理<
数据处理是指对原始的数据进行分析、预处理和计算等步骤。
数据处理的目标是保证数据的准确性、可用性等。
3)可视化模式<
可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。
可视化模式的选取决定了可视化方案的雏形。
4)可视化应用<
可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。
可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。
五、名词解释(共3道试题,共18分)
38.聚类分析
聚类分析(Clusteranalysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster),同一个簇中的数据之间存在最大相似性,不同簇之间的数据间存在最大的差异性。
39.云存储
云存储是在云计算(cloudcomputing)概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术。
它是云计算的重要组成部分,也是云计算的重要应用之一。
云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
40.NoSQL
NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。
以下内容可以删除:
非标准劳动关系是从标准劳动关系发展而来。
标准劳动关系是一种典型的劳动契约关系,产生于资本主义社会,并一直延续至今。
自20世纪60年代始,随着经济的迅速发展,信息技术的普遍应用,各国的产业结构和知识结构发生了巨大变化,进而要求劳动力作为生产要素流动性增强,灵活就业、弹性就业需求增大。
因为,在工业、机械制造业占主导的产业结构模式下,固定用工制度、长期就业合同是主流的用工和就业形式,但随着商业、服务业的不断扩大,简单、统一的传统就业形式已经不能满足劳动关系双方主体的自身需求,取而代之的应是形式灵活、富于弹性的就业形式,非标准劳动关系也就应运而生。
一方面,企业可以根据市场的需求变化,通过灵活多样的用工形式来雇佣非核心员工,弹性用工能够降低企业劳动力成本,提高企业竞争力,追逐利益最大化。
“企业想要更好的迎接全球化带来的巨大的挑战,人力资源的运用必须要有弹性,也就是劳动弹性化。
”
另一方面,随着社会的发展,人们的就业观念发生了重大变化,更多的人认为工作的目的不仅仅是为了生存,而是为了实现自身的价值,人们不再愿意从事那种传统的束缚于单位的就业形式,而更愿意寻找一种适合自己意愿的、满足自己爱好的、更加自由的就业方式,从而拥有更多属于自己的自由时间和空间来安排自己的生活、实现个人的价值,近年来兴起的SOHO一族就是典型例证。
SOHO是SmallOfficeHomeOffice(小办公室、居家办公室)的缩写,它是指个人以自己的家或小型场所为办公室而从事工作的小型事业体(个体户)。
SOHO代表了一种自由的新型就业方式,其工作场所不固定,工作时间自由,收入高低也不确定,特别适合与高新科技、信息技术相关工作的劳动者,如软件程序员、网络工程师、记者、编辑、自由撰稿人、音乐制作人、广告工作者、咨询师等。
非标准劳动关系面对的挑战
我国的非标准劳动关系是在市场经济快速发展,就业形式日益严峻的大背景下产生并发展起来的,更多的是缓解就业压力的产物。
由于国有企业改革,我国的城镇失业率一直居高不下,而传统的僵化的固定就业模式刚性太大,不利于缓解就业压力。
非标准劳动关系对于降低用人单位的用工成本、方便劳动者自由选择劳动时间、缓解就业压力、扩大就业机会等作用越来越突出,正成为就业的重要渠道,使劳动关系呈现出多元化、复杂化格局。
非标准劳动关系突破了标准劳动关系的内涵,对原有的劳动关系法律调整机制提出了新的挑战。
随着非标准劳动关系的不断发展,我国传统的标准劳动关系法律调整体系已经越来越不适应非标准劳动关系调整的需求。
非标准劳动关系对传统法律的挑战主要体现在以下几方面:
1.法律适用和劳动主体方面
我国现行的劳动法律主要以标准劳动关系为主,很多非标准劳动关系被排斥在基本法律调整的范围之外。
此外,我国《劳动法》主要覆盖的是传统行业的劳动者,范围狭窄。
非标准劳动关系就业人员中有些是在《劳动法》或者《劳动合同法》调整范围之内,如劳动者派遣关系中的劳动者等,但还有很多人被排斥在这两部法律的调整之外,如家政人员等。
我国非标准劳动关系调整的现状要求劳动主体适用范围必须扩大。
2.劳动关系的建立方面
根据《劳动法》的规定,只有用人单位与劳动者之间才能建立劳动关系。
用人单位可以是企业也可以是个体经营者,但不能是个人。
但是在非标准劳动关系领域,用人的一方有可能是个人、家庭和自营经济实体等。
不属于《劳动法》规定的用人单位,因此这种法律关系不受劳动法的调整。
因此,很长时间以来,非标准劳动关系就业人员与用人方之间仅被视为具有平等主体之间的民事权利义务关系。
发生民事权益问题,按民事诉讼的程序处理。
实际上,无论是标准劳动关系就业还是非标准劳动关系就业,都是具有劳动能力的公民从事为国家和社会承认的社会工作,并以此获得用以维持本人及家庭生活的劳动报酬或者经营收入。
因此,将非标准劳动关系放在劳动关系调整之外不符合非标准劳动