南开20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业参考答案Word格式文档下载.docx
《南开20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业参考答案Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《南开20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业参考答案Word格式文档下载.docx(10页珍藏版)》请在冰豆网上搜索。
A
4.下列哪个R语言扩展包可以创建带有点和边的网络图()A.network
B.ggplot2C.ggmapsD.animation答案:
5.下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A.networkB.ggplot2C.ggmaps
D.animation
D
6.GFS中的文件切分成()的块进行存储
A.32MBB.64MBC.128MBD.1G
7.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。
A.运营式系统阶段
B.用户原创内容阶段C.感知式系统阶段答案:
8.下列不属于商业大数据类型的是A.社交数据
B.电子商务数据
C.机器和传感器数据D.传统企业数据
9.用于描述相等时间间隔下连续数据随时间变化趋势的是()A.饼图
B.条形图C.散点图D.折线图答案:
10.数据仓库是随着时间变化的,下列不正确的是()A.数据仓库随时间变化不断增加新内容
B.数据仓库随事件变化不断删去旧的数据内容
C.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
D.捕捉到的新数据会覆盖原来的快照
11.以下不是数据仓库基本特征的是()A.数据仓库的数据是相对稳定的
B.数据仓库的数据是反映历史变化的C.数据仓库是面向事务的
D.数据仓库是面向主题的答案:
12.哪个选项不属于大数据4V特点?
A.Volume
B.Variety
C.ValueD.Valid答案:
13.以下哪项不是数据可视化工具的特性()A.简单操作
B.更丰富的展现C.实时性
D.仅需一种数据支持方式即可答案:
14.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
15.大数据的特点不包含A.数据体量大
B.数据不统一C.处理速度快D.价值密度高答案:
二、多选题(共15道试题,共30分)16.大数据在社交网络中的应用
A.预测外部趋势
B.舆情监控、突发事件预警C.用户画像、精准推荐
D.用户偏好、情感、社交网络结构答案:
ABCD
17.离群点检测的应用包括()等。
A.疾病的不寻常模式
B.欺诈检测C.故障检测D.入侵检测答案:
18.百度大数据引擎主要包含三大组件()A.百度大脑。
B.数据工厂C.开放云答案:
ABC
19.KNIME(KonstanzInformationMiner)是一个对用户友好的、智能、开源的平台。
该平台包括了##、##、##、##。
A.数据集成B.数据处理C.数据分析D.数据挖掘答案:
20.可视化工具包括()A.ppt
B.GoogleChartC.GephiD.Excel
BCD
21.云计算是##,##,##的发展?
是虚拟化、效用计算、IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A.网络计算
B.流计算C.并行计算
D.分布式计算答案:
ACD
22.医疗领域如何利用大数据A.社保资金安全
B.用户行为分析C.临床决策支持D.个性化医疗答案:
23.可使用##,##,##进行光滑。
A.箱边界
B.箱均值C.箱中位数D.最大值答案:
24.大数据智能感知层:
主要包括()及软硬件资源接入系统A.网络通信体系
B.智能识别体系C.数据传感体系D.传感适配体系答案:
25.下列属于传统统计学展示方法的是()A.饼状图
B.网络图C.柱状图D.曲线图答案:
26.层次方法可以分为()A.分裂法
B.凝聚法
C.K均值算法
D.K中心点算法答案:
AB
27.一个HDFS集群由一个##和##构成。
此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点答案:
AD
28.交通数据分析可用于:
A.实时路况查询播报B.合理进行道路规划C.信号灯智能调度D.交通流量实时分析答案:
29.数据变换(DataTransformation)的方法有()A.规范化
B.聚集
C.数据泛化D.光滑
30.医疗大数据特点:
除了包含了大数据4个“V”的特点之外还有()A.时效性
B.多态性C.冗余性D.不完整性
三、判断题(共20道试题,共40分)
31.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据答案:
正确
32.Flume的数据流由RDD贯穿始终。
错误
33.ID3算法的核心思想就是以信息增益度量属性选择答案:
34.大数据数据量一定是PB,TB级的答案:
35.网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。
36.规则性分析(PrescriptiveAnalysis)用于解决决策制定和提高分析效率答案:
37.数据分析是大数据发展面临的挑战答案:
38.直接拿Python输出的图片用于印刷效果很好答案:
39.通常将统计指标的数值按时间顺序排列所形成的数列 ,称为时间序列。
40.结构化数据是用excel结构表现的数据答案:
41.多维数据指的是具有多个维度属性的数据变量。
42.时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析
43.BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。
44.基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。
45.利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。
46.数据分析是大数据价值链中最终和最重要的阶段,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。
通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。
47.数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据
48.数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
49.大数据的挑战仅仅来自于数据的增长。
50.Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;
或者是从小数据开始,但数据每年增长速率至少为60%。
以下内容如不需要请删除
销售部应收账款管理制度
遵照公司对业务部门的管理要求,以及本公司货款回收的实际情况,特制定本办法:
一、适用范围
本制度适用于销售部管理的中药材,中成药,西药等产品的销售客户。
应收账款含货已发出暂未开出增值税发票的发出商品。
不包括原料药客户,新昌人民医院,丽水生生堂等客户。
二、应收账款责任人
业务部门负责人作为应收货款的直接责任人,对货款的回收承担责任。
三、应收账款管理及考核
1、应收账款回款期限:
应收账款的回款期限从货物发出日起开始计算。
货物发出后2个月回款为正常的回款周期,超过2个月未回款,即为超龄账款,按照相应的考核标准进行考核。
2、应收账款考核标准:
(1)正常经营过程产生的超龄账款:
货物发出后超过2个月未回款的,应收账款责任人应承担该货款超期相应的责任,具体考核办法为:
按货款销售额支付超期利息;
以后公司每个月对上述货款清理一次,六个月后如果仍然未收回货款,由业务部门负责人承担该笔货款赔偿给公司。
(2)回款期限的计算依据:
回款期限按月计算,不精确到日;
回款日以账款到达公司账户为准,银行汇票及1个月期限的银行承兑汇票视同现金,3个月以上期限的银行承兑汇票则承担贴
现利息。
利率按年利率银行同期利率计算。
3、应收账款的预警
财务部每月对超龄应收进行预警,编制超龄应收账款预警表发给业务部门,业务部门应及时进行核对并确认。
4、应收账款的对账
应收账款责任人负责与所管理的经销商进行账务的核对工作,确保账务相符。
对账要求如下:
(1)所有经销商必须确保每年一次的书面对账,并在公司规定的时间内将对账单原件寄回公司财务部。
(2)超龄应收账款的对账不受上条限制,随时发生及时对账。
由财务部发出应收账款对账表,货款回收责任人须在当月完成对账工作。
(3)对账单必须取得对方经销单位的确认,并加盖真实、合法的财务章、业务章或公章。
5、资产侵占
按照相关规定和法律相关条款追究责任人的赔偿和刑事责任。
四、本制度从2019年1月1日期执行。