ImageVerifierCode 换一换
格式:DOCX , 页数:10 ,大小:16.79KB ,
资源ID:129480      下载积分:15 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/129480.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(南开20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业参考答案.docx)为本站会员(b****9)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

南开20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业参考答案.docx

1、20 春学期(1709、1803、1809、1903、1909、2003)大数据导论在线作业试卷总分:100得分:98一、单选题 (共 15 道试题,共 30 分) 1.PaaS 是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务答案:B2. 基础设施即服务的英文简称是A.SaaSB.PaaSC.IaaS答案:C3. 数据清洗的方法不包括A.重复数据记录处理B.缺失值处理 C.噪声数据清除D.一致性检查 答案:A4. 下列哪个 R 语言扩展包可以创建带有点和边的网络图() A.networkB.ggplot2 C.ggmaps D.animation 答案:A5. 下列哪

2、个 R 语言扩展包可以制作一系列的图像并将它们串联起来做成动画()A.network B.ggplot2 C.ggmapsD.animation答案:D6. GFS 中的文件切分成()的块进行存储A.32MB B.64MB C.128MB D.1G答案:B7. 数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段 答案:B8. 下列不属于商业大数据类型的是A.社交数据B. 电子商务数据C. 机器和传感器数据D.传统企业数据答案:C9. 用于描述相等时间间隔下连续数据随时间变化趋势的是() A.饼图B.条形图C.散点图D.折线图

3、答案:D10. 数据仓库是随着时间变化的,下列不正确的是() A.数据仓库随时间变化不断增加新内容B. 数据仓库随事件变化不断删去旧的数据内容C. 数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合D. 捕捉到的新数据会覆盖原来的快照答案:B11. 以下不是数据仓库基本特征的是() A.数据仓库的数据是相对稳定的B.数据仓库的数据是反映历史变化的C.数据仓库是面向事务的D.数据仓库是面向主题的答案:C12. 哪个选项不属于大数据 4V 特点? A.VolumeB.VarietyC.Value D.Valid 答案:D13. 以下哪项不是数据可视化工具的特性() A.简单操

4、作B.更丰富的展现C.实时性D.仅需一种数据支持方式即可答案:D14. 数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段 答案:C15. 大数据的特点不包含A.数据体量大B.数据不统一C.处理速度快D.价值密度高答案:B二、多选题 (共 15 道试题,共 30 分) 16.大数据在社交网络中的应用A. 预测外部趋势B. 舆情监控、突发事件预警C.用户画像、精准推荐D.用户偏好、情感、社交网络结构答案:ABCD17. 离群点检测的应用包括()等。A.疾病的不寻常模式B.欺诈检测C.故障检测D.入侵检测答案:ABCD18. 百

5、度大数据引擎主要包含三大组件() A.百度大脑。B.数据工厂C.开放云 答案:ABC19. KNIME(Konstanz Information Miner) 是一个对用户友好的、智能、开源的平台。该平台包括了#、#、#、#。A. 数据集成B.数据处理C.数据分析D.数据挖掘答案:ABCD20. 可视化工具包括() A.pptB. Google Chart C.Gephi D.Excel答案:BCD21. 云计算是#,#,#的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。A.网络计算B.流计算 C.并行计算D

6、.分布式计算答案:ACD22. 医疗领域如何利用大数据A.社保资金安全B.用户行为分析C.临床决策支持D.个性化医疗 答案:ABCD23. 可使用#,#,#进行光滑。A.箱边界B.箱均值 C.箱中位数D.最大值 答案:ABC24. 大数据智能感知层:主要包括()及软硬件资源接入系统A.网络通信体系B.智能识别体系C.数据传感体系D.传感适配体系答案:ABCD25. 下列属于传统统计学展示方法的是() A.饼状图B.网络图C.柱状图D.曲线图答案:ACD26. 层次方法可以分为() A.分裂法B.凝聚法C.K 均值算法D.K 中心点算法答案:AB27. 一个 HDFS 集群由一个#和#构成。此外

7、,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点 B.若干个名字节点C.一个数据节点 D.若干个数据节点答案:AD28. 交通数据分析可用于:A. 实时路况查询播报B.合理进行道路规划C.信号灯智能调度 D.交通流量实时分析答案:ABCD29. 数据变换(Data Transformation)的方法有() A.规范化B. 聚集C. 数据泛化D.光滑答案:ABCD30. 医疗大数据特点:除了包含了大数据 4 个“V” 的特点之外还有() A.时效性B.多态性 C.冗余性 D.不完整性答案:ABCD三、判断题 (共 20 道试题,共 40 分)31. 在现有大数据的存

8、储中,结构化数据仅有 20%,其余 80%则在存在于物联网、电子商务、社交网络等 领域的半结构化数据和非结构化数据答案:正确32. Flume 的数据流由 RDD 贯穿始终。答案:错误33. ID3 算法的核心思想就是以信息增益度量属性选择答案:正确34. 大数据数据量一定是 PB,TB 级的答案:错误35. 网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类 ,形成数据库文件的一个过程。答案:正确36. 规则性分析(Prescriptive Analysis) 用于解决决策制定和提高分析效率答案:正确37. 数据分析是大数据发展

9、面临的挑战答案:正确38. 直接拿 Python 输出的图片用于印刷效果很好答案:错误39. 通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。答案:正确40. 结构化数据是用 excel 结构表现的数据答案:错误41. 多维数据指的是具有多个维度属性的数据变量。答案:正确42. 时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析答案:正确43. BI 分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。答案:错误44. 基于大数据研究个体或群体行为 ,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息

10、服务,进而支持个体或群体时空行为决策。答案:正确45. 利用大数据技术对电子病历中的数字化信息进行分析处理 ,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。答案:正确46. 数据分析是大数据价值链中最终和最重要的阶段 ,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。答案:正确47. 数据表达是通过计算机图形图像技术来更加友好地展示数据信息 ,方便人们阅读、理解和运用数据答案:正确48. 数据采集,又称数据获取,是大数据生命周期的第一个环节 ,通过 RFID 射频识别技术、传感器、交互型

11、社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。答案:正确49. 大数据的挑战仅仅来自于数据的增长。答案:错误50. Gartner 研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过 100TB 的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为 60%。答案:错误以下内容如不需要请删除销售部应收账款管理制度遵照公司对业务部门的管理要求,以及本公司货款回收的实际情况,特制定本办法:一、适用范围本制度适用于销售部管理的中药材,中成药,西药等产品的销售客户。应收账款含货已发出暂未开出增值税发票的发出商品。

12、不包括原料药客户,新昌人民医院, 丽水生生堂等客户。二、应收账款责任人业务部门负责人作为应收货款的直接责任人,对货款的回收承担责任。三、应收账款管理及考核1、应收账款回款期限:应收账款的回款期限从货物发出日起开始计算。货物发出后 2 个月回款为正常的回款周期,超过 2 个月未回款,即为超龄账款,按照相应的考核标准进行考核。2、应收账款考核标准:(1) 正常经营过程产生的超龄账款:货物发出后超过 2 个月未回款的,应收账款责任人应承担该货款超期相应的责任,具体考核办法为:按货款销售额支付超期利息;以后公司每个月对上述货款清理一次,六个月后如果仍然未收回货款,由业务部门负责人承担该笔货款赔偿给公司

13、。(2) 回款期限的计算依据:回款期限按月计算,不精确到日;回款日以账款到达公司账户为准,银行汇票及 1 个月期限的银行承兑汇票视同现金,3 个月以上期限的银行承兑汇票则承担贴现利息。利率按年利率银行同期利率计算。3、应收账款的预警财务部每月对超龄应收进行预警,编制超龄应收账款预警表发给业务部门,业务部门应及时进行核对并确认。4、应收账款的对账应收账款责任人负责与所管理的经销商进行账务的核对工作,确保账务相符。对账要求如下:(1) 所有经销商必须确保每年一次的书面对账,并在公司规定的时间内将对 账单原件寄回公司财务部。(2) 超龄应收账款的对账不受上条限制,随时发生及时对账。由财务部发出 应收账款对账表,货款回收责任人须在当月完成对账工作。(3) 对账单必须取得对方经销单位的确认,并加盖真实、合法的财务章、业 务章或公章。5、资产侵占按照相关规定和法律相关条款追究责任人的赔偿和刑事责任。四、本制度从 2019 年 1 月 1 日期执行。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1