春数据思维期末考试Word文件下载.docx

上传人:b****3 文档编号:13720426 上传时间:2022-10-13 格式:DOCX 页数:16 大小:22.52KB
下载 相关 举报
春数据思维期末考试Word文件下载.docx_第1页
第1页 / 共16页
春数据思维期末考试Word文件下载.docx_第2页
第2页 / 共16页
春数据思维期末考试Word文件下载.docx_第3页
第3页 / 共16页
春数据思维期末考试Word文件下载.docx_第4页
第4页 / 共16页
春数据思维期末考试Word文件下载.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

春数据思维期末考试Word文件下载.docx

《春数据思维期末考试Word文件下载.docx》由会员分享,可在线阅读,更多相关《春数据思维期末考试Word文件下载.docx(16页珍藏版)》请在冰豆网上搜索。

春数据思维期末考试Word文件下载.docx

4、()是通过射频识别、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议把需要联网的物品与网络连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络。

A、互联网

B、传感器

C、物联网

D、移动互联网

5、以下哪项不属于数据生成的阶段()。

A、数据运营阶段

B、数据分析阶段

C、用户内容生成阶段

6、数据生产的场景有许多,如下哪些属于数据生产的行为()。

A、小王在大众点评网上对某家餐厅菜品进行评论

B、小赵在知乎上回答了一个问题

C、小李使用淘宝购买商品,并对商品进行评论

D、气象部门使用遥感技术采集天气信息

7、大数据时代,数据生产呈现出了如下哪些特征?

A、实时性

B、具体性

C、大时空

D、多场景

8、大数据的来源途径有许多,如下哪些属于数据的生产源?

()。

A、用户在微博上发表的记录

B、计算机网络运行产生的日志

C、波音飞机飞行时所产生的物联网数据

D、企业ERP系统关于企业人、财、物等数据

第五章单元讨论

1、基于出租车、用户签到等数据获取海量移动轨迹,得知人们在地理空间中的活动和移动范围这一事例体现了数据生产的什么特征?

请再举一个体现相同特征的例子。

2、你是如何理解数据生产的?

谈谈你生活中的数据生产场景?

第六章数据采集

第六章单元测验

1、以下关于社交媒体类数据源,说法错误的是()。

A、社交媒体是指人们彼此之间用来分享意见、见解、经验和观点的工具和平台。

B、博客、论坛等都是社交媒体类数据源。

C、社交媒体产生的数据以文本、图像、音频、视频等为主要内容。

D、网易新闻是社交媒体类数据源。

2、以下哪项不是数据采集的常用方法之一()。

A、系统日志

B、加密传输

C、传感器

D、网络爬虫

3、以下行为不符合爬虫使用的道德规范的是()。

A、使用爬虫下载音乐软件中《七里香》的一条评论。

B、使用爬虫下载音乐软件中《七里香》的所有评论。

C、使用爬虫下载中国知网新闻库的一期新闻。

D、使用爬虫下载中国知网新闻库的所有新闻。

4、下列关于政府数据说法正确的是()。

A、政府数据来自于社会,应该全部向社会公开。

B、政府数据包括政策、法规、公告、以及政府部门的工作数据等,是全社会信息总量最大组成。

C、公安数据涉及公众安全,应该禁止向社会开放利用。

D、部门数据由部门业务产生,是业务部门的资产。

5、下列教室的物品中,哪一项未含有传感器()。

A、监控摄像头

B、电子黑板

C、空调遥控器

D、电风扇

6、下列关于数据采集说法正确的是()。

A、“采”是指对物体的数字化表达、形成数据的过程,主要是感知设备。

B、“集”是指数据汇聚的过程,主要是传输网络,如今天的云系统。

C、数据采集更多是通过RFID射频识别、传感器、社交网络、互联网、摄像头、拾音器、数码相机等方式获取数据。

D、采集的数据类型丰富,既可能是传统的结构化数据,也可能是半结构化和非结构化数据。

7、下列关于数据采集方法说法正确的是()。

A、日志文件是由数据源系统自动生成的记录文件,以指定的文件格式记录活动。

B、传感器能感受到被测量的信息并能将感受到的信息按一定规律变换成为电信号或其他所需形式的信息输出。

C、网络爬虫可以代替人们自动地在互联网中进行数据信息的采集与整理。

D、Python与C++相比,代码更简洁,适合非专业编程人员入手。

8、以下哪个软件可用于日志数据的采集与处理()。

A、Flume

B、Scribe

C、Pycharm

D、Kafka

第六章单元讨论

1、对于爬虫技术的争议一直存在,请就规范爬虫技术提出你的建议。

2、数据采集的过程中可使用RFID射频识别技术,请举出实际使用该技术收集数据的例子。

同时再列举出几种数据采集可使用的方式和工具。

第七章数据存储

第七章单元测验

1、()是将数据分散存储在多台独立的设备上,其核心理念是让多台服务器协同工作,完成单台服务器无法处理的任务,尤其是高并发或者大数据量的任务。

A、云存储

B、分布式存储

C、数据库存储

D、普通文档存储

2、()是面向多用户的,专为大规模客户群而设计建设,除了具备数据共享功能外,还可以为每个用户提供数据的隔离,保证用户数据的安全。

A、私有云存储

B、混合云存储

C、公共云存储

D、独立云存储

3、“非关系型数据库”指()。

A、人工管理

B、文件系统

C、数据库系统

D、NoSQL数据库

4、()模型是NoSQL中最基本也是最重要的数据存储模型。

它的主要思想来自于哈希表:

在哈希表中有一个特定的key和一个value指针,指向特定的数据。

A、列式存储

B、文档存储

C、键值存储

D、图形存储

5、以下哪项不属于CAP理论的内容()。

A、一致性

B、可用性

C、分区容错性

D、原子性

6、在实际应用中,分布式系统代表有Google的()和Apache的()。

A、GPS

B、GFS

C、HDFS

D、HGPS

7、云存储是伴随着云计算技术的发展而衍生出来的一种新兴的网络存储技术,提供了()的数据存储服务。

A、按需分配

B、随机分配

C、按量计算

D、按量下载

8、云存储是将网络中海量的异构存储设备构成可弹性扩张、低成本、低能耗的共享存储资源池,共同对外提供数据存储和业务访问功能的一个系统。

以下哪点是云存储具有的特点?

A、灵活方便

B、成本昂贵

C、成本低廉

D、个性化

第七章单元讨论

1、云存储改变了以往数据主要集中在本地存储和处理的传统模式,企业和个人用户无需再投入大量购置硬件等设施的成本,就能够方便快捷地通过网络根据需求访问计算与存储等服务。

请讨论云存储在现实生活中有哪些实际的应用场景。

2、IBM通过其Lotus群件产品Notes提出了数据库技术的全新概念——“文档数据库”,文档数据库有别于传统数据库,它是一种用来管理文档的数据库。

请你谈谈你对文档数据库中文档存储的理解,并说说它与文件系统的区别。

第八章数据预处理

第八章单元测验

1、以下不属于数据科学中数据预处理过程的是()。

A、小赵使用重复过滤方法对数据集中的“重复类”的冗余数据进行处理

B、小周对数据进行“0-1标准化”处理

C、小吴使用爬虫软件爬取了与某一电影评论有关的数据

D、小刘对数据集中的“姓名”、“家庭住址”、“身份证号”等个人隐私数据进行了删除处理

2、以下关于数据清洗有关内容说法不准确的是()。

A、数据清洗又称数据漂白、数据去隐私化

B、数据清洗广泛应用于银行、保险、零售、电信和交通等行业的数据分析工作

C、缺失数据的清洗主要涉及缺失数据的识别、分析以及选择合适的缺失数据处理方法这三个关键活动

D、数据清洗一般包括缺失数据清洗、冗余数据清洗和噪声数据清洗

3、以下哪项不属于数据预处理的步骤?

A、数据集成

B、数据分析

C、数据清洗

D、数据变换

4、当原始数据的形态不符合目标算法的要求时,需要进行()。

B、数据清洗

C、数据脱敏

5、在不影响数据的完整性和数据分析结果的正确性的前提下,减少所考虑的随机变量或属性的个数的数据归约方法是()。

A、维度归约

B、值归约

C、数据压缩

D、数据标注

6、根据缺失数据对分析结果的影响极其导致数据缺失的影响因素,需要选择具体的缺失数据处理策略。

以下属于缺失数据处理策略的有()。

A、大小变换处理

B、插值处理

C、忽略处理

D、删除处理

7、噪声数据是由于测量变量时发生随机错误或偏差而引起的,噪声数据的处理方法有()。

A、分箱

B、聚类

C、排序

D、回归

8、从标注的实现层次看,数据标注可以分为()和()。

A、手工标注

B、语义标注

C、语法标注

D、自动化标注

第八章单元讨论

1、请举出实际生活中需要进行数据清洗的例子,并简要论述数据清洗的方法。

2、请简要论述你对数据脱敏的理解以及数据脱敏的意义。

第九章数据分析与可视化

第九章单元测验

1、以下哪项不是数据理解的内容()。

A、理解数据更新的时间间隔

B、了解变量间是否是独立的

C、数据存储在哪里

D、删除不必要的数据

2、以下关于数据分析的说法,错误的是()。

A、结构化数据分析是指传统的数据分析

B、社交网络分析只能基于联系结构来分析

C、文本分析又称为文本挖掘,是指从无结构的文本中提取有用信息或知识的过程

D、Web数据分析的目标是从web文档和服务中自动检索、提取和评估信息以发现知识

3、下列算法中哪种是分类算法()。

A、决策树算法

B、聚类算法

C、K-Means算法

D、回归分析

4、以下软件中,哪一个不是数据分析常用软件()。

A、Excel

B、SPSS

C、Python

D、八爪鱼

5、以下关于人工智能AlphaGo的说法正确的是()。

A、AlphaGo对战人类选手未曾一败

B、AlphaGo的智能源于对围棋规则的理解

C、AlphaGo使用的是深度学习来获得智能

D、只要搜集了人类所有的棋谱,AlphaGo将不可战胜

6、借助于图形化的手段,可以清晰有效地传达与沟通信息,这个过程就是()。

A、数据结构化

B、数据可视化

C、数据高效化

D、数据差异化

7、Excel的数据分析图表可用于将工作表数据转换成图片,具有较好的可视化效果。

例如,如果要体现的是一个整体中每一部分所占的比例,如市场份额,通常使用()。

A、饼图

B、折线图

C、散点图

D、柱状图

8、R语言中,ggplot2包的目标是提供一个全面的、基于语法的、连贯一致的图形生成系统

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 其它模板

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1