1、中小学教师信息技术试题一:判断题(每小题5分)1:Spark是一个高效的分布式计算系统,它有MapReduce所有优点,同时性能与Hadoop一样高。A:对 B:错答案:B 错误2:对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。A:对 B:错答案:B 错误3:信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。A:对 B:错答案:B 错误4:Pig是一个基于Hadoop的大规模数据分析平台,它为复杂的海量数据并行计算提供了一个简单的操作和编程接口。A:对 B:错答案:A 错误5:决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个
2、分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。A:对 B:错答案:A 错误二:单选题(每小题5分)6:HDFS中的block默认保存_份A1 B2 C3 D4 A B C D答案:C 错误7:下列关于HadoopAPI的说法错误的是_A Hadoop的文件API不是通用的,只用于HDFS文件系统 BConfiguration类的默认实例化方法是以HDFS系统的资源配置为基础的 CFileStatus对象存储文件和目录的元数据 D FSDataInputStream是java.io.DataInputStream的子类 A B C D答案:A 错
3、误8:支撑大数据业务的基础是_A数据科学 B数据应用 C数据硬件 D数据人才 A B C D答案:B 错误9:下面_程序负责HDFS数据存储。A NameNode B Jobtracker C Datanode D SecondaryNameNode A B C D答案:C 错误10:云数据库的特性不包括_A动态可扩展 B高可用性 C高性能 D较高的使用代价 A B C D答案:D 错误11:数据清洗的方法不包括_A缺失值处理 B噪声数据清除 C一致性检查 D重复数据记录处理 A B C D答案:D 错误12:HDFS中当前block大小为128M,如果当前要上传到HDFS中的文件大小为300
4、M,那么在存储时会分配_个block进行存储A1 B2 C3 D4 A B C D答案:C 错误13:YARN的http端口默认是_A80 B8080 C 8090 D8088 A B C D答案:D 错误14:大数据的基本特征不包括_A数据量大 B数据类型繁多 C处理速度快 D价值密度高 A B C D答案:D 错误15:在数据生命周期管理实践中_是执行方法A数据存储和备份规范 B数据管理和维护 C数据价值发觉和利用 D数据应用开发和管理 A B C D答案:B 错误三:多选题(每小题5分)16:大数据应用需依托的新技术有_A大规模存储与计算 B数据分析处理 C智能化 D云计算 A B C
5、D答案:ABCD 错误17:大数据产业发展特点_A规模较大 B规模较小 C增速较快 D增速缓慢 E多产业交叉融合 A B C D E答案:ACE 错误18:下列关于大数据的说法中,错误的是_A大数据具有体量大、结构单一、时效性强的特征 B处理大数据需采用新型计算架构和智能算法等新技术 C大数据的应用注重相关分析而不是因果分析 D大数据的应用注重因果分析而不是相关分析 A B C D答案:AD 错误19:大数据人才整体上需要具备_等核心知识A数学与统计知识 B计算机相关知识 C马克思主义哲学知识 D市场运营管理知识 E在特定业务领域的知识 A B C D E答案:ABE 错误20:按照涉及自变量
6、的多少,可以将回归分析分为_A线性回归分析 B非线性回归分析 C一元回归分析 D多元回归分析 A B C D答案:CD 错误一:判断题(每小题5分)1:简单随机抽样,是从总体 N 个对象中任意抽取 n 个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。A:对 B:错答案:B 错误2:HDFS能提供高吞吐量的数据访问,非常适合于大规模数据集上的应用。A:对 B:错答案:A 错误3:所有的MapReduce程序都需要经过Map和Reduce这两个过程A:对 B:错答案:B 错误4:在噪声数据中,波动数据比离群点数据偏离整体水平更大。A:对
7、B:错答案:B 错误5:对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。A:对 B:错答案:B 错误二:单选题(每小题5分)6:下列关于聚类挖掘技术的说法中,错误的是_A不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B要求同类数据的内容相似度尽可能小 C要求不同类数据的内容相似度尽可能小 D与分类挖掘技术相似的是,都是要对数据进行分类处理 A B C D答案:B 错误7:YARN的http端口默认是_A80 B8080 C 8090 D8088 A B C D答案:D 错误8:Hbase中的批量加载底层使用_实现A MapRe
8、duce B Hive C Coprocessor D Bloom Filter A B C D答案:A 错误9:HBase系统基本架构中主服务器Master的作用是_A包含访问HBase的接口,同时在缓存中维护着已经访问过的Region位置信息,用来加快后续数据访问过程 B可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一一个Master在运行 C主要负责表和Region的管理工作 D是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求 A B C D答案:C 错误10:数据清洗的方法不包括_A缺失值处理 B噪声数据清除 C一致性检查 D重复
9、数据记录处理 A B C D答案:D 错误11:YARN架构中整个集群同一时间提供服务的ResourceManager有_个,负责集群资源的统一管理和调度。A1 B2 C3 D4 A B C D答案:A 错误12:下列关于HadoopAPI的说法错误的是_A Hadoop的文件API不是通用的,只用于HDFS文件系统 BConfiguration类的默认实例化方法是以HDFS系统的资源配置为基础的 CFileStatus对象存储文件和目录的元数据 D FSDataInputStream是java.io.DataInputStream的子类 A B C D答案:A 错误13:数据仓库的最终目的是
10、_A收集业务需求 B建立数据仓库逻辑模型 C开发数据仓库的应用分析 D为用户和业务部门提供决策支持 A B C D答案:D 错误14:信息技术发展史上的第二次信息化浪潮发生在_A1950年前后 B1980年前后 C1995年前后 D2010年前后 A B C D答案:C 错误15:当前社会中,最为突出的大数据环境是_A互联网 B物联网 C综合国力 D自然资源 A B C D答案:A 错误三:多选题(每小题5分)16:按照涉及自变量的多少,可以将回归分析分为_A线性回归分析 B非线性回归分析 C一元回归分析 D多元回归分析 A B C D答案:CD 错误17:在网络爬虫的爬行策略中,应用最为基础
11、的是_A深度优先遍历策略 B广度优先遍历策略 C高度优先遍历策略 D反向链接策略 A B C D答案:AB 错误18:下列关于数据生命周期管理的核心认识中,正确的是_A数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段 B在不同的数据存在阶段,数据的价值是不同的 C根据数据价值的不同应该对数据采取不同的管理策略 D数据生命周期管理旨在产生效益的同时,降低生产成本 A B C D答案:ABC 错误19:数据再利用的意义在于_A挖掘数据的潜在价值 B实现数据重组的创新价值 C利用数据可扩展性拓宽业务领域 D优化存储设备,降低设备成本 A B C D答案:ABC 错误20:下列关于大数据的说
12、法中,错误的是_A大数据具有体量大、结构单一、时效性强的特征 B处理大数据需采用新型计算架构和智能算法等新技术 C大数据的应用注重相关分析而不是因果分析 D大数据的应用注重因果分析而不是相关分析 A B C D答案:AD 错误一:判断题(每小题5分)1:利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展现的关联,大大提升政府决策的科学性。A:对 B:错答案:A 错误2:大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事件必然会发生。A:对 B:错答案:B 错误3:所有的MapReduce程序都需要经过Map和Reduce这两个过程A:对 B:
13、错答案:B 错误4:具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。A:对 B:错答案:B 错误5:Hive是一个基于Hadoop的数据仓库工具,可以用于对Hadoop文件中的数据集进行数据整理、特殊查询和分布存储。A:对 B:错答案:A 错误二:单选题(每小题5分)6:下列关于HadoopAPI的说法错误的是_A Hadoop的文件API不是通用的,只用于HDFS文件系统 BConfiguration类的默认实例化方法是以HDFS系统的资源配置为
14、基础的 CFileStatus对象存储文件和目录的元数据 D FSDataInputStream是java.io.DataInputStream的子类 A B C D答案:A 错误7:HDFS中的block默认保存_份A1 B2 C3 D4 A B C D答案:C 错误8:下面与HDFS类似的框架是_A NTFS B FAT32 C GFS D EXT3 A B C D答案:C 错误9:Hadoop具有特性不包括_A高可靠性 B高效性 C高可扩展性 D低容错性, A B C D答案:D 错误10:数据仓库的最终目的是_A收集业务需求 B建立数据仓库逻辑模型 C开发数据仓库的应用分析 D为用户和
15、业务部门提供决策支持 A B C D答案:D 错误11:支撑大数据业务的基础是_A数据科学 B数据应用 C数据硬件 D数据人才 A B C D答案:B 错误12:Heartbeat间隔默认_A1S B2S C3S D4S A B C D答案:C 错误13:下列_程序通常与NameNode在一个节点启动A SecondNameNode B DataNode C TaskTracker D JobTracker A B C D答案:D 错误14:大数据时代,数据使用的关键是_A数据收集 B数据存储 C数据分析 D数据再利用 A B C D答案:D 错误15:数据清洗的方法不包括_A缺失值处理 B噪
16、声数据清除 C一致性检查 D重复数据记录处理 A B C D答案:D 错误三:多选题(每小题5分)16:按照涉及自变量的多少,可以将回归分析分为_A线性回归分析 B非线性回归分析 C一元回归分析 D多元回归分析 A B C D答案:CD 错误17:数据研究经历了几种范式,包括_A实验 B理论 C计算 D数据 A B C D答案:ABCD 错误18:数据再利用的意义在于_A挖掘数据的潜在价值 B实现数据重组的创新价值 C利用数据可扩展性拓宽业务领域 D优化存储设备,降低设备成本 A B C D答案:ABC 错误19:下列关于大数据的说法中,错误的是_A大数据具有体量大、结构单一、时效性强的特征
17、B处理大数据需采用新型计算架构和智能算法等新技术 C大数据的应用注重相关分析而不是因果分析 D大数据的应用注重因果分析而不是相关分析 A B C D答案:AD 错误20:大数据应用需依托的新技术有_A大规模存储与计算 B数据分析处理 C智能化 D云计算 A B C D答案:ABCD 错误一:判断题(每小题5分)1:具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。A:对 B:错答案:B 错误2:大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,
18、确定判断事件必然会发生。A:对 B:错答案:B 错误3:简单随机抽样,是从总体 N 个对象中任意抽取 n 个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。A:对 B:错答案:B 错误4:决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。A:对 B:错答案:A 错误5:Hive是一个基于Hadoop的数据仓库工具,可以用于对Hadoop文件中的数据集进行数据整理、特殊查询和分布存储。A:对 B:错答案:A 错误二:单选题(每小题5分)
19、6:YARN架构中整个集群同一时间提供服务的ResourceManager有_个,负责集群资源的统一管理和调度。A1 B2 C3 D4 A B C D答案:A 错误7:大数据的基本特征不包括_A数据量大 B数据类型繁多 C处理速度快 D价值密度高 A B C D答案:D 错误8:HBase系统基本架构中主服务器Master的作用是_A包含访问HBase的接口,同时在缓存中维护着已经访问过的Region位置信息,用来加快后续数据访问过程 B可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一一个Master在运行 C主要负责表和Region的管理工作 D是HBase中最核心的模
20、块,负责维护分配给自己的Region,并响应用户的读写请求 A B C D答案:C 错误9:Hbase中的批量加载底层使用_实现A MapReduce B Hive C Coprocessor D Bloom Filter A B C D答案:A 错误10:下列关于大数据的分析理念的说法中,错误的是_A在数据基础上倾向于全体数据而不是抽样数据 B在分析方法上更注重相关分析而不是因果分析 C在分析效果上更追究效率而不是绝对精确 D在数据规模上强调相对数据而不是绝对数据 A B C D答案:D 错误11:信息技术发展史上的第二次信息化浪潮发生在_A1950年前后 B1980年前后 C1995年前后
21、 D2010年前后 A B C D答案:C 错误12:云数据库的特性不包括_A动态可扩展 B高可用性 C高性能 D较高的使用代价 A B C D答案:D 错误13:数据清洗的方法不包括_A缺失值处理 B噪声数据清除 C一致性检查 D重复数据记录处理 A B C D答案:D 错误14:HDFS中的block默认保存_份A1 B2 C3 D4 A B C D答案:C 错误15:YARN的http端口默认是_A80 B8080 C 8090 D8088 A B C D答案:D 错误三:多选题(每小题5分)16:数据再利用的意义在于_A挖掘数据的潜在价值 B实现数据重组的创新价值 C利用数据可扩展性拓
22、宽业务领域 D优化存储设备,降低设备成本 A B C D答案:ABC 错误17:大数据产业包含_关键技术A批处理计算 B流计算 C图计算 D查询分析计算 A B C D答案:ABCD 错误18:大数据应用需依托的新技术有_A大规模存储与计算 B数据分析处理 C智能化 D云计算 A B C D答案:ABCD 错误19:在网络爬虫的爬行策略中,应用最为基础的是_A深度优先遍历策略 B广度优先遍历策略 C高度优先遍历策略 D反向链接策略 A B C D答案:AB 错误20:下列关于数据生命周期管理的核心认识中,正确的是_A数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段 B在不同的数据存在
23、阶段,数据的价值是不同的 C根据数据价值的不同应该对数据采取不同的管理策略 D数据生命周期管理旨在产生效益的同时,降低生产成本 A B C D答案:ABC 错误一:判断题(每小题5分)1:在噪声数据中,波动数据比离群点数据偏离整体水平更大。A:对 B:错答案:B 错误2:决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。A:对 B:错答案:A 错误3:信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。A:对 B:错答案:B 错误4:所有的MapReduce程序都需要经过Map和Re
24、duce这两个过程A:对 B:错答案:B 错误5:利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展现的关联,大大提升政府决策的科学性。A:对 B:错答案:A 错误二:单选题(每小题5分)6:数据清洗的方法不包括_A缺失值处理 B噪声数据清除 C一致性检查 D重复数据记录处理 A B C D答案:D 错误7:下面与HDFS类似的框架是_A NTFS B FAT32 C GFS D EXT3 A B C D答案:C 错误8:信息技术发展史上的第二次信息化浪潮发生在_A1950年前后 B1980年前后 C1995年前后 D2010年前后 A B C D答案:C
25、错误9:HDFS中当前block大小为128M,如果当前要上传到HDFS中的文件大小为300M,那么在存储时会分配_个block进行存储A1 B2 C3 D4 A B C D答案:C 错误10:下面_程序负责HDFS数据存储。A NameNode B Jobtracker C Datanode D SecondaryNameNode A B C D答案:C 错误11:大数据的基本特征不包括_A数据量大 B数据类型繁多 C处理速度快 D价值密度高 A B C D答案:D 错误12:大数据时代,数据使用的关键是_A数据收集 B数据存储 C数据分析 D数据再利用 A B C D答案:D 错误13:大
26、数据关键技术中,Hbase主要被应用于_A数据采集 B数据分析 C数据存储 D数据挖掘 A B C D答案:C 错误14:下列关于大数据的分析理念的说法中,错误的是_A在数据基础上倾向于全体数据而不是抽样数据 B在分析方法上更注重相关分析而不是因果分析 C在分析效果上更追究效率而不是绝对精确 D在数据规模上强调相对数据而不是绝对数据 A B C D答案:D 错误15:下列_程序通常与NameNode在一个节点启动A SecondNameNode B DataNode C TaskTracker D JobTracker A B C D答案:D 错误三:多选题(每小题5分)16:下列关于大数据的
27、说法中,错误的是_A大数据具有体量大、结构单一、时效性强的特征 B处理大数据需采用新型计算架构和智能算法等新技术 C大数据的应用注重相关分析而不是因果分析 D大数据的应用注重因果分析而不是相关分析 A B C D答案:AD 错误17:大数据产业发展特点_A规模较大 B规模较小 C增速较快 D增速缓慢 E多产业交叉融合 A B C D E答案:ACE 错误18:数据再利用的意义在于_A挖掘数据的潜在价值 B实现数据重组的创新价值 C利用数据可扩展性拓宽业务领域 D优化存储设备,降低设备成本 A B C D答案:ABC 错误19:下列关于数据生命周期管理的核心认识中,正确的是_A数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段 B在不同的数据存在阶段,数据的价值是不同的 C根据数据价值的不同应该对数据采取不同的管理策略 D数据生命周期管理旨在产生效益的同时,降低生产成本 A B C D答案:ABC 错误20:大数据人才整体上需要具备_等核心知识A数学与统计知识 B计算机相关知识 C马克思主义哲学知识 D市场运营管理知识 E在特定业务领域的知识 A B C D E答案:ABE 错误
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1