1、6.竞赛时长4小时,竞赛连续进行。竞赛内容构成如下:考核环节考核知识点和技能点描述Hadoop平台及组件的部署管理Hadoop平台安装部署和基本配置考察Hadoop平台及组件的部署能力,掌握常用的基本配置和命令,能够部署和管理Hadoop高可用集群。Hadoop集群节点的动态增加与删除Hadoop平台相关组件部署与管理Hadoop平台的高可用数据采集使用开发者工具查看网页源码,分析网页结构,明确数据采集对象考察学生多维度数据采集能力,包括对关系型数据库、非关系型数据库和网络爬虫技术的应用。构建数据采集请求,抓取网络数据利用网络爬虫相关组件实现网络数据爬取规则文件数据和关系型数据库数据抓取以及数
2、据同步非关系型数据库数据抓取以及数据同步数据采集结果导出及数据库推送数据清洗与分析基于Hadoop平台架构组件和多维度的数据采集,实现数据一致性检查、无效值和缺省值的处理考察对分布式计算、分布式存储系统、数据仓库等综合应用能力,使用Java、Python等开发语言,完成数据清洗、数据存储、数据转化、数据分析、数据预测及数据推送等一系列数据操作多表数据合并和离群值处理通过常见的数据分析算法,对数据进行标准化、离散化和多元化分析掌握数据仓库导入、导出,利用数据仓库相关命令或代码实现数据多维度、多层次的分析对数据的查询、整理和计算。进行编译、打包、发布,执行程序,完成数据处理、清洗。实现不同数据库间
3、的文件传输及转换数据预测分析数据可视化编写后台代码实现数据库访问和数据整理通过常见的数据可视化方法,将数据分析结果以图表的形式进行呈现,使用Python及Web前端等编程语言,实现数据源分析结果展现编写Web前端代码,对数据分析结果进行呈现综合分析通过知识技能,根据数据分析、预测及可视化结果进行分析,做出分析报告。考察学生对大数据技术与分析的综合操作能力和业务分析能力(二)竞赛流程根据竞赛任务要求,参赛队伍在4小时竞赛时间内须完成竞赛任务,参赛队伍须按顺序完成各项任务,但每项任务用时可自行掌握。1.日程安排日期时 间内 容第一天14:00-17:00报到15:30-16:指导老师会议16:00
4、-16:30选手熟悉竞赛场地30-17:裁判员会议第二天7:30-8:领队抽取场次签及检录顺序号8:00-8:20开赛仪式20-8:35裁判长在监督长监督下,考试题目发布35-8:50赛场检录;竞赛选手抽签、确定竞赛工位号50-9:竞赛选手进入赛位,检查赛位设备;现场裁判发放题目、宣布竞赛注意事项;9:00-13:竞赛选手完成竞赛任务13:30-20:竞赛成绩评定,进行成绩汇总第三天00-9:公布竞赛成绩00-10:闭赛与颁奖仪式2.竞赛流程四、竞赛方式1.本赛项采用团体赛方式进行。2.竞赛队伍组成:以院校为单位组队参赛,不得跨校组队,每个参赛队由3人(其中1队长1名)组成,每个参赛队可配1-
5、2名指导老师,指导教师须为本校专兼职教师,参赛选手和指导教师报名获得确认后不得随意更换。3.竞赛时间4小时。五、竞赛试题本赛项样题详见附件一。六、竞赛规则1.参赛资格:参赛选手须为高等职业学校全日制在籍学生;本科院校中高职类全日制在籍学生;五年制高职四、五年级学生;年龄不超过25周岁,性别不限。凡在往届本赛项全国大赛中获一等奖的学生,不得参加同一组别同一赛项的竞赛。2.参赛选手应严格遵守赛场纪律,服从指挥,着装整洁,仪表端庄,讲文明礼貌。各地代表队之间应团结、友好、协作,避免各种矛盾发生。3.参赛队的竞赛工位号采用抽签方式确定。赛题以任务书形式发放,竞赛参考资料在赛前植入参赛选手的计算机,参赛
6、队根据任务书要求完成竞赛任务。4.组委会统一布置竞赛需要的软硬件环境。选手不得私自携带任何移动存储、辅助工具、移动通信等进入赛场。5.参赛选手报到当天可预先熟悉比赛场地,但不得进行现场练习。参赛选手按规定时间到达指定地点,凭参赛证、学生证和身份证(三证必须齐全)进入赛场。选手迟到10分钟取消比赛资格。6.各队领队和指导教师,以及观摩人员在赛场指定的观摩区观摩比赛。7.参赛选手不得携带通讯工具和其它未经允许的资料、物品进入比赛场地,不得中途退场。如出现较严重的违规、违纪、舞弊等现象,经裁判组裁定取消比赛成绩。8.新闻媒体在赛场设定的媒体采访区工作,并且听从现场工作人员的安排和管理,不能影响比赛进
7、行。9.在竞赛过程中,参赛选手如有疑问,应举手示意,考场裁判长应按要求及时予以答疑。如遇设备或软件等故障,参赛选手应举手示意,考场裁判长、技术人员等应及时予以解决。确因计算机软件或硬件故障,致使操作无法继续的,经考场裁判长确认,予以启用备用设备。10.比赛过程中,参赛选手须严格遵守操作标准和规范,保证自身安全,并接受裁判员的监督和警示;若因设备故障导致选手中断或终止比赛,由大赛裁判长视具体情况做出裁决。11.参赛选手不得因各种原因提前结束比赛。如确因不可抗因素需要离开赛场的,须向现场裁判员举手示意,经裁判员许可并完成记录后,方可离开。凡在竞赛期间内提前离开的选手,不得返回赛场。12.现场比赛结
8、束,经裁判员确认后方可离开赛场。13.各赛项由裁判员现场评分,经裁判长签字确认后予以公布,如有异议请直接向大赛仲裁工作组申请复核。14.每个参赛队必须参加所有专项的比赛。参赛选手应严格遵守赛场纪律,服从指挥,着装整洁,仪表端庄,讲文明礼貌。各地代表队之间应团结、友好、协作,避免发生任何形式的矛盾。15.其它未尽事宜,将在赛前向各领队做详细说明。七、竞赛环境竞赛现场设置场内竞赛区、现场裁判工作区、技术支持区等。监考人员协助裁判长和现场裁判做好负责工位范围内的秩序维持,监考人员不得在考场内随意走动。技术支持保障人员在技术支持服务区候场,有需要时在现场裁判的带领下到相关的工位进行赛场技术支持保障,在
9、条件具备时,技术支持区可不设置在考场内。场内竞赛区为参赛队提供统一的竞赛设备;无需选手自带任何工具及附件。竞赛现场符合消防安全规定,现场消防器材和消防栓合格有效,应急照明设施状态合格,赛场明显位置张贴紧急疏散图,赛场地面张贴荧光疏散指示箭头,赛场出入口专人负责,随时保证安全通道的畅通无阻。各工位分区供电,强电弱电分开布线,现场临时用电满足施工现场临时用电安全技术规范JGJ46-2005的要求。竞赛现场通风良好、照明需符合教室采光规范。八、技术规范本赛项的技术规范将包括:相关专业的教育教学要求、行业、职业技术标准,以及根据高职目录修订后的大数据技术与应用相关专业人才培养标准和规范,适时地修订本赛
10、项遵循的技术规范。(一)基础标准标 准GB/T 11457-2006信息技术、软件工程术语 GB8566-88计算机软件开发规范GB/T 12991-2008信息技术数据库语言SQL第1部分:框架GB/T 21025-2007XML使用指南GB/T 20009-2005信息安全技术数据库管理系统安全评估准则已发布GB/T 20273-2006信息安全技术数据库管理系统安全技术要求20100383-T-469信息技术安全技术信息安全管理体系实施指南(二)软件开发标准GB/T 8566 -2001信息技术 软件生存周期过程 GB/T 15853 -1995软件支持环境 GB/T 14079 -19
11、93软件维护指南GB/T 17544-1998信息技术 软件包 质量要求和测试九、技术平台(一)竞赛设备设备类别数量设备用途基本配置竞赛服务器4台。采用集群管理方式;1台备用支撑大数据竞赛管理系统运行使用。内嵌虚拟化资源管理控制端,作为虚拟化资源管理系统的计算资源、网络资源和存储资源的源节点。1、CPU模块:2*Intel 5118(2.3GHz/12核/16.5MB/105W)2、内存模块:8*32GB 2Rx4 DDR4-2666P-R 3、硬盘模块:6*600GB 12G SAS 10K 2.5in EP 512n 4、RAID卡:1*12Gb 2端口SAS RAID卡(带2GB缓存,支
12、持8个SAS口,PCIe,不含超级电容) 5、网口:4端口千兆电接口网卡-360T-B2 6、电源模块:550W交流电源模块(白金) 7、超级电容模块:LSI G3超级电容模块(适配2U机型)客户端每支参赛队伍3台。根据参赛团队数量,配备10%的备份机器。竞赛选手比赛使用。性能相当于i5处理器,8G以上内存,1TB以上硬盘,显示器要求1024*768以上。(二)软件环境设备类型软件类别软件名称、版本号服务器集群大数据集群操作系统CentOS 7.4大数据分析平台组件Hadoop 2.6.0Yarn 2.6.0Zookeeper 3.4.5Hive 1.1.0Flume 1.6.0Sqoop 1.4kafka 1.0Spark 2.0数据库MySQL 5.7开发客户端PC操作系统Windows 10 64位浏览器Chrome开发语言Python 3.6 64bitJava 8Scala 2.0以上开发工具Pycharm 2019(Communi
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1