大数据实训与科研平台软件部分广东农工商职业技术学院.docx
《大数据实训与科研平台软件部分广东农工商职业技术学院.docx》由会员分享,可在线阅读,更多相关《大数据实训与科研平台软件部分广东农工商职业技术学院.docx(68页珍藏版)》请在冰豆网上搜索。
大数据实训与科研平台软件部分广东农工商职业技术学院
1、投标人资格要求
1.中华人民共和国境内注册的法人或其他组织,具有独立承担民事责任的能力、独立承担招标项目的能力和独立订立、履行合同的能力。
2.已登记报名并购买了招标文件。
用户需求书
一、项目概况及资质要求
本项目为广东农工商职业技术学院软件教学工厂(大数据实训与科研平台软件部分)采购项目
投标人资格要求
1、经营范围必须满足本项目实施的要求。
2.中国境内具有中央政府供货资格的供应商
3、具有项目的承接能力、合同的履约能力、售后服务能力和良好的信誉。
4、为方便供货及项目的实施,本次竞价仅限在中国境内设有长期售后服务机构(在中国境内有分公司或分支机构);
5.货物须由供应商派人送货上门,不得使用快递或者客户自提等方式发货。
6.投标人应当具有项目的承接能力。
投标人负责自己设备间的互通测试,因系统调试而产生的现场工作费用由投标人承担。
二、总体要求
1、所有设备必须是已注册商标的品牌机,必须是厂商原装、全新的正品,符合国家及该产品的出厂标准。
所有产品、设备提供出厂合格证等质量证明文件。
设备外观清洁,标记编号以及盘面显示等字体清晰,明确。
2、对于影响设备正常工作的必要组成部分,无论在技术规范中指出与否,投标人都应在投标文件中明确列出。
3、所投的产品必须是在中国大陆范围内合法销售,原装、全新、并完全符合用户要求的产品。
4、除厂家的售后服务计划外,投标人应提供详细的、针对于高校的售后服务计划。
5、投标人根据本招标文件要求提出的方案和设备配置,确保设备配套,必须能实现本系统所有要求的功能和性能,不能短缺和增加未被要求的冗余,如要增加未被要求的冗余,应加以解释。
三、详细参数、要求及报价表
说明:
指标按重要性分为“▲”和一般无标示指标。
▲代表重要指标,但不作为无效投标条款;无标识则表示一般指标项。
“证明材料要求”项可填“是”和“否”。
填“是”的,投标人须提供包含相关指标项的证明材料,证明材料可以使用厂家产品功能截图或产品白皮书或第三方机构检验报告。
未提供有效证明材料或证明材料中内容与所填报指标不一致的,该指标按不满足处理。
1.大数据教学资源平台
序号
重要性
指标项
指标要求
证明材料要求
大数据教学资源及实验管理系统
1.
教师端功能
系统首页需显示学生上课课表、消息通知、我的信息
否
2.
需包括学习统计和整体统计。
实现对学生、班级课程教学情况、课程情况等的整体统计;实现对教授的班级、课程、教授过的学生、批改的实验报告及作业等数量的统计。
否
3.
▲
需提供理论课程与实验课程的教学相关功能。
1、课程教学:
需支持在线展示PPT课件,可查看备课材料、课后作业;需支持在线学习实验课程,可登陆实验环境、查看实验视频、实验手册,并且相关资源均需支持下载。
课件下载后需支持以PPT格式打开、备课材料等文档需支持Word格式打开。
2、进入试验:
实验课程中需支持实验环境的文件下载,支持虚拟机集群,可以切换集群中不同的虚拟机配置。
系统需在确保低资源占用和高性能体验的基础上,支持教师与学生间的双向屏幕广播,并可以自由设置、锁定或协同操作。
需支持剪切板功能,可以在复制当前环境中的文字(中英文需都支持)在虚拟机中粘贴,需支持利用SFTP工具的上传、下载虚拟环境中的内容功能。
需支持实验视频的查看,虚拟机的替换,镜像的保存。
教师保存的镜像需在教师的‘虚拟机管理’的‘镜像管理’中有显示。
该保存的镜像可以在‘虚机管理’的‘模板配置’功能中为课程使用分配。
否
4.
▲
创作课程:
需支持通过上传材料和在线编辑等方式制作课程。
制作章节:
需支持教师上传自己制作的PPT课件,支持在线制作备课材料、实验手册。
支持上传课后作业、实验视频、课程材料等文档资源制作自己的课程章节。
支持类型是实验的章节实验镜像的保存。
保存的镜像需在教师的‘虚拟机管理’的‘镜像管理’中有显示,支持集群的保存,保存的集群在教师的‘集群配置’中有显示。
制作课程:
需支持课程间章节资源的自由组合形成新的课程。
支持预置课程与自定义课程的自由组合,支持拖拽的方式调整章节资源。
需支持课程的发布,发布课程后管理员可将课程分配给其他班级和其他教师。
需支持资源的共享,共享后其他教师可以使用该教师制作的章节资源制作课程。
需支持将上传的PPT课件在系统中以PDF版式文件形式展示。
否
5.
班级管理:
用于教师维护班级结课时使用,需包括查看授课信息、操作班级结课。
否
6.
实验管理:
需支持对学生实验报告的查看、批阅等功能。
支持教师下载学生制定目录虚拟机的文件。
否
7.
作业管理:
需支持对学生作业的查看、批阅等功能。
否
8.
成绩管理:
需支持学生成绩的查看查询、导入导出等功能。
否
9.
成绩设置:
需支持所授课程的成绩权重值及评价分的设置。
否
10.
试题管理:
提供题库功能和在线考试功能。
1、题库管理:
需支持按照网页添加、文件导入的方式添加题库试题,形成试题题库。
2、生成试卷:
需支持按照题库试题类型生成试卷(需支持按照自定义试题类型和数量,随机抽取试题生成试卷,并支持试卷以word文档形式下载。
还需支持设置试卷答题的时间进行在线考试)。
支持同一课程生成多张试卷,支持考试选择班级,支持考试试卷的预览。
3、在线批阅:
需支持填空题自动批阅,主观题手动批阅。
试卷分数自动统计。
支持考试成绩计入系统总成绩。
否
11.
▲
教学统计分析
需支持按照教学活跃度、教学周期、教学成果、教学成绩全方位统计教学质量。
需包括按课程统计学习人数、问题交流问题数、考试及格率、平均成绩等功能。
对教师教授的每门课程也需要有详细的统计,需包括统计分析学生的实验总时间、问题交流回答数、提交作业率、实验报告提交率。
该功能也需包括按班级统计该班级课程学习人数、每个班级课程的考试及格率、实验报告提交率、作业提交率、实验学习平均时长、平时平均成绩,考试平均成绩,总成绩平均成绩等功能。
需支持对每门课程的实验时长、课程成绩分数、每个章节的课程成绩、班级平均成绩等统计分析功能
否
12.
▲
学生统计分析
需支持按照班级查询所有学生的学习状况,支持通过图形的方式反应学生的大数据能力、分析该能力下学生适合的大数据岗位,支持统计分析学生整体学习过程,包括学习的所有大数据课程、统计每门课程知识点的具体掌握情况、需支持统计作业情况、考试情况、问题交流等详细学习情况。
要求以图形的方式展示学生各课程知识点优秀、良好、一般分布的比率。
否
13.
▲
学习情况资料下载
需支持按照班级所有学生的学习报告的下载,学习报告中包涵‘学生统计分析’中的统计数据。
可以打包、下载该学生在学习工程中产生的理论作业,实验报告、考试试卷。
否
14.
虚机管理
需支持管理教师和教师该班级学生虚机功能。
包括虚机查询、模板配置、集群配置、镜像管理等功能
15.
需提供教师端问题交流、帮助文档及消息通知等功能。
否
16.
学生端功能
首页展示:
系统首页需显示学生课表,统计学生的实验总时间、提问问题数、提交作业数、实验报告数。
否
17.
▲
我的课程(核心功能需提供截图)
用于学生查看课程信息、提交作业以及进入实验环境时使用。
1、课程教学:
需支持在线展示PPT课件,可查看作业、支持作业的在线编辑;需支持在线学习实验课程,可登陆实验环境、查看实验视频、实验手册。
2、进入试验:
实验课程中需支持实验环境的文件下载,支持虚拟机集群,可以切换集群中不同的虚拟机配置。
需支持学生在实验环境中填写实验报告,并支持学生查看教师对试验报告的评价。
系统需在确保低资源占用和高性能体验的基础上,支持教师与学生间的双向屏幕广播,并可以自由设置、锁定或协同操作。
需支持剪切板功能,可以在复制当前环境中的文字在虚拟机中粘贴。
支持实验视频的查看,虚拟机的替换,镜像的保存。
需系统提供截图功能,在学生实验报告和实验笔记过程中,实现对实验环境的一键截图,便于留存。
支持学习笔记的保存和下载。
是
18.
在线选课
需支持按不同条件检索课程、查看教师简介、课程简介、查询课程学分及人数,可以选课、退选;
否
19.
▲
学生统计分析
需支持通过图形的方式反应学生的大数据能力、分析该能力下学生适合的大数据岗位,支持统计分析学生整体学习过程,包括学习的所有大数据课程、统计每门课程知识点的具体掌握情况、需支持统计作业情况、考试情况、问题交流等详细学习情况。
要求以图形的方式展示学生各课程知识点优秀、良好、一般分布的比率。
否
20.
需支持成绩查询;在线考试(规定时间内作答,时间截止后自动交卷);问题交流(支持问题提问、问题查询等)
否
21.
管理员端功能
机构管理:
需支持地点管理、部门管理、院系管理等功能。
并支持对地点、部门、院系等基础信息的维护等功能。
在院系管理中还应支持对专业、专业方向的维护等功能。
支持图标管理,支持上传后的图标在“学生统计分析”功能的“下载”文件中显示。
需支持图标在“下载”文件中显示的停止和启用。
否
22.
教学管理:
需支持教师管理(支持教师信息的维护,模板下载、导入,密码初始化等功能)、班级管理(支持班级、学生信息的维护,班级学生信息模板下载、批量导入,密码初始化,增加课程等功能)、排课管理(需支持按照手动排课或按照时间段自动排课,需支持基于指定院系、专业、专业方向、授课教师、课程名称、上课地点等条件的排课操作,提供图形化点选排课界面,并提供排课冲突提示等)、排课详情(对已排好课程进行维护)、任课概要(维护教师与班级的任课关系)、课程库(用于对所有预置和自定义课程内容进行管理维护)等功能。
否
23.
交流管理
需支持查询‘问题交流’功能中的信息。
支持的信息的的发帖人禁言。
禁言后的发帖人不能在‘问题交流’中‘提问’和‘回答’问题。
支持批量禁言人员的解禁。
24.
▲
虚机管理
需支持管理教师和学生虚拟机功能。
需包括虚机查询(支持查询所有人员虚拟机名称、使用该虚拟机的课程、镜像/集群名称等。
需支持按照班级名称等的检索);模板配置(支持为课程分配镜像。
支持按照该课程的实验课程章节分配镜像。
镜像分配好后学生和教师进入‘我的课程’点击分配的章节进入实验,虚拟机自动创建。
需支持‘单节点’和‘集群’两种配置。
按照集群分配后,教师和学生自动分配多台虚拟机,可以随时为该模板分配配置上限);镜像管理(支持系统中的镜像的查询和删除。
需支持显示镜像的来源是系统预置还是来源于某位教师);集群配置(支持按照一个主机两个从机的方式配置集群。
该集群配置好后可以在‘镜像管理’功能分配使用。
可以删除、修改一主二从的设置);虚机销毁(支持可以设置教师、学生使用的虚拟机一直存在或者每天设定时间自动销毁昨天的虚拟机);教师镜像保存数量(支持可以设置教师镜像最大保存数量)
否
25.
需支持用户管理,参数管理,帮助文档和消息通知等功能。
否
26.
▲
产品资料
产品资料
需提供所投软件产品的《需求规格说明书》、《系统安装部署手册》、《系统用户使用手册》等相关文档,文档现场备查。
是
大数据教学资源
27.
▲
大数据教学资源
平台内至少包含:
大数据概论、分布式文件系统、分布式计算框架、Python语言程序设计、分布式数据库、大数据可视化技术、数据采集、数据清洗与数据仓库HIVE、Excel数据分析技术与DV可视化等大数据课程。
每门课程理论课部分须提供对应课程内容的教学PPT、备课材料、课后作业及答案、考试试题及答案,每门课程实验课部分须提供对应实验内容的实验手册等。
否
28.
▲
大数据概论
理论课程:
1)大数据的概念
2)大数据的架构
3)数据中心的构建与管理
4)数据采集与预处理
5)大数据存储技术
6)大数据处理平台
7)大数据分析
8)大数据可视化
9)大数据安全
否
29.
▲
分布式文件系统
理论课程:
1)HadoopHDFS理论基础
2)HadoopHDFS数据构造与IO
3)HadoopHDFS应用
4)HadoopRPC原理
5)HDFSNameNode结构分析
6)分布式系统概述、Hadoop基础
7)文件系统原理
实验课程:
1)HDFS上传与下载文件
2)HDFS创建文件或目录
3)HDFS删除文件或目录
4)HDFS查看文件及文件状态
5)HDFS重命名文件
6)获取HDFS下的所有文件及文件所在位置
7)获取HDFS集群所有节点名称信息
8)FileSystemAPI操作HDFS
9)IO序列化类型
10)HDFS字符处理
11)Avro文件的IO
12)HDFSAPI操作
13)HDFS命令操作
14)压缩与解压缩
15)Hadoop集群环境搭建
否
30.
▲
分布式计算框架
理论课程:
1)Hadoop-YARN原理
2)Mapper的输入与输出
3)MapReduce常用设计模式(上)
4)MapReduce常用设计模式(下)
5)MapReduce工作原理
6)MapReduce中的shuffle
7)MapReduce中的连接分析
8)QQ好友推荐案例分析
9)Reducer输入输出
10)Shuffle原理详解
11)社交网络评分案例分析
12)微博精准广告营销案例分析
13)物品推荐案例分析
实验课程:
1)MapReduce中的混排
2)QQ好友推荐案例设计与实现
3)NlineInputFormat输入格式化
4)微博精准营销案例设计与实现
5)社交网络综合评分案例设计与实现
6)数据库的输入格式化
7)多路径输出
8)WordCount编程
9)单表关联
10)倒排序
11)多表关联
12)平均成绩
13)去重编程
14)数据排序
15)数据清洗
16)数据二次排序
17)计数器
18)求全年最高气温
19)input输入方式
20)连接
21)全排序
22)物品推荐案例设计与实现
否
31.
▲
Python语言程序设计
理论课程:
1)Python简介及示例
2)数据类型及其运算
3)条件与循环
4)函数与模块
5)函数高级应用
6)类与对象
7)继承与多态
8)类与对象高级应用
9)列表与元组
10)集合与字典
11)字符串与格式化方法
12)正则表达式
实验课程:
1)Python环境安装
2)Python语法编程1
3)Python语法编程2
4)Python函数编程
5)Python文件操作
6)Python设计模式
7)PythonDjango框架
8)getter、setter、deleter
9)从字符串中去掉不需要的字符
10)优先级队列
11)公共键字典列表排序
12)分解传入数据
13)去重
14)实现一个链表
15)对调KV计算最小值及最大值
16)打印宽高均为9的空心菱形
17)根据字段将记录分组
18)模拟map函数
19)读取以指定分隔符进行分隔的csv文件中的数据
20)调用父类及父类的父类的构造器
否
32.
▲
分布式数据库
理论课程:
1)HBase与非关系型数据库
2)HBase基础知识
3)HBase环境配置
4)Hbase-Shell基本操作
5)Hbase-API应用开发
6)HBase架构与设计
7)HBase与其它工具互操作
实验课程:
1)HBase环境搭建
2)HBase客户端API
3)HBase过滤器
4)Nutch+HBase爬虫
5)HBase提取关键字
6)HBase关键字查询
7)OracleNoSQL数据库介绍
8)Oracle创建表
9)Oracle创建表数据
10)Oracle获取表数据
11)Oracle使用键值API
12)Oracle配置一致性持久性
13)Oracle创建事务及安全存储
14)Oracle处理大对象
否
33.
▲
大数据可视化技术
理论课程:
1)大数据可视化概述
2)视觉感知与认知
3)数据
4)数据可视化基础
5)层次和网络数据可视化
6)文本和文档可视化
7)可视化中的交互
8)可视化评测
9)面向领域的数据可视化
实验课程:
1)图表类型
2)基础组件
3)高级组件
4)原生图形元素组件
5)动画
6)触发图表行为
7)事件及监听
8)地图
9)高校学生消费能力分析
10)微博数据分析
11)双十一狂欢节
12)城市综合资源分布
否
34.
▲
数据采集
理论课程
1)数据采集概论
2)网络爬虫原理
3)网络爬虫实战
4)信息提取原理
5)互联网信息提取实践
6)自然语言处理与信息提取
7)文档信息提取实践
8)物联网信息提取
9)众包与群智感知
10)模式识别原理
11)文字识别实践
实验课程:
1)认识爬虫
2)复杂HTML解析
3)使用API
4)存储数据
5)自然语言处理
6)忽略表单与登陆采集
7)图像识别
8)Scrapy介绍
9)单机Scrapy
10)分布式爬虫(上)
11)分布式爬虫(下)
否
35.
▲
数据清洗
理论课程:
1)数据质量与清洗数据
2)数据格式转换
3)数据分组、分割、合并和变形
4)不一致错误清洗
5)缺失值填充
6)实体识别
7)真值发现
8)异常值发现
9)时间序列清洗
10)基于众包的数据清洗
11)数据清洗过程的并行化
12)数据清洗实践
实验课程:
1)为什么需要清洗数据
2)格式、类型与编码
3)数据转换
4)清洗来自网络的数据
5)RDBMS清洗技术
6)MapReduce清洗技术
7)StackOverflow清洗示例
8)Twitter清洗示例
9)ETL工具使用(Kettle)
10)Python爬虫+数据清洗示例
11)数据转换工具Sqoop
12)数据转换工具Datax
否
36.
▲
数据仓库Hive
理论课程:
1)数据库系统概述
2)Hive概述
3)数据类型、文件格式和关键字
4)Hive环境安装
5)Hive命令接口
6)HiveDDL(数据定义语言)
7)HiveDML(数据操作语言)
8)HiveQL基本查询
9)Hive运算符
10)Hive函数
11)Hive用户自定义函数
12)HiveQL高级查询
13)视图和索引
14)模式设计(包含分区与分桶的知识点)
15)Hive调优
实验课程:
1)Hive安装配置
2)Hive导入数据
3)Hive数据操作
4)Hive表查询
否
37.
▲
Excel数据分析技术与DV可视化
理论课程:
1)VBA基础1
2)VBA基础2
3)大数据可视化概述
4)视觉感知与认知
5)数据
6)数据可视化基础
7)层次和网络数据可视化
8)文本和文档可视化
9)可视化中的交互
10)可视化评测
11)面向领域的数据可视化
12)OracleDV安装和使用
13)数据源
14)散点图
15)线形图
16)雷达图
17)条形图
18)饼图
19)其他图形
实验课程:
1)数据的输入和导入
2)使用数据有效性规范录入
3)排序
4)筛选
5)高级筛选
6)分级显示和分类汇总
7)数据透视表
8)函数公式基础1
9)函数公式基础2
10)Excel连接mysql数据库
11)Excel可视化
12)VBA操作Excel
13)OracleDV安装和使用
14)数据源
15)散点图
16)线形图
17)雷达图
18)条形图
19)饼图
20)其他图形
21)电商网站销售数据可视化
22)学生课程成绩数据可视化
23)钻石信息数据可视化
24)电影信息数据可视化
25)人员业绩信息数据可视化
26)金融信息数据可视化
27)电信行为数据可视化
否
2.大数据实验管理平台
序号
重要性
指标项
指标要求
证明材料要求
大数据实验镜像系统
38.
大数据实验镜像系统
大数据实验镜像系统应集成大数据实验系统套件,可用于部署实验室,实验室部署应采用私有云架构,不得以其它形式访问校园外网公有云上实验环境,所有软硬件及课程资源、项目必须安装部署在本地。
否
39.
大数据实验镜像系统应为每个学生分配独立使用的虚拟机及大数据镜像系统。
否
40.
▲
资源和软件
数据库类:
基于数据库市场最广泛使用的关系型商业数据库、大数据数据库
否
41.
操作系统类:
Linux操作系统
否
42.
大数据类:
镜像系统需包含Datax、ApacheFlume、ApacheHbase、ApacheHive、ApacheKafka等
否
43.
语言类:
需包括Java、Python、R、Scala等
否
44.
工具类:
ApacheAnt、ApacheMaven、ApacheNutch、ApacheTomcat等
否
45.
IDE类:
IDea、PyCharm等
否
46.
大数据实验镜像系统应集成大数据软件环境
分布式文件系统实验环境
否
47.
分布式计算框架实验环境
否
48.
分布式数据库实验环境
否
49.
数据仓库Hive实验环境
否
50.
Python语言实验环境
否
51.
数据采集实验环境
否
52.
数据清洗实验环境
否
53.
全部实验环境需支持快速销毁重建;
否
54.
全部实验环境支持图形界面化管理及操作;
否
55.
▲
大数据实验镜像系统需支持71个用户同时在线使用。
否
大数据私有云管理系统
56.
大数据私有云管理系统
大数据私有云管理系统需集成云技术虚拟化管理平台,采用云平台架构,具备大规模部署能力,支持数据中心高可用适应节点规模增长的阶段性特点。
否
57.
需支持将资源分组归属到多个环境。
每个环境具有自己独立的基础设施资源及服务,并由一个或多个用户、团队或组织管理。
需支持环境的添加、停用、删除,需支持环境成员的管理、成员角色的分配。
需支持用户自定义需要部署的基础设施服务组合。
基础设施服务包括(但不限于)容器编排、网络、健康检查、DNS、Metadata、调度、服务发现、存储。
需支持环境模板的添加、编辑、删除。
否
58.
需支持用户自定义应用和基础设施应用。
支持用户自定义自己的应用,支