高性能计算机集群平台实施与售后方案xWord下载.docx
《高性能计算机集群平台实施与售后方案xWord下载.docx》由会员分享,可在线阅读,更多相关《高性能计算机集群平台实施与售后方案xWord下载.docx(128页珍藏版)》请在冰豆网上搜索。
4)项目实施安装前准备 35
a)安装场所的准备阶段 35
b)设备安装及配置方案制定 36
5)产品安装 36
a) 现场的硬件安装服务 36
6)现场的硬件调试 37
7)配合其他厂商、应用软件厂商安装调试 37
8)软件部署规划与实施方案 37
a)实施计划 37
b)实施准备 37
c)硬件系统 38
d)软件系统:
39
e)维护 40
9)软件产品实施 41
a)存储系统 41
b)集群管理与作业调度软件 41
c)并行库软件 44
d)应用软件集成 44
e)系统备份 44
f)安装后验证 44
10)软件产品调试 45
a)HPL调试 45
b)IOZone调试 46
c)支撑环境调试 47
11)软件验收方案 47
a)项目基本情况 47
b)项目进度审核 48
c)项目验收计划 48
d)项目验收原则 48
e)项目验收内容 48
f)项目验收情况汇总 50
g)项目验收附件明细 50
h)开发单位项目实施总结 55
i)使用单位意见 56
5.测试方案 56
1)系统测试目标 56
2)HP集群测试计划 57
a)连通性测试 57
b)NIS功能测试 57
c)NTP时间服务测试 58
d)CPU稳定性测试 58
e)CPU浮点运算测试 58
3)网络性能测试 59
a)网络性能测试 59
b)8.4.2网络延迟测试 59
6.实施质量控制和管理措施 62
1)重点提示 62
2)项目管理工具 62
3)项目组织结构及岗位责任 66
4)总指挥部职能、责任简介 66
5)工程部职能、职责简介 66
6)合同执行部职能、职责简介 68
7)阶段成果的交付及确认 68
8)项目变更管理 69
9)沟通管理 70
a)项目中的沟通 70
b)会议 70
c)情况通报会议 70
d)解决问题会议 70
e)合理化建议阶段评审会议 71
f)报告 71
g)客户评价管理 73
10)质量保证程序 73
a)重点提示 73
b)质量管理规范与标准 74
c)项目质量保证策划 74
d)质量度量 74
e)质量考核 75
f)过程监控与阶段评审 75
g)系统测试与验收 75
h)配置管理 76
i)文档管理 77
j)独立的项目审计 77
11)货物安装、验收标准 77
a)到货验收 77
b)初步验收:
78
c)最终验收 78
7.技术支持及培训方案 83
1)北京科技股份有限公司培训方案 83
2)紫光华山硬件培训方案 84
a)现场培训 84
b)集中培训 85
c)HPCMU及Proliant系列服务器培训课程 85
3)培训方案 85
a)培训目的 85
b)现场培训 86
c)培训内容 86
4)培训质量保证 88
a)培训策略 88
b)培训过程管理 89
8.售后服务方案 91
8.1本项目售后服务承诺 91
8.2公司售后服务内容 91
8.3售后服务体系 101
a)服务体系说明 102
b)分支机构和服务组织结构 103
c)标准服务流程 104
d)巡检及健康检查流程 104
e)故障处理流程 107
f)技术支持流程 110
g)现场服务流程 116
h)重大故障处理流程 117
i)备品备件流程 120
j)故障事件总结,统计分析报告流程 123
k)设备,软件,微码以及相关补丁,升级流程 125
一、高性能计算平台技术服务方案与项目实施方案
1.投标人对任务的理解
硬件技术方案规划:
a)高性能计算系统
采用5台HP DL380G9两路服务器,每台配置2颗Intel E5-2690v4处理器,主频
2.6GHz,14个CPU物理核心,28个线程,内存配置128GB1866MHzRDIMMs内存,配置2块300GB万转SAS硬盘。
b)集中网络存储系统
我们采用HPHPE3Par高性能计算专用存储阵列,以确保高性能计算集群的数据能快速地读写,也确保整个平台数据的安全性。
存储包含14块4T近线SAS硬盘.
系统一共70个计算核心,存储裸容量为56TB,系统整体功耗约为8KW。
方案拓扑图如下:
方案描述:
GPU计算节点:
我们选用HPDL380G9服务器作为高性能计算系统的GPU计算节点。
每个计算节点配置2颗IntelXeonE5-2690v4处理器2.6GHz,每节点14个CPU内核。
配置GPU加速卡
5台计算节点组成的高性能计算系统就可以满足用户的相应技术要求。
基于英特尔E5-2600v4系列至强处理器,可以实现性能、功能和经济高效性的超凡组合。
a)管理和I/O节点:
选择HPHPE3Par两节点高密服务器作为管理节点并配置每个计算节点配置2颗IntelXeonE5-2690v4处理器2.6GHz,每节点14个CPU内核。
HPHPE3Par服务器作为系统的登录与管理节点,用于作业递交和系统管理。
计算网络和磁盘I/O通过InfiniBand56GB网络互联保证工作效率。
b)成熟的计算网络:
每台计算节点、登录节点之间采用主流的infiniband连接,保证系统的通信性能和节点的计算性能相匹配。
c)管理网络:
为所有节点之间的管理和访问信息,提供千兆以太网链路,承载运行集群的管理、调度的网络通讯信号。
d)存储系统:
计算节点、NFS存储节点、登录节点之间的系统磁盘I/O数据通过高速的IB链路传输。
e)HPHPE3Par双I/O节点提供NFS网络共享,冷热数据分离存放,大大提高了文
件的读写性能,同时保证系统的可用性。
f)操作系统:
64位LINUX企业级操作系统,提供相应的服务。
软件技术方案
本系统集群管理软件采用联科CHESS高性能计算管理系统完成集群管理功能,CHESS联科高性能计算管理平台是联科自主研发的高性能集群软件,采用B/S架构,通过浏览器进行操作实现集群资源统一部署、管理、监控、报警、调度和报表,可将松散的堆叠服务器变成一整套HPC集群系统,可大幅提高集群效率,简化集群管理。
CHESS可以帮助用户部署操作系统,安装和调试集群软件,应用环境和应用软件,搭建一套完整的HPC软件系统。
a)NFS文件系统
NFS文件系统是可以在群集中的多个节点间实现对共享文件系统中文件的快速存取操作,并提供稳定的故障恢复和容错机制。
b)系统方案特点
序号
本方案特点
其他方案容易出现的缺点
1
放心的交钥匙工程,完整的
HPC系统解决方案
整体方案完全基于成熟的服务器硬件产品和
HPC系统软件产品,统一品牌,平衡设计。
全球排名靠前的大型机构均采用HPE高性能计算系统;
在中国HPE公司已经为包括国家气象
局在内的数百家机构提供了规模不等的高性能
计算系统。
系统硬件和软件、技术服务来源于多个厂家/供应商/开发者,很多软件产品是基于开源软件二次开发;
软件配合程度欠佳。
2
资源管理软件的先进性
CHESS其具有灵活的调度策略,比如抢占、回填、预约等高级调度策略。
开源软件
3
成熟、稳定的硬件产品平台
HP服务器为数据中心提供10年的公认可靠性,拥有十几年经验的高弹性的创新架构。
全世界的数据中心。
许多中小硬件厂商,采用OEM或ODM的产品,产品换代之间没有技术连续性,出货量小,可靠性和稳定性差。
4
有力的技术支持、培训及售后服务
完整售后服务体系支持,提供完善的售后服务;
现场高性能计算环境培训和客户化,包括
Fortran/C/C++编译器使用,并行环境使用,数学库使用,作业调度程序的客户化设置和使用,常用技巧等。
无法保证系统顺利实施,无法保证客户得到有力的技术支持服务。
2.本项目实施团队主要人员简历表
一般情况
姓名
杨明
年龄
35
电话
13810051792
职称
高级工程师
职务
客户经理
本项目中
任职
项目经理
学习经历
2004年7月毕业于北京信息工程学院学校
电子信息工程专业,学制4年
技术认证
PMP认证
工作经历
时间
参加过的相关项目
项目中任职
备注
2015.2-
2015.8
新华社容灾备份系统第三阶段核心采编供稿同城
灾备项目IT设备采购与集成子项
2015.9-
2016.2
新兴际华云数据中心建设项目
2014.8-
2015.1
新华社承建中央纪委监察部网站客户端项目
姓名
李金泷
年龄
32
专业
信息管理与信息系统
职称
公司单位职务
部门经理
拟在本项目担任职务
实施工程师
毕业学校
2007年7月毕业于北京机械工业学院学校
信息管理与信息系统专业,学制4年
经历
年~年
参加过的项目名称
担任何职
用户代表及联系电话
2016年
东风电气容灾项目
王勇02887898946
2014-2015年
永安保险异地容灾项目
李乾029-86476373
2012-2013年
中海油CDP项目
郭浩010-84528099
获奖情况
优秀员工
目前任职项目状况
项目名称
担任职位
可以调离日期
随时
可随时参与本项目
王博
31
电子信息工程
高级工程
师
售后工程师
拟在本项目担任职
务
工程师
2008年7月毕业于西安电子科技大学学校应用数学专业,学制4年
年~年
用户代表及联系电话
2014/10至今
中石油物联网备份项目
姚刚13466793637