存储维护服务方案.docx
《存储维护服务方案.docx》由会员分享,可在线阅读,更多相关《存储维护服务方案.docx(9页珍藏版)》请在冰豆网上搜索。
存储维护服务方案
存储维护服务方案
1.1项目背景
我矢运行重要业务的存储设备CX系列四台,一直以来都直接购买原厂商的硬件支持服务,但服务期的截止时间均不同,每年出现多次报告申请的情况,工作效率较低,重复工作较多,如2009年9月份我科通过HB方式申请一台CX500存储设备的保修,至今尚因其原厂商合同不能满足我矢的要求而无法签订,这期间一旦设备出现故障测维修的时效性无法得到保障,必将严重影响我尖的正常业务运作。
另外原厂商提供的服务所需费用相对较多,一台CX500第五至第六年两年矢键部件保修就需要87000元,而且随着时间越久,价格也越高。
并且原厂商在保修过程中仅提供相应的尖键备件,未能定期对存储设备进行安全检测和性能分析,这对于像黄埔海尖业务处理量较大的技术维护工作是远远不够的。
1.2维护服务目的
能够最大限度的节省和保护海矢用户在硬件设备和软件设备上的投资,高效快速的解决客户遇到的各种问题,为客户排忧解难。
保证客户系统的连续,稳定,高效运行。
1.3维护范围和期限
设备维保服务清单
序
厂商
型号
数量
原厂免费更换硬件保
修截至日期
用途
1
DELL
CX700(编号
7HZWK61)
1
2011-12-31
风险管理平台
2.0.3.0.三期等
2
DELL
CX500(编号4821291)
1
2011-12-31
运行网预订、统计
3
EMC
CX320(编号
CK200070200149)
1
2011-7-11
HB2004数据
4
DELL
CX340(编号820MZB1)
1
2012-1-25
原有虚拟机、物流
平台
1-4维护期限
维护期限均为2012年1月1日至2013年12月31Bo
1・5维护服务内容
提供原厂维保承诺函,即在维保期间,提供相当于原厂全天候
7*24*4小时的现场技术支持服务,该服务已经包含续保期内所有配件及服务费用,享有相当于原厂所规定的保内机器一切维修权益。
并提供以下技术增值服务如下:
提供7x24小时的呼叫响应服务:
在接到报障电话后立即响应,并即刻安排值班工程师回应,并与用户确定维护方式;同时对所有的问题按时逐级通知和汇报。
本服务的次数不限。
提供7x24小时的技术支持:
工程师根据对问题的判断,远程向用户提供诊断、性能测试的手段。
远程解决不了的问题将提供现场服务。
本服务的次数不限。
提供7x24X4小时的现场技术支持服务:
若黄埔海尖维保范围内存储系统
确定出现故障,原厂工程师在接到服务请求后立即响应,4小时内携带配件抵达现场,24小时内解决保修范围内的所有问题,一旦预计在规定时间内无法解决保修范围内的问题,承诺在48小时内提供相应的备用设备,保证用户基本的使用需求。
备件更换服务承诺:
合同期间,将对黄埔海矢已经确认出现故障的设备坏件,提供原厂免费备件更换服务,用户无需承担任何额外费用。
巡检服务:
每年进行四次预防性健康检查,包括硬件设备的检查、清尘、调整和坏件更换,运行环境、硬件配置的检查,以及对系统日志的检查与分析,根据系统的报错信息,发现系统潜在问题,尽早采取措施,排除故障隐患和安全漏洞。
并且提供性能测试和调优服务,提交性能测试报告及系统性能扩充和使用建议,以便保证系统性能不断改进并运行在最佳状态并提供相应的书面报告。
维护后提交完整的报告。
1•6系统规划与调整服务
〉客户在其设备系统发生较大变化时包括:
RAIDgroups;LUN;
storagegroups变更,为其提供技术支持服务;
〉存储连接的主机的数量以及平台发生变化时,提供技术支持服务;
〉在多链路冗余环境中的软件支持服务;〉提供与主机系统的集成与调试服务。
1■7预防性巡检维护服务
定期对系统进行检查,发现并排除硬件和软件系统错误隐患,保证设备正常稳定运行。
1.7.1巡检内容
〉检查设备运行状态,设备物理及环境状态,更换有故障的部件;
〉检查系统日志文件、系统错误记录、以及系统资源使用率等,分析系统存在的隐患;
〉根据系统检查及分析结果,提出解决方案和措施,并对对系统的参数进行调整;
>对设备进行清洁等例行工作;
>检查系统运行工作环境,并给予用户改进建议;
〉在保障系统正常运行的基础上,提出对系统资源分配的合理优化建议;
1.7.2巡检周期与方式
1•巡检周期:
定期巡检:
每年至少巡检维护卫次;
不定期巡检:
重大项目和时段、系统改造等重要操作日期前,增
加对系统现场巡检支持服务。
定期走访:
工程师定期走访,解答使用方技术疑难。
注:
具体项目的巡检周期可根据贵方的具体情况协商确定。
2•巡检方式
现场巡检:
一般采取现场巡检方式,也就是工程师定期到客户
现场对保修设备的硬件及系统软件进行预防性的检查维护。
远程巡检:
为增加巡检频度,由客户系统管理员按照我司制定的巡检脚本和巡检步骤进行现场巡检,而工程师根据客户的巡检结果进行分析,并做出巡检报告发给客户。
1.7.3巡检流程
知乙二谢込
1.7.4巡检流程说明1•巡检准备
〉工程师提前一个工作日与客户确认巡检时间以及相矢的服务要求。
〉工程师确认巡检设备的机型、序列号及服务内容,并根据"技术服务准备检查表〃的规定,逐项进行检查。
2.执行巡检
工程师按照"设备巡检表"要求的检查项目,对巡检设备逐一进行检查,同时填写"设备巡检表"或〃数据库巡检表"并由客户签字确认。
3.问题处理
〉针对巡检发现的故障或问题,工程师通过系统参数调整或更换问题部件,及时给予排除,同时填写"故障处理记录单”并由客户签字确认。
〉对于复杂疑难的故障或问题,工程师自己无法排除的,应及时将故障或问题提交技术专家组诊断并处理。
4.巡检确认
〉工程师检查所有保修设备配置与保修合同是否一致,对不同的进行修改,同时填写”保修设备配置清单”并由客户签字确认。
〉工程师需了解每台保修设备所运行的应用、系统软件,以及哪些是不允许业务中断的矢键设备、哪些设备是单机运行、
哪些设备存在单点故障,哪些系统软件需要升级、哪些HA不能正常切换等,并填写
”首次巡检报告单”。
〉对于巡检发现部件损坏的,工程师需经销售人员与客户确认后进行更换,原则上若该故障发生在保修合同生效前,更换部件所需的费用由客户承担。
1・8故障响应与修复承诺
1.8.1故障级别走义
服务级别:
故障级别
故障定义
故障描述
一级故障
指设备在运行中出现系统瘫痪或服务中断,导致设备的基本功能不能实现或全面退化的故障,造成业务中断1小时以上或导致矢键业务数据丢失的故障。
业务中断1小时以上;业务
数据丢失
二级故障
指设备在运行中出现的直接影响服务,导致系统性能或服务部分退化的故障;设备在运行中出现的故障具有潜在的系统瘫痪或服务中断的危险,并可能导致设备的基本功能不能实现或全面退化,如冗余设备单侧故障等;系统设备或操作系统故障,造成业务中断但不满1小时的,如系统复位等。
冗余设备单侧故障
三级故障
指设备在运行中出现的,影响系统功能和性能,但尖键业务不受影响的故障,如磁带机故障。
业务不受故障影响
四级故障
产品功能、安装或配置方面需要信息或支持,对业务运作无影响。
对业务运作无影响
1・&2服务响应与故障恢复时间
服务响应分类:
”牛HourResponse24x7〃指从周一到周日田可时间段内,工
程师在接到服务请求后4小时内携带原厂备件到达客户现场;
响应时间规定:
故障级别
电话响应时间
现场响应时间
故障解决时间
备件到场时间
■•级
7*24*15min
7*24*4h
24小时
4小时
二级
7*24*15min
7*24*8h
32小时
12小时
三级
7*24*30min
-
-
-
四级
7*24*30min
-
-
-
1.8.3流程说明1.故障报告
工程师接到故障报告后,记录故障及问题相矢的信息。
2、故障诊断
工程师根据故障及问题状况进行诊断,并相应采取电话指导、或现场服
务、或专家支持、或整机替换进行处理。
3・电话指导
对异地能够解决的软件故障,或能够使系统恢复正常运行的,工程师可
通过电话指导客户进行处理,同时填写”故障处理记录单"。
4、现场服务
对于电话指导不能解决的故障及问题,工程师应及时赶到客户现场进行故障
排除,同时填写“故障处理记录单”并由客户签字确认。
5.专家支持
〉对于复杂疑难故障及问题,工程师自己无法排除的,应及时将故障及问题提交技术专家组诊断并处理;
〉技术专家电话指导工程师或赶到客户现场进行故障排除,并填写”技术支持记录单"。
6、部件替换
对属于尖键性故障,且不能使系统恢复正常运行的,工程师应为客户提供备件”并做好故障部件的替换。
1.8.4未解决故障或问题的承诺
如果公司无能力维修的故障,或未能在承诺时间内恢复生产业务运行,经双方协商,使用方有权请第三方权威机构和设备原厂商专家进行解决处理,由此所产生的费用由公司承担。
供货渠道
服务产品相应的酉己件,均由EMC、DELL等原厂商提供。
1.9移机服务
移机服务是指在规定的时间内,安全、可靠地将客户保修设备从原放置地点迁移至新放置地点。
将提供专业的移机服务,并提交详细的移机方案,说明人员安排、移机步骤、双方责任、风险防患等,并进行实施。
移机服务的主要内容如下:
〉负责检查搬迁前设备的状况,并向客户提供设备状况报告;
〉负责设备的拆卸、安装、调试,并保证主机操作系统在迁移后恢复为迁移前的状态;
〉在拆卸、安装过程中,如因工程师操作不当而造成部件的损坏,由工程师免费进行备件更换;
〉设备拆卸后,客户负责从迁移地到目的地的设备搬动、运输,并确保运输的安全,如果在此期间发生设备的损坏,由客户负责,由此产生的费用由客户承当;
〉对于客户在设备搬动、运输过程中,我司工程师将提供技术指导,并在设备到达目的地时检查设备的状况,告知客户;
〉搬迁后不影响原来的任何保修条款,所有设备的保修服务仍然有效。
1.10备件系统保障
必须在广州市或深圳市存在备件库,具备此次保修服务承诺的相应存储矢键备件。
工程师完成首次巡检后,或客户保修设备配置发生变化后,应填写"保修设备配置清单”和”首次巡检报告单”,作为我司为该客户准备备机备件的依据。
工程师完成每次的例行巡检、或故障(问题)处理、或技术支持后,应相应填写"设备(数据库)巡检表”、"故障处理记录单”和"技术支持记录单”,并由客户签字确认。
工程师在年度巡检结束后一周内,应向客户提供"年度维护总结报告”,详
细陈述年度系统运行情况、服务统计、备件使用总结、相矢建议等。
1.11现场技术培训与交流
在系统维护期间,根据管理员的需求提供现场技术交流与培训,提高系统管理人员在存储系统维护操作方面的工作能力和技术素养及日常常见故障的处理方法和经验。
主要包括:
>进行系统登录
〉熟悉设备的启动和尖机
>了解服务产品特性和运行机制
〉掌握服务产品的日常使用、维护管理和配置方法
>掌握每个相矢设备控制面板显示灯的意义
〉执行系统故障期的应急魅理程序、进行一线诊断和应采取的适当措施;
〉对每次的故障进行总结交流,提高故障的处理能力;
〉对其它典型案例进行抛析,增加解决问题的经验。
在维保期间,我们为保修设备建立服务档案。
1.12文挡构成
必须建立起一套与技术服务流程相对应的技术服务表单,从而构
成一套科学、规范的服务文挡,主要文档包括如下:
〉保修设备配置清单
>首次巡检报告单
>设备(数据库)巡检表〉故障处理记录单
〉技术支持记录单
>维护和服务阶段工作总结报告
〉年度维护总结报告
1.12.1文播填写
工程师完成首次巡检后,或客户保修设备配置发生变化后,应填写"保修设备配置清单”和"首次巡检报告单”,作为客户准备备机备件的依据。
工程师完成每次的例行巡检、或故障(问题)处理、或技术支持后,应相应填写"设备(数据库)巡检表"、“故障处理记录单”和"技术支持记录单”,并由客户签字确认。
工程师在年度巡检结束后一周内,应向客户提供"年度维护总结报告”,详细陈述年度系统运行情况、服务统计、备件使用总结、相矢建议等。
112.2文播归集
技术管理部的技术助理负责服务文挡的归集管理。
工程师填写技术服务表单后,将及时传真或邮寄给技术助理,而技术助理按照
客户归类,对文挡定期进行归集。