运维服务交付规范.docx
《运维服务交付规范.docx》由会员分享,可在线阅读,更多相关《运维服务交付规范.docx(41页珍藏版)》请在冰豆网上搜索。
运维服务交付规范
运维服务交付规范
XXXXX有限公司
2019年1月
文档变更
版本
描述
修订人
修订日期
审核人
审核日期
创建
运维服务交付规范
1需求分析
85%的IT事故源于交付行为不规范;
97%的投诉源于对交付过程的不满意;
83%的服务纠纷源于供需双方对交付标准的意见不一;
目前国际国内没有权威的运维交付的参考标准。
2目的和意义
规范交付行为,避免事故发生,确保客户业务正常运转;
管理交付过程,提高服务效率,确保客户SLA达成;
统一交付标准,减少双方分歧,确保互信互惠共同成长;
作为需方判断供方交付规范性的参考依据;
作为供方提升运维交付水平的行动指南。
3编制原则
提出信息技术运维服务需方和运维服务供方实用统一的交付规范性指导;
成为需方选择供方的依据和供方改进运维服务交付指教的行动指南;
促进运维服务单位向需方提供有效、高效和合理的运维服务;
覆盖供需双方从服务级别协议签署到结束过程中交付行为规范。
4编制思路
确定运维服务交付规范的框架:
包括交付管理、交付内容、交付方式和交付成果四个部分;
确定运维服务交付规范框架的组件:
对运维服务交付框架的四个部分定义不同的组件。
明确每个组件应具备的关键要素:
在确定月内服务交付规范框架的组件后,通过明确每个组件应具备的关键要素来具体指导运维服务交付的规范性。
5术语定义
运行维护服务交付:
供方在服务级别协议有效期内向需方提供服务级别协议中的承诺的运行维护服务。
运行维护服务供方:
提供运行维护服务的内、外部组织和机构。
运行维护服务需方:
需要运行维护服务的组织或机构。
例行操作:
供方日常提供的预定服务。
注:
如巡检、监控、备份和测试等。
响应支持:
供方对服务请求或故障申报提供的即时服务。
注:
如突发事件处理等。
优化改善:
供方对运行维护服务对象提供功能和性能的调优服务。
注:
如数据库优化、网络优化等。
调研评估:
供方通过对运行维护服务对象的调查研究或分析评价,给出报告或建议。
注:
如系统调研、IT连续性评估等。
应急事件:
导致或即将导致运行维护服务对象运行中断、运行质量降低,以及需要实施重点时段保障的事件。
SLA服务级别协议:
运行维护服务供方与需方之间签署的描述符合和约定服务级别的协议。
6标准框架
每个模块的定义说明如下:
交付管理:
供需双方通过对服务交付成果的策划、实施、检查和改进以保障服务级别协议的达成。
交付内容:
供方根据服务级别协议要求,向需方提供的例行操作服务、响应支持服务、优化改善服务和调研评估服务。
交付方式:
供方根据服务级别协议要求,采用现场交付和远程交付方式向需方提供服务,
交付成果:
供方根据服务级别协议要求,向需方提供的无形和有形的交付成果。
6.1交付管理
一、交付策划
根据需方需求和供方自身能力,双方协商服务级别协议;供方做好必要的交付准备,制定交付计划,确保服务正常提供。
交付策划过程中供方应:
依据服务目录与需方确认服务级别协议(服务目录框架见附录A,服务级别协议见附录B);
确保服务级别协议内容完成准确;
编制交付实施计划、交付检查计划和交付改进计划;
编制预算;
配备符合能力要求的管理人员和专业人员;
明确职责分工、服务流程和关键技术要求,必要时提供服务手册和技术手册;
准备必要的资源,如备件、工具、服务台和知识库;
明确考核要求、计算方法和奖惩措施;
明确服务交付过程中的安全要求,并采取保障措施,如签署保密协议等。
明确服务交付过程中可能存在的风险,制定风险规避计划;
与需方就必要信息达成共识,如时间计划、人员配备、投诉受理渠道及流程等,明确供需双方产生异议的处理原则;
明确供需双方在交付过程中产生遗留问题的处理原则;
针对应急事件制定预案。
交付策划过程中需方应:
提供服务需求,并与供方达成服务级别协议等。
二、交付实施
供方按照交付策划向需方提供运维服务,完成服务级别协议所规定内容。
交付实施过程中供方应:
按照交付策划的要求实施;
对关键服务信息有记录,如内容、过程、状态、人员和时间等。
保证关键信息及时传递和供需双方相关人员,如项目经理、上级主管、技术主管等。
记录和统计衡量服务级别协议所需信息,如响应时间、现场支持时间等;
按照管理要求和服务承诺提交服务报告;
在组织内建立并使用知识库,及时归档文件,分享经验;
确保人员、操作、数据以及工具等符合交付策划中对安全的要求;
根据风险规避计划及时处理实时过程中发生的风险。
交付实施过程汇总需方应:
完成交付所需的协助工作,如提供资源配置、故障信息、审批相关申请等。
三、交付检查
供需双方通过交付策划与交付实施的对比检查,确认完成情况,并对发现的问题提出改进建议。
交付检查过程中供方应:
依据交付策划对交付实施情况进行检查;
向需方调查满意度;
对服务交付的情况做审计评估,如策划的执行情况、服务交付的规范程度、文档的归档情况、交付过程信息的记录情况等;
检查交付过程中遗留的处理情况;
检查评估交付各过程中的安全情况和风险规避情况。
交付检查过程中需方应:
组织或参与交付检查工作,提供反馈。
四、交付改进
供方通过向交付各过程的总结分析,提出建议并改进,以提高效率,提升需方满意度。
交付改进过程中供方应:
总计分析不符合服务级别协议的服务交付,提供并实施改善建议,跟踪反馈;
调查分析需方投诉或满意度低分项,与需方确认不满意的具体内容,提出并实施改善意见,跟踪反馈;
对需要规避的安全问题和风险提出并实施改进措施,跟踪反馈;
按照交付改进计划持续改进。
交付改进过程中需方应:
参与交付改进工作,确认改进措施,反馈成效。
注:
交付改进过程中双方应在必要时协商修订服务级别协议。
6.2交付内容
一、例行操作:
包括例行交付规划、例行操作检查、例行安全检查。
例行操作过程中供方应:
根据例行维护服务对象的特点,制定交付的目标、内容、范围、周期和人员安排;
编制指导手册,并指定专人负责更新和完善。
指导手册中应包括:
1.任务清单;
2.各项任务的操作步骤及说明;
3.运行状态是否正常的判定标准;
4.运行状态信息的记录要求;
5.异常状况处置流程,包括角色定义、处置方法、流转过程和结束要求;
6.报告模板。
确保人员、操作、数据以及工具等符合安全的要求;
在必要时创建与响应支持、优化改善和调研评估服务的接口,启动和完善相应服务交付过程。
例行操作过程中需方应:
完成例行操作所需的协助工作,如提供访问权限、工作环境等。
二、响应支持:
包括响应渠道、承诺,响应级别和报警,响应沟通和关闭。
响应支持过程中供方应:
公示受理的渠道,如电话、传真、邮件或网络方式等;
提供服务承诺,如工作时间、响应时间等;
与需方就响应级别、报警升级条件等内容达成共识;
记录响应支持的关键交付过程;
针对有效申报进行分类,分配优先级,分发给相应人员,分配优先级时按照附录C确定申报优先级可成为响应支持的一部分,附录C所列的申报优先级表并不包含所有的优先级,供方也可能需要按照另外的优先级分配方式完成工作;
在分配过程汇总设置预警、报警机制以及升级流程,进行相关设置时按照附录C确定相关机制可成为响应支持的一部分,附录C所列的预警、报警盒升级机制并不包含所有的预警、报警和升级机制,供方也可能需要按照另外的机制完成工作。
在处理过程中的各个关键环节,将进展信息及时通知供需双方相关人员;
在需方同意的情况下结束支持;
确保人员、操作、数据以及工具等符合安全的要求;
在必要时创建与例行操作、优化改善和调研评估服务的接口,启动和完善相应服务交付过程。
响应支持过程中需方应:
完成响应支持所需的协助工作,如提供资源配置、故障信息、确认支持效果。
三、优化改善:
包括优化方案、方案评审、优化观察和回顾。
优化改善过程中供方应:
编写优化改善方案,方案中宜包含目标、内容、步骤、人员、预算、进度、考核指标、风险预案和回退方案;
对方案进行必要的评审,包括内外部评审;
按优化改善方案实施并有观察期的安排;
对遗留问题制定改进措施并跟进;
在优化改善完成后进行必要的回顾总结;
确保人员、操作、数据以及工具等符合安全的要求;
在必要时创建与例行操作、响应支持、调研评估服务的接口,启动完善相应服务交付过程。
优化改善过程中需方应:
完成优化改善所需的协助工作,如提出建议、确认方案等。
四、调研评估:
包括调研计划、调研评审、落地实践。
调研评估过程中供方应:
在调研评估过程开展前提供计划,包括目标、内容、步骤、人员、预算、进度、交付成果和沟通计划等。
编写调研评估报告,如现状评估、访谈调研、需求分析、后续建议等。
制定报告的评审制度,包括组织内容评审和需方评审,并进行记录;
持续跟踪调研评估的落地执行情况;
确保人员、操作、数据以及工具等符合安全的要求;
在必要的时候创建与例行操作、响应支持和优化改善服务的窗口,启动和完善相应服务交付过程。
调研评估过程中需方应:
完成调研评估所需的协助工作,如提出需求、组织评审等。
6.3交付方式
一、现场交付:
现场交付过程中供方应:
在到达需方现场前:
1.了解现场交付的内容、到达时间要求、之前的支持情况以及遗留问题,并与需方确认;
2.对复杂或存在风险的工作做好预案,经审核后实施;
3.准备必要的资料和工具;
4.根据安全要求,做好准备工作。
在到达需方现场后:
1.及时通知需方并确认到达现场的时间;
2.与需方确认服务的内容、操作流程和可能的风险后实施;
3.严格遵守需方现场的管理制度;
4.根据安全要求提供现场交付服务,并做好相关服务记录;
5.完成确认的工作内容;
6.遇到无法解决的问题或需方提出额外要求时,通知上级,得到授权后再做处理。
二、远程交付:
远程交付过程中供方应:
在提供远程交付前:
1.了解需要远程交付的内容、支持时间要求、之前的支持情况以及遗留问题,并与需方确认;
2.对复杂或存在风险的工作做好预案,经供需双方审核后实施;
3.确保远程交付所需的工作条件满足安全、稳定和可用的要求。
在远程交付过程中:
1.按照约定时间提供远程交付;
2.与需方确认服务内容、操作流程和可能的风险后实施;
3.严格遵守需方的管理制度;
4.根据安全要求提供远程交付服务,并做好相关服务记录;
5.完成确认的工作内容;
6.遇到无法解决的问题或需方提出额外要求时,通知上级,得到授权后再做处理。
在结束远程交付前:
1.就遗留问题的处理建议和需方达成共识;
2.做必要的安全检查,如清除本次服务临时账号等;
3.获得需方结束许可。
在结束远程交付后:
1.调查客户满意度;
2.更新服务记录;
3.就遗留问题虚招解决方案,跟踪解决。
6.4交付成果
一、交付成果管理:
交付成果管理过程中供方应:
制定成果的编制、审核、发布、归档等管理流程;
明确受众、内容、时间或频度要求;
明确安全管理要求;
1.无形成果:
对安全风险的控制;
2.有型成果:
对生命周期的安全控制,如加密存储、授权访问、脱密共享、数据粉碎等。
确保无形成果产生的效用满足服务级别协议要求;
确保有形成果的规格或格式满足服务级别协议要求;
明确无形和有形成果之间的关系,如性能提升通过服务报告体现。
二、例行操作成果:
供方在提供例行操作服务交付的过程中,通过向需方提供无形的或有形的交付成果,以满足服务级别协议要求。
无形成果包括但不限于:
运行维护服务对象当前运行状态(正常/异常/存在潜在风险等);
运行状态从异常到正常的状态恢复;
对潜在风险的消除;
需方满意度的提升。
有形成果包括但不限于:
运行状态信息记录;
运行状态异常处理记录;
趋势分析及可能的风险消除建议;
运行维护服务对象配置信息记录;
需方满意度调查和分析报告。
三、响应支持成果:
供方在提供响应支持服务交付的过程中,通过向需方提供无形的或有形的交付成果,以满足服务级别协议要求。
无形成果包括但不限于:
运行状态从异常到正常的状态恢复;
运行维护知识的传递;
需方满意度的提升。
有形成果包括但不限于:
响应支持记录;
响应支持关键指标数据记录(服务级别协议达成情况、数量、分布、趋势);
重大事件(故障)的分析改进报告;
运行维护服务对象配置信息更新记录;
需方满意度调查和分析报告。
四、优化改善成果:
供方在提供优化改善服务交付的过程中,通过向需方提供无形的或有形的交付成果,以满足服务级别协议要求。
无形成果包括但不限于:
运行维护服务对象运行性能的提升;
运行维护服务对象实现功能的完善;
需方满意度的提升。
有形成果包括但不限于:
优化改善方案及相关评审记录;
优化改善实施方案及相关评审记录;
优化改善实施的变更和发布报告;
运行维护服务对象配置信息更新记录;
需方满意度调查和分析报告。
五、调研评估成果:
供方在提供调研评估服务交付的过程中,通过向需方提供无形的或有形的交付成果,以满足服务级别协议要求。
无形成果包括但不限于:
需方满意度的提升。
有形成果包括但不限于:
调研评估计划书;
调研评估分析报告;
调研评估的规划方案或建议及评审记录;
需方满意度调查和分析报告。
附录
附录A服务目录
04-运行维护服务
0401-基础环境运维服务
服务编号
服务项目
服务对象
服务内容
响应时间
服务频度
交付方式
交付成果
040101
机房空调巡检服务
机房空调室内机、室外机
对机房空调各项显示数据进行统计、分析,对机房空调室内机出风口、过滤网进行检查,对空调室外机冷凝器、散热风扇进行检查
双方协定
4次/年
现场
《机房空调检测记录单》、
《机房空调检测报告》
040102
机房空调故障处理服务
机房空调室内机、室外机
对机房空调室内机、室外机的故障诊断与处理服务
7*24*20min
每天
现场/远程
《机房空调故障单》、
《机房空调重大故障报告》
040103
机房UPS巡检服务
UPS包括机头、电池组和线路
对机房UPS系统的各项数据的统计分析、对机头、电池组和线路的运行健康统计与分析
双方协定
4次/年
现场
《机房UPS检测记录单》、
《机房基UPS检测报告》
040104
机房UPS故障处理服务
UPS包括机头、电池组和线路
提供机房UPS包括机头、电池组合线路的故障诊断与处理服务
7*24*20min
每天
现场/远程
《机房UPS故障单》、《机房UPS重大故障报告》
040105
机房UPS电池组备件服务
UPS包括机头、电池组和线路
提供机房UPS电池组电池备件库存服务
7*24*30min
每天
现场
《机房UPS电池备件服务报告》、
《机房UPS电池备件进出库清单》、
《机房UPS电池变更记录》
040106
机柜巡检服务
服务器机柜、网络机柜
针对机房机柜的巡检服务包括(机柜剩余容量、机柜风扇巡行状况、PDU健康状况)
双方协定
4次/季
现场
《机房机柜检测记录单》、
《机房机柜检测报告》
040107
机房安全系统巡检服务
门禁系统、消防系统、告警情况、机房监控系统
对机房的门禁系统、消防系统、告警情况、机房监控系统等进行状态检查与监控
双方协定
4次/年
现场
《机房安全系统巡检报告》
0402-硬件运维服务
040201-网络运维服务
服务编号
服务项目
服务对象
服务内容
响应时间
服务频度
交付方式
交付成果
04020101
边界网络安全设备巡检服务
边界网络安全设备硬件(防火墙、入侵防御、上网行为管理等)、软件和安全策略等基本状态
对防火墙、入侵防御、上网行为管理等边界防护设备软件进行运行健康统计和分析,对防火墙、入侵防御、上网行为管理等边界防护设备的安全策略进行检查和运行健康统计和分析
双方协定
4次/每年
现场
《边界网络安全设备巡检报告》
04020102
边界网络安全设备故障处理服务
边界网络安全设备硬件(防火墙、入侵防御、上网行为管理等)、软件和安全策略等基本状态
对防火墙、入侵防御、上网行为管理等边界防护设备软件故障诊断和处理服务、对防火墙、入侵防御、上网行为管理等边界防护设备的安全策略故障诊断和处理服务
7*24*20min
每天
现场/远程
《边界网络安全设备故障处理报告》
04020103
边界网络安全设备备件服务
边界网络安全设备硬件(防火墙、入侵防御、上网行为管理等)、软件和安全策略等基本状态
提供边界网络安全设备备件服务(防火墙、入侵防御、上网行为管理等)
7*24*30min
每天
现场
《边界网络安全设备备件服务报告》、
《边界网络安全设备备件进出库清单》、
《边界网络安全设备变更记录》
04020104
网络核心设备巡检服务
网络核心设备(路由器、核心交换机)
对网络运维服务中的网络核心设备(网络路由器、核心交换机)设备运行的基本状态进行健康性检查和保养等预防性维护服务、以及路由器、交换机配置检查等服务
双方协定
12次/年
现场
《网络设备巡检记录单》、
《网络设备巡检报告》
04020105
网络核心设备故障处理服务
网络核心设备(路由器、核心交换机)
提供网络运维服务中(网络路由器、核心交换机)设备的故障诊断与处理服务,分析故障原因,提出改进建议和防范措施
7*24*20min
实时/每天
现场
《网络故障处理单》、
《网络故障分析报告》
04020106
网络核心设备优化升级服务
网络核心设备(路由器、核心交换机)
通过对网络运维服务中(网络路由器、核心交换机)设备的运行数据进行性能统计分析、性能评估,优化设备配置,同时针对厂家更新的版本升级依据实际情况制定升级方案并实施。
7*24*20min
每天
现场/远程
《网络系统优化调整方案》、
《网络系统性能优化调整总结报告》、《网络系统性能评估报告》
04020107
网络核心设备备件服务
网络核心设备(路由器、核心交换机)
提供网络核心设备的备件库存和备件更换服务
双方协定
2次/年
现场
《网络设备备件服务报告》、
《网络备件进出库清单》、
《网络设备变更记录》
04020108
网络汇聚设备巡检服务
网络汇聚交换机
对网络运维服务中的网络汇聚交换机设备运行的基本状态进行健康性检查和保养等预防性维护服务、以及交换机配置检查等服务
双方协定
12次/年
现场
《网络设备巡检记录单》、
《网络设备巡检报告》
04020109
网络汇聚设备故障处理服务
网络汇聚交换机
提供网络运维服务中交换机设备的故障诊断与处理服务,分析故障原因,提出改进建议和防范措施
7*24*20min
实时/每天
现场
《网络故障处理单》、
《网络故障分析报告》
04020110
网络汇聚设备优化升级服务
网络汇聚交换机
通过对网络运维服务中交换机设备的运行数据进行性能统计分析、性能评估,优化设备配置,同时针对厂家更新的版本升级依据实际情况制定升级方案并实施。
7*24*20min
每天
现场/远程
《网络系统优化调整方案》、
《网络系统性能优化调整总结报告》、《网络系统性能评估报告》
04020111
网络汇聚设备备件服务
网络汇聚交换机
提供网络汇聚设备的备件库存和备件更换服务
双方协定
2次/年
现场
《网络设备备件服务报告》、
《网络备件进出库清单》、
《网络设备变更记录》
04020112
网络接入设备巡检服务
网络接入交换机
定期对网络运维服务中的网络接入交换机设备运行的基本状态进行健康性检查和保养等预防性维护服务、以及交换机配置检查等服务
双方协定
12次/年
现场
《网络设备巡检记录单》、
《网络设备巡检报告》
04020113
网络接入设备故障处理服务
网络接入交换机
提供网络运维服务中交换机设备的故障诊断与处理服务,分析故障原因,提出改进建议和防范措施
7*24*20min
实时/每天
现场
《网络故障处理单》、
《网络故障分析报告》
04020114
网络接入设备优化升级服务
网络接入交换机
通过对网络运维服务中交换机设备的运行数据进行性能统计分析、性能评估,优化设备配置,同时针对厂家更新的版本升级依据实际情况制定升级方案并实施。
7*24*20min
每天
现场/远程
《网络系统优化调整方案》、
《网络系统性能优化调整总结报告》、《网络系统性能评估报告》
04020115
网络接入设备备件服务
网络接入交换机
提供网络接入设备的备件库存和备件更换服务
双方协定
2次/年
现场
《网络设备备件服务报告》、
《网络备件进出库清单》、
《网络设备变更记录》
040202-主机运维服务
服务编号
服务项目
服务对象
服务内容
响应时间
服务频度
交付方式
交付成果
04020201
服务器巡检服务
PC服务器、机架式服务器
为使服务器运行正常,定期对PC服务器、机架式服务器等主机设备进行设备健康性检查和保养等预防性维护服务
双方协定
12次/年
现场
《主机设备巡检记录单》、《主机设备巡检报告》
04020202
服务器故障处理服务
PC服务器、机架式服务器
提供PC服务器、机架式服务器等主机设备的故障诊断与处理服务,分析故障原因和提出解决方案,并根据客户需求和实际情况提供现场维修服务
7*24*20min
每天
现场/远程
《主机故障处理单》、《主机故障分析报告》
04020203
服务器性能优化升级服务
PC服务器、机架式服务器
通过对服务器的运行数据进行性能统计分析、性能评估,优化存储设备性能,同时针对厂家发布的补丁、版本依据实际情况制定升级方案,升级设备
双方协定
2次/年
现场
《主机设备优化调整方案》、
《主机设备性能优化调整总结报告》
04020204
服务器设备备件服务
PC服务器、机架式服务器
提供PC服务器、机架式服务器等主机设备硬件的备件库存和备件更换服务
7*24*30min
每天
现场
《主机设备备件服务报告》、
《主机备件进出库清单》、
《主机设备变更记录》
040203-存储运维服务
服务编号
服务项目
服务对象
服务内容
响应时间
服务频度
交付方式
交付成果
04020301
存储设备巡检服务
存储服务器、磁盘阵列、光交换机
定期对存储设备的运行的基本状态进行设备健康性检查和保养等预防性维护服务
双方协定
12次/年
现场
《存储设备巡检记录单》、《存储设备巡检报