网络运维服务运营级别协议示例.docx
《网络运维服务运营级别协议示例.docx》由会员分享,可在线阅读,更多相关《网络运维服务运营级别协议示例.docx(27页珍藏版)》请在冰豆网上搜索。
网络运维服务运营级别协议示例
运营级别协议
1概述
1.1服务声明
甲方:
乙方:
本文件是乙方为甲方提供技术服务的运营级别协议(以下简称OLA)。
乙方将根据本文件中约定的规范提供相关服务,甲方对乙方的相关工作给予支持。
1.2联系人
甲方联系人:
XXX
乙方联系人:
XXX
1.3变更说明
下列项目可能导致此OLA发生变更:
1.服务内容发生变化;
2.服务级别发生变化;
3.服务的环境、配置发生变化。
如果是由甲方发起的OLA内容变更,由甲方将变更内容提交给乙方,乙方评审后修改OLA,甲乙方共同评审后重新签订OLA。
如果是由乙方发起的OLA内容变更,乙方修改OLA,甲乙方共同评审后重新签订OLA。
2服务内容
2.1乙方服务的覆盖范围
2.2乙方提供的服务
2.2.1基础服务(套餐服务)
1)LAN服务
服务级别
服务目录
LAN_特级
LAN_一级
LAN_二级
核心业务系统等级
重要业务系统等级
普通业务系统等级
服务内容
级别
服务内容
级别
服务内容
级别
人员
一线管理员现场支持
7×24
P1
7×24
P1
7×24
P1
二线管理员现场支持
7×13
P1
7×13
P1
7×13
P1
管理员电话支持
7×24
P1
7×24
P1
7×24
P1
变更双人操作和复核
所有变更均需双人操作和复核(标准变更除外)
P1
重要和重大变更实施双人操作和双人复核;
P3
重要和重大变更实施双人操作和双人复核;
P3
管理员配置
AB角配置
P2
AB角配置
P2
AB角配置
P2
流程
普通变更时间窗口
20:
00-6:
00
P1
20:
00-6:
00
P1
20:
00-6:
00
P1
重要变更时间窗口
0:
00-6:
00
P1
22:
00-6:
00
可根据实际情况与业务协商制定
P2
22:
00-6:
00
可根据实际情况与业务协商制定
P2
重大变更时间窗口
2:
00-6:
00
P1
2:
00-6:
00
P1
2:
00-6:
00
P1
故障汇报和升级机制
接收到故障报障5分钟内向室、组负责人和运行中心负责人汇报
P1
接收到故障报障5分钟内向室、组负责人和运行中心负责人汇报
P1
接收到故障报障10分钟内向室、组负责人汇报;
故障30分钟内未解决,向运行中心负责人汇报
P3
上班时段管理员非现场值班故障响应到场时间
5分钟
P1
5分钟
P1
5分钟
P1
非上班时段管理员非现场值班故障响应到场时间
60分钟
P1
60分钟
P1
120分钟
P3
备份和恢复计划
无
N/A
无
N/A
无
N/A
健康检查机制
每天一次
P2
每天一次
P2
每天一次
P2
深度巡检
一季度一次
P1
一季度一次
P1
一季度一次
P1
可用性报告
每月一次
P1
每月一次
P1
每月一次
P1
应急演练
一年一次,本地、异地均需覆盖
P1
一年一次,本地、异地均需覆盖
P1
一年一次,本地、异地均需覆盖
P1
可用性及连续性评估
一年一次
P1
一年一次
P1
一年一次
P1
日常运维及应急管理培训
至少一年两次,包括技术、流程、人员、工具均需覆盖
P1
至少一年两次,包括技术、流程、人员、工具均需覆盖
P1
可选
P4
补丁策略
必须
P1
必须
P1
可选
P4
日志清理策略
无
N/A
无
N/A
无
N/A
性能管理规范
必须
P1
必须
P1
必须
P1
维护文档回顾和更新
必须+半年更新一次
P1
必须+半年更新一次
P1
必须+一年更新一次
P2
应急文档回顾和更新
必须+半年更新一次
P1
必须+半年更新一次
P1
必须+一年更新一次
P2
安全管理制度
建立管理制度,并每半年对管理制度进行检查和审定
P1
建立管理制度,并每半年对管理制度进行检查和审定
P1
建立管理制度,并每半年对管理制度进行检查和审定
P1
操作规程
无
P3
无
P3
无
P3
安全管理中心
建立安全管理中心,对设备状态、恶意代码、补丁升级、安全审计等安全相关事项集中管理
P1
建立安全管理中心,对设备状态、恶意代码、补丁升级、安全审计等安全相关事项集中管理
P1
建立安全管理中心,对设备状态、恶意代码、补丁升级、安全审计等安全相关事项集中管理
P1
系统安全运维文档
必须
P1
必须
P1
必须
P1
上线部署协调及培训
必须
P1
必须
P1
可选
P3
正式运行公告及培训
可选
P3
可选
P3
可选
P4
技术
RTO(本地)
0分钟
P1
30分钟
P2
60分钟
P3
RTO(异地)
5分钟
P1
30分钟
P2
60分钟
P3
容灾等级
(以GB/T20988-2007标准进行评价)
等级五
P1
等级五
P1
等级四
P3
自动监控与故障报警
必须
P1
必须
P1
必须
P1
可用性及连续性方案
本地:
双分区+分区内双机+无接入层交换机/无二层环路;
异地:
部署相同规格的网络设备
P1
双活+【LAN:
有接入层交换机/双上联/有二层环路】
P2
双活/热备+【LAN:
有接入层交换机/双上联/有二层环路】
P3
部件冗余
所有部件均为冗余设计
P1
所有部件均为冗余设计
P1
所有部件均为冗余设计
P1
在线维护
无
N/A
无
N/A
无
N/A
网络准入控制(禁止便携式和移动设备接入)
必须
P1
必须
P1
必须
P1
进行网络管理时必须保证两人同时在场并保留不可改变的日志
可选
P2
可选
P2
可选
P2
资源
维保服务等级
原厂+7*24
P1
原厂+7*24
P1
5*8
P4
备件库
原厂商或XX在系统所在大楼具有备件库
P1
原厂商或XX在系统所在大楼具有备件库
P1
可选
P4
驻场服务
必须
P1
必须
P1
必须
P1
故障时现场支持服务
2小时上门
P1
2小时上门
P1
2小时上门
P1
现场升级支持
必须
P1
必须
P1
必须
P1
总体可用性级别
P1
总体可用性级别
P2
总体可用性级别
P3
2)WAN服务
服务级别
服务目录
WAN_特级
WAN_一级
核心业务系统等级
重要业务系统等级
服务内容
级别
服务内容
级别
人员
一线管理员现场支持
7×24
P1
7×24
P1
二线管理员现场支持
7×13
P1
7×13
P1
管理员电话支持
7×24
P1
7×24
P1
变更双人操作和复核
所有变更均需双人操作和复核(标准变更除外)
P1
重要和重大变更实施双人操作和双人复核;
P3
管理员配置
AB角配置
P2
AB角配置
P2
流程
普通变更时间窗口
20:
00-6:
00
P1
20:
00-6:
00
P1
重要变更时间窗口
0:
00-6:
00
P1
22:
00-6:
00
可根据实际情况与业务协商制定
P2
重大变更时间窗口
2:
00-6:
00
P1
2:
00-6:
00
P1
故障汇报和升级机制
接收到故障报障5分钟内向室、组负责人和运行中心负责人汇报
P1
接收到故障报障10分钟内向室、组负责人汇报;
故障30分钟内未解决,向运行中心负责人汇报
P3
上班时段管理员非现场值班故障响应到场时间
5分钟
P1
5分钟
P1
非上班时段管理员非现场值班故障响应到场时间
60分钟
P1
120分钟
P3
备份和恢复计划
无
N/A
无
N/A
健康检查机制
每天一次
P2
每天一次
P2
深度巡检
一季度一次
P1
一季度一次
P1
可用性报告
每月一次
P1
每月一次
P1
应急演练
一年一次,本地、异地均需覆盖
P1
一年一次,本地、异地均需覆盖
P1
可用性及连续性评估
一年一次
P1
一年一次
P1
日常运维及应急管理培训
至少一年两次,包括技术、流程、人员、工具均需覆盖
P1
可选
P4
补丁策略
必须
P1
可选
P4
日志清理策略
无
N/A
无
N/A
性能管理规范
必须
P1
必须
P1
维护文档回顾和更新
必须+半年更新一次
P1
必须+一年更新一次
P2
应急文档回顾和更新
必须+半年更新一次
P1
必须+一年更新一次
P2
安全管理制度
建立管理制度,并每半年对管理制度进行检查和审定
P1
建立管理制度,并每半年对管理制度进行检查和审定
P1
操作规程
无
P3
无
P3
安全管理中心
建立安全管理中心,对设备状态、恶意代码、补丁升级、安全审计等安全相关事项集中管理
P1
建立安全管理中心,对设备状态、恶意代码、补丁升级、安全审计等安全相关事项集中管理
P1
系统安全运维文档
必须
P1
必须
P1
上线部署协调及培训
必须
P1
可选
P3
正式运行公告及培训
可选
P3
可选
P4
技术
RTO(本地)
0分钟
P1
60分钟
P3
RTO(异地)
5分钟
P1
60分钟
P3
容灾等级
(以GB/T20988-2007标准进行评价)
等级五
P1
等级四
P3
自动监控与故障报警
必须
P1
必须
P1
可用性及连续性方案
无
N/A
无
N/A
部件冗余
所有部件均为冗余设计
P1
所有部件均为冗余设计
P1
在线维护
无
N/A
无
N/A
网络准入控制(禁止便携式和移动设备接入)
必须
P1
必须
P1
进行网络管理时必须保证两人同时在场并保留不可改变的日志
可选
P2
可选
P2
资源
维保服务等级
原厂+7*24
P1
5*8
P4
备件库
原厂商或XX在系统所在大楼具有备件库
P1
可选
P4
驻场服务
必须
P1
必须
P1
故障时现场支持服务
2小时上门
P1
2小时上门
P1
现场升级支持
必须
P1
可选
P3
总体可用性级别
P2
总体可用性级别
P3
2.2.2日常支持服务目录(单项服务)
服务细类
服务项
服务描述
服务指标
服务时间窗口
服务响应时间
服务解决时间
平台构建
业务网构建/改建
外联网构建/改建
办公网构建/改建
测试开发环境构建
分行网络改建/扩建
根据特定需求提供符合要求的网络环境,
包括测试环境、生产环境、演练环境等不同环境
5*8
1个工作日
60个工作日
网络接入服务
服务器接入
应用系统接入
分行接入
VPN开通
IP地址分配
网络端口开通
外联线路开通
负载均衡开通
网络设备接入
KVM连接
Token服务
域名解析服务
增加VLAN端口
防火墙策略调整
网络访问控制变更
提供各类硬件、应用系统、内部各部门、外联单位、终端用户接入局域网、互联网
7*13
1个工作日
1个工作日
网络异常诊断服务
线路中断
流量异常
数据包丢失
网络延迟
解决网络日常运行中各种故障,确保网络恢复到正常运行状态,如指硬件的问题、软件的漏洞、病毒入侵可以引起网络的故障等等
7*13
30分钟
60分钟
网络应用服务
视屏会议系统
电话会议系统
多媒体应用
网络传真
提供网络视屏、语音、多媒体、传真等应用
7*13
30分钟
60分钟
网络监测与调整服务
流量监测
安全监测
连接检测
数据抓包
网络上对特定的目标进行监测的服务,包括内部运维数据采集,分析,诊断;外部市场活动运维表现评估;网络的IDC性能以及CDN的表现评估
7*13
30分钟
60分钟
网络咨询规划服务
操作咨询
设备采购咨询
链路租用咨询
网络规划与设计
规划待建的网络在企业或部门的信息系统中的地位以及各个子网络之间的联系,提供详尽的可行性分析报告和网络规划纲要,如可用性、容量规划、可持续性、所需资源、安全规划等
5*8
1个工作日
60个工作日
3 运营级别协议
3.1服务等级定义
服务等级
定义
核心业务系统
等级
重要业务系统
等级
普通业务系统
等级
3.2服务指标定义
指标大类
指标小类
指标细项
指标要求
可用性
可用率
核心业务等级/年
>=99.99%
重要业务等级/年
>=99.95%
可靠性
P1及P2事件个数/年
<=5件/年
P4及以上事件数/年
<=15件/年
可维护性
P1、P2事件修复时长/次
<25分钟/次
P4级及以上事件平均修复时长/次
<=35分钟/次
满意度
服务请求
平均满意度/年
>=90%
突发事件
平均满意度/年
>=90%
ITIL流程
问题
及时解决率/年
>=70%
主动提出率/年
>=80%
变更与发布
计划按时实施率/年
>=90%
变更(发布)成功率/年
>=90%
服务请求
及时解决率/年
>=80%
突发事件
及时解决率/年
>=80%
P4级及以上事件转问题平均时效/年
<=3工作日
知识
知识条数/年
>=50条
3.3服务报告
1)乙方每月15日之前向甲方提交上一个月度的月度服务报告;
2)月度报告中必须包括OLA指标的统计和分析。
4双方职责
4.1甲方
根据业务部门及业务系统的需求和银监会等行业组织的管理要求,制定合理的IT战略、计划,并及时与各室组沟通、确认详细执行计划;定期对室组提交的运维报告进行评审,确认当期目标是否达标。
4.2乙方
依据本OLA的服务项,提供相应的服务,保障业务系统的正常运行。
具体到各ITIL流程,各项流程职责分别如下:
4.2.1事件管理流程职责
1.确保有效协调资源,通过支持人员快速恢复正常服务,保持IT服务的稳定性;
2.按规范记录、分类、分析、诊断、处理、关闭事件,必要时进行升级;
3.定期对事件服务流程回顾,提高流程的效果和效率。
4.2.2问题管理流程职责
1.根据优先级合理分派IT资源,分析并确定事件的根本原因,找到最终解决方案,防止此类事件再次发生;
2.对事件记录做趋势性分析,主动提供预防性措施,减少事件的发生;
3.定期收集、汇总、并分析生成小组运维系统状态报告,提出改进建议。
4.2.3变更管理流程职责
1.所有影响生产环境配置项的变更都必须严格遵循变更管理流程,并确保所有的变更请求记录都应被记录和追踪;
2.定期产生变更管理报表,对失败的变更和风险等级重大的变更进行回顾和检查,以更好地管理变更流程;
4.2.4发布管理流程职责
1.制定合理的发布计划,确保所有的发布过程记录都应该被记录和追踪;
2.定期对失败的发布和风险等级重大的发布进行回顾和检查,以更好地管理发布;
3.定期对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进发布管理流程。
4.2.5请求管理流程职责
1.根据优先级合理分配资源,及时响应并执行请求,并准确记录相关处理过程和信息;
2.定期收集、汇总、并分析生成运维系统状态报告,提出改进建议。
4.2.6配置管理流程职责
1.确保CMDB准确反映当前已知的IT架构状态、关键配置项信息;
2.定期对流程进行回顾,持续改进配置管理。
4.2.7容量管理流程职责
1.结合项目计划书,业务需求,工作负荷或资源性能的变动定期更新容量计划,提高评估资源和业务的容量准确性;
2.定期被报告和回顾,持续改进容量管理。
4.2.8可用性管理流程职责
1.定期检验可用性计划的有效性,确保承诺的可用性目标得到实现,同时确保可用性计划能不断适应业务的需要;
2.定期对可用性管理流程的流程关键衡量指标、流程执行效率、流程支撑工具有效性等进行回顾,以改进和优化流程。
4.2.9持续性管理流程职责
1.定期检验联系性计划的有效性,确保承诺的可用性目标得到实现,同时确保持续性计划能不断适应业务的需要;
2.定期对持续性管理流程的流程关键衡量指标、流程执行效率、流程支撑工具有效性等进行回顾,以改进和优化流程。
4.2.10信息安全管理职责
1.采取一切可能的技术手段和管理措施,保护系统中的信息安全;
2.定期对安全管理发生的事件进行回顾,改进和优化安全管理。
5 投诉
甲方如对乙方的服务提供有任何不满意,可拨打投诉电话:
(XXXX)XXXXXXXX或投诉Email:
XXXXX@。
乙方在接到投诉后的一个工作日内给投诉人回复,七个工作日内解决。
甲方:
乙方:
签字:
签字:
时间:
时间:
附录:
附录一:
服务指标度量说明
注1:
以下时间计算均在指定工作时间区域,需要扣除非工作时间。
注2:
统计的突发事件只包括P4及P4以上人工登记的突发事件及其任务单,简称为“重要突发事件”。
注3:
事件服务时间标准
优先级
指标
P1
P2
P3
P4
P5
响应时间
5分钟
15分钟
1小时
2小时
4小时
解决时间
1小时
4小时
8小时
16小时
32小时
注4:
服务请求时间标准
优先级
指标
P1
P2
P3
P4
P5
响应时间
3.5小时
10.5小时
17.5小时
35小时
77小时
解决时间
7小时
21小时
35小时
70小时
154小时
各指标详细说明如下:
流程
指标
统计范围
计算标准
计算方式
需关注工单项
事件
及时解决率
本年关闭的重要突发事件
工单的实际完成时间在计划完成时间之前,判断为及时解决
(及时解决事件单数)/事件单总数)*100%
管理辅助信息页面:
计划完成时间
实际完成时间
是否按时完成
满意度
本年关闭的重要突发事件
所有已关闭重要突发事件的总体满意度不为空
(总体满意度值之和)/已关闭重要突发事件
申请人验收信息页面:
本次服务总体满意度
问题
及时解决率
本月解决的问题
实际完成时间在计划完成时间之前,判断为及时完成
(及时完成问题总数/当月所有问题总数)*100%
问题详细信息页面:
计划完成时间
实际完成时间
主动提出率
当年登记的问题数
是否引起业务中断值为否的问题
(当年主动性问题数/当年登记问题总数)*100%
是否引起业务中断为否,则为主动
变更
/发布
按计划实施率
本年实施的变更单,不包含关闭代码为“取消”、“超计划取消”、“审批未通过”的变更
实际开始时间在计划开始时间和计划完成时间之间,并且实际完成时间不超过计划完成时间后1小时,判断为按计划实施
(按计划实施变更总数/实施变更单总数)*100%
变更详细信息页面:
计划开始时间
计划完成时间
变更实施页面:
实际开始时间
实际完成时间
变更(发布)成功率
本年实施的变更单,关闭代码为“成功”的变更
关闭时间在当年,登记时间包括当年。
(成功实施变更总数/实施变更单总数)*100%
变更详细信息页面:
计划开始时间
计划完成时间
变更实施页面:
实际开始时间
实际完成时间
知识
条目/年
当年提交的知识条目
当年提交的知识条目,审核通过后评分高于3分
当年符合评分范围的知识条目之和
可用性
可用率/年(核心业务等级)
本室组所负责的核心业务系统相关支撑工作
核心业务系统全年实际可用时间
核心业务系统全年实际可用时间)/核心业务系统全年计划时间*100%
可用性计算结果信息页面:
总体系统可用性损失
可用率/年(重要业务等级)
本室组所负责的重要业务系统相关支撑工作
重要业务系统全年实际可用时间
重要业务系统全年实际可用时间)/重要业务系统全年计划时间*100%
可用性计算结果信息页面:
总体系统可用性损失
P1、P2事件次数/年
本室组本年发生的P1、P2级事件
参见事件等级标准
P1总次数+p2总次数
可用性事件基本信息页面:
优先级:
P1、P2
P4及以上事件数/年
本室组本年度发生的P4级及以上事件
参见事件等级标准
P1总次数+p2总次数+p3总次数+p4总次数
可用性事件基本信息页面:
优先级:
P1、P2、P3、P4
P1、P2事件平均修复时长/年
本室组本年度发生的P1、P2级事件
参见事件等级标准
(P1总时长+P2总时长)/(P1总次数+p2总次数)
可用性事件基本信息页面:
突发事件发生时间
最终全面恢复时间
P4级事件及以上平均修复时长/年
本室组本年度发生的P4级及以上事件
参见事件等级标准
(P1总时长+P2总时长+P3总时长+P4总时长)/(P1总次数+p2总次数+p3总次数+p4总次数)
可用性事件基本信息页面:
突发事件发生时间
最终全面恢复时间
请求
及时解决率/年
本年度关闭的服务请求
工单的实际完成时间在计划完成时间之前,判断为及时解决
(及时解决请求单数)/请求单总数)*100%
请求详细信息页面:
计划完成时间
实际完成时间
满意度
本年度关闭的服务请求
满意度调查结果为“满意”、“基本满意”
(满意+基本满意)/已关闭请求单
请求详细信息页面:
计划完成时间
实际完成时间
事件等级标准:
代码
分级
描述
P1
灾难事件
1、在主要业务时段全行所有业务和服务不可用
P2
严重事件
1、在非主要业务时段全行所有业务和服务不可用
2、总行一个(含)以上重要信息系统不可用或可用性受严重影响
3、在主要业务时段一个(含)以上分行所有业务和服务不可用
P3
重大事件
1、全行所有业务和服务可用性受威胁
2、总行一个(含)以上重要信息系统可用性受一般影响
3、在非主要业务时段一个(含)以上分行所有业务和服务不可用
4、分行一个(含)以上重要信息系统不可用或可用性受严重影响
P4
一般事件
1、总行一个(含)以上重要信息系统可用性受威胁
2、总行一个(含)以上非重要信息系统不可用或受严重影响
3、分行一个(含)以上重要信息系统可用性受一般影响
4、分行一个(含)以上非重要信息系统不可用或受严重影响
P5
隐患事件
其他的信息系统可用性相关事件
message
其他事件
信息类事件
附录