ITSS运维服务事件管理制度.docx
《ITSS运维服务事件管理制度.docx》由会员分享,可在线阅读,更多相关《ITSS运维服务事件管理制度.docx(39页珍藏版)》请在冰豆网上搜索。
![ITSS运维服务事件管理制度.docx](https://file1.bdocx.com/fileroot1/2022-10/5/5ef6c515-329b-4271-8c6f-5f0b7c0b0571/5ef6c515-329b-4271-8c6f-5f0b7c0b05711.gif)
服务事件管理制度
文件编号:
ITSS-PM-EM-001
版本号:
V1.0
受控状态:
受控文件
服务事件管理制度
西安**信息科技有限公司
编制人:
段豆豆
编写日期:
2018-12-10
审核人:
赵新娟
审批日期:
2018-12-25
36
文档控制
描述:
文档名:
服务事件管理制度
文档编号:
ITSS-PM-EM-001
版本号:
V1.0
定版日期:
2018年12月
编制人:
段豆豆
审核人:
赵新娟
版本控制:
版本
日期
审核人
备注
V1.0
2018年12月
赵新娟
编写初稿。
目录
1 概述 1
1.1 目标 1
1.2 范围 2
2 制定依据 3
3 术语定义 3
4 角色和职责 4
5 内容 6
5.1 程序准则 6
5.1.1 执行准则 6
5.1.2 输入及入口准则 10
5.1.3 输出及出口准则 11
5.1.4 事件定义准则 12
5.2 流程图 16
5.3 流程详述 17
5.4 子流程1:
记录与分类 20
5.4.1 流程图 20
5.4.2 流程详述 21
5.5 子流程2:
一线尝试解决 23
5.5.1 流程图 23
5.5.2 流程详述 24
5.6 子流程3:
二线尝试解决 26
5.6.1 流程图 26
5.6.2 流程详述 27
5.7 子流程4:
记录详细解决方案 29
5.7.1 流程图 29
5.7.2 流程详述 29
5.8 子流程5:
紧急、重大事件管理 31
5.8.1 流程图 31
5.8.2 流程详述 32
5.9 子流程6:
事件关闭 34
5.9.1 流程图 34
5.9.2 流程详述 34
5.10 定期评估和改进 35
6 相关文件与记录 37
1概述
1.1目标
事件管理流程的目的是尽快解决用户IT环境中的突发事件,保障IT系统的稳定性,提高服务质量,为业务的发展提供更优质的IT服务,并且可以有效实施其他相关ITSM管理流程,如问题管理流程。
通过本文档的定义,建立一个完整的事件管理系统,从而实现:
1 减小突发事件对业务的影响
1)在成本允许的范围内尽快恢复IT服务
2)快速响应服务请求(电话/Web/QQ/微信/邮件等)
2提高用户工作效率
3 提升客户满意度
4 进行事件有效控制
1)按规范记录事件,避免事件丢失
2)就事件的优先级,影响度进行分类
3)分析,诊断,必要时进行升级
4)监视并结束事件
5)进行定期服务流程回顾
5 提供IT管理信息
1)人力资源利用情况,从而更好使用人力
2)支持效率
3)IT系统故障处理情况
4)给准确信息至配置管理数据库(CMDB)
5)服务质量管理报告。
1.2范围
事件管理的范围包括公司合同范围内的客户的IT生产和运行环境中发生的故障事件、用户的服务请求以及用户提出的变更请求,具体如下:
1 故障申告
1)用户报告的故障事件
2)监控系统的报警事件
3)IT服务人员监测、检测的故障事件
4)其他人员转告的用户故障事件
2 服务请求
1)信息咨询,主要包括:
客户在IT信息系统建设,运维管理,IT产品,系统使用等方面提出的咨询请求
2)业务支持请求,主要包括:
组织级服务目录中相关服务内容,系统培训支持请求
3)辅助配合,主要包括:
领导交办任务及第三方配合的服务请求
事件管理的范围不包括客户提出的、合同范围之外的相关请求,以及投诉事件和西安**信息科技有限公司内其他部门的工作任务。
2制定依据
1)ITSS.1—2015《信息技术服务运行维护服务能力成熟度模型》
2)GB/T28827.1-2012《信息技术服务运行维护第一部分:
通用要求》
3)GB/T29264-2012《信息技术服务分类与代码》
4)GB/T28827.2-2012《信息技术服务运行维护第2部分:
交付规范》
5)GB/T28827.3-2012《信息技术服务运行维护第3部分:
应急响应规范》
6)ISO20000.1:
2011《信息技术服务管理第一部分:
服务管理体系要求》
7)ISO9000:
2008《质量管理体系—基础和术语》
8)ISO9001:
2015《质量管理体系—要求》
3术语定义
本程序采用制定依据系列标准中的术语和定义。
4角色和职责
角色
职责
事件经理
1.进行事件满意度分析;
2.确保事件SLA的达成;
3.出现紧急、重大事件时,负责协调外部资源尽快解决;
4.当事件优先级为紧急或者事件将超过规定的时限,负责按照升级方法对事件进行处理确保有效协调资源,促进各类角色小组(如一线支持、二线支持)快速恢复正常服务;
5.确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题;
6.确保与问题管理、外部供应商等部门的有效合作。
服务台
1.为客户唯一联系点
2.在指定的响应时间内响应所有服务台热线电话、邮件、工单等事件报告;
3.正确、完整记录所有接收的事件信息,包括:
记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等;
4.检查事件记录的处理进度,保持与用户的联系,适时通知事件处理进展;
5.尝试使用知识库、初步诊断、分析相关信息等方式解决事件;
6.如事件无法解决,将事件进行升级,并寻求事件经理的支持;
7.回访用户满意度反馈并记录,满足关闭条件关闭事件;
8.结束事件。
一线工程师
1.接收服务台的事件工单指派,响应用户请求;
2.为事件进行适当的分类、为事件分配优先级、关联配置项等属性,进行初步支持;
3.根据解决方案进行IT服务的解决与恢复。
二线工程师
1.接收和处理升级事件;
2.进行事件的深入调查研究;
3.根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动;
4.及时提供有效解决方案;
5.与其他二线小组合作,确定解决方案;
6.必要时引入供应商的支持;
7.根据解决方案进行IT服务恢复;
8.如果事件无法解决,将事件升级,寻求事件经理的支持;
9.已解决的事件转回服务台,由服务台关闭事件。
5内容
5.1程序准则
5.1.1执行准则
5.1.1.1常规准则
1 服务台作为事件接口,监督事件的处理,负责事件的发起与关闭;
2 从事件记录时起至事件关闭时结束,事件全生命周期监控事件的影响及处理情况;
3 所有事件都应该被记录在《运维综合管理平台》中,记录的信息应足够详细,包括事件处理交互过程,详细的解决方案和相应的信息;
4 所有运维人员按照服务级别协议规定时限对事件进行处理,当事件冲突时,对优先级为极高的事件所采取的服务恢复行动,在比对其它行动的时候,将拥有优先处理级别,如果优先级别相同,则优先处理相对简单事件;
5 安全事件发生时,严格遵循服务安全管理程序的原则,通过事件管理流程进行事件管理;
6 事件处理过程中,应持续保持与客户的沟通,通知客户事件处理进展;
7 应该每月产生事件管理报表,对重复发生的事件和变通方法解决的事件,进入问题管理程序;
8 应每年对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进事件管理流程。
5.1.1.2升级原则
制定升级原则的目的是确保事件在规定的解决时限内能够及时通知相关技术人员和管理领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。
1 优先级为极高的事件,由一线工程师确认,如果确认了优先级为极高,则立即升级到事件经理,并通知相应的管理层(通过运维综合管理平台),由事件经理启动紧急事件处理流程
2 各支持人员应及时响应和处理分配到本组或自己的事件单,如果超出规定的解决时限,服务台应将事件信息升级至二线工程师进行支持,如果二线工程师超过解决时限,则通报事件经理,事件经理负责协调资源,并督促事件能够及时被响应和处理
3服务台应及时将不能解决的事件升级到下一级,若未及时升级,事件经理应及时介入,负责协调升级处理
5.1.1.3关闭原则
客户申报的事件单,关闭必须由服务台或客户完成。
1 已关闭的事件单不允许重开,如果事件重复发生,则创建一个新的事件单。
2 事件处理人员在解决完成事件时,根据实际解决情况填写事件的结束代码,采用临时措施恢复服务时,结束代码为"临时解决";由IT用户认可获得关闭的事件单的结束代码为"成功解决";
3 运维平台产生的事件发送到服务台,由服务台分派处理人员解决并关单。
5.1.1.4流程关联原则
事件管理与问题管理、变更管理、发布管理、配置管理存在以下关联原则:
1 和问题管理的关联
通过临时解决方法解决的重大事件或重复发生事件在恢复服务后,都应该创建问题单,问题单需和事件单建立关联。
2 和变更管理的关联
事件处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提交变更请求单(变更单必须和事件单建立关联),变更完成后,继续事件单的处理。
紧急事件(优先级为极高的事件,下同)的处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提出紧急变更请求,变更完成后,补录紧急变更单,并和紧急事件单建立关联。
3 和配置管理的关联
事件处理过程中,可以通过配置管理查询相关的配置项信息以及该配置项历史上发生的事件或变更,来帮助故障的定位。
事件处理过程中,如果可以将故障定位到某个配置项,则必须将事件单与该配置项关联。
4 和发布管理的关联
发布工作结束后,可能触发新事件的产生。
发布管理应向事件管理提供发布相关信息,包括:
年度发布计划,发布信息等。
5.1.2输入及入口准则
5.1.2.1入口准则
公司合同范围内,用户通过电话、邮件、传真、QQ、微信等方式进行的事件请求、监控系统告警、服务人员巡检过程中发现或其他人员转告的事件请求。
5.1.2.2输入
序号
名称
描述
模板
输入来源
1
故障申告
客户故障详细信息,包括:
客户信息、故障描述,发生故障的配置项等
事件单
用户
服务台专员
监控系统
2
服务请求
当前客户业务对IT系统的需求
事件单
用户
5.1.3输出及出口准则
5.1.3.1出口准则
由客户提出的事件,关闭时必须通知客户。
5.1.3.2输出
序号
名称
描述
模板
输出去向
1
故障解决
服务请求解决
客户故障、请求得到及时解决
运维工单
客户满意度
2
解决方案
包括事件现象,故障的分析,处理、解决过程
故障排查手册
知识库
3
变更请求
当发生配置项发生变更或操作可能对用户IT生产系统产生影响的情况时提起变更请求
变更工单
变更管理
4
问题请求
当事件解决方案为临时方案时,提出问题请求
问题工单
问题管理
5
事件报告
事件统计报表(周报、月报、季报、年报)
事件报告
服务组织
5.1.4事件定义准则
5.1.4.1事件分类准则
事件分类按组织服务目录类别进行划分,目前在《运维综合管理平台》中分类定义如下:
5.1.4.2事件分级准则
根据事件的紧急程度,结合客户SLA级别协议,划分优先级如下(详细划分规则见《事件分级规则》):
优先级别
响应时间
解决时间(h)
备注
极高
立即
1小时
高
30分钟
4小时
中
1小时
24小时
低
4