ITSS实例文件事件管理流程文件模板.docx

上传人:b****5 文档编号:3307017 上传时间:2022-11-21 格式:DOCX 页数:19 大小:370.38KB
下载 相关 举报
ITSS实例文件事件管理流程文件模板.docx_第1页
第1页 / 共19页
ITSS实例文件事件管理流程文件模板.docx_第2页
第2页 / 共19页
ITSS实例文件事件管理流程文件模板.docx_第3页
第3页 / 共19页
ITSS实例文件事件管理流程文件模板.docx_第4页
第4页 / 共19页
ITSS实例文件事件管理流程文件模板.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

ITSS实例文件事件管理流程文件模板.docx

《ITSS实例文件事件管理流程文件模板.docx》由会员分享,可在线阅读,更多相关《ITSS实例文件事件管理流程文件模板.docx(19页珍藏版)》请在冰豆网上搜索。

ITSS实例文件事件管理流程文件模板.docx

ITSS实例文件事件管理流程文件模板

 

XXX有限公司

事件管理流程文件

 

文档编号

ITSS-15-03

密级

内部公开

版本号

V1.0

受控状态

受控

作者

XXX有限公司

发布日期

XX年X月X日

 

修订记录

版本号

修订内容

修改人

修改日期

审核人

V1.0

创建

XXX

XX.01.03

XXX

 

 

1目的

为落实ITSS的管理,规范运维服务的事件受理、处理与解决的规范性,特制定事件管理流程。

事件管理是负责解决IT服务的事件、故障和客户请求等的运维流程。

它的目的是尽快恢复被中断或受到影响的IT服务,所以它的特点往往是以解决表征现象为目的,而不在于查找根本原因。

为了有效地解决运维服务中产生的突事件,提高运维服务的质量,为客户提供更优质的信息技术服务建立一个完整的事件管理系统,从而实现:

(1)减小事件对客户业务建设的影响

(2)最优化支持资源,提高工作效率

(3)屏蔽错误事件和服务请求

(4)根据客户业务系统的轻重缓急解决事件,保障有效IT系统运营

(5)加强有效监控和及时反馈

(6)提升用户满意度

(7)提供管理信息

2适用范围

事件管理覆盖的范围是运维服务的客户。

事件管理的范围包括以下:

Ø网络与基础设施:

如局域网,广域网,机房,电力,空调等;

Ø安全事件:

如病毒,攻击,泄露等;

Ø系统数据库:

如操作系统,数据库等;

Ø应用系统软硬件:

主机,系统,客户网站等;

Ø运维服务范围内的咨询,协调处理等。

3名词术语

故障:

任何不属于正常服务运营,导致服务中断或使服务质量明显下降的情况。

事件:

包括故障和运维服务范围内的咨询,协调处理等。

4事件的分类和分级

4.1事件分类

运维服务的事件分类主要包括:

网络与基础设施,安全事件,系统数据库,应用系统软硬件和范围内的咨询,协调处理等。

4.2事件分级

一级

业务系统重要程度级别定义为高;

有害程序事件、网络攻击事件、信息破坏事件、信息内容安全事件、设备设施故障、灾害性事件和其他信息安全事件造成系统大面积瘫痪,影响业务用户数量>=80%;使其丧失业务处理能力,导致业务中断时间>=2小时;系统关键数据的保密性、完整性、可用性遭到严重破坏。

二级

业务系统重要程度级别定义为高;

有害程序事件、网络攻击事件、信息破坏事件、信息内容安全事件、设备设施故障、灾害性事件和其他信息安全事件

造成系统长时间中断或局部瘫痪,影响业务用户数量>=50%;中断时间:

>=1小时;使其业务处理能力受到极大影响,系统关键数据的保密性、完整性、可用性遭到破坏。

三级

业务系统定义级别为中;有害程序事件、网络攻击事件、信息破坏事件、信息内容安全事件、设备设施故障、灾害性事件和其他信息安全事件造成造成系统影响业务用户数量>=20%;中断时间:

>=0.5小时,明显影响系统效率。

4.3处理事件原则

处理事件的原则是尽可能减小对业务的影响;

◆事件管理流程必须包括管理服务事件影响的步骤,比如评估影响、沟通、提供变通方案等,使事件对客户业务活动的影响降至最小;

◆在可能的情况下,应该向客户提供继续进行业务活动的手段,即使降低服务级别,比如禁用一项有错误的功能,目的是将事件对客户业务活动的影响降至最小;

◆当服务级别不能被满足时,应该提前提醒客户,并且对下一步的处理行动达成一致意见。

4.4升级原则

类别

升级策略

职能升级

若一线支持在职责范围内完成事件诊断,仍未找到相应的解决方案,应立即将故障转给二线支持。

若二线支持支持在职责范围内完成事件诊断,仍未找到相应的解决方案,应立即将故障转给三线支持。

层次升级

若接近故障的解决期限,故障仍未能解决,应通知更高一级的管理人员。

按照商定的升级层次和时间,向用户高层管理人员升级。

 

5流程角色

角色

职责

职能岗位

事件经理

●确保有效协调资源,使事件快速恢复正常服务状态

●确保事件管理支持人员的适当技能水平和绩效表现

●确保和问题管理、外部供应商等其他角色的有效合作

●确保事件的快速恢复

●确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题

●确保有关IT服务和用户支持的管理信息的可获得性

●提供相关的事件统计报表和趋势分析

各负责人

服务台

(一线)

●接受用户的事件申告,对事件进行确认

●确保所有相关事件信息都被正确登记

●对登记的事件进行分级和分类

●直接为用户提供相应的恢复方案

●将事件分派给适当的事件分析员

●跟踪事件处理过程以确保在规定的时间内恢复问题

●结束事件,更新信息

●作为事件的所有者,监控,跟踪所有的事件。

●必要时进行事件升级

客服人员

事件分析员

(现场一线、二线、三线)

●接受服务台转交的事件,对之进行处理。

●确认事件的分类、分级和关联配置项。

●在规定的时间内恢复事件,必要时进行事件升级。

●事件的调查和诊断。

●把事件的影响降到最小,并确保快速恢复到正常服务水平。

●收集及确定恢复方案,根据恢复方案进行IT服务恢复。

●如事件产生了一个问题,提交问题单给问题分析员。

●如事件产生了变更,则提交变更请求给变更管理。

各部门参与事件分析与解决的人员

一线:

服务台和现场人员

二线:

运维部门

三线:

供应商和研发团队

 

6流程

6.1事件管理流程

活动

描述

责任人

输入

输出

1报告事件

Ø用户通过热线电话、语音邮件、直接访问、信件、传真和电子邮件等方式提交事件申告;

Ø运维工程师巡检发现系统故障;

Ø监控系统上报故障告警。

用户

Ø申报用户信息

Ø申报的事件信息

Ø用户报告的事件

2记录事件请求、维护用户信息

Ø服务台使用系统接受并记录用户提交的事件及用户基本信息。

服务台

Ø用户报告的事件

Ø含有用户信息和事件描述的事件记录

3事件分类/优先级确定

Ø服务台人员参考目前事件分类标准对该事件进行分类;

Ø服务台人员参考事件分级标准确定事件请求的优先级;

Ø如果该事件为重大事件,需要启动应急预案,则根据业务连续性管理规范进行处理。

服务台

 

服务台

Ø事件记录

 

Ø已分类及划定优先级的事件

 

Ø重大事件

4处理解决事件

Ø服务台分配事件请求,并快速解决服务台能够解决的事件;

Ø一线支持人员解决咨询、询问类事件及简单的故障,一线机房现场支持人员解决现场故障,无法解决时升级事件到二线支持人员;

Ø二线支持人员解决故障类事件,在无法解决时升级到三线,并通报服务台;

Ø运维经理监控所有事件请求并跟踪、协调未解决事件。

服务台

一线支持人员

二线支持人员

运维经理

Ø含有分类及优先级的事件记录

Ø已解决的事件的记录

5关闭事件

Ø服务台以多种方式与用户确认是否认可事件的解决方案;

Ø服务台在用户认可后关闭事件记录。

服务台

Ø已解决的事件记录

Ø已关闭的事件记录

6事件后续处理

Ø服务台在事件关闭后定期生成事件报告;

Ø运维经理查看事件报告并根据需要转向其他流程。

服务台

运维经理

Ø已解决事件记录

Ø定期事件报告

Ø定期事件报告

Ø需要提交安全管理流程处理的事件记录

Ø需要进入问题管理流程的事件记录

6.2处理解决流程

活动

描述

责任人

输入

输出

1分配事件请求

Ø服务台查看事件记录和知识库,如果是服务台能快速解决的事件,则服务台自行解决;

Ø如果确定需要转派才能解决的事件,则指派一线现场支持人员解决事件。

服务台

Ø已分类并确定优先级的事件记录

Ø由服务台负责的事件

Ø由一线现场支持人员负责解决的事件

2服务台快速处理事件

Ø服务台根据事件分类和描述查找知识库和历史事件记录;

Ø如果有相关的解决方案,则根据历史记录或知识库记载的方案快速解决事件;

Ø解决尚无相关历史记录的事件。

服务台

Ø由服务台负责的事件

Ø已解决的事件

3事件分配确认

Ø一线支持人员查看被指派的事件请求,如果是自己工作范围内的请求,则接受指派;

Ø如果事件分配错误,则报运维经理重新指派。

一线支持人员

服务台

Ø由服务台指派给一线支持人员的事件记录

Ø由一线支持人员负责解决的事件

Ø由服务台重新分配的事件记录

4处理事件/提交变更请求

Ø一线支持人员根据事件分类和描述查找知识库和历史事件记录,如果有相关解决方案则根据知识库记载或历史记录解决事件,如无历史记录,一线支持人员调查研究解决该事件,事件的解决方案如需对配置项进行变更则提交变更请求;

Ø一线支持人员解决事件,如果在时限内仍未能解决该事件,则服务台根据已经定义的事件升级规则将该事件升级到运维经理处;

Ø如果是重大事件,则执行子流程重大事件处理流程。

一线支持人员

Ø由一线支持人员负责解决的事件

Ø已解决的事件

 

Ø未能解决升级的事件

Ø重大事件

5申请二线支持

Ø如果一线人员未能解决接受指派的事件,则由二线支持人员解决该事件。

一线支持人员

Ø一线人员未能接受的事件记录

Ø指定二线支持人员的事件

6事件分配确认

Ø二线支持人员查看被指派的事件请求,如果是自己工作范围内的,则接受指派;

Ø如果事件分配错误(仅指应用指派错误),则交给运维经理重新指派。

二线支持人员

Ø服务台分配给二线支持人员的事件记录

Ø由二线支持人员负责解决的事件记录

Ø由运维经理重新分配的事件记录

7处理事件/提交变更请求

Ø二线支持人员根据事件分类和描述查找知识库和历史事件记录,如果有相关解决方案则根据知识库记载或历史记录解决事件,如无历史记录,二线支持人员调查研究解决该事件,事件的解决方案如需对配置项进行变更,则提交变更请求;

Ø如果二线人员未能解决接受指派的事件,则由三线支持人员解决该事件。

二线支持人员

Ø由二线支持人员负责解决的事件记录

 

Ø二线人员未能接受的事件记录

Ø已解决的事件

 

Ø指定三线支持人员的事件

8事件分配确认

Ø三线支持人员查看被指派的事件请求,如果是自己工作范围内的,则接受指派;

Ø如果事件分配错误,则交给运维经理重新指派。

三线支持人员

Ø二线人员分配给三线支持人员的事件记录

Ø由三线支持人员负责解决的事件记录

Ø由运维经理重新分配的事件记录

9处理事件/提交变更请求

Ø三线支持人员根据事件分类和描述查找知识库和历史事件记录,如果有相关解决方案则根据知识库记载或历史记录解决事件,如无历史记录,三线支持人员调查研究解决该事件,事件的解决方案如需对配置项进行变更,则提交变更请求。

三线支持人员

Ø由三线支持人员负责解决的事件记录

Ø已解决的事件

10协调处理未解决事件/事件重新分配

Ø运维经理协调解决所有由一线、二线升级的事件和监控中发现需要协调解决的事件直至解决事件;

Ø如果事件不能得到解决,则应立即提交到问题管理流程。

运维经理

Ø需要协调处理的事件

Ø已解决的事件

Ø需要提交问题管理流程的事件

6.3重大事件处理流程

活动

描述

责任人

输入

输出

1处理事件/提交变更请求

Ø二线支持人员根据事件分类和描述查找知识库和历史事件记录,处理重大事件,需要时提出变更请求。

二线支持人员

Ø经确认的重大事件

Ø重大事件的记录

Ø安全事件的记录

2每月报告中报告该事件

Ø二线支持人员记录重大事件,并在每月的服务报告中报告该事件;

二线支持人员

Ø经确认的重大事件

Ø每月的服务报告,对重大事件的记录

3通知网络、系统负责人/三线

Ø二线支持人员负责将重大事件通知网络、系统负责人/三线;

Ø并负责协助三线解决事件。

二线支持人员

Ø经确认的重大事件

Ø重大事件报告

4监控重大事件进展

Ø对重大事件进行监控和回顾。

三线系统责任人

Ø重大事件报告

Ø服务改进计划,包括对重大事件的回顾和分析

6.4关闭事件流程

活动

描述

责任人

输入

输出

1记录事件解决方案

Ø各事件解决者记录已解决的事件的解决方案。

各事件的解决者

Ø已解决的事件

Ø包含解决方案的事件记录

2与用户确认事件已解决

Ø服务台以多种方式与事件申报者联系,由事件申报者认可该事件的解决方案;

Ø若事件申报者认可该事件解决方案,则关闭事件;

Ø若事件申报者不认可该解决方案,则由服务台继续跟踪。

服务台

Ø已记录解决方案的事件记录

Ø事件申报者认可的可关闭的事件记录

Ø继续跟踪的事件记录

3事件状态标记为关闭

Ø服务台关闭事件记录。

服务台

Ø事件申报者认可的可关闭的事件记录

Ø已关闭事件记录

4回访

Ø服务台对事件申报者进行本次服务的回访调查。

服务台

Ø已关闭事件记录

Ø用户回访调查结果

6.5后续处理流程

活动

描述

责任人

输入

输出

1定期生成事件报告

Ø服务台定期生成事件报告。

运维经理

Ø所有已关闭事件记录

Ø事件报告

2审阅事件报告

运维经理审阅事件报告,通过事件报告识别问题,并将问题提交到问题管理流程。

运维经理

Ø事件报告

Ø提交到问题管理流程的事件记录

7与其他流程的关系

Ø配置管理

需要从配置管理数据库中查询配置项的属性和配置项间的关联关系来定位故障和帮助快速的恢复。

Ø问题管理

事件管理流程将提供事件的详细、精确的记录信息给问题管理流程来定位问题及分析问题的趋势,以及在优先级为高的事件解决并恢复服务后作为问题进行进一步的分析和处理。

Ø变更管理

服务台应了解变更管理流程中目前正在进行的变更信息,监测因变更引发的事件。

在事件的解决过程中,必要时需要发起变更请求来解决事件。

Ø服务级别管理

服务级别管理流程对SLA协议完成情况进行持续监控,事件流程相关人员必须全面了解SLA协议内容,以便在与用户进行沟通的时候可用到这些信息。

有关事件记录的报告可用来判断是否真正地提供的规定级别的服务。

Ø可用性管理

为了评估服务的可用性,可用性管理流程需要使用配置管理流程提供的事件记录和状态监控信息,例如事件处理期间导致的某项服务的“不可用”状态。

Ø能力管理

能力管理流程关注由于能力(Capability)不足导致的事件,例如系统处理能力不足导致的处理响应时间过长。

8审核

定期对事件管理全流程进行审核。

9度量

详细指标参见《运维服务KPI指标体系》

10参考文件

GB/T28827.1-2012《信息技术服务运行维护第1部分:

通用要求》

ISO/IEC20000-1:

2005《IT服务管理体系要求》

ISO/IEC20000-2:

2005《IT服务管理体系实践指南》

ITSS.1—2015信息技术服务运行维护服务能力成熟度模型

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 育儿理论经验

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1