事件管理流程手册.docx

上传人:b****5 文档编号:7715072 上传时间:2023-01-25 格式:DOCX 页数:99 大小:54.99KB
下载 相关 举报
事件管理流程手册.docx_第1页
第1页 / 共99页
事件管理流程手册.docx_第2页
第2页 / 共99页
事件管理流程手册.docx_第3页
第3页 / 共99页
事件管理流程手册.docx_第4页
第4页 / 共99页
事件管理流程手册.docx_第5页
第5页 / 共99页
点击查看更多>>
下载资源
资源描述

事件管理流程手册.docx

《事件管理流程手册.docx》由会员分享,可在线阅读,更多相关《事件管理流程手册.docx(99页珍藏版)》请在冰豆网上搜索。

事件管理流程手册.docx

事件管理流程手册

事件管理流程手册

IncidentManagementFlowHandbook

骏网快车IT外包服务中心

(广州中育科技设备有限公司)

文档控制

描述

文档名:

事件管理流程手册

文档号:

版本号:

定版日期:

2006-6-28

作者:

发布人:

詹俊权

发布日期:

2006-6-28

版本控制

版本

日期

修改人

备注

2007-2-14

詹俊权

增加涉及DLR相关重大问题对应子流程

2007-02-27

詹俊权

修改维护子流程

2007-6-15

詹俊权

增加事件通报子流程

2007-7-27

詹俊权

增加投诉处理子流程

2007-08-06

詹俊权

增加应急预案制作要求及指导

批准

主题

签署

日期

1综述

1.1设计目的

《事件管理流程设计报告》是中国惠普公司和骏网快车IT外包服务中心(以下简称骏网快车)共同制定的事件管理的流程设计文档。

通过制定该流程设计文档,可以帮助骏网快车有效地解决IT环境的突发事件,提高IT系统和服务的质量,并为骏网快车今后进一步的完善事件管理提供指南。

1.2适用范围

本文档作为本次项目的事件管理流程详细设计的交付物,读者对象为与事件管理流程相关的所有技术与管理人员。

1.3相关术语

ITIL(ITInfrastructureLibrary)

是英国政府在1987年制定的有关IT服务管理的方法论,现已成为事实上的IT管理标准。

帮助台(ServiceDesk)

帮助台从根本上来说是提供了用户和IT部门的唯一接口。

此项功能常通过集中方式提供服务。

帮助台的根本目的是提供初始支持,并通过变通方法、解决方案或升级到一线、二线支持等手段帮助用户恢复到正常工作状态。

事件管理(IncidentManagement)

ITIL流程之一,事件管理负责解决所有的IT事件、问题和用户请求。

它的目的是尽快恢复被中断或受到影响的IT服务,所以它的特点往往是以解决表征现象为目的,而不在于查找根本原因。

问题管理(ProblemManagement)

ITIL流程之一,问题管理负责解决重大紧急事件或具有相同症状的一组事件。

它的目的是找出事件的根本原因,并通过解除该根本原因从而防止类似事件的再次发生。

同时问题管理流程也负责预防事件的发生。

配置管理(ConfigurationManagement)

ITIL流程之一,配置管理负责描述,跟踪和汇报所有IT基础架构中的每一个设备或系统的管理流程。

这些设备和系统被称为配置项(CI)。

每一个CI必须有效管理,跟踪和控制以支持公司的IT服务和基础设施成功运行。

配置管理数据库(CMDB-ConfigurationManagementDatabase)

是在配置管理流程中用于记录企业所有IT相关配置项信息及其相互关系而建立的数据库。

变更管理(ChangeManagement)

ITIL流程之一,变更管理通过控制和管理IT相关的变更,使变更对生产环境可能的影响和风险降到最小,从而提高IT环境的整体稳定性。

2事件管理流程设计

2.1流程目的

事件管理流程的主要功能是尽快解决出现的事件,保持业务系统的稳定性,其目的包括:

在成本允许的范围内尽快恢复IT服务

快速响应服务请求(电话/Web/邮件等)

用户在线获得帮助

沟通事件解决的状态

和客户确认事件的解决

进行事件控制

按规范记录事件

就事件的优先级,影响度进行分类

分析,诊断,必要时进行升级

监视并结束事件

进行定期服务流程回顾

提供IT管理信息

人力资源利用情况

故障处理情况

支持效率

2.2流程主要内容

事件管理流程始于事件的接收和报告,结束于事件的解决。

该流程包含下述主要内容:

事件接收和记录

这个环节是事件管理流程的起点。

所有用户或系统报告的IT事件必须由此步骤开始。

此步骤的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并通知相关人员。

在此步骤中将会收集创建事件记录所需的信息。

该环节的关键是信息的准确性和完整性。

分类和在线支持

事件可以是一个故障、告警、咨询等等,对于每个事件,需要确立优先级和分类。

若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。

该环节的关键是必要的问题库支持和正确的事件分派。

调查和诊断

若支持人员无法解决事件,可运用问题库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时可调用多名支持人员以寻求解决措施。

解决和恢复

支持人员实施事件的解决方案,并将解决完毕的事件转回帮助台,由帮助台通知用户解决的结果,并得到用户的确认。

优先级为很紧要的事件(很紧要事件)和事件升级

对于很紧要事件,帮助台/一线应立即提交给二线人员,由二线人员判断,上报给事件经理和相关的管理层,由事件经理决定很紧要事件的处理方式,确保其得到最快速的解决。

当事件处理超过预期时限,将自动通知处理人员和相应管理层,以引起相关人员和管理人员的重视和参与。

结束事件

当用户确认事件解决后,此时可结束该事件,并在必要时更新问题库。

2.3与其他流程的关系

和问题管理流程的关系

事件管理流程将提供事件的详细、精确的记录信息给问题管理流程来定位问题及分析问题的趋势,以及在优先级为很紧要的事件解决并恢复服务后做为问题进行进一步的分析和处理。

和配置管理流程的关系

需要从配置管理数据库中查询配置项的属性和配置项间的关联关系来定位故障和帮助快速的恢复。

和变更管理流程的关系

帮助台应了解变更管理流程中目前正在进行的变更信息,检测因变更而可能引发的事件。

在事件的解决过程中,必要时需要发起变更请求来解决事件。

2.4流程范围

骏网快车事件管理范围如下表格所示(以广州丰田为例):

分类(English)

子类(Englishi)

monitoring

BeijingMonitoring(IDC)

Singaporemonitoring(FTH/NQC/eKanban-G)

TGNMonitoring

TMCMonitoring

Monitoring

G-SCMprovidedbyTMC

GPPS/PartsForecast

G-ALC/VSM/G-CVT

T-LMS

e-Kanban

PAMS/RUNDOWN 

Online&BatchFrameWork

BeijingIDCInfra(Server)

BeijingIDC FireWall/FTH

BeijingIDCServerH/W、M/W

SMSprividedbyTMC

SMS(car)

SMS(ServiceParts)

SMS-BR

P-SMS

SMS&P-SMS(Infra)

otherssystemprovidedbyTMC

G-YNS

Servive Parts Packaging for China

SMMACS

KBS/InternalKanban

ALC_ES

Address Registraion System

Progress Counter

TeiTei

SFT

ATSC

localsystem

UnofficialNotificationSystem

NQCDATAReceivingSystem

ReceiptIssuingSystem

PruductionRecordSystem

Import&EntrySystem

GeneralFileTransferSystem

Finance(exceptbasicparts)

AccountingSystem

UnitPriceforPaymentSystem

HumanResourceSystem

RecordManageSystem

PassCertificateIssuingSystem

CRSI

MQS

TaxSystem

InventorySystem

salessystem

TACT

C-DIST

TOPSS

E-CRB

managementprovidedbyTMC

WARP

Finance(basicparts)

W-Cube/WAIS/TQ-NET

network

LAN(exceptTGN)

TGNRouter

TGN GlobalBackbornTGNTMCparts

WAN(exceptG-YNS)

G-YNSIDCSERVERH/W、N/W

G-YNSIDCFIREWAREFTH

server

LocalServer#1/#2/#3/BU

G-ALC_ESServer

KBS/InternalKanbanServer

AddressRegistraionServer

ProcessCounterServer

SMMACSServer

TeiTeiServer

Finance/ProcurementServer

AccountingSystemServer

HumanResourceServer

RecordManageServer

SMS-BRServer

TACT/C-DISTServer

TOPSSServer

E-CRBServer

PassCertificateIssueServer

CRSIServer

MQSServer

MailServer

DNSServer

ProxyServer

ActiveDirectoryServer

AntiVirusServer

UpdateServer

PrintServer

FireWall/FileServer

otherssystem

Telephone

Fax

AirConditioner

Printer(OA)

Others

本事件管理范围不包括尚处于开发或测试环境的系统和应用引发的事件。

2.5流程执行原则

2.5.1常规原则

所有IT科事件管理范围内发生的事件,都由帮助台人员记录在服务管理平台中,记录的信息应足够详细,包括事件处理交互过程,详细的解决方案和相应的附件

所有IT支持人员对优先级为很紧要和紧要的事件所采取的服务恢复行动,在比对其它行动的时候,将拥有优先处理级别

应该定期产生每日和每月的事件管理报表。

对重复发生的事件和变通方法解决的事件,应该举行定期的事件管理会议对这些事件进行评估

应该半年对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进事件管理流程

2.5.2流程关联原则

和问题管理的关联

所有优先级为很紧要的事件在恢复服务后,都应该创建问题单(问题单必须和事件单建立关联)

一线支持在解决事件的过程中,可以通过问题记录查找相应的解决方案

和变更管理的关联

事件处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提交变更请求单(变更单必须和事件单建立关联),变更完成后,继续事件单的处理

很紧要事件(优先级为很紧要的事件,下同)的处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提出很紧要变更请求,变更完成后,补录很紧要变更单,并和很紧要事件单建立关联

和配置管理的关联

事件处理过程中,可以通过配置管理查询相关的配置项信息以及该配置项历史上发生的事件、问题或变更,来帮助故障的定位

事件处理过程中,如果可以将故障定位到某个配置项,则必须将事件单与该配置项关联

2.5.3所有权原则

所有权原则用来确保每个事件在任何时段都有适当的人员负责,帮助台是事件的负责人。

帮助台员工是事件单的责任人,必须确保事件得到有效跟踪与解决,并负责事件单的关闭

2.5.4再分派原则

事件的再分派原则是确保事件在服务目标时段内处理和解决的重要因素。

因此,应当尽量减少事件单再分派的几率。

事件单分配到个人,事件单的重分派次数不应该超过5次。

帮助台可以将事件单分配给帮助台/一线支持,如果找不到合适的帮助台/一线支持,可以直接分配到二线支持

帮助台/一线支持可以将事件单重新分配给帮助台,其他帮助台/一线支持人员,二线支持

二线支持可以将事件单重新分配给帮助台/一线支持

2.5.5重复事件原则

重复事件是指在一个较短时间段(通常30分钟内至1小时),由监控平台上报的同一个配置项上现象相同的事件或一人/多人申告的同一来源(系统、应用)现象相同的事件。

当被报告的事件与某个已经创建且尚未解决的事件单相同,则该事件被认为是重复的。

由于此时已创建的事件尚未解决,还没有采取修正措施来恢复服务,因此,新报告的事件被认为是原有事件单的重复事件单。

在原有事件单获得解决时,所有的重复事件单获得解决。

监控平台应该自动过滤重复告警,避免将重复的告警发送到服务管理平台

重复的事件信息必须被标识,并且不计入事件流程的关键衡量指标

如果帮助台/一线可以判断到重复事件,则由帮助台对重复事件标识,否则由二线支持人员负责重复事件的处理

2.5.6关闭原则

所有的事件单,关闭必须由帮助台完成,关闭之前需要与用户和IT科担当确认。

事件处理人员在解决完成事件时,根据实际解决情况填写事件的结束代码,采用临时措施恢复服务时,结束代码为“变通方法解决”。

帮助台负责和IT用户再次确认事件的解决。

由IT用户认可获得关闭的事件单的结束代码为“成功解决”关闭

已解决的事件单如果没有得到IT用户的认可,则首先关闭该事件单,结束代码修改为“不成功”,同时创建一个新的事件单重新分配到原处理人员继续处理

已关闭的事件单不允许重开。

如果事件重复发生,则创建一个新的事件单

2.5.7升级原则

制定升级原则的目的是确保事件在规定的解决时限内能够及时通知相关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。

优先级为很紧要的事件,帮助台应立即升级到相应二线支持,由二线支持再次确认,如果确认了优先级为很紧要,则立即升级到事件经理,并通知相应的管理层(通过服务管理平台),由事件经理启动很紧要事件处理流程

各支持人员应及时响应和处理分配到自己的事件单,如果超出规定的响应时限和解决时限,服务台系统应自动将事件信息通报事件经理,事件经理负责协调资源,并督促事件能够及时被响应和处理

帮助台/一线支持应及时将不能解决的事件升级到下一级,若未及时升级,事件经理应及时介入,负责协调升级处理

2.6流程相关定义

2.6.1事件信息项

事件单必须包含如下事件信息项:

序号

信息项(中文)

信息项(English)

说明

1

事件ID

ID

事件单流水号(系统自动产生)

2

事件编号

ISSUE_ID.

原有事件ID的更新

3

请求人信息

Requtesor

事件申报人的信息,包括:

姓名、总部/分公司、部门、电子邮件、办公电话、手机(手工填写)

4

登记时间

Registered

在帮助台生成事件记录的时间(系统自动产生)

5

地点

Location

事件发生的地点(手工填写)

6

事件发生时间

OccurrenTime

针对故障:

指的是业务中断的实际时间(可能早于登记时间,需要手工填写)

针对其它:

缺省值等于登记时间

7

业务恢复时间

RecoveryTime

针对故障的业务恢复实际时间(手工填写)

8

事件性质

Category

参见“事件性质”定义

9

事件来源

Medium

参见“事件来源”定义

10

事件影响度

Impact

参见“事件影响度”定义

11

事件优先级

Priority

参见“事件优先级”定义

12

事件完成期限

Deadline

对应每一个事件优先级,系统根据流程相关定义中“事件解决时限”自动设定最终的完成期限(系统自动产生)

13

事件所属系统类型

System

参见“事件所属系统类型”定义

14

事件分类(原因定位)

Classification

参见“事件分类”定义

15

事件标题

Description

事件的简要描述(手工填写)

16

用户现象描述

Phenomenon

对于整个事件内容的详细描述(手工填写)

17

事件解决人

Solver

事件的最终解决人(手工填写)

18

事件状态

Status

参见“事件状态”定义

19

分配对象

Toperson

被分配的技术支持组和人员(手工填写)

20

事件日志

History

反映事件信息项的变化历史,如一个事件在处理过程中事件状态变化的时间点等信息(系统自动产生)

21

解决方案

Solution

事件解决方案的描述(手工填写)

22

事件结束代码

ClosureCode

参见“事件结束代码”定义

23

是否重复事件

RepeatTag

标记为重复事件(手工填写)

24

处理是否超时

OvertimeTag

参见“处理是否超时”定义(系统自动产生)

25

事件解决人角色

Solverrole

参见“事件解决人角色”定义

26

实际开始时间

ActualStart

记录事件状态到XX处理中的时间(系统自动产生)

27

实际完成时间

ActualFinish

记录事件已解决的时间(系统自动产生)

28

故障厂商

Faultfactory

记录故障厂商信息(手工填写)

29

关联配置项

Configuration

记录出现故障的配置项代码(手工填写)

30

审核描述

Approvaldescription

记录方案审批过程,同时把相关审批的手续(复印的签字文件或邮件等)

31

是否通过事件回顾产生

Incidentreviewtag

是否是过对已发生事件分析后重新创建的事件,布尔型,默认否

32

是否常见问题

FAQ

事件处理完毕后,是否形成完善的解决方案,布尔型,默认否

33

是否进行审核

SolutionApprovaltag

事件的变通方法或解决方案是否需要审核,布尔型,默认否

34

审核进度

Approvalscheduler

方案审核中不同级别的审核,包括:

IT担当审核、系长审核、科长审核、部长审核

35

审核状态

Approvalstatus

方案审核中的状态,包括:

审核提交、审核进行中、审核完毕

36

是否通过结果

Approvalresult

方案审核结果,通过或不通过

37

是否发送邮件

Mailenabledtag

事件是否按照定义的规则发送邮件,布尔型,默认是

38

是否补单

DelayOperationTag

事件单是事件处理完毕后填写的,布尔型,默认否

39

转发次数

Forwardednum

事件单在分配过程中,由于对事件原因不明确导致的转发次数,不得超过5次,第五次被分派的处理人员,不管事件是否是其管理范围,将最终负责该事件的处理

40

变通方法

Workaround

事件临时方案的描述(手工填写)

41

OtherSDNo.

OtherSDNo.

其他帮助台ID

42

代理厂商

Agencyfactory

记录代理厂商信息(手工填写)

43

是否影响业务

BusinessImpactedTag

是否影响业务(生产、销售、供应商)

44

现象分析

Phenomena

事件现象分析(手工填写)

45

原因详细描述

DetailReason

事件原因详细分析描述(手工填写)

46

表象

Presentation

事件外在表象(手工填写)

47

IT担当

ITpeopleof

事件归属的IT科担当

48

知识库编号

FAQNo.

知识库编号

49

知识库组

FAQGroup

知识库组

50

重复事件单号

RepeatISSUE_ID

记录之前重复的事件单号(手工填写)

51

服务工时

ServiceTime

处理人员处理事件实际花费时间(手工填写)

52

接收时间

ReceiveTime

帮助台/一线接收用户请求或其它方式事件的时间

2.6.2事件性质

根据骏网快车IT科的管理范围和和管理要求,定义如下五类事件:

编号

代码(中文)

代码(English)

描述

1

故障

Fault

指IT系统错误或反映IT系统部分或全部功能不能正常使用的报障;

监控管理平台上报的影响系统正常使用的告警

2

询问

Inquire

指对系统操作使用等方面的求助和询问

3

告警

Alarm

监控平台自动产生的没有影响到系统正常使用的告警,监控平台发送的严重告警、主要告警、一般告警等

4

需求

Requirement

电话安装、系统安装、功能需求等服务

5

维护

Maintenance

指运维人员的日常维护作业或临时进行的维护作业

2.6.3事件来源

事件来源代码用来标明事件的提出方式,事件来源可以包括以下几种:

编号

代码(中文)

代码(English)

描述

1

电话

Phone

用户通过电话告知,由帮助台手工录入(包括口头描述)

2

邮件

E-mail

用户通过邮件的方式发起,需要手工录入

3

监控系统

MonitoringSystem

由监控系统发现并产生的突发事件,可通过集成自动生成

4

日常检查

ProactiveChecking

IT科和二线维护人员,在日常检查中发现问题,需要手工录入

5

公文

Document

纸质文件、FAX和传达文书等

6

WEB

WEB

通过web界面提交的事件

2.6.4事件所属系统类型(以广州丰田为例)

根据目前骏网快车管理范围内的系统和分类定义事件所属系统类型,当事件发生时,应该由帮助台/一线支持初步定位是哪个系统及子类出现问题,由二线、三线进行进一步的明确。

对没有覆盖到的系统用”其它”表示。

类别

编码

系统(中文)

系统(English)

应用系统(ApplicationSystem)

P-01

P-SMS

P-SMS

P-02

PartsForecas

PartsForecast

P-03

NQC数据授受系统

NQCDATAReceivingSystem

P-04

GPPS

GPPS

P-05

G-ALC(HOST)

G-ALC(HOST)

P-05A

VSM

VSM

P-06

G-CONVERTER

G-CONVERTER

P-07

分散ALC

G-ALC_ES

P-09

内示表发行系统

UnofficialNotificationSystem

P-10

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 判决书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1