02ITIL 重大事件管理流程详细设计方案Word格式.docx
《02ITIL 重大事件管理流程详细设计方案Word格式.docx》由会员分享,可在线阅读,更多相关《02ITIL 重大事件管理流程详细设计方案Word格式.docx(27页珍藏版)》请在冰豆网上搜索。
![02ITIL 重大事件管理流程详细设计方案Word格式.docx](https://file1.bdocx.com/fileroot1/2022-12/1/222eeeae-a06b-45a6-9044-a78d2e5e226a/222eeeae-a06b-45a6-9044-a78d2e5e226a1.gif)
✧应急小组成员当确认为重大事件时,必须立刻根据当时故障定位情况电话通知本小组负责人。
✧接受各小组负责人的安排。
✧及时根据重大事件当值决策人的决策实施恢复行动。
✧应急小组成员由各小组负责人指定,并根据附件4的格式提交小组成员通讯录。
✧详细记录处理过程
2.3.3流程监督员职责
✧负责督促整个流程的实施。
在每个关键时间点到达时提醒并监督各小组负责人处理重大事件,流程监督员负责将以上处理过程在《重大事件改进措施跟踪表》中进行记录并跟进改进措施的执行情况。
重大事件的最终当值决策人负责提供相关信息及资料。
2.3.4故障分析报告邮件发送组
✧知晓重大事件解决过程,各处理记录,原因分析,改善措施。
2.3.5实际岗位与方案角色的映射
重大事件流程
角色
角色细分
说明
成员
通知组
监控小组成员
职责:
及时处理监控报警信息,诊断错误,及时反馈进展信息,如遇重大问题及时通知应急小组成员。
处理记录组
应急小组成员
应急小组成员当确认为重大事件时,必须立刻根据当时故障定位情况电话通知本小组负责人。
接受各小组负责人的安排。
及时根据重大事件当值决策人的决策实施恢复行动。
严格遵守本流程制定的所有规则。
应急小组成员由各小组负责人指定,并根据附件4的格式提交小组成员通讯录。
原因分析组
分析重大事件发生的原因,及分析处理过程
改进措施组
流程监督员
负责督促整个流程的实施。
在每个关键时间点到达时提醒并监督各小组负责人启动升级机制,流程监督员负责将以上处理过程在《重大事件改进措施跟踪表》中进行记录并跟进改进措施的执行情况。
当值决策人
当值决策人组
提供决策
故障分析报告邮件发送组
知晓重大事件解决过程,各处理记录,原因分析,改善措施
2.4流程执行原则
2.4.1常规原则
❑所有IT和信息技术中心重大事件范围内发生的事件,都应该记录在IT服务管理平台中,记录的信息应足够详细,包括事件处理交互过程,详细的解决方案和相应的附件
❑应该每月产生重大事件报表,并对重复发生的事件和变通方法解决的事件,应该举行定期的重大事件会议对这些事件进行评估
❑应该半年对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进重大事件流程
2.4.2流程关联原则
❑和问题管理的关联
Ø
所有严重的重大事件在恢复服务后,都应该由改进措施创建问题单(问题单必须和重大事件可建立关联)
支持人员在解决事件的过程中,可以通过问题记录查找相应的解决方案。
❑和变更管理的关联
重大事件处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提交变更请求单(变更单必须和事件单建立关联),变更完成后,继续事件单的处理。
❑和配置管理的关联
重大事件处理过程中,可以通过配置管理查询相关的配置项信息以及该配置项历史上发生的事件、问题或变更,来帮助故障的定位。
重大事件处理过程中,如果可以将故障定位到某个系统和相关的改进措施,改进措施创建问题工单,所创建的问题与重大事件相关联,如问题工单可以定位到某个配置项,则必须将问题工单与该配置项关联。
2.4.3所有权原则
所有权原则用来确保每个事件在任何时段都有适当的人员负责,服务台是事件的负责人。
❑由监控人员建的事件单,服务台员工是该事件的责任人,必须确保事件得到有效跟踪与解决,并负责处理相关联的问题工单。
2.4.4关闭原则
与重大事件所关联的所有问题工单都关闭后,系统自动关闭重大事件工单。
2.4.5人员岗位与角色落实原则
❑
2.4.6工单流转原则
当重大事件发生时,通知组启动重大事件工单,并填写邮件通知内容和选择好邮件发送人
并提交给相关处理记录人,处理记录人填写好处理过程后,因为可能有多个处理人,所以当所有人处理完成后,当提交给原因分析组后,提交时,系统发送重大事恢复通知,原因分析组分析重大事件发生的原因,并填写重大事件故障报告,填写完后,系统给故障分析报告邮件发送通知组发送重大事件故障分析报告邮件通知;
提交给改进措施跟踪组,改进措施跟踪组改进所有的处理记录,并查看所以有处理过程的完成情况是不是都为已完成,如果是则完成工单,工单完成后,根据改进措施关联问题工单,并把问题工单派发给改进措施的负责人,由重大事件改进措施所关联的问题工单都关闭以后,系统自动关闭重大事件工单。
2.5流程图设计
2.5.1重大事件流程图如下:
2.5.2步骤说明
步骤名称
责任人
600.1
启动重大事件
❑启动重大事件和给当值决策人发送邮件通知
600.2
处理并记录流程
❑记录自己的处理过程,处理完成时,提交给原因分析组,系统发送邮件给知通组建单选择好的通知对象
600.3
原因分析
❑分析重大事件发生的原因,系统发送故障分析报告
600.4
填写改进措施跟踪表
❑根据所有的处理说明填写改进措施
600.5
关闭
❑所有关联的问题工单都关闭后,重大事件工单自动关闭
2.6流程相关定义
2.6.1事件信息项
事件单必须包含如下事件信息项:
字段名
字段英文
类型
数据说明
必添
以下为建单人填写的字段
流水号
BaseSN
Character(254)
是
状态
BaseStatus
提交时间
BaseCreateDate
Date/Time
系统自动填写工单提交(保存)时间
登录名+
Requester_LoginName
系统自动填写当前登录用户的姓名
姓名
Requester_Name
电子邮件
Requester_Email
系统自动填写当前登录用户的电子邮件
办公电话
Requester_Phone
系统自动填写当前登录用户的办公电话
否
手机
Requester_Handset
系统自动填写当前登录用户的手机
公司
Requester_Company
系统自动填写当前登录用户的公司
分公司
Requester_Filiale
系统自动填写当前登录用户的分公司
部门
Requester_Department
系统自动填写当前登录用户的部门
获知来源
EventSource
监控,用户上报,用户上报/监控
发生系统
EventSourceSystem
手动写入
发生时间
EventStartTime
发生单位
EventCompany
各省公司
通知标题
BaseSummary
格式:
XX系统于XXXX年XX月XX日XX时间发生XX故障
故障描述
BaseDescrption
Character(2000)
手工填写
故障影响范围
EventDealRange
255
如果发生系统为逻辑集中系统,则“故障影响范围”下拉菜单显示“全国”“部分省”;
如果发生系统为非逻辑集中系统,则“故障影响范围”下拉菜单显示“全省”“部分地市”
故障影响程度
EventDealImpactLevel
254
全部功能/部分功能
受影响机构
EventImpactOrgan
根据“发生系统”判断,如果“发生系统”为逻辑集中系统则让建单人自己填写,如果为非逻辑集中系统则受影响机构默认为发生单位
受影响系统
EventImpactedSystem
默认为发生系统,但是可以多选
受影响功能
EventDealImpactLevelDesc
Character(500)
当‘故障影响程度’选项为‘部分功能’时,为必填
受影响用户
EventImpactUser
预计恢复时间
EventPlanRestoreEndTime
故障预处理过程
EventDealPlanProcess
系统自动填写
[故障预处理过程描述]
EventDealPlanDesc
故障处理过程
EventDealP
[故障处理过程描述]
EventDealPDesc
确认恢复方案
EventDealRestore
[确认恢复方案描述]
EventDealRestoreDesc
恢复操作
EventDealRestoreOP
[恢复操作描述]
EventDealRestoreOPDesc
故障影响总时长
EventDealLongTime
故障影响总时长=恢复时间-发生时间系统自动填写
故障影响可用时长
EventImpactWorkingTime
Real
故障影响可用的时长指故障时间内包含的发生单位营业时间。
说明:
如果是影响到全国的系统,则用总部的营业时间。
是否影响可用率
EventImpactUsed
是/否
引发类
EventAttractClass
手动选择
控制类
EventControlClass
是
是否变更引起
EventChangeCase
变更类型
EventChangeCategory
和变更工单的变更类型一样
变更描述
EventChangeDescrption
EventDealReasonDesc
开发方面
EventDealDevelopDesc
基础架构方面
EventDealStructureDesc
系统运维方面
EventDealKeepDesc
注:
以提供的模板为主
2.6.2重大事件获知来源(必填项)
重大事件来源用来标明事件的提出方式,重大事件来源可以包括以下几种:
编号
代码
描述
1
用户上报
来自于用户自己发现的重大事件
2
监控/用户上报
结合监控系统用户发现的重大事件
3
监控系统
来自于监控系统的重大事件
2.6.3重大事件受影响系统(必填项)
根据目前信息技术中心支撑的应用系统和二级分类的划分定义事件所属系统类型,当事件发生时,应该由服务台初步定位是哪个系统及二级分类出现问题,由一线进行进一步的明确。
受影响系统分类
子业务系统分类
简称
办公管理
IT服务管理系统
ITSM
综合办公系统
电子邮件系统
请填写简称
电子商务
网上招聘系统
管理决策
团体年金报表子系统
财务计算机管理系统
集团财务计算机管理系统
财务报表辅助系统
大中城市业绩考核分析系统
财务分析系统
基础率分析系统
精算系统
每日业务快报系统
统计信息系统
审计系统
核心运营
综合业务处理系统
集团综合业务处理系统
老业务处理系统
出单管理系统
档案影像管理系统
单证管理系统
打印管理系统
数据清理系统
团体年金核心业务处理系统
中介业务处理系统
统括业务处理系统
健康意外险系统
互联网销售系统
销售客服
团体年金大客户支持子系统
团体年金报价子系统
团体年金销售支持系统
个人代理人管理信息系统
讲师管理系统
会员管理系统
个人代理人营销支持系统
大客户支持系统
网络查询系统
呼叫中心系统
CALLCENTER
短信系统
SMS
其他
其他系统类
OTS
说明:
第一层为”其它”的话,分公司可以对其子类可以扩充并提交到总公司,由总公司统一协调配置
事件发生时的通告定义
2.6.4重大事件影响程度
事件影响度用于衡量事件所影响业务的严重程度。
严重程度通常通过事件所影响的人数、关键系统数以及服务故障所造成的损失来设定。
影响程度
全部功能
●影响所有功能
部分功能
●列出受影响系统关健功能
2.6.5重大事件原因分类(故障分类)标准
字段
下拉菜单
需求分析不完善
1.1
系统设计问题(架构设计、实现方案设计、安全方案设计问题)
1.2
关联系统分析/同步不正确或缺失
1.3
程序代码错误/代码执行效率问题
1.4
版本归并/移交错误
1.5
变更/实施/操作方案设计问题
1.6
对生产环境违规操作
1.7
对生产环境错误操作(未违反规范)
1.8
软硬件产品过期/故障/BUG
1.9
软硬件产品容量/配置不合理
1.10
软硬件产品、网络或备份机制导致HA失效
1.11
软硬件产品、网络导致的单点故障
1.12
病毒
1.13
原因未明
1.14
方案评审缺失/不完善
2.1
新功能测试不到位
2.2
回归测试不到位
2.3
压力/性能测试不到位
2.4
系统运维设计问题(容错缺失/不完善、运维需求实现问题)
2.5
监控设计不充分或缺失
2.6
申请/请求处理跟踪不及时或告警提醒事项未及时处理跟进
2.7
变更后检查环节缺失/检查方式不完善
2.8
未按规范组织验证/未执行可用性验证
2.9
软硬件产品HA缺失
2.10
变更前风险评估不足
2.11
已知错误未及时规避(导致再次发生)
2.12
规范不完善
2.13
未按规范执行/规范执行不力
2.14
病毒防范不足/安全防范不足
2.15
2.6.6是否影响可用率
发生重大事件后,系统用不了
发生重大事件后,系统还可以正常工作
2.6.7影响范围
影响范围
整体影响不可用
发生重大事件后,影响很大整体都用不了
部分影响不可用
发生重大事件后,只是影响一部分
2.6.8是否变更引起
2.6.9变更类型
标准变更
紧急变更
重大变更
2.6.10数据模型
2.6.10.1字段菜单配置表
ConfigEventID
Character(15)
本记录的唯一标识,创建是自动形成,无业务含义
ConfigEventName
工单类别名称
ConfigEventSchama
工单Form名
ConfigEventTpye
工单配置类别
ConfigEventTier0
菜单类型
ConfigEventTier1
菜单一级分类
ConfigEventTier2
菜单二级分类
ConfigEventMenuDisplay
菜单显示名
EventMenuSort
菜单排序值
2.6.10.2改进措施跟踪表
重大事件编号
ConfigEventImpactedSystem
ConfigEventStartTime
起始时间
ConfigEventEndTime
结束时间
ConfigEventLongTime
影响时长
ConfigEventDescription
事件描述
ConfigEventMeasures
改进措施
ConfigEventResponsible
ConfigEventHelper
协助人员
ConfigEventPlanEndTime
计划完成时间
ConfigEventFactEndTime
实际完成时间
ConfigEventFinishStatus
完成情况
ConfigEventFinishStep
完成关键步骤
ConfigEventRemarks
备注
ConfigEventMeasuresID
改进措施编号
2.6.10.3通知对象后台表
ConfigNoticeID
通知编号
ConfigNoticeStartTime
重大事件开始时间
ConfigNoticeDescription
重大事件描述
ConfigNoticeRange
通知范围
ConfigNoticePlanEndTime
ConfigNoticeDetail
具体咨询请联络
ConfigNoticeObject
Char