ImageVerifierCode 换一换
格式:DOCX , 页数:104 ,大小:4.44MB ,
资源ID:22523977      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/22523977.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(云计算运维管理体系方案设计Word格式.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

云计算运维管理体系方案设计Word格式.docx

1、根据PDCA指导思想结合数据中心现状,我方将运维服务体系建设及平台实施划分为五个阶段:IT战略阶段、管理体系设计、整理数据模型、工具实施、运行与改进阶段。第一步是IT战略阶段IT战略阶段的任务是帮助管理层设定实施ITIL的整体战略,明确管理层对于运维服务管理的承诺。在IT战略阶段,通过现状评估、差距分析、目标确立等活动,明确管理目标建设的优先等级。IT战略阶段的目标: 通过现状评估全面了解IT运维服务管理流程和活动的成熟度,并以ITIL作为近期服务改进的目标,分析、评估运维服务管理现状以及与最佳实践的差距,同时提出改进建议。 帮助企业运维部门全面认识现有运维服务管理水平,并作为项目下阶段规划与

2、设计双方交流的基础。第二步管理体系设计:明确IT战略之后,需要对组织的管理体系进行梳理和改进。管理体系阶段主要包括以下内容: 组织架构分析 明确岗位职责 规范管理制度 运维流程设计 考核体系第三步整理数据模型:数据模型阶段分为以下三个步骤:1. 模型建立H3C 为客户提供基于长期实践经验得出的数据模型工具帮助客户梳理流程及数据,并将流程及数据固化到系统中。2. 数据采集基于前期阶段顾问咨询的成果,按照数据模型的标准格式,转换成可被统计、量化并被系统识别的数据。3. 数据整理整理优化数据,通过手工流程检验数据的合理性和可操作性。第四步工具实施:工具实施阶段分为以下五个步骤:1. 系统配置及部署完

3、成运维管理产品的部署,管理资源、组织、人员、权限录入,监控告警策略设置,接口集成等。2. 流程导入将已构建的运维管理流程导入到运维管理系统中,实现各个流程在系统平台中的落地。3. 系统测试在测试环境中检验系统及数据的可操作性,并进行适当的调整。4. 工具培训产品操作培训,确保使用人员熟练掌握工具,并可自行配置和调整。5. 系统上线运维管理系统正式部署上线,支持业务运行。第五步运行与改进:IT运营阶段将全新的H3C运维管理解决方案集成到数据中心IT架构中,并提供日常的运行、监视、维护和管理服务。该阶段包括以下内容:评估与改进:监视、评估H3C服务管理平台的运行情况。将信息反馈回评估小组,以进行持

4、续改进。它包括: 评估已交付的服务是否实现了预期价值; 识别哪方面的要求发生了变化。运维服务管理体系的建立并不能只实施一次就实现所有运维服务管理建设的目标,它只是企业在建设符合ITIL规范的IT服务管理系统的诸多循环中的一次过程。配合以不断的项目回顾和持续改进,才能使得企业的IT服务管理不断的向设定的目标远景靠近。1.3 运维管理体系设计示例需根据对数据中心现状调研与差距分析的结果,结合数据中心已有流程,针对ISO20000/ITIL要求,结合数据中心实际情况建设符合数据中心的IT服务管理体系。我们将为数据中心设计管理流程与策略(包括流程策略、流程图、流程活动描述、流程输入与输出、角色与职责、

5、流程KPI等)、定义相关代码(如优先级的定义、升级定义、角色职责定义等)、制定相关模板(如事件记录单模板、事件请求单模板、重大事故报告模板)。本部分以事件管理、问题管理、变更&变更管理三个流程举例说明实施中的关键点,如:流程设计、角色划分、角色职责等。 事件管理 目的:规范事件与服务请求管理流程的相关策略及活动,确保事件与服务请求管理流程的执行质量和执行有效性。 术语和定义:事件和服务请求:事件和服务请求管理流程的目的是尽快解决事件或服务请求与恢复服务。事件和服务请求记录的信息决定了其它许多流程的效率。重大事件:影响度为一级和二级的事件为重大事件。影响度:表明事件对服务所产生的业务影响,它是事

6、件的处理优先级的一个重要影响因素。临时措施:是解决事件的临时修复方法或技术,目的是使用替代措施暂时消除用户对服务的依赖和减少事件对用户的影响,该事件的永久解决措施有赖于对该事件潜在问题的最终解决。通过临时措施,用户能够在没有中断的情况下继续使用服务。临时措施通常会使用户的工作方式发生变化,比如从使用另一台PC、使用早期版本的软件、或临时提供更多的磁盘空间。 角色职责:事件和服务请求经理:协调事件管理的日常操作确定和执行流程本身的变更鉴别流程执行过程中的例外和异常情况, 进行管理传达流程的新政策和更新的政策(Policy)确保流程标准和步骤得到遵循作出资源的承诺和分配鉴别和实施流程的改进建议创建

7、和分派流程管理的报表对事件管理流程的负责人提出鉴别问题/改进的建议作为流程的集中联络点,负责与用户、服务供应商、管理层之间的沟通对于不遵守流程的情形进行受理 确保对于严重等级为1的事件进行事后回顾主持事件回顾会议 在需要的时候,按照升级政策的途径进行升级对不遵从事件管理流程的参与者作出通告 执行日常的流程管理出席会议并传达和协调有关事件和问题确保日常操作中所采集信息的完整性管理所有事件管理的模板和报表准备和分析报表管理资源的分配确保每个事件都被分派给适当的人员,并在服务水平或其他服务协议规定的时间范围内进行受理 监控尚未关闭的事件故障单: 关联类似的事件、确定超时的事件、对于未在规定时间内受理

8、的、并且分派错误的事件进行重新分配、负责受理事件受理员升级报告的事件、鉴别需要特别注意和需要升级的事件。事件和服务请求记录员:接受用户的联系 收集基本的联系信息收集用户的请求信息分析请求信息 创建或者更新事件和服务请求单 验证用户的基本信息,如有需要,更新用户的资料鉴别请求的种类 (例如:被动运维服务请求,应用提升类服务请求等)对不同的请求,收集适当的信息初步评估请求的严重等级 请求的初步受理 确定适当的分派 (包括:在适用的情况下,对现有的问题或者是请求作出连接)若用户要求了解事件状态,则将事件的当前状况通知用户 更新和关闭事件和服务请求单事件和服务请求受理员:决定恢复服务所需要的必要条件,

9、并启动适当的行动 ,这些行动包括:创建变通方法确定事件执行变通方法,如果可行执行解决方案,如果可行在流程工具平台更新事件的解决方法更新事件关闭的信息根据事件的严重等级提供有效的解决方案 安装/执行事件的永久解决方案确定可以作为知识库候选对象的事件如有需要,与第三方和其他小组人员协同合作 角色映射事件管理流程中定义的角色对应的数据中心人员事件和服务请求经理事件和服务请求事件记录员事件和服务请求事件受理员 流程描述此流程描述为示例,实施中需要根据实际和ITIL最佳实践做出调整。 流程图概览图事件和服务请求的识别与记录事件和服务请求的初步支持和分派事件和服务请求调查和诊断事件和服务请求解决和恢复事件

10、和服务请求的关闭主要活动说明活动序号活动名称详细描述相关表单1事件和服务请求识别和记录 鉴别用户 验证用户信息(必要时进行更新) 鉴别并记录事件和服务请求表现症状事件和服务请求单2事件和服务请求分派和初步支持 鉴别所影响的部件和服务 初判严重等级和类别等 与已知的变通方法或解决方案进行匹配 事件和服务请求的初步处理支持 将无法解决的事件和服务请求分配给事件和服务请求处理员,以获得进一步的分析解决3事件和服务请求调查与诊断 查找相似的表现症状 查找变通方法 需要的话,准备进行根源分析,进入问题管理流程4事件和服务请求解决与恢复 执行变通方法(需要的话使用变更管理流程) 若成功,验证变通方法结果5

11、事件和服务请求关闭 目前集中由事件和服务请求经理统一关闭 关闭时须与用户验证结果,征求用户同意关闭事件或服务请求 根据知识库决定是否需要进行后续操作 关闭事件和服务请求,设定适当的关闭代码 流程间的关系 相关数据事件分类:分类级别采用三级分类方式,即类别、子类、项目。优先级:事件或服务请求优先级也可理解为处理事件或服务请求的优先顺序优先级由影响度和紧急度两个因素决定优先级在事件、服务请求的生命周期中是可以改变的。关于更改事件单或服务请求单优先级的原因和行为应该在事件单或服务请求单中记录。 优先级的准确评定需要不断地回顾事件、服务请求,从而优化事件、服务请求/问题的分类和设定准确的优先级。为了避

12、免一线人员缺乏经验无法判断优先级。我们需要工程师在现有事件和服务请求分类的基础上,基于事件和服务请求优先级的设定原则,设置默认的优先级,并在将来的工作中逐步优化。影响度定义1极高关键业务系统的全局性故障基础架构的全局性故障2高关键业务系统和基础架构的局部故障普通应用系统的全局故障3-中普通应用系统的局部故障影响关键用户或多个普通用户4低单点故障影响普通用户紧急度 客户接受的可耽搁时间:2小时需解决4小时需解决8小时需解决4-低无时限规定优先级极高高中低紧急度请求来源:事件和服务请求来源描述电子邮件 通过电子邮件收到一个请求;电话 通过电话收到一个请求;Web 通过Web提交的请求;巡检和监控

13、通过巡捡和系统监控工具主动监控得到的请求;内部通讯软件 内部及时通讯服务方式:事件和服务请求服务方式 通过电话支持提供服务;远程 远程诊断和解决提供服务;现场 现场工程师现场处理服务;状态代码:事件和服务请求状态代码待处理 一个事件或服务请求被记录或创建;已分派 一个事件或服务请求已被分派给二线支持人员或事件和服务请求经理;处理中 任何一个支持人员或第三方(供应商)接受了事件或服务请求并开始处理;挂起事件或服务请求信息不完整,或在某些情况下阻止事件或服务请求处理员对事件或服务请求进行处理,等待的原因为: 需要客户提供更详细的信息 不能联系到用户人员 升级到供应商处理 采购定单的批准 不可抗拒力

14、原因已完成 为一个事件或服务请求找到解决方案或变通方法;已关闭 事件或服务请求经用户确认已关闭 ;考核指标:衡量指标指标计算说明事件或服务请求总数 数量:在事件单或服务请求单中根据以下条件过滤 1.【重复事件或服务请求标记】为空 2.【事件或服务请求发生时间】在统计周期内 事件或服务请求关闭的数量/比率 数量 :在事件或服务请求总数中过滤【事件或服务请求状态】关闭 比率:数量 / 事件或服务请求总数 100 % 事件或服务请求成功关闭的数量/比率 在事件或服务请求总数中过滤【事件或服务请求结束代码】成功解决or变通方法解决 用户反馈超时关闭的数量/比率 在事件或服务请求总数中过滤【事件或服务请

15、求结束代码】反馈超时关闭超时解决的事件或服务请求数量/比率 在事件或服务请求总数中过滤【解决是否超时】超时and 【事件或服务请求结束代码】成功解决or变通方法解决 数量/事件或服务请求总数 6超时分配的事件或服务请求数量/比率 在事件或服务请求总数中过滤【分配是否超时】超时and 【事件或服务请求结束代码】成功解决or变通方法解决7服务台及时解决率 在事件或服务请求总数中过滤所有【解决是否超时】未超时and【事件或服务请求解决人角色】服务台工程师 8二线及时解决率在事件或服务请求总数中过滤所有【解决是否超时】未超时and【事件或服务请求解决人角色】二线工程师 9平均解决时间完成的事件或服务请

16、求:在事件或服务请求总数中过滤所有【事件或服务请求状态】已解决or 已关闭的事件或服务请求 平均解决时间:累加完成事件或服务请求的(【事件或服务请求解决时间】【事件或服务请求登记时间】)/ 完成的事件或服务请求数量 10服务台解决率在事件或服务请求总数中过滤所有【事件或服务请求分配次数】0 11二线解决率在事件或服务请求总数中过滤所有【事或服务请求件解决人角色】二线工程师 12用户满意度所有事件或服务请求记录中【用户满意度】分值总计 / 事件或服务请求总数 问题管理 目的规范问题管理流程的相关策略及活动,确保问题管理流程的执行质量和执行有效性。 术语和定义问题:表示引起一个或多个现存或潜在事件

17、的深层根源。已知错误:是指问题经过诊断分析后找到其产生的根源后所处的状态(Known Errors)。问题管理:是负责管理问题所有生命周期的流程,包括诊断故障根本原因和确定这些问题解决办法的活动。还要确保通过合适的控制过程实施解决办法,特别是变更管理和发布管理。规避措施:通过规避措施,用户能够在没有中断的情况下继续使用服务。规避措施通常会使用户的工作方式发生变化,比如从使用另一台PC、使用早期版本的软件、或临时提供更多的磁盘空间。 角色职责问题经理协调问题管理流程的日常操作 对问题的有效性进行判断确保问题分派给问题分析专家确保问题分析专家在其管辖范围内的可用性和能力问题实施结果的评审与确认 问

18、题提交人记录问题基本信息并将其与相应事件、CI进行关联将问题归类,初步设定其优先级将问题提交给问题经理与问题经理共同确认问题实施结果 问题分析专家进行深入的问题分析,以找出根本原因,并提供解决方案问题实施人实施问题解决方案,如有需要,提起变更 记录问题实施结果,提请问题经理确认问题管理流程中定义的角色1.1拟似问题信息收集并初步分类 收集相关事件信息 关联事件和配置 初步将问题进行分类事件和服务请求单;问题工单1.2问题单提交 问题提交人将生成的工单流转到问题经理1.3是否为问题 问题经理根据问题定义判定问题如果是则转入1.4,否则注明原因,关闭问题单1.4确认问题单分类并排定优先级 问题经理

19、对问题分类、优先级进行确认1.5问题单分派 根据问题类别将问题工单分派给相应问题分析专家2.1调查并诊断 根据知识库排查故障判定是否为已知问题 根据相关联配置项、历史事件排查问题根本原因 制定解决方案/规避措施2.2是否挂起 无法找到解决方案则挂起 解决方案无法实施则挂起 需要供应商操作则挂起 其他情况转入1.112.3 由问题经理将问题工单挂起2.4评审会议 定期召开会议评审目前挂起问题工单处理方式2.5是否关闭问题 当评审会议上问题分析专家一致决定无需解决的问题关闭 评审会议决定强制关闭 其他情况转入1.62.6给出解决方案/规避措施 问题分析专家给出问题的相关解决方案或规避措施2.7评审

20、并分派 问题经理确认方案可行性 分派给相关问题实施人2.8实施方案 根据解决方案进行相关实施活动2.9是否需要变更 判定实施活动是否触发变更流程,如果触发则进入变更流程,如果不触发则转入1.152.10解决问题 变更流程关闭 解决方案活动完成3.1评审 对问题是否解决进行确认 评审解决方案的有效性3.2问题是否解决 最终判定问题是否解决,如解决则转入1.18,未解决则转入1.63.3更新知识库 将问题原因、解决方案/规避措施作为知识库更新的输入3.4关闭问题单 问题经理关闭问题单 流程间的关系 问题分类 优先级由影响度和紧急度两个因素决定 优先级在问题管理的生命周期中是可以改变的。关于更改问题单优先级的原因和行为应该由问题经理进行操作。 关键业务系统

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1