运维管理平台项目建议书文档格式.docx

上传人:b****6 文档编号:16016610 上传时间:2022-11-17 格式:DOCX 页数:12 大小:31.36KB
下载 相关 举报
运维管理平台项目建议书文档格式.docx_第1页
第1页 / 共12页
运维管理平台项目建议书文档格式.docx_第2页
第2页 / 共12页
运维管理平台项目建议书文档格式.docx_第3页
第3页 / 共12页
运维管理平台项目建议书文档格式.docx_第4页
第4页 / 共12页
运维管理平台项目建议书文档格式.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

运维管理平台项目建议书文档格式.docx

《运维管理平台项目建议书文档格式.docx》由会员分享,可在线阅读,更多相关《运维管理平台项目建议书文档格式.docx(12页珍藏版)》请在冰豆网上搜索。

运维管理平台项目建议书文档格式.docx

如何建立配套的信息系统运营管理体系,提高信息系统运营质量和技术服务水平,有效地控制管理信息系统运营成本,确保大集中的信息系统安全、稳定、可靠、高效地运行,使得有限的信息系统资源最有效地用在核心业务的发展上,已成为当前商业信息化建设过程中亟待解决的重要矛盾之一。

(一)信息化建设现状与存在的运营管理风险

信息系统作为XXXX商业生产经营的支撑平台,其中任何相关信息技术环节出问题都将直接导致业务失败,生产率降低,影响市场占有率、客户满意度、销售收入和快速反应能力,甚至导致公司经营管理瘫痪。

因此,信息系统运营管理水平的高低直接影响到公司战略能否顺利实施。

然而,在信息系统运营管理体系的配套建设上,我们尚未建立起以业务视角为主线、以流程管理为导向的服务性的信息系统运营管理体系,仍处于以技术管理为导向的运营管理阶段。

在当前运营管理模式下,信息系统运行风险主要体现为:

1.缺乏预警监控手段,突发事故难以减少

我省XXXX大集中信息系统建成后,信息系统规模日益庞大、技术日趋复杂、系统间耦合程度不断提高、系统性能健康监控指标数量空前增长,现阶段需监控的设备达XX余台套、服务类别达XX余类、关键性能监控指标达XX余项。

由于缺少专业的系统监控工具,现行的手工方式不能及时全面地监控到信息系统运行状态,也无法预警潜在的隐患,不能采取有效的事故预防手段,导致突发事故,造成业务中断。

信息系统技术服务处于被动的“救火式”服务状态。

2.缺乏故障定位手段,修复时长难以缩短

信息系统瘫痪达4小时以上为重大安全事故。

目前,当信息系统出现故障时,技术人员需要对XX余台套设备和XX余类服务类别,以及XX余项系统关键性能指标进行逐一的手工排查,故障排除效率低下,不能及时准确定位故障源。

由于缺少专业的故障排查工具的技术支持,不能在较短的时间内定位故障源,即便是面对普通的系统故障,技术人员都很难确保在4小时内准确定位故障源,从而争取不到更多的故障处理时间,导致信息系统故障恢复时间不可控。

3.缺乏知识管理手段,排障效率难以提高

缺乏规范的故障处理和系统维护记录流程与工具,手工维护记录分散,不便于实现痕迹化管理,没有形成运营管理维护知识库。

在处理故障时,缺少明细的系统历史维护信息,从而不能借鉴过往的处理经验,导致重复劳动且故障处理效率不高。

4.缺乏变更管理手段,违规操作难以避免

通过对信息系统故障的事后统计分析表明:

其中百分之六十的系统故障是由技术原因(例如硬件故障、操作系统崩溃、应用软件自身漏洞等)造成,而剩余百分之四十的系统故障都是由各种人为失误因素造成。

在各种人为失误因素当中,不规范的系统变更操作又占其中的百分之八十左右。

由于缺少流程化的业务管理工具,对信息系统的变更、故障、事件、应急响应等重大事件,不能按照科学合理的审批程序实施流程化的监控和管理,有时会造成解决了老的问题又引发了新的问题,导致信息系统变更操作不当造成的信息系统事故增多。

5.缺乏资产管理手段,运营成本难以降低

信息资产包括软件、硬件、网络设备、外部设备以及信息资源等。

由于缺少有效的信息资产管理工具支持,导致对信息资产的申请、采购、接受、库存、部署、监控、支持、转移、废弃,以及软件版权许可、采购合同期限、售后技术服务、系统配置参数等管理缺乏有效性,信息资产管理数据和维护记录没有历史积累,信息资产运营维护成本不能有效统计和控制,系统配置参数无标准管理基线,不能为信息系统运营业务的宏观管理提供决策支持数据,运营成本无从管理。

6.缺乏服务台管理功能,用户满意度难以提升

由于服务台功能的缺失,导致信息系统运营服务水平和质量不高。

具体表现为:

信息系统用户遇到信息故障时不知道该由谁来处理故障;

问题上报到经济信息中心后,由于没有统一的工单派发、处理和流转过程管理,导致技术处理人员内部协作不畅,发生相互推诿扯皮,故障处理效率低下,外部技术协作困难,往往是服务要求与响应不统一、不规范、不到位。

7.缺乏运营管理体系,过程改进难以持续

由于没有信息系统服务管理体系,在服务过程中,缺乏问题库的建设,没有知识沉淀,每次出现事故往往都是紧急修复,没有体系化的问题管理流程,很多事件的出现都不能做到从根本上解决问题,导致运营管理过程的持续改进难以进行。

同时,信息系统问题的解决都是依靠“个人能力”,一旦某一个人离开,就会造成某一个环节的缺失,影响整个系统的稳定性,形成对某个人而不是对一个服务体系的依赖。

(二)项目建设必要性

遵循信息技术服务管理国际标准ISO20000,科学设计信息系统运营管理流程和全省信息系统运营管理人员绩效考核指标,建设信息系统运营管理体系与平台,能够有效解决信息系统大集中部署后面临的上述突出问题,规避运营管理中存在的大部分风险。

1.采用自动预警监控工具,有效预防突发事故发生

通过安装部署专业的系统运行状态监控工具,预设告警阀值,自动采集信息系统运行状态,在系统运行状态超过预设阀值时,按照事先定义的流程,系统自动生成告警手机短信、告警邮件、事件处理工单等,及时通知相关系统管理员,尽量在事故的萌芽阶段消除事故隐患,降低突发事件的发生次数,降低业务中断时间。

2.采用专业故障排查工具,有效缩短修复时长

通过安装部署专业的故障排查工具,收集所有的系统告警信息,对告警信息进行汇总、关联度分析、压缩、集中等处理,自动定位故障源,提高系统管理员故障排查效率,减少系统恢复时间。

3.规范运维知识管理流程,有效提高排障效率

通过规范故障处理和系统维护记录流程,提供电字化记录手段,实现运维工作痕迹化管理,形成系统历史维护信息和相关知识库。

系统管理员在进行故障处理时,可以查询历史维护记录,手动查询或自动关联引用知识库,提高故障分析处理效率。

4.规范系统变更管理流程,有效避免违规操作

通过规范信息系统变更的风险评估、审批及操作等流程,实施流程化的监控和管理,最大限度减少由于操作不当引起的系统事故。

5.规范信息资产管理流程,有效降低运营成本

通过安装部署信息资产管理工具,对信息资产的申请、采购、接受、库存、部署、监控、支持、转移、废弃,以及软件版权许可、采购合同期限、售后技术服务、系统配置参数等实现有效管理,积累信息资产管理数据,为信息系统运营业务的宏观管理提供决策支持,逐步实现信息系统运营成本可视化管理,降低运营成本。

6.规范用户服务管理流程,有效提升用户满意度

通过规范服务台的建设,建立经济信息中心对外服务的单一联系点,统一接受来自信息系统用户的投诉或故障申告,同时统一接收来自系统监控软件的告警事件。

服务台将根据事件关键字自动受理并下派工单,或由服务台工作人员人工受理后下派工单。

服务台负责事件的受理直至关闭,全程执行闭环的监控管理。

服务台根据各类事件的服务级别和服务标准,在相应的时间要求内进行催办提示、超时转单等。

通过信息系统运营目标管理和科学的绩效考核管理,有效激励信息系统运营管理人员的工作积极性,严格执行服务标准,提高服务质量,提升全省信息系统用户满意度。

7.逐步完善运营管理体系,持续改进管理过程

通过运营管理体系的建设,从业务、管理、技术、人员等多纬度实行体系化管理,规范知识库的建设,培养更多具备专业能力的人员,消除人员使用上存在单点故障带来的隐患,力争将信息系统运营管理工作由“人治”改变为“法治”,使运营管理工作系统化及制度化。

制定关键绩效指标来发现需要改进的地方,并结合运营管理制度来执行和控制这些改进,完善信息系统“持续优化”管理过程,提升XXXX信息系统运营管理服务水平。

建设信息系统运营管理体系与平台,是XXXX商业信息化发展的客观要求和必然选择,也是XXXX商业信息化建设重点工程项目之一。

二.项目建设的主要内容

(一)指导思想

提高系统运营质量和技术服务水平,有效地控制管理运营成本,确保大集中的信息系统安全、稳定、可靠、高效地运行。

(二)建设原则

“以需求为导向、以应用促发展,安全为先、实用为本,统一规划,分步实施。

(三)建设目标

1.总体目标

遵循信息技术服务管理国际标准ISO20000,建立信息系统运营管理体系,通过管理平台的软件系统开发建设,固化和规范相关运营管理平台流程,完善信息系统运营内控管理机制,对信息系统运营进行成本可视化管理,提升信息系统运营管理绩效和管理水平。

2.分阶段目标

第一阶段(年月日-年月日):

重点实施服务台、资产(含配置)管理、事件管理、变更与发布管理、问题与知识库管理、服务级别管理等的流程设计、软件开发、系统部署,建设配套管理体系,主动管理故障,完善内部管控并形成改善机制。

实现平均服务响应时间由现在的1小时提升至30分钟,系统平均故障间隔时间(MTBF)由现在的120小时提升至300小时,一般系统故障平均恢复时间由现在的8小时提升至4小时。

第二阶段(年月日-年月日):

重点实施可用性管理、连续性管理、财务管理、容量管理等的流程设计、软件开发、系统部署,建设配套管理体系,对运营成本进行可视化管理。

实现平均服务响应时间由30分钟提升至10分钟,系统平均故障间隔时间(MTBF)由现在的300小时提升至500小时,一般系统故障平均恢复时间由现在的4小时提升至2小时。

(四)项目建设内容

1.建设信息系统运营管理体系

通过管理咨询,设定信息系统可用性目标,评估信息系统系统架构风险和信息系统运维管理缺陷,提交评估报告,设计信息系统运营管理流程、全省信息系统运营监控指标体系、全省信息系统运营管理人员绩效考核指标。

遵循IT服务管理国际标准ISO20000,建立与管理平台相适应的信息系统运营管理制度,制订相应的信息系统运营管理手册、程序文件、作业文件、记录文件和绩效考核文件等。

(1)信息系统运营现状评估

网络资源评估

收集网络设备配置文件,使用网络仿真工具,建立虚拟的和切实有效的网络模型,对现有网络设备配置进行分析并给出错误/警告/提醒等信息,提交网络资源评估报告和网络优化方案。

系统安全评估

对信息系统进行安全设计检查,包括防病毒,防火墙,网络安全,专区、访问控制,验证,审计和加密等,通过检查现有IT基础设施在已知威胁方面存在的设计和实施漏洞,按照最佳实践和监管要求检查现有信息系统基础设施的设计与实施,针对基础设施安全存在的缺陷,提交系统安全评估报告,并根据关键应用的应用数据流和服务器及客户端所分布的位置,制定网络安全域的规划及对应的网络功能分区,明晰网络域之间的逻辑安全边界,定制相应边界安全策略和实现方法。

应用系统评估

A、应用系统性能评估

建立XXXX商业信息系统端到端网络跟踪数据的收集环境,建立用于数据收集的应用交易脚本程序,分析收集到的网络跟踪数据包括响应时间、应用的字节数量、响应往返次数和吞吐量等,评估端到端应用交易的性能、数据吞吐量和连通性。

根据评估结果,确定性能瓶颈的具体位置(服务器、网络或应用程序),提交应用系统性能评估,包括采集分析的结果和建议。

B、应用利用率评估

在应用数据流量必经的路径上部署一个网络探针,通过采集应用服务器端到远程客户端之间的网络数据流量,获取应用的网络流量百分比,确定应用的网络带宽占用情况,细分应用数据包的大小、应用的利用率和响应时间,建立应用带宽使用基线,提交应用利用率评估报告,报告包括各种评测结果和建议。

计算与存储资源评估

制定信息系统负载压力测试计划与实施步骤,采用QALoad、LoadRunner等先进的测试工具,并综合运用参数池、事务、集合点、动态关联等技术,对信息系统进行并发性能测试、疲劳强度测试和大数据量测试。

重点分析I/O过载、内存不足、数据库资源匮乏、网络速度低、应用程序架构存在缺陷,软硬件配置不恰当等问题产生根源

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 面试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1