电子政务办IT系统运维服务解决方案最全.docx
《电子政务办IT系统运维服务解决方案最全.docx》由会员分享,可在线阅读,更多相关《电子政务办IT系统运维服务解决方案最全.docx(29页珍藏版)》请在冰豆网上搜索。
电子政务办IT系统运维服务解决方案最全
XXXX有限公司
—IT系统运维服务解决方案
四川XX科技有限公司
2015年4月
概述
随着XX市政府信息化工作重点已经从基础设施建设向深化应用逐步转移,信息技术应用与业务之间已形成良性互动发展的趋势。
XX市政府服务平台信息化系统建设,具有特别的重要性和特殊性,尤其以行政权力系统为核心,扩展到相应的关键业务子系统及集成项目,其运行环境多系统、多数据库、多应用平台、多厂商网络及系统设备,多业务应用等复杂的管理环境。
在此背景下,市信息办信息系统的运行维护和建设对比,已经变得同等重要,信息系统建设后的有效应用更依赖于高质量的IT运行维护服务。
因各应用系统的维护难度和专业度的不断加深,目前现有的传统维护方式已经无法满足信息应用系统的维护需求,如何提高信息化应用系统的持续可用时间,从而有效提高业务部门的工作效率,已经成为越来越迫切需要解决的问题。
XXXX公司作为专业的软、硬件系统建设厂家,为政府信息化系统提供了具有针对性和科学性的运行维护服务解决方案。
市信息办IT系统运行现状
运行的系统及设施
非正常或不稳定运行系统
1.系统名称:
2.运行情况:
3.系统名称:
4.运行情况:
目前系统维护现状和存在的问题
1.系统厂家多,售后服务分散,容易形成技术孤岛,造成资源浪费。
2.各系统厂家遇到系统边界线问题时,相互推卸责任,影响系统整体运行效果。
3.当遇到紧急重大故障时,无法得到及时的恢复服务。
4.对于安全隐患或隐性故障没有有效的技术防患措施。
现状总结重点需求
1.具有全年365天,7x24小时无间隙服务
2.需要加强机房设施及核心设备的日检管理方式
3.需有系统硬件、软件全面维护服务的整体解决方案
4.需常驻资深运维工程师提供快速技术支持
5.需设备备件保障及设备硬件保修
6.需本地现场技术及软件业务操作培训
7.通过相关措施,完善非正常或不稳定运行系统
XXXXIT运维服务优势
XXXX有限公司可为市电子政务系统提供涵盖主流IT设备厂商从核心服务器、主机、存储、网络、视频、集成设备到软件系统等全线IT基础构架的维保服务产品,为电子政务的IT系统提供跨厂商的技术支持,以专业的工程师队伍和规范的服务流程为电子政务办及时解决软、硬件系统故障、恢复系统故障、恢复系统运行,降低系统故障率,提高IT系统可用性,提升电子政务系统的IT运维管理能力。
1)严格按照ISO/IEC20000的IT服务管理体系标准,实施运维管理;
2)XX科技高层管理对IT运维服务管理体系的实施非常重视,完善的管理体系平台,包括方针和框架,保障有效管理和实施;
3)核心系统(三台合一接处警调度通讯指挥系统)技术故障快速处理能力;
4)针对市电子政务办IT运维服务项目的服务策划管理、SLA服务级别管理、业务关系管理、事件管理、问题管理、配置管理、变更管理、服务报告、服务能力管理、服务可持续性管理、服务可用性管理、服务成本管理、发布管理有一套完整的体系建立;
5)涵盖主流IT厂商软、硬件产品的服务能力,已电子政务系统为核心,统一服务接口,简化服务管理流程;
6)灵活的SLA服务级别选择,便于客户根据自身需求情况定制服务;
7)全天侯服务、全过程监督,通过各关键指标监控实现服务过程可测量;
8)提供从数据、硬件平台、软件平台、网络平台和基础平台的全面维护服务的整体解决方案;
9)现场常驻资深工程师提供快速技术支持和故障排除;
10)建立确定可行的保修设备备件保障机制;
11)通过例行操作服务、响应支持服务、咨询评估服务和优化改善服务,多角度多层次立体式保障客户系统的运行稳定,拓展客户信息化建设思路;
IT系统运维服务项目指导原则
总体目标
引入先进的IT运行维护服务理念和方法,建立并完善基于ISO/IEC20000IT服务流程管理体系,从传统的项目售后服务向基于服务水平管理和流程导向的IT运维服务管理转型,以期达到:
1.建立规范的服务流程,提高服务接受方与服务提供方运营效率;
2.建立持续一致的服务,提高服务接受方满意度,确保客户满意度;
3.有效及高效地整合和利用信息、基础架构、应用、人员等IT资源;
4.以最低的成本、最大的效率来利用、管理和维护资产和设备;
5.提高一线服务台解决率,改善服务流程,快速响应服务接受方的需求。
在SLA服务级别协议约定的事件处理时间内,事件处理完成率达到100%;
基于IT服务管理模式(ITSM)
ITSM管理模式通过业务-IT相结合,服务内容定位和管理,服务的实施和开展以及服务运作的管理四个方面将业务和IT服务密切的结合起来。
根据业务需求制定出相应的IT策略,并将IT策略转换为具体的IT服务计划和定义出服务级别。
服务的建立和实施将IT策略贯穿始终,使IT最大程度的满足业务的需要。
人员、资源、技术和过程四者平衡的运行维护服务模型
1.人员:
为确保服务提供方的相关人员具备应有的运行维护服务能力。
为保证故障响应、解决问题和交付结果可控,XX科技在人员管理、岗位结构和人员的知识、技能、经验、安全意识等方面建立了完善的管理和考核体系,从而保证服务人员能够具备和达到应有的水平。
2.资源:
为确保具备提供足够资源的能力,以满足与服务接受方约定的及未来的运行维护服务需求。
XX科技将合理建立和配置运行维护工具、服务台、备件库和知识库等相关服务资源,从而保障服务资源的及时、有效投入。
3.技术:
为确保具备与运行维护服务策划相适应的技术和手段。
在运行维护服务实施过程中,可能面临各种问题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿技术应用所提出的新要求,XX科技根据客户方的相关要求或技术发展趋势,能够发现和解决问题、风险控制、技术储备以及研发、应用新技术和前沿技术。
4.过程:
通过对ITIL最佳服务实践模型的理解,XX科技将建立以下服务过程:
服务级别管理、服务报告、事件管理、问题管理、配置管理、变更管理、发布管理、安全管理,通过对各个服务过程的流程化、标准化管理对整个服务过程实现可监控,从而保障服务提供的可控和持续可靠。
快速响应及时解决
XX科技将为XX市电子政务办IT运行维护服务对象提供快捷便利的服务方式,根据客户IT运行维护服务对象不同阶段的业务需求和内部人员结构客户化我们的服务。
XX科技丰富的经验和庞大的服务体系,以运维团队驻场方式服务,使我们的服务具有快速响应和及时解决事件的能力。
以预防为主的方针
XX科技的IT运行维护服务改变了传统保修服务只是被动的接受问题并解决问题的特点,而是从预防为主,通过实时的监控和分析发现IT应用系统中潜在的问题和风险,及时采取相应的措施以避免问题的发生。
这样的做法最大程度的减少了IT应用系统事故的发生,保证客户IT应用系统最大时间的持续工作。
量化的服务级别管理
服务质量的评估不再是一种模糊的概念,通过对服务过程中各项关键指标的持续监控,以关键指标量化方式定期按照建立的内部测评审核机制对关键指标达成度进行测量,从而实现服务过程的持续改进,保障服务质量的稳定和持续提高。
经合同双方同意的服务级别将作为服务质量管理的依据。
清晰明确的服务质量要求使得服务的管理最有效。
IT运维服务项目阶段划分设计
为了整个IT运维服务项目提供良好的管理监控,并对项目中各管理组织之间的持续运作建立恰当联系,我们把整个项目执行分为四个阶段:
1)启动阶段:
服务实施过程前期的准备工作和计划,包括运维服务管理制度的建立、项目团队人力资源的到位。
2)过渡阶段:
完善支持服务流程,服务磨合逐渐成熟。
3)正常服务阶段:
正常地执行运维服务全过程。
4)总结阶段:
项目的总结移交并达到有序的结束。
时间跨度如图所示:
在每一个阶段过程中都有相应的工作安排及阶段成果输出,启动阶段、正常服务阶段和总结阶段三个不同的主要阶段构成完整的服务过程。
启动阶段
与市电子政务IT运维合同正式生效后,作为整个项目的启动阶段。
在此阶段中,主要执行前期的准备工作,为尽快提供高质量的服务打好基础。
(启动阶段估计需要2周时间)。
该阶段主要工作如下:
1)成立IT运维项目组,确定市电子政务办为运维服务接受方,XX科技为运维服务提供方,并确定双方的职责分配;
2)相关人员到位,提供IT运维服务项目的准备工作;
3)召开项目启动会议,制定各现场支持服务计划沟通会,明确工作范围,制定启动阶段计划;
4)双方互动协调出台SLA服务等级协议细节,报请双方上级部门或领导审核,并明确SLA服务等级协议;
5)项目管理、运营维护等规章制度流程的确定;
6)双方人员一起讨论有关的工作计划和需求;
7)系统维护服务实施计划的出台和审核;
8)针对服务范围涉及的硬件设备进行预检服务;
正常服务阶段
项目启动后,新的服务系统可以实现IT运维服务范围所承诺的服务后,即进入正常的服务阶段。
在正常服务阶段,所有的工作将按照制定的计划进行,并提供服务级别的承诺。
具体的工作如下:
1)运维服务管理体系和流程的改进;
2)正常的运维管理;
3)季度服务例会的召开;
4)设备运行风险评估;
总结阶段
此阶段开始于合同规定服务时间即将结束前2周。
这个阶段的主要工作是和XX市电子政务办充分沟通,移交服务本年的工作。
并从项目的服务实施过程中积累总结经验,以促进提高在后续运维项目中的工作质量和绩效。
1)收集服务期中各部分的服务文档资料及相关报告;
2)汇总、装订,提交用户并存档;
3)项目评估、总结;
4)召开年度服务回顾总结会形成项目总结报告;
IT系统运维服务项目的范围
服务范围
资产托管服务、技术咨询服务、故障处理服务、系统升级改造服务、系统搬迁服务、培训服务、巡检服务、回访服务、硬件维修更换服务、定期系统健康检查服务、系统演练服务、重大会议保障服务、厂家支撑服务;
运维服务项目服务时间、服务方式
1)运维服务项目服务期:
从XXXX年XX月XX日起——XXXX年XX月XX日止,共计XX年;
2)运维服务项目服务方式:
XXXX有限公司的运维项目组在XXX市现场驻点式服务;
运维服务项目涉及的产品范围
1.硬件维护服务范围清单
根据硬件维护服务范围清单,确定对运维项目中提供服务产品的界定更加准确;
2.软件维护范围清单
根据软件维护范围清单,确定对运维项目中软件维护范围更加清晰;
硬件范围清单
机柜
序号
设备
型号
6-06柜
1
HP服务器
DL388GenB
2
认证网关
吉大正元G3000-E
3
认证网关
吉大正元G3000-E
4
证书注册中心
吉大正元LRA2000
5
身份认证服务器
曙光A420r-G
6
行政权力运行服务器
曙光A420r-G
7
行政权力运行服务器
曙光A420r-G
8
行政权力运行服务器
曙光A840-G10
6-05柜
1
抗DDOS
傲盾KFW-2000
2
负载均衡A
华夏APPEX
3
负载均衡B
华夏APPEX
4
山石VPN
HILLSTONESG-6000M3100
5
WEB防火墙
国舜科技
6
交换机
H3CS5500
7
交换机
H3CS5500
8
深信服AF-1520
深信服AF-1520
9
交换机
H3CS5120-28P-SI
10
交换机
H3CS5120-28P-SI
11
深信服1550
12
华三路由器
H3CMSR36-20
6-04柜
1
交换枢纽
IBMsystemX3650m4
2
办件查询前置
IBMsystemX3650m4
3
信息公开前置
IBMsystemX3650m4
4
数据库/备份服务器
IBMsystemX3850X5
5
WEB服务器
IBMsystemX3850X5
6
WEB服务器
IBMsystemX3850X5
7
WEB服务器
IBMsystemX3850X5
8
IBM2498-B24
9
IBMDS3512
10
NAS存储
IBMsystemstorageN3240
6-03柜
1
数据库/备份服务器
IBMsystemX3650
2
企业和部门服务器
HPDL580
3
网页防篡改服务器
HPDL380G6
4
电子政务流转服务器
IBMX3610
5
电子政务公章服务器/防病毒服务器
IBMX3610
6
政务外网市级核心交换机
H3CS7506E
软件范围清单
项目运维预算
序号
收费项
预算计算方式
金额
备注
一
软件服务成本预算
1、
2、
二
硬件服务成本预算
1、
2、
三
硬件保修成本预算
1、
2、
四
备品备件库建设预算
1、
2、
五
场地成本预算
1、办公室
2、测试环境
3、办公设施
六
项目组组织成本预算
1、薪水:
2、培训费:
3、交通费:
4、差旅:
七
公司管理成本预算
3.项目的管理成本
4.税金
运维服务项目预算合计:
IT系统运维服务项目组成员及职责
运维服务项目组成员
针对运维服务项目,双方建立项目组成员,设计合适的事情管理接口,便于正确有效快速的管理运维项目工作事物。
XX科技运维服务项目组人员配置及职责
运维项目经理(多年IT运维服务项目管理经验)
XXXX有限公司指派一名具有良好技术背景和丰富项目经验的项目经理,作为项目的总接口人和项目负责人。
1.负责协调内部人员、软硬件资源,及时对市局运维项目范围提供服务、保证各项指标的完成情况;
2.负责整个服务项目的具体组织和管理,召集季度例会和工作协调会;
3.制作、完善详细的服务项目方案和服务级别计划,在服务过程中及时动态地调整方案,提高工作效率,保证服务质量;
4.给管理小组成员分配任务,随时监控每个成员的服务管理情况,控制服务质量;
5.负责整个服务项目中的问题管理、变更管理;
6.作为与市局指挥系统间的唯一接口,负责向市电子政务办汇报服务情况、变更需求等情况,并及时将有关要求反馈给管理小组;
7.接受市局指挥系统投诉和协调市局指挥系统需求的变化,及时反馈制订应急计划,报告项目领导小组和市局指挥系统负责人;
驻场运维工程师(二年IT运维服务项目实施工作经验)
1.负责计划内服务内容的实施;
2.负责第一时间响应客户故障报告;
3.负责主动性监控,及时发现故障隐患;
4.负责现场故障修复;
5.关键、疑难故障及时上报项目经理和热线中心;
6.负责实施其它主动式服务及其它专业服务;
7.负责解决现场和服务台无法解决的客户问题;
8.负责在技术问题方面的与总部支持团队和原厂服务商的联系沟通;
项目接口人
1.代表电子政务办,负责运行维护服务项目管理,与XX科技接口人;
2.在运行维护过程中,负责变更管理等需要协调、确定之事宜;
3.突发事件处理的管理协调;
4.与XX科技运维组的定期交流沟通;
项目协调人
1.运行维护服务中用户方具体维护协助人员;
2.在运行维护过程中,负责协助运维工程师处理日常故障事宜;
3.突发事件的相关协助工作;
4.日常与运维组人员的交流沟通;
IT系统运维服务项目服务级别管理
针对市电子政务IT系统运行情况及需求,识别编写具体的服务需求和绩效并形成服务目录和服务级别协议;
对服务需求进行商定、定义、编制、监控、变更和评审等;
故障级别定义
故障级别
定义
重大故障
因核心系统设备或服务端软件导致系统瘫痪,造成整个业务系统功能丧失性故障(如:
交换机瘫痪造成数据库瘫痪、核心服务程序故障、整个系统无法进行受理等);
一般故障
辅助子系统在运行过程中发生的不影响基础业务系统使用或间接性故障(如:
服务器故障)
关键指标定义
关键指标
定义
响应时间
从接到客户故障申报时间起,到工程师电话反馈给客户止,所使用的时间。
到场时间
故障响应时间起,到工程师抵达故障现场之时止,所使用的时间。
解决时间
故障响应时间起,到工程师完成故障处置之时止,所使用的时间。
主动式服务
规定时间
结合项目实施周期,制定服务计划,并规定具体的时间阶段,长期执行的过程。
SLA服务协议
服务项目
故障级别
SLA-1
响应时间
重大故障
7天*24小时0-10分钟响应;
一般故障
7天*24小时0-10分钟响应;
到场时间
重大故障
7天*24小时1小时内工程师到场处置;
一般故障
5天*8小时2小时内工程师到场处置;
解决时间
重大故障
4小时内工程师处置完毕,核心系统恢复,基本业务系统恢复使用;
一般故障
24小时内工程师处置完毕业务系统恢复使用;
主动式服务
规定时间
根据服务计划时间,保证时间的不偏离
运营级别协议
运营级别协议(OLA)是IT运维组与公司研发部门和采购供应部门就市电子政务IT系统运维服务项目所签订的协议。
(如服务台或项目组有受理故障升级、软件修改需求时,公司内部需严格遵守与项目组的OLA协议约定,保障运维项目服务执行效果)OLA支持运维组提供的各种服务。
支持合同
支持合同(UC)是与外部提供商就运维项目中部分服务的供应所签订的合同。
(如通信运营商、专用服务器厂商、DLP大屏厂商、其它专用设备厂商等第三方厂商支持保障)
IT系统运维服务项目配置管理
目的
配置管理流程的总体目的是提供一个统一的、一致的流程来管理IT系统运维服务项目环境中的所有组成部分,以确保:
1)所有配置项被识别和记录下来;
2)配置项当前和历史状态得到汇报;
3)配置项记录的完整性得到维护和确认;
4)客户服务环境的稳定性;
5)实现资产管理的目的;
范围
配置管理的范围是XX科技开发的管理信息系统的运行和服务环境下所包含的配置项,包括接处警调度指挥通讯系统、其它各子系统运行环境的部署环境设备、系统软件等,及服务环境中涉及的客户信息配置。
具体活动包括识别、控制、汇报和审核等行为。
包括:
1)客户信息:
企业客户信息;
2)软件信息:
参考软件服务范围清单的全部系统软件,建立配置信息;
3)硬件信息:
参考硬件服务范围清单的全部系统硬件,建立配置信息;
4)服务文档:
服务项目文档、服务记录、用户手册等;
配置管理项目
各配置管理对象需记录的具体配置参数项,例如服务器的物理位置、计算机名称、服务器品牌型号、IP地址、CPU型号、内存量、操作系统版本号、安装的业务系统软件名称等。
配置管理表
记录配置管理对象的各项配置信息。
每个配置管理对象建立一张配置管理表,表
内记录该对象的每个配置管理项目的具体值。
流程说明
定义配置管理对象和配置管理项
在初次建立配置管理系统或增加新的软硬件资源时,运维经理需要对管理对象和配置参数进行定义,建立相应的配置管理表,并提交给运维工程师。
收集初始数据
配置维护预案按照配置管理表收集系统数据,并核查其数据的准确性。
更新配置管理表
在确认配置数据的准确性后,由运维工程师将新的配置信息写入配置管理表,配置维护预案需要在接到配置变更单后24小时内完成配置管理表的更新。
填写配置变更记录表
运维工程师在完成配置管理表更新,并通知运维经理后,需要将本次配置变更情况记录在配置变更记录表中。
定期核查配置管理表
1)当由于系统变更导致配置变更时,在变更完成后1日内填写配置信息变更通知,并提交配置管理员。
2)配置管理员在接到配置变更单后,根据配置变更单的内容进行配置变更派单,由配置操作员进行配置变更操作。
若需要增删配置对象或配置项目,则由配置管理员进行相应的增删操作后,通知维护员更新配置信息。
3)配置维护预案在接到配置信息变更单后的24小时内,需要按照流程规定完成配置信息的更新,并在变更单中写明处理人、处理时间和处理结果,并回送至配置管理员。
4)配置管理员在配置变更记录表中记录本次变更行为
IT系统运维服务项目事件管理
目的
事件管理是一个被动性的任务,为了减少或消除存在或可能存在于IT服务中的干扰因素给IT服务带来的影响,以确保用户可以尽快恢复自己的正常工作。
因此,将事件记录下来并分类,再分配给适当的专业人员处理,同时监控事件的发展,并在事件得到解决之后将其关闭。
事件管理流程主要功能是尽快解决日常工作环境中出现的事件,保持IT服务的稳定性,其目的包括:
1)建立统一的事件受理机制;
2)事件处理流程中设立升级机制,与其它流程之间关联接口,设置优先级别和业务影响划分;
3)建立重大事件流程管理;
4)保证事件统计内容全面,保证流程的输入;
5)在成本允许的范围内尽快恢复服务。
6)快速响应服务请求。
7)跟踪事件处理的状态。
8)确认事件的解决和用户满意度。
9)进行事件控制。
10)按规范记录事件。
11)监视并结束事件。
12)进行定期服务回顾。
13)提供一个日常服务接口。
事件管理流程
服务台事件受理
客户通过服务台报告事件,收集好相关信息,受理并进入事件处理流程。
服务台需要收集以下信息:
5.来电客户的单位名称、联系人、电话号码等基本信息。
6.影响业务的具体原因、故障现象以及所属优先级。
请求记录和分类
根据事件报告的信息,一线支持记录《客户服务受理单》,通过电话方式需要询问客户详细的事件描述,然后根据用户的描述判断事件的分类、优先级等信息。
如果事件是关于供应商的问题,根据合同协议,直接转三线支持。
若事件比较重大且优先级为重要紧急,则需要报告项目经理。
热线电话尝试解决
一线支持人员受理事件后,首先根据用户所描述故障情况,参照《知识库》,对用户进行相应的指导解决。
远程解决
一线支持人员无法通过电话指导客户解决的事件,在征得客户同意的情况下,可以采用远程工具,登录客户计算机来操作解决。
现场解决
一线支持人员无法通过电话或远程协助客户解决的事件,需要到现场协助用户解决问题。
二线支持
经一线支持人员尝试解决无果或经判断不属于一线支持能力范围内的,提交二线支持解决。
工程技术部和软件开发部:
负责解决客服工作遇到的疑难问题,并分析其问题原因。
公司管理层:
负责客服人员新增、各种配套服务设备添加的审批,并牵头解决重大的故障或者服务中产生的纠纷问题。
服务响应
参照SLA服务协议执行。
调查诊断
现场服务人员(一线、二线、三线)在现场通过标准配置进行比对等方法对故障进行分析,查找出故障原因。
确定解决方案
技术服务人员根据故障分析结果确定解决方案,并与客户沟通执行解决方案所需要的时间,确定解决方案的可行性。
若发生的事件一时解决不了,需要与客户约定解决时间。
对于重大故障(故障等级为高或中)须做好数据备份。
若故障处理时涉及一般、重大、紧急的变更,转变更管理流程,参考《变更管理程序》。
事件解决后,故障现场负责人分析若属于影响重大或经常出现的问题,需要通过问题管理进行彻底解决的,转问