xxxx信息系统运维服务方案.docx
《xxxx信息系统运维服务方案.docx》由会员分享,可在线阅读,更多相关《xxxx信息系统运维服务方案.docx(31页珍藏版)》请在冰豆网上搜索。
xxxx信息系统运维服务方案
XX局信息化系统
运维服务方案
XX局
2013年6月
1概述
1.1服务范围和服务内容
本次服务范围为✠✠局信息化系统硬件及应用系统,各类软硬件均位于✠✠局第一办公区内,主要包括计算机终端、打印机、服务器、存储设备、网络(安全)设备以及应用系统。
服务内容包括日常运维服务(驻场服务)、专业安全服务、主要硬件设备维保服务、主要应用软件系统维保服务、信息化建设咨询服务等。
1.2服务目标
●保障软硬件的稳定性和可靠性;
●
●保障软硬件的安全性和可恢复性;
●
●故障的及时响应与修复;
●
●硬件设备的维修服务;
●
●人员的技术培训服务;
●
●信息化建设规划、方案制定等咨询服务。
●
2系统现状
2.1网络系统
✠✠局计算机网络包括市电子政务外网(简称外网)、市电子政务内网(简称内网)以及全国政府系统电子政务专网(简称专网)三部分。
内网、外网、专网所有硬件设备集中于✠✠局机房各个独立区域,互相物理隔离。
外网与互联网逻辑隔离,主要为市人大建议提案网上办理、✠✠局政务公开等应用系统提供网络平台,为市领导及✠✠局各处室提供互联网服务。
外网安全加固措施:
WS✞S服务器、瑞星杀毒软件服务器为各联网终端提供系统补丁分发和瑞星杀毒软件管理服务,建立✋PS、防火墙等基本网络安全措施。
内网与外网和互联网物理隔离,为✠✠局日常公文流转、公文处理等信息化系统提供基础网络平台。
内网安全加固措施:
WS✞S服务器、瑞星杀毒软件服务器为各联网终端提供系统补丁分发和瑞星杀毒软件管理服务;配备防火墙实现内网中服务器区域间的逻辑隔离及安全区域间的访问控制,重点划分服务器区,实现相应的访问控制策略。
专网由✠✠局电子政务办公室统一规划建设,专网和互联网、内网及其他非涉密网络严格物理隔离,目前主要提供政务信息上报服务和邮件服务。
(内网结构图)
(外网结构图)
(专网结构图)
2.2设备清单
✠✠局各个计算机网络及应用系统硬件设备集中于✠✠局专用机房。
清单如下:
硬件设备汇总表
设备类型
设备型号
数量
备注
服务器
服务器合计
39
交换机
4
2
光纤交换机
1
1
交换机合计
8
防火墙
5
内外网各一台冷备
安全审计
1
✋PS
1
存储
2
1
1
1
磁带库
1
虚拟带库
1
其他设备
1
机房监控系统使用
支撑软件统计表
类型
版本
数量
数据库
操作系统
除上述设备外,维护内容还包括约✠✠台电脑终端(含笔记本电脑)和✠✠台打印机。
2.3应用系统
✠✠局日常公文流转、公文办理等日常工作均在基于内网的不同应用系统上得以实现。
各系统使用的操作系统包括MS-W♓⏹S♏❒v♏❒和☹✋☠✞✠两大类,数据库包括☹☐♦◆♦、✌♍♍♏♦♦、MS-S✈☹等。
主要应用系统清单如下:
应用系统清单
序号
系统名称
访问地址
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
对于其中部分重要应用,描述如下:
1、✠✠局办公资源网
2、政府公文综合管理系统
3、政府信息管理服务平台
3服务方案
3.1系统日常维护
系统首要维护工作是信息化系统的日常维护,主要包括以下4个方面:
3.1.1系统支撑软硬件的日常维护
系统支撑软硬件主要包括PC服务器、存储、网络、安全设备及数据库软件、中间件等基础软硬件设施。
3.1.1.1服务器维护
服务器系统主要包括信息处目前在用的各类服务器:
数据库服务器、应用服务器、W☜B/网管/备份服务器、门户网站、防病毒服务器等。
具体服务内容包括:
(1)服务器硬件状态检查
(2)
(3)服务器硬件安装与调整
(4)
(5)服务器设备事件管理服务
(6)
要求运维团队根据服务器的情况制订相应的事件管理文档,由现场服务人员对服务器发生的事件进行记录、跟踪与分析,通过对事件的分析,及时发现服务器中存在的潜在问题,并进行解决或提出相应的解决方案。
(7)服务器性能监控
(8)
要求运维团队每天由现场服务人员根据制定的性能监测模板对服务器的性能监控,监控的参数为服务器的CP✞、❍♏❍☐❒⍓、♒♎♎、⏹♏♦♦☐❒k,并根据各服务器的应用情况,分析出服务器性能的基本基准线。
(9)应用维护
(10)
要求运维团队现场服务人员对这些应用进行定期的维护,对防病毒软件的防护状态与更新情况进行每天检查。
(11)服务器进程与服务检查
(12)
(13)服务器磁盘空间检查
(14)
(15)服务器系统漏洞修补
(16)
(17)系统配置与变更管理
(18)
(19)系统垃圾清理
(20)
(21)记录与报告
(22)
Ø服务器操作管理手册
Ø
Ø服务器事故管理文档
Ø
Ø服务器监控报告
Ø
Ø服务器设备标识,配置记录
Ø
Ø服务器故障处理报告
Ø
Ø服务器运维分析报告
Ø
Ø应用系统故障处理报告
Ø
Ø服务器系统配置记录
Ø
Ø垃圾信息清理记录
Ø
3.1.1.2存储设备维护
存储系统平台主要包括:
S✌☠存储系统(接入S✌☠网络的服务器客户端、S✌☠交换机)、磁盘阵列、磁带库等的管理和维护工作。
具体服务内容包括:
(1)存储设备配置管理服务
(2)
(3)备份作业检查
(4)
(5)S✌☠交换机日常状态检查维护
(6)
(7)存储设备事件管理服务
(8)
(9)备份及恢复策略制定
(10)
(11)备份介质管理
(12)
(13)备份软件维护
(14)
(15)备份数据恢复
(16)
当系统出现异常数据丢失时,协同应用厂商,在信息处的授权下,要求运维团队现场服务人员对相应的备份数据进行数据恢复,以快速保证与恢复客户的应用。
(17)备份数据整理
(18)
由于目前备份数据没有明确的管理制度,备份数据管理程无序化状态,对于备份数据的保存声明周期没有周密的限定计划,造成备份数据占用大量的存储空间,要求运维团队现场服务人员根据备份和存储数据的情况,提出数据整理频率计划,并信息处进行数据的整理。
(19)存储设备运行维护
(20)
要求运维团队现场服务人员对存储设备硬件状态监控,问题及时处理。
(21)记录与报告
(22)
Ø存储设备操作管理手册
Ø
Ø设备检修报告
Ø
Ø故障处理报告
Ø
Ø存储设备运维分析报告
Ø
Ø数据备份操作管理手册
Ø
Ø数据备份记录
Ø
Ø存储系统配置记录
Ø
Ø存储系统空间调整记录
Ø
Ø备份策略调整更新记录
Ø
3.1.1.3网络、安全设备维护
网络、安全平台维护的目标是:
通过网络、安全系统管理服务,降低网络设备故障率,提高网络设备的运行性能。
提高✠✠局网络运行的稳定性、可靠性,以专业化运作模式解决✠✠局各类信息系统信息化发展的需求。
需要提供故障诊断、远程支持、现场支持、软件升级、设备搬迁、网络优化、网络巡检、现场培训、技术交流、网络安全、网络建设建议等服务。
具体服务内容如下:
(1)网络故障排查
(2)
(3)网络设备硬件状态检查
(4)
(5)网络流量监测
(6)
(7)安全策略配置及配置优化
(8)
(9)网络设备配置管理服务
(10)
(11)网络设备资料整理,配置参数整理
(12)
(13)网络使用状况趋势分析及建议
(14)
3.1.1.4数据库系统维护
数据库为S✈☹2000及S✈☹2008,其维护服务内容主要包括:
(1)数据库实例状态检查
(2)
(3)数据库表空间使用情况
(4)
(5)监控查看数据库的连接情况
(6)
(7)表空间使用情况和性能检查
(8)
(9)数据库告警日志检查分析
(10)
(11)数据库备份检查
(12)
3.1.1.5中间件维护
中间件软件维护服务内容主要包括:
(1)数据维护
(2)
(3)数据备份
(4)
(5)系统日常维护
(6)
(7)中间件升级而对应用软件进行适应性更新与调测服务
(8)
(9)中间件维护操作手册及应急流程更新
(10)
3.1.2应用系统的日常维护
维护要求为:
通过对应用系统的维护,分析用户的不断更新的需求,分析应用系统对服务平台性能的要求,提出系统优化扩容解决方案,保障应用系统的处理服务性能。
主要维护内容包括:
(1)业务数据维护;
(2)
(3)业务数据备份;
(4)
(5)业务系统日常维护;
(6)
(7)软件更新服务;
(8)
(9)对业务管理系统健康状态检查与分析报告;
(10)
(11)对系统用户信息进行维护和修改,添加系统用户、更改系统用户信息、权限,负责系统中管理人员、操作人员、监督人员名单的调整,以及数据同步。
(12)
3.1.3终端设备的日常维护
3.1.3.1电脑终端运维服务
主要包括✠✠局工作人员的台式电脑、笔记本电脑等,共计约✠✠台。
具体维护内容为:
(1)操作系统安装维护及补丁安装
(2)
Ø对终端用户的计算机的操作系统的安装与维护请求进行响应;(操作系统安装介质由信息处提供)
Ø
Ø对终端用户的计算机的操作系统的补丁安装;
Ø
Ø在重装前协助终端用户进行计算机数据的备份。
Ø
(3)终端防病毒软件安装及升级
(4)
Ø对终端计算机的防病毒软件故障进行现场处理与解决;
Ø
Ø对其他用户的防病毒软件进行电话技术支持与问题解决。
Ø
(5)终端网络接入调整
(6)
对终端计算机的网络连接的调整(不包括布线)。
(7)终端事件检查及排查
(8)
对终端计算机的安全事件进行故障定位与排查;
对终端计算机的故障事件进行故障定位与排查。
(9)通用办公软件安装
(10)
提供对终端计算机的通用软件的安装;(通用软件包括☐♐♐♓♍♏等办公软件,安装介质由信息处提供)
提供对终端计算机的客户需求软件的安装。
(软件由用户提供)
(11)计算机使用规范
(12)
制定计算机的使用规范,使用规范主要包括计算机的使用注意事项、✞盘的使用注意事项、计算机使用的一些小常识等,该规范主要是帮助用户了解计算机的使用常识与技巧,减少故障的发生频率。
该规范可做成相应的贴示张贴在终端用户计算机的显示器或机箱上。
(13)计算机安装操作规范
(14)
计算机安装规范主要是对终端用户的计算机安装过程进行规范,规定相应的文件备份地点、分区大小、补丁安装、安全加固、软件安装等方面。
通过制定相应的计算机安装操作规范,以规范与保证服务人员在服务过程中的服务质量。
(15)记录与报告
(16)
Ø计算机使用规范(贴示);
Ø
Ø计算机安装操作规范;
Ø
Ø服务确认单;
Ø
Ø电话支持记录单;
Ø
Ø故障处理报告。
Ø
3.1.3.2
3.1.3.3网络信息点位维护
(1)根据信息点的编号,分别将编号的单数和双数规划为网络信息接口和语音接口,并统一建立信息点数据。
通过对✠✠局的调研和了解,对各办公室的信息点作出适当调整和数据的修改。
(2)各处室接入期间,做好配合工作,包括楼层交换机调试、桌面跳线等。
(3)要求运维团队现场服务人员做好定期对网络信息点、配线架、理线架、终端模块的巡检工作。
3.1.4维护制度建设
制度是一种必须共同遵守的行为规范,是保证工作有序开展和任务圆满完成的基础。
建立和健全✠✠局信息化设施运行维护的各项管理制度,对于维护工作的顺利完成是必需的。
要求运维团队依据以下标准,协助✠✠局建立规范、科学、实用的维护制度。
(1)《电子信息系统机房设计规范》(☝B50174-2008)
(2)《综合布线设计规范》☝B50311-2007
(3)《中华人民共和国消防法》
(4)《电力供电标准与内部控制管理制度全集》
(5)《成都市电子政务外网使用管理规定》
(6)✋SO/✋☜C9001:
2008质量管理体系
(7)✋SO/✋☜C20000:
2005✋❆服务管理体系
(8)✋❆✋☹☎✋⏹♐☐❒❍♋♦♓☐⏹❆♏♍♒⏹☐●☐♑⍓✋⏹♐❒♋♦♦❒◆♍♦◆❒♏☹♓♌❒♋❒⍓✆2.0✋❆基础架构库终端设备的日常维护
(9)✋❆SS(✋⏹♐☐❒❍♋♦♓☐⏹❆♏♍♒⏹☐●☐♑⍓S♏❒v♓♍♏S♦♋⏹♎♋❒♎♦)信息技术服务标准
3.2信息系统安全服务
风险评估和安全加固工作贯穿于信息系统的整个生命周期的各阶段中。
在运行维护阶段,要不断地实施风险评估以识别系统面临的不断变化的风险和脆弱性,并通过安全加固进行有效的安全措施干预,确保安全目标得以实现。
3.2.1风险评估
风险评估的目的是了解和控制运行过程中的信息系统安全风险,运维阶段的风险评估是一种较为全面的风险评估。
评估内容包括对真实运行的信息系统、资产、威胁、脆弱性等各方面。
(1)资产评估:
对真实环境下较为细致的评估,包括实施阶段采购的软硬件资产、系统运行过程中生成的信息资产、相关的人员与服务等。
本阶段资产识别是前期资产识别的补充与增加;
(2)威胁评估:
真实环境中的威胁分析,应全面地评估威胁的可能性和影响程度。
对非故意威胁产生安全事件的评估可以参照事故发生率;对故意威胁主要由评估人员就威胁的各个影响因素做出专业判断;同时考虑已有控制措施;
(3)脆弱性评估:
全面的脆弱性评估。
包括运行环境下物理、网络、系统、应用、安全保障设备、管理的脆弱性。
对于技术的脆弱性评估采取核查、扫描、案例验证、渗透性测试的方式验证脆弱性;对安全保障设备脆弱性评估时考虑安全功能的实现情况和安全措施本身的脆弱性。
对于管理脆弱性采取文档、记录核查进行验证;
(4)风险计算:
根据相关标准,对主要资产的风险进行定性或定量的风险分析,描述不同资产的风险高低状况。
3.2.2安全加固
安全加固是指对在风险评估中发现的系统安全风险进行处理,按照级别不同,应该在相应时间内完成。
安全加固的内容主要包括:
(1)日常安全加固工作,主要是根据风险评估结果进行系统安全调优服务,根据系统运行需要适时调整各类设备及系统配置、合理规划系统资源、消除系统漏洞,提高系统稳定性和可靠性;
(2)主动安全加固,在未出现安全事故之前就对已经通报或者暴露出来的软件漏洞或最新病毒库更新,就主动进计划的升级和改进,从而避免出现安全事故。
具体加固内容包括但不限于:
帐户策略、帐户锁定策略、审核策略、☠❆☞S、用户权限分配、系统服务策略、补丁管理、事件日志、应用软件的更新等。
3.2.3应急响应
应急状态的安全值守、响应工作,主要是系统应急响应、重大安全故障处理,确保系统出现安全事件时快速反应、及时处理,降低系统安全问题对✠✠局内工作的影响。
3.2.4安全巡检
安全巡检主要是指深入现场,了解情况:
质检服务内容中的各类安全设备,了解安全设备运行情况,仔细观察各个安全节点的可靠性,并综合安全巡检情况,定制安全策略。
3.2.5安全监控
对服务内容进行监控,在安全环境产生变化时,及时更新安全策略,在现有设备和网络情况有改变的时候,快速制定,针对更新后设备环境的安全策略,并实施部署。
避免因设备变更而带来的安全风险。
3.2.7安全通告
定期安全通告,在互联网上出现新型病毒或者新出现漏洞并且部分修补的情况下,制作安全通告及时告知相关运维人员,增强对于新型病毒和漏洞的防御力。
3.3系统设备维修及保养服务
针对本项目中的系统硬件设备,除在4.1.1中提供的日常运维服务外,要求运维团队提供设备的维修及保养服务。
主要包括:
(13)当硬件设备出现故障时,硬件设备故障部件的现场替换工作或对返修工作,具体如下:
故障设备名称
现场替换
返修
备注
内存条
是
硬盘
是
CP✞
是
视现场情况,可提供现场更换
主板
是
电源模块
是
是
有冗余电源的,返修后更换;无冗余电源现场更换。
网卡
是
散热模块
是
散热模块都有冗余,可在返修后进行更换
其他设备
是
其他非常规设备,只能原厂返修
(14)非故障时期对系统硬件设备的定期现场巡检、功能性能测试等日常保养工作,具体如下:
(15)
1.电源是否稳定;
2.
3.散热是否正常;
4.
5.检查服务器指示灯是否有故障灯亮起;
6.
7.定期用测试软件对服务器CP✞性能进行压力测试,并给予打分;
8.
9.定期用测试软件对服务器内存读取速度进行测试,并给予打分;
10.
11.定期用测试软件对服务器硬盘✋/O能力进行测试,并给予打分;
12.
检查出故障的按第一条进行相应处理,无故障但是在性能测试中分数较低者,提出相应更换或者维修建议。
(16)要求运维团队每年定期对服务器进行一次除尘工作,既提高服务器的散热能力,也可避免由于微尘造成的服务器线路不通、性能降低或短路等危险。
(17)
3.4软件系统升级及维保服务
针对本项目中的防病毒软件、公文综合管理及会议管理系统、智能文件交换系统三个较为重要的应用,除在4.1.2中提供的日常运维服务外,要求运维团队提供系统的原厂升级及维保服务。
主要包括:
(1)防病毒软件的原厂升级服务,保证杀毒引擎和病毒库随时更新;
(2)公文综合管理及会议管理系统的业务流程调整、简单功能调整等小开发量维保服务;
(3)智能文件交换系统所包含的专用设备(文件柜、锁等)的维保服务。
4服务要求
在本服务项目中,运维团队应明确自己的责任和义务,在充分了解项目所述各个系统现有环境的基础上,提供规范化、高质量的服务,并对服务质量做出可量化的承诺。
4.1基本要求
4.1.1日常运维服务
针对✠✠局的不定时工作日制度,为客户提供系统级的日常维护、定期巡检、性能测试、故障排查等服务。
具体内容包括:
4.1.1.1工作日服务
主要指现场值守服务,维护团队需要指派3名资深服务技术服务工程师长期值守在✠✠局现场,负责对现场设备运行状态进行监视、管理和维护以及工作终端的管理和维护,通过对系统运行日志的分析提前发现并排除可能发生的潜在故障,并在全部维护服务团队支持下,在1小时内排除普通故障,2小时内排除较大故障,4小时内排除重大故障,24小时内排除特大故障。
维护期内提供技术人员进行现场监控服务。
4.1.1.2故障响应服务
除了现场值守服务方式外,同时,提供7×24小时故障响应服务具体包括:
Ø维护期内提供电话、传真、电子邮件等方式的咨询和支持服务。
Ø
Ø主要系统设备出现故障时,15分钟内响应,当现场维护工程师或节假日值班维护工程师无法排除故障时,1小时内中心派专业工程师赶赴现场进行故障诊断及处理,在1小时内排除普通故障,2小时内排除较大故障,4小时内排除重大故障,24小时内排除特大故障。
Ø
Ø一般故障,正常工作日内响应。
Ø
4.1.2其他时间及夜间服务
当系统在非工作日出现异常时,维护团队现场人员将在1小时内赶赴现场并排除系统普通故障,特大故障将在24小时内处理完毕。
具体联系方式包括:
通过维护团队提供的7×24小时响应服务热线;现场维护人员通过移动通信网络(当运维管理系统具备短信故障报警通知功能时)接收到系统报警信息;或维护人员接到服务请求电话时。
4.1.3临时保障服务
当遇到重大活动需要提供临时保障服务时,维护团队须在需要保障服务的前三天进驻现场,并对所有设备进行临时性安全检查,排除安全隐患,以做到万无一失。
4.1.4月度检查
每月对各系统及设备进行检查,进行安全系统、防病毒系统检查,进行漏洞扫描,并对检查中存在的故障及安全隐患进行处理。
每月第一周向用户单位提交上月的《月度巡检报告》,报请用户单位审批签署。
4.1.5季度检查
每季度对由维护团队的专业维护队伍对所有设备进行安全评估和风险分析,提交完整的安全状况评估报告,分析存在的安全漏洞情况,提出《整改方案和建议》。
4.1.6年度检查
每年由维护团队组织相关的专家(含硬件和软件)对整个系统进行安全检查,对每个硬件设备使用状态进行风险评估,并对下一年可能存在的问题进行风险预测,对每个设备的状态出具使用报告。
4.2服务队伍要求
要求维护团队拥有强大的技术支持力量,拥有稳定的专业化的技术支持服务队伍,完善的技术支持服务体系。
现场服务人员负责网络的监控、简单故障的解决,接听技术热线。
现场服务人员按照计划对现场工作终端、楼层设备、机房及机房设备等进行例行巡检。
技术专家负责重大故障的处理,定期对运行情况进行分析,并提出整改或优化方案和建议。
4.3服务流程要求
4.3.1主动式服务
(1)定期预防性维护服务
维护团队根据系统维护服务计划或用户要求为用户提供定期预防性维护服务。
此类服务是有计划有步骤进行的,目的是为了提高系统的可使用率和高可靠性,把系统故障的可能性降低到最低。
在硬件维护方面,要求维护团队工程师每两周进行一次现场例行检查,为用户维护硬件设备,并为用户替换那些虽然能够工作但不是很正常的部件,以避免系统崩溃的情况发生,防患于未然。
在系统服务方面,投标方应指定预防性服务级别,安装预防性P❆☞软件☎补丁软件✆检测系统运行状况,解决系统软件问题,使用户的系统保持良好的运行状况。
(2)系统运行健康检查
维护团队应提供一月一次的系统运行健康检查,按计划由专家定期对主机系统性能进行诊断,根据结果出具性能诊断报告,并征得用户同意后调整系统参数,使系统始终在最佳状态下运行。
对可能出现的问题提供科学预测,并采取必要的预防和补救措施,防患于未然。
(3)系统运行状况分析
每季一次对系统的运行状况分析。
提供本项目系统设备和PC服务器设备运行状态和性能的分析、评估服务,以提高系统的可靠性、可用性和整体性能。
每年一次向用户提交详细的系统可用性、安全性、运行状况分析等预防性维护策略、报告和总结。
4.3.2纠错性维护/维修服务
维护团队应提供电话技术支持服务或到场维修服务。
在部件服务方面,维护团队应及时确认故障原因,并更换故障部件,恢复系统正常运行。
解决系统软件问题,恢复系统软件正常运行,作系统备份,递交系统检查报告等。
4.4服务响应要求
4.4.1日常服务响应时间
由于针对本项目采用的驻留现场服务方式,维护团队需指派驻3名资深工程师采取同步的作息时间,因此,现场服务的响应时间为及时响应。
4.4.2事故分级响应服务时间
各级故障事件的最晚响应时间为:
确认时间
一级故障事件
二级故障事件
三级故障事件
四级故障事件
1小时
技术服务人员
4小时
专业工程师
技术服务人员
24小时
技术支持专家
专业工程师
技术服务人员
48小时
服务项目经理
服务项目经理
专业工程师
技术服务人员
故障事件等级划分如下:
Ø