1、软件系统运维方案模板 文档编号:XXXXXXXXXX版 本 号:XXXXXXXXXXXXX项目系统运维方案编制单位:XXX公司编制日期:2016年7月2日项目概况阐述此运维项目的基本情况、运行状况、运行环境等。示例:项目名称:xxx项目建设单位:xxx学校承建单位:xxx公司监理单位:xxx公司运维时间:XXXX年XX月XX日至XXXX年XX月XX日运维服务方案1.1运维服务的原则阐述项目运维时需遵守的原则。示例:1、全面考虑,重点部署,分步实施安全保障体系是融合设备、技术、管理于一体的系统工程,需要全面考虑;同时,尽量考虑到涉及网络安全的重点因素,充分考虑可扩展性和可持续性,从解决眼前问题、
2、夯实基础、建设整个体系等方面作好安全工作。2、规范性、先进性、可扩展性、完整性并重安全防护涵盖的对象较多,涉及管理、技术等多个方面,包括系统定级、安全评测、风险评估等多项环节,是一项复杂的系统工程,相关工作应按照国家有关标准实施。系统应采用成熟先进的技术,同时,网络安全基础构架和安全产品必须有较强的可扩展性,为安全系统的改进和完善创造条件。1.2运维服务的范围及内容1.2.1运维服务范围描述运维服务的范围。示例:用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业
3、务应用软件等。通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量1.2.2运维服务的内容描述运维服务的内容。示例:1、大屏幕显示子系统结合大屏幕显示子系统运行维护服务合同,对大屏幕显示子系统进行日常运行维护,主要包括网站日常运行维护、故障处理及重大活动现场保障等工作。具体内容如下:(1)日常系统巡检;(2)日常运行维护服务;(3)运行环境安全保障服务以及应急响应服务;1.3运维的流程及方法1.3.1运维服务的流程描述运维的工作流程。示例:图2-1 XX运维服务人员发现问题后对出现问题进行登记,分析问题类型后对
4、问题操作、处理,处理结束后反馈使用单位处理结果,并在维护记录表做记录。1.3.2运维服务的方法描述运维的工作方法。示例:1.提供系统服务器巡检(1)查看各应用服务器状态(2)在Main菜单中选择Statistics,进入Statistics Types下拉菜单中选择Pools菜单,查看当前应用服务器的运行状态(绿色代表正常运行、红色代表宕机)。2.日常运维系统日常巡检是对系统进行现场检查,及时发现包括硬件设备、通信网络、系统软件出现的隐患,以减少系统发生故障的概率,保证系统的稳定运行。因此本投标人在系统维护方面设有专门维护人员,主要负责一般故障排除、日常设备巡检等工作。1.4保障措施描述为避免
5、系统运行中出现故障所做的保证措施,如:充足的计算机硬件备件、良好的备份机制、定期数据排查、系统定时更新、杀毒等。示例:1、硬件配备巡检机房已按规定配备防静电地板、UPS、温湿度感应器、消防设备等相关基础设施,同时运维公司技术人员定期对机房硬件设备设施进行巡检,以保证设备正常运行并且建立相关的出入登记、设备巡检、重大故障等记录。2、机房出入管理严禁非机房工作人员进入机房,特殊情况需经信息中心批准,并认真填写登记表后方可进入。进入机房人员应遵守机房管理制度,不得携带任何易燃、易爆、强电磁、辐射性等对设备正常运行构成威胁的物品。1.5运维人员描述运维项目中的人员安排。示例:表2-1 XX姓名职 责X
6、XX主要负责机房巡视1.6管理制度描述本项目运维人员管理的相关制度。示例:为加强项目后期的系统运维管理,确保系统能够平稳、可靠地运行,更好地为客户提供管理服务,运维人员实行如下制度:1、工作时间要求遵照国家有关规定实行双休日及法定节假日制度,其中法定节 假日的具体安排,依照国家当年的相关规定执行。常驻运维人员的上下班时间应按照区政府规定的网站组上下班时间执行。如不能按时到达时,必须在规定到岗时间前主动联系客户或通过已到达人员联系客户,解释原因、请求谅解,并通知公司部门领导。2、处分制度根据考勤管理制度的规定,公司有权对违反规定的员工进行处罚。1.7文档清单描述运维过程中所涉及到的文档清单。示例
7、:巡检记录;现场服务记录;故障分析报告;应急预案1.8等级规定列出本项目应急预案级别的确定。示例:根据网络信息安全事件等级的不同,相关部门启动相应预案,并负责应急处理工作。表3-1 XX信息系统名称安全保护等级业务信息安全等级系统服务安全等级XXX系统第x级第x级第x级1.9运行服务应急流程描述启动应急各阶段的工作内容。示例:1、事件发现阶段事件发生单位和现场我公司会尽快配合现场工作人员尽最大可能收集事件相关信息,确定事件类别,确定事件来源,保护证据,以便缩短应急响应时间。2、事件分析阶段配合用户方网络维护人员,检查威胁造成的结果,评估事件带来的影响和损害:如检查系统、服务、数据的完整性、保密
8、性或可用性,检查攻击者是否侵入了系统,以后是否能再次随意进入,损失的程度,确定暴露出的主要危险等。抑制事件的影响进一步扩大,限制潜在的损失与破坏。可能的抑制策略一般包括:关闭服务或关闭所有的系统,从网络上断开相关系统,修改防火墙和路由器的过滤规则,封锁或删除被攻破的登录账号,阻断可疑用户得以进入网络的通路,提高系统或网络行为的监控级别,设置陷阱,启用紧急事件下的接管系统,实行特殊“防卫状态”安全警戒,反击攻击者的系统等。1.10灾难应急措施描述相关解决方案,其中包括供电故障、系统宕机、硬件故障、软件故障、网络故障等带来的解决方案。示例:任何系统都可能因设备故障、系统缺陷、病毒破坏、黑客攻击、人
9、为错误或停电、雷击等意外灾害导致速度下降甚至系统崩溃,造成重大灾难事件。系统运维服务小组可从以下途径得知故障的发生:1、运维服务中心通过网管告警发现故障2、维护站点通过维护巡检发现故障3、用户发现故障,报给呼叫中心如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。3.3.1供电故障3.3.2系统宕机1.11应急结束描述应急结束后需要整理的相关文档信息,及防范工作等。示例:各部门要组织落实专人收集、整理预案执行中存在的问题,及时报告领导小组,领导小组根据应用系统的完善和发展情况,结合暴露出的问题适时进行修订。领导小组对本次故障进行全面总结。汇总应急工作开展情况,对本次突发事件的起因、造成的不良影响、资金损失以及应急工作本身等进行全面总结分析,并提出改进意见,督查改进情况,进一步优化应急流程。信息科负责备份应急数据至工作站,在应急业务结束后及时删除应急数据,防范风险。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1