机房应急预案Word格式.doc
《机房应急预案Word格式.doc》由会员分享,可在线阅读,更多相关《机房应急预案Word格式.doc(10页珍藏版)》请在冰豆网上搜索。
消防及空调设备负责人
服务器及存储设备负责人
第四章应急机构人员岗位职责
第六条应急总指挥职责
(一)保证在任何时间,及时协调应急行动所有涉及的岗位人员;
(二)提供必须的紧急响应设备;
(三)在紧急情况下全面负责紧急行动;
(四)在必要时向外界求救,例如:
119、110、120等。
第七条应急副总指挥职责
(一)在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;
(二)根据获得的应急信息下达命令。
第八条各相关设备负责人职责
(一)负责尽快收集信息向应急总指挥汇报事故情况;
(二)负责现场临时设备抢救和对事态的控制;
(三)听从上级指挥人员的指挥。
第五章信息与网络安全突发事件处理原则
第九条预防为主。
立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑信息与网络安全保障体系。
第十条快速反应。
突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。
第十一条分级负责。
按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。
根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。
第十二条以人为本。
把保障人员以及公共利益的安全作为首要任务。
第十三条常备不懈。
加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规范化。
第六章服务器及存储设备故障处理
第十四条排错流程
故障发生
硬件故障
软件故障
服务器前后面板相关指示灯异常显示
查看系统日志、任务管理器、程序状态等
综合判断,列出原因
编写故障文档
解决故障
判定
结束
第十五条应急处置具体措施
(一)服务器设备损坏应急处置措施
(1)关键应用系统所在服务器设备损坏后,应立即查明原因,使用备份服务器替换损坏设备,并立即恢复应用系统正常使用;
(2)立即与设备提供商联系,请求派维修人员前来维修。
(二)服务器软件损坏紧急处置措施
(1)迅速查找原因,尝试重启系统。
使用备份进行恢复。
必要时联系开发商;
(2)当发现服务器感染有病毒后,应立即将该机从网络上隔离出来。
并启用杀病毒软件对该机进行杀毒处理,同时使用病毒检测软件对其他机器进行病毒扫描和清除工作。
经技术人员确认确实无法查杀该病毒后,应作好相关记录,并迅速联系有关产品商研究解决;
(3)当因空调,电力等问题需要关闭所有服务器时,应遵循如下步骤:
先关闭所有应用服务器和数据库服务器,再关闭存储设备。
启动所有服务器时,应先打开存储设备,再打开数据库服务器,最后打开应用服务器。
第十六条服务器突发情况记录文档
日期
故障发生时间
服务器名称
IP
现象
处理情况
故障恢复时间
处理工程师
备注
第七章网络设备故障处理
第十七条网络设备排错流程
下面流程图是网络维护人员所应采取的排错模型,当发生网络故障时应按照此流程快速进行定位、排除故障。
进行故障数据采集
经验判断和理论分析、列出各种可能原因列表并排列优先顺序
对每种原因实施排错
故障排错判定
YES
NO
第十八条网络系统故障突发事件分级
故障等级
故障现象
1级
网络完全拥塞或设备宕机
网络或设备处理能力严重受影响,对最终客户的业务运作有严重影响
网络或设备故障对重要的客户(公司经理级或重要的部门)造成严重影响
2级
网络或设备的性能严重下降,对最终客户的业务运作产生重要影响
部分区域网络故障
一般网络节点发生故障
大部分客户的网络通讯质量下降
3级
网络或设备性能受损,但最终客户大部分业务仍可正常工作
报警出错和操作命令反常
4级
其它一般的故障,不影响系统的整体运行,不影响大部分客户的使用
第十九条应急措施
(一)黑客攻击时的紧急处置措施
(1)当发现网页内容被篡改、Internet接入路由器有未知用户登录或通过其他方式发现有黑客正在进行攻击时,应立即向信息部相关人员通报情况;
(2)在信息部人员授权下,立即备份当时的log日志并采用端口限制方式阻断外部的入侵,观察被攻击的服务器等设备状态,同时向信息部领导汇报情况;
(3)协调相关应用部门,与信息部有关技术人员一同负责被破坏系统的恢复与重建工作;
(4)协助信息部人员协同有关部门共同追查非法信息来源;
(5)情况严重的,根据突发事件级别应及时向有关上级部门汇报。
(二)病毒安全紧急处置措施
(1)当发现计算机感染有病毒后,应立即将该机从网络上隔离出来;
或从网络设备状态发现病毒爆发应采取show
mac-address
sh
arp定位或IP查询将病毒机器所在的网络设备端口shutdown;
(2)通知维护人员对该设备的硬盘进行数据备份;
(3)启用杀病毒软件对该机进行杀毒处理,同时进行病毒检测软件对其他机器进行病毒扫描和清除工作;
(4)如发现杀病毒软件无法清除该病毒,应立即通知用户并向及信息部负责人报告,经信息部技术人员确认无法查杀该病毒并同意格式化硬盘后,作好相关记录,并格式化硬盘;
(5)机器恢复后重新开启网络设备的相应端口;
(6)认为情况极为严重,根据突发事件级别应及时向有关上级部门汇报。
(三)广域网线路中断紧急处置措施
(1)链路出现问题后,网络维护人员应立即信息部负责人报告,沟通地方节点技术人员共同迅速判断故障,查明故障原因;
(2)如属我方管辖范围,由双方技术人员立即配合予以恢复。
如遇无法恢复情况,立即进行备件更换或向有关厂商请求支援;
(3)如属运营商管辖范围,立即与运营商维护部门申报故障,请求修复;
(4)根据突发事件级别应及时向有关上级部门汇报。
(四)局域网中断紧急处置措施
(1)局域网中断后,网络维护人员应立即判断故障节点,查明故障原因,并向信息部领导汇报;
(2)如属线路故障,更换新线路或重新安装线路;
或从最近飞线至故障设备;
(3)如属路由器、交换机等网络设备(光模块)故障,应立即查找是否有相关备件可以替换,或与设备提供商联系更换设备,并调试畅通;
(4)如属路由器、交换机配置文件破坏,应迅速按照备份配置文件重新配置,并调试畅通;
如遇无法解决的技术问题,立即向有关厂商请求支援;
第二十条网络突发事件记录文档
第八章电源系统应急预案
第二十一条定期检查机房供电设备的运行状况和电路线缆器材情况;
第二十二条当机房发生市电供电突然停电或是电源异常时。
首先应和供电局联系确认正常停电以及预计停电时间。
检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将不在UPS电源供电范围内的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象;
第二十三条当确定停电时间超出机房UPS承载范围后,首先确定停电的范围以及受影响的设备范围。
并及时通知各部门和支公司营销部做好停电应急准备。
然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。
在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复;
第二十四条当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。
对于恢复时间无法预计的,要通知各个部门做好准备工作;
第二十五条恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。
第九章消防和防雷应急预案
第二十六条上班工作时间发生火警,还在机房工作的人员应及时紧急撤离,并立刻拨打119报警。
在确保自身安全的情况下,应尽量使用灭火器进行灭火,减少电子设备的损坏。
同时采取关闭电源总闸等措施,尽量减少可能造成的损失和破坏;
第二十七条非工作时间或节假日休息时间值班人员发现火情后,要立刻拨打119报警,并立刻通知相关部门和领导,做好火灾的处置工作;
第二十八条火情结束之后,机房相关人员应全体赶赴现场,并向公司相关部门汇报。
同时立即联系相关网络公司和设备相关厂家,及时评估事故损失情况,研讨恢复网络系统正常运行的最佳解决方案;
第二十九条遇雷暴天气或接上级部门雷暴气象预警,应关闭所有服务器,切断电源,暂停内部计算机网络工作。
雷暴天气结束后,及时开通服务器,恢复内部计算机网络工作。
因雷击造成的损失,应及时进行核实、报损,并将详细情况向部门领导汇报。
第十章自然灾害应急预案
第三十条发生自然灾害后,首先应该组织人员撤离现场。
当确认灾害不会造成人生伤害后,在回到机房检查设备,立刻向上级领导汇报,并联系相关网络和设备厂家,积极做好灾后恢复工作,确保在最短时间内恢复机房正常运行;
第十一章
第三十一条本标准由信息技术部负责解释。
第三十二条本标准自颁布之日起实行。
第十二章附件
附件一维护小组成员
现场服务人员联系方式
序号
职务
姓名
手机
邮件
附件二厂家协助服务人员联系方式
公司
电话
职责
网络设备代理商
服务器及小型机等设备代理商
机房弱电相关事项
机房强电相关事项
机房空调
UPS设备
发电机设备
物业工程部
消防设施
比较文学是一种以寻求人类文学共通规律和民族特色为宗旨的文学研究。
它是以世界文学的眼光,运用比较的方法,对各种文学关系进行的跨文化的研究。
一个国家或民族的文学思潮、文学运动队另一个国家或民族文学发展的影响,不同国家具体作家的相互影响