ImageVerifierCode 换一换
格式:DOCX , 页数:62 ,大小:426.59KB ,
资源ID:27924480      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/27924480.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(计算机机房应急预案.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

计算机机房应急预案.docx

1、计算机机房应急预案计算机机房应急预案XXXX单位名称20XX 年 XX月编 制 人 员编 制 审 核XXX XXXX前 言近年来,经常会听到某地机房发生因某种原因导致灾难性的事件;由于处理不及时或人为因素操作不当, 导致严重后果,造成了巨大的经济损失。 为了避免类似事情发生,项目组每年对应急预案进行修订,优化使用流程及操作步骤,保障在突发情况下及时、有效处理各类应急情况。本应急预案编制依据单位网络系统运行管理规定而编写。根据单位领导提出新的改进建议,应急预案的版本修订相比之前有了较大的改动,项目组结合机房的实际情况, 针对所涉及故障及其处理方法分别进行说明并细化了每一个处理步骤,增加了非工作时

2、间机房出现突发事件的处理步骤及紧急联系人相关信息,确保维护人员能够直观、及时、有效地处理突发情况,在维护人员不能第一时间到达现场,其他人员也能以及有效协助处理突发情况。项目组每年组织两次的机房应急演练,模拟机房设备故障,维护人员参照应急预案能够熟练操作并进行突发事件的处理,验证应急预案对于机房的有效性和可用性。目次1概述.11.1目的 . .11.2应急预案存放 . .11.3编制依据 . .11.4技术资料 . .12适用范围及启动条件 .13应急组织和职责 .24应急响应流程 . .34.1应急事件响应 .34.2应急事件升级 .35应急执行流程 . .45.1影响程度的评估 .45.2宣

3、告启动应急 .45.3应急恢复 .55.4事后处理 .55.5应急注意事项 .56应急恢复步骤 . .66.1强电系统故障 .66.2 UPS 故障 .96.3网络系统故障 .106.4机房漏水 .126.5空调故障 .146.6机房火灾 .17附表一 交换机信息 .22附表二 自主运维办公交换机信息 .22附表三 交换机常用命令 .23附表四 机房应急预案联系人信息表 .23附表五 机房服务器联系人信息表 .237 预案附录 24附录一 机房示意图 24附录二 配电柜操作说明书 24附录三 UPS 操作说明 24附录四 空调操作手册 24附录五 设备监控软件使用说明书 241 概述1.1 目

4、的为了提高单位计算机机房、网络突发事件的应急处理能力,最大程度地预防和减少突发事件及其造成的损害,保障设备正常运行,制定本预案。本预案参照单位领导的要求,对机房空调、电力、消防、漏水以及网络系统五种突发情况制定具体的应急工作流程。1.2 应急预案存放1) 电子版本本应急预案电子版存放于单位共享服务器及所有项目组成员工作电脑中。2) 纸质版本本应急预案纸质文档存放于机房缓冲区桌面、运维人员办公室。1.3 编制依据本应急预案编制依据单位安全管理规定编写。1.4 技术资料序号资料名称存放地点获取方式1UPS使用手册机房缓冲区桌面进入机房获取2机房专用空调操作维机房缓冲区桌面进入机房获取护指南3消防使

5、用手册机房缓冲区桌面进入机房获取2 适用范围及启动条件1) 地域范围:本预案适用于本单位机房及网络运行中发生故障时使用。2) 人员范围:本预案在执行中涉及的人员包括机房、网络运维人员,相关主管领导,大楼安保人员以及机房内各应用系统负责人等。13) 启动条件机房、网络运行中出现的一般性突发事件和重大突发事件。一般性突发事件:是指机房、网络突发故障,将影响机房提供正常服务及网络服务的能力且预计修复时间大于 30 分钟,此时应立即启动应急预案,主要包括:1) 市电中断和 UPS 故障引起的电力供应中断。2) 机房空调冷凝水或上下水管道漏水。3) 机房温度超过 30。4) 网络故障影响用户范围超过 2

6、0%,预计修复时间在 2 小时以内。重大突发事件:是指一般性突发事件在特定的时间内无法修复或发生特殊事件时,严重影响机房提供正常服务及网络服务的能力,并且修复时间大于 2 小时,此时除了立即启动应急预案外还应升级为重大事件,其中包括但不限定于以下分类:1) 机房出现火灾。2) 市电中断和 UPS 故障引起的电力供应中断。3) 机房温度超过 40。4) 网络故障造成全网中断,预计修复时间超过 2 小时。3 应急组织和职责计算机机房应急组名单如下:表 1 应急小组名单部门 / 岗位 职责 姓名 联系方式单位领导 重大应急决策指挥部门主任 应急决策指挥应急小组组长 负责评估应急事件并协调处理应急预案

7、操作岗 启动应急预案并实施24 应急响应流程4.1 应急事件响应1、发生突发事件时,通过电话或当面通知应急小组组长报告情况。2、必要时第一时间启动应急预案。3、应急小组组长根据实际情况启动应急预案,参照应急恢复步骤组织协调相关人员进行应急处理。4、电话通知机房内生产业务系统管理员做相应的应急措施。5、应急小组组长根据情况判定是否需要将事件升级为重大事件。6、事件处理完毕后,应急小组组长将事件处理详细经过形成书面报告,上报部门主任和单位领导。4.2 应急事件升级在应急小组组长认定突发事件升级为重大事件时,应按以下步骤操作:1、立即通知部门主任。2、通知机房内生产业务系统管理员事件升级为严重,参照

8、应急恢复步骤做相应的应急措施。3、根据应急决策领导的决策指令处理故障。4、事件处理完毕后,应急小组组长将事件处理详细经过形成书面报告,上报部门主任和单位领导。35 应急执行流程5.1 影响程度的评估表 2 影响程度评估表序号故障类型影响程度及范围一般性突发事件重大突发事件市电中断和 UPS影响程度大,修复时间大于影响程度为重大, 修复时间30 分钟,小于 2 小时的电力2 小时以上的电力供应中1故障引起的电供应中断 , 影响范围为机房断 , 影响范围为机房内所有力供应中断。内所有设备及系统。设备及系统。影响程度一般,机房出现小影响程度重大, 机房出现大摊积水,修复时间大于 30面积漏水,或者漏

9、水修复时2机房漏水分钟,小于 2 小时的机房漏间 2 小时以上的机房漏水,水,影响范围为机房内所有影响范围为机房内所有设设备及系统。备及系统。影响程度大 , 机房温度超过影响程度重大, 机房温度超30 度,修复时间大于 30 分过 40 度,修复时间 2 小时3机房温度过高钟,小于 2 小时的,影响范以上的空调故障, 影响范围围为机房内所有设备及系为机房内所有设备及系统。统。影响程度大,修复时间大于影响程度重大, 修复时间 230 分钟,小于 2 小时的网络小时以上的网络系统故障,4网络系统故障系统故障,影响范围为生产影响范围为生产业务系统业务系统及影响用户范围超及影响用户范围超过 20%。过

10、 20%。影响程度重大, 影响范围为5机房火灾-机房内所有设备、 系统及用户。5.2 宣告启动应急应急小组组长宣告启动应急预案,并通知应急预案操作岗所有成员参与预案的执行。重大事件时要向部门主任、单位领导汇报。45.3 应急恢复突发事件发生后,应急组长根据不同的启动条件执行应急预案进行应急恢复。表 3应急恢复步骤序号启动条件恢复步骤操作人员备注1市电中断见步骤 6.1应急小组组长、 应急预案操作人员2UPS故障见步骤 6.2应急小组组长、 应急预案操作人员3见步骤 6.3应急小组组长、 应网络系统故障急预案操作人员见步骤 6.4应急小组组长、 应4机房漏水急预案操作人员5见步骤 6.5应急小组

11、组长、 应空调故障急预案操作人员见步骤 6.6应急小组组长、 应6机房火灾急预案操作人员5.4 事后处理事后仔细分析事件发生的原因,查找引起事件发生的根本原因,力争杜绝类似问题的再次发生;总结每次应急处理的经验与不足,及时进行总结记录,作为知识储备,进行共享;重大事件处理完毕时, 要向部门主任、 单位领导及时汇报整个事件的处理过程,并提出预防措施建议。5.5 应急注意事项为了在突发事件发生时,能够及时顺畅地执行预案,应保证以下几点 :平时多做应急演练,对应急小组的组织和预案执行力进行检验和加强。熟读应急预案,责任分工明确,应急流程掌握熟练。加强技术能力和业务能力。通讯保持畅通,应急小组的人员要

12、保持 24 小时手机开机。处理应急突发事件时要认真做好应急处理记录,有利于进行问题回溯。56 应急恢复步骤6.1 强电系统故障6.1.1 市电中断1) 当发生市电中断或同时收到 UPS输入、电量仪、空调及数据库读取异常等告警短信,立即到机房检查 UPS工作状态。非工作时间发生电力中断时,电话联系保安人员进入机房确认是否停电, 同时联系附近的紧急联系人协助处理, 并直接跳到第三步。紧急联系人姓名 联系电话 备注(住所)2) 检查 UPS的负载量及电池能够支持的时间:步骤:双击 UPS控制面板“ ESC”按键,点击“ ”键,找到相关信息,查看电池负载;在“电池参数显示”处,查看备用时间确认 UPS

13、供电剩余时间。(具体详情可参照附录三:UPS操作说明进行操作。图1 UPS控制面板3) 立即拨打物业电话, 询问断电原因及断电预计恢复时间, 同时通知应急小组组长。(如电话无人接听,立即拨打物业人员手机询问具体情况,物业人员详细联系方式可参照附表三:联系人信息表进行查询)4) 当发生单路供电中断时, 应立即通知物业切换至另一路供电, 观察 UPS状态是否供电正常,等待第一路供电恢复切回。5) 如物业通知无法切换电路且 30 分钟内无法恢复供电, 应立即按照附表五:机房服务器联系人信息表 的清单顺序通知各生产业务系统管理员进行系统备份并关闭系统。同时维护项目组关闭机房内负责的所有设备。6) 向部

14、门主任及单位领导汇报当前情况。7) 确认所有服务器关闭后,直接手动拉下配电柜 01 后面 A4、A5、A6、 B2、B5、6C3机柜输出开关,关闭网络设备。8) 当机房温度超过 40 度时,为确保机房内服务器安全,经单位领导许可,维护组人员按顺序直接拉下位于配电柜 01 后面所有机柜输出开关,关闭机房内所有设备。图2 配电柜 019) 待市电恢复供电后,打开网络机柜对应的输出开关,启动网络设备。10) 按附表五中的清单分批次对系统服务器加电, 通知相关人员进行测试, 并要求相关人员电话回复系统测试结果。11) 如 UPS故障造成的电力供应中断,手动重启 UPS,查看 UPS故障是否解除并恢复正

15、常。(在 UPS显示屏上点击“开机” ,查看 UPS是否正常启动)12) 如 UPS故障依旧,立即通知各生产业务系统切换备份系统。13) 向部门主任和单位领导汇报当前情况,并联系厂商对UPS进行检修。14) 待所有系统恢复正常后,提交处理报告,上报部门主任和单位领导。76.1.2 市电中断流程图图 3 强电系统故障处理流程图86.2 UPS 故障6.2.1 UPS 电池漏液、冒烟1) 发生机房电池漏液、冒烟或监控组人员发现机房电池柜冒烟,立即到机房查看电池状态。(电池柜位于储藏室内部)图 4 机房电池柜2) 如发现是电池漏液、冒烟导致,应按照下列处理方法操作。并密切观察 UPS工作状态。3)

16、关闭电池供电时,先将机房手提式干冰灭火器放置电池柜附近。4) 打开两组电池柜,手动关闭电池开关。开关位于电池柜的下方,此时应用力向左拨动电池开关,直至开关显示“ OFF”状态。图 5 电池柜的开关位置5) 如电池出现火情,使用事先准备的手提式干冰灭火器进行灭火。6) 确认无火情后,查看 UPS状态,供电情况,立即联系厂商工程师进行检修。注意:关闭电池开关不会影响机房的正常供电。7) 向部门主任做口头汇报 , 电话上报单位领导。8) 事件处理完毕后,将事故处理报告,单位领导。6.2.1 电池火情无法控制导致机房火灾1) 处理电池漏液、冒烟过程中,无法使用手提灭火器控制火情。2) 打开电池柜,手动

17、关闭电池开关。3) 立即按照机房火灾处理步骤进行操作。 (详情见步骤 6.6 机房火灾进行操作)4) 火灾处理完毕后, 消除火灾报警,恢复市电,查看 UPS运行状态, 如无法恢复市电,立即通知物业切换备用电路,观察 UPS状态是否正常供电。步骤:打开机房配电柜 2,手动用力推上机房电力闸恢复市电供应。图6 机房电力总开关5) 立即联系 UPS厂商进行处理并向部门主任做口头汇报 , 电话上报单位领导。(详细联系方式可参照附表三: 联系人信息表进行查询)96) 统计火灾造成损失,提交相关更换 UPS电池的申请。7) 事件处理完毕后,将事故处理报告,上报部门主任和单位领导。6.2.3 UPS 故障处

18、理流程图7 UPS故障处理流程图6.3 网络系统故障局部楼层网络中断1. 如果是局部楼层断网,首先判断是否是交换机故障;2. 远程 PING交换机管理地址(各楼层管理地址详见附表 1)看是否可以正常 PING通3. 如果可以 PING通,证明交换机本身没有故障,网线没有故障。交由网络管理员处理。4. 如果不能 PING通,说明交换机主线断或交换机宕机,应去弱电机房找到该楼层交换机上联端口和电源灯状态是否正常,如果上联端口不亮(光纤口) ,证明主线有问题,更换主线测试。5. 如果看到交换机电源灯不亮,证明交换机掉电,检查电源和电源线。6. 如果以上通过检查交换机和线路后故障现象仍然存在,由此判断

19、可能交换机存10在异常,按交换机故障进行处理。交换机故障1. 当确认是交换机出现故障时,应首先从库房中找备用交换机进行更换;2. 若原有故障交换机有配置,应立即联系网络管理员对更换的交换机进行配置(网管应有所有交换机的配置备份)3. 配置完成后,测试是否正常;全网中断1. 首先测试网络的连通性,查看是否可以 PING通网关地址,如果可以 PING通说明从 PC到核心交换机之间的链路正常,如 PING不通应检查接入交换机是否有故障、是否掉电或者交换机主线是否不通;如果确实不通,按照局部楼层网络中断中的第4 条、第 5 条处理。2. 通过访问邮件、外网网站,判断是局域网问题还是广域网问题,如果局域

20、网正常;无法访问互联网说明广域网中断,向运营商进行报修。3.PING 核心交换机到核心路由器的互联 IP 地址的连通性,如果可以 PING通,说明路由器以下网络连通性正常;4. 用 tracert 命令 tracert 办公网网段的任意地址如果 tracert 结果可以从出去,但不能到达外部网络,说明有可能是核心路由器上联链路中断,向运营商进行报修。5. 若可以访问办公地址,无法访问互联网网站如:XX、搜狐,需要检查代理服务器是否正常, PING是否可以连通,向运营商进行报修。其他网络中断故障1. 当办公网部分用户无法获取 IP 地址,不能上网的时候,尝试用能上网的主机,进行 IP 测试。2.

21、 用 PING命令去 DHCP服务器是否可以 PING通,并通知网络管理员登陆 DHCP服务器进行检查服务是否正常,如果是 DHCP服务器故障,应立即切换备用 DHCP3. 如果从网管员处确定 DHCP服务器没有故障,应 PING核心交换机的这个 IP 地址看是否有延时长、丢包的现象,如果有应该可以初步判断院内有 ARP广播风暴形成环路或者大面积病毒爆发;再次交由网络管理员处理。116.4 机房漏水1根据机房环境监控检测的漏水示意图,查找漏水位置,判断漏水严重性。2. 在非工作时间 , 通过电话第一时间通知值班室保安,关闭上水总开关。3机房漏水并触发告警分为以下 3 种情况:1) 上水管漏水

22、:使用地吸打开空调前地板,查看上水管漏水位置( 1 层饮水间通过走廊从机房 6 号空调地板下进入机房) 。图8 空调上水管道2) 发现漏水位置,应立即关闭位于一楼饮水间顶棚的上水总开关,将水迹擦干。3) 立即联系机房工程有限公司,处理水管漏水故障。 (详细联系方式可参照附表三:联系人信息表进行查询)4) 空调冷凝漏水 :分别检查 3 台空调地板的下水管道是否漏水,空调下水开关是否打开。(开关逆时针旋转为打开,顺时针旋转为关闭)图 9 机房 1、2 号空调下水管道及开关图10 机房 3 号空调下水管道及开关5) 如下水开关正常打开,冷凝水无法下水,说明下水管道堵塞。6) 首先关闭机房内空调及空调

23、下水管阀门(下水阀门1-4 )7) 分别打开上水阀门 1 和上水阀门 4,进行机房下水反冲。12图11 机房上下水管道及阀门示意图8) 空调反冲过程中,密切关注机房温度,确保温度不影响机房内设备的运行。9) 反冲完成后,首先关闭上水阀门,然后打开空调下水阀门并打开空调。10) 如故障依旧,联系厂商进行检修。11) 空调压缩罐瓶体结霜: 打开空调前面板, 查看压缩罐上是否结霜。(拆卸面板工具在机房缓冲区的工具箱里)图12 机房 1、2 号空调压缩罐位置图13 机房 3 号空调压缩罐位置12) 关闭空调,将压缩罐上的霜及滴下的水迹擦干。13) 尝试重新开启空调,观察空调运行状态。14) 如故障依旧,立即联系厂商进行处理。4. 事件处理完毕后,将事故处理报告,上报部门主任和单位领导。136.4.3 机房漏水处理流程图图 14 机房漏水处理流程图6.5 空调故障6.5.1 高压报警1) 收到空调高压告警后,立即进入机房查看空调运

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1