机房日常维护方案.docx
《机房日常维护方案.docx》由会员分享,可在线阅读,更多相关《机房日常维护方案.docx(15页珍藏版)》请在冰豆网上搜索。
![机房日常维护方案.docx](https://file1.bdocx.com/fileroot1/2022-12/1/d75b6a58-8833-49e7-bef4-e1d0bc1c5502/d75b6a58-8833-49e7-bef4-e1d0bc1c55021.gif)
机房日常维护方案
第一章日常维护方案
一、预防性检查
1.1巡检地点
机房、精密空调、UPS等。
1.2巡检目的
进行机房检查,对机房设备及供电系统、UPS系统、精密空调系统、录像系统等设备进行检查,及时发现设备隐患,排除故障。
1.3巡检要求
巡检期间,进行状态检查,若发现问题,如机房物理环境异常、精密空调异常、UPS及配电系统异常等,应按照应急预案及操作流程进行处理。
(1)电源、UPS:
检查机房供电状况,UPS工作情况、指示状态。
检查UPS蓄电池使用状态,确保蓄电池无松动。
并使用温度枪进行检测物理温度。
确保配电柜及UPS、蓄电池无温度过高现象。
(2)机房环境:
检查机房卫生状况及物理环境。
(3)机房温度:
检查温湿度,将温湿度控制在一定范围内。
温度:
22℃±5℃,湿度≤60%。
(4)机房空调:
空调运行状态、空调内部有无漏水现象、空调噪音、空调风量等。
(5)机房照明:
机房照明系统是否正常,有无异常状况。
(6)机房PDU:
PDU市电或UPS是否正常,使用温度枪进行检测外部物理温度。
(7)机房整体:
检查机房其余设备运行状态,有无报警及指示灯异常状态。
1.4如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知甲方相关领导,由相关领导协调资源进行故障处理。
1.5故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。
机房现场管理要求:
除工作人员外,其他工作人员进出机房,需签字后方可进入,同时机房人员要在现场,检查监督其人员工作,避免其他人员XX擅自接触机房物理设备。
机房的机柜、线缆、设备等的标签管理;
2.机房环境清理。
每日检查内容列表
项目
性能检查内容
脆弱性检查内容
空调系统
高压压力、低压压力(风冷系统),冷冻水压力、温度,冷却水压力、温度(水冷系统),风机运行情况,滤网、内机排水系统、灰尘情况等。
机房热点情况、室内机漏水检查、室外风机运转情况、加湿罐阳极棒检查、过滤网检查等。
供配电系统
输入输出功率,输入输出电流、断路开关、接地电阻、零序电流、器件发热情况等。
导线、器件发热情况,断路开关、防浪涌器件情况等。
UPS系统
负载功率情况、器件发热情况、电池情况(外观、液位、接线柱)等。
器件、导线发热情况,电池放电时间等。
安全系统
录像备份管理、出入机房登记、器件灵敏度、画面清晰度(不同照度情况下)、云台运行等。
器件灵敏度、监控死角问题等。
设备运行
机房环境
查看设备运行指示灯、机房照明运行情况、机房环境
设备运行是否有报警情况、照明是否正常、机房卫生是否整洁等
二、现场故障维修
每日巡检过程中,如有发现设备及环境系统有故障状态,需进行记录并恢复故障状态。
如不能立即恢复故障状态,则需进行应急预案处理。
具体如下:
2.1环境故障:
卫生、温湿度、照明。
(四级故障)
2.2交换机故障:
交换机蜂鸣,交换机启动不正常,指示灯异常。
(三级故障)
2.3空调故障:
空调压缩机故障、空调冷凝水故障、空调漏水故障、空调制冷故障、空调加湿器故障等。
(二级故障)
2.4UPS故障:
UPS逆变故障、UPS旁路、UPS蓄电池温度、UPS蓄电池外观鼓包现象、UPS蜂鸣报警等(一级故障)
2.5配电柜故障:
配电柜内温度过高、配电柜打火现象等。
(一级故障)
在解决故障时,最大限度做好故障恢复的文档,力争恢复到故障点前的业务状态。
对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于30分钟内解决故障,应立即提出应急方案,确保业务系统的运行。
故障解决后24小时内,提交故障处理报告。
说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。
故障类型、级别及相应标准列表:
故障级别
响应时间
故障解决时间
I级:
属于紧急问题;其具体现象为:
机房出现电力事故等意外情况导致业务停止、UPS系统崩溃导致业务停止、空调系统崩溃导致业务停止。
电话立即响应,5分钟内人员抵达现场,30分钟内恢复业务使用,2小时内提交故障处理方案。
12小时以内
II级:
属于严重问题;其具体现象为:
出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。
电话立即响应,5分钟内抵达现场,1小时内提交故障处理方案
24小时以内
III级:
属于较严重问题;其具体现象为:
出现系统报错或警告,但业务系统能继续运行且性能不受影响。
电话立即响应,5分钟内抵达现场,2小时内提交故障处理方案
48小时以内
IV级:
属于普通问题;其具体现象为:
系统技术功能、安装或配置咨询。
电话立即响应,30分钟内抵达现场,2小时内提交故障处理方案
3天内
三、后台故障维修
后台故障状态维修,需要在甲方允许的情况下,对设备进行维护及维修。
3.1质保期内的设备由我方查找故障原因并填写故障申请单,交由甲方进行协调处理,并协助甲方进行故障排除及维修。
如需联系厂商,则由我方负责。
3.2三级及四级故障状态,我方可自行进行维护和维修的设备,报由甲方同意后,我方自行进行设备维修,更换零配件部件等,并将维修记录保存文档交由甲方及我方双方管理。
3.3质保期外的设备出现故障,则由我方统一进行维修,费用由我方负责。
并将维修记录报由甲方确认并存档。
3.4设备更换
对于无法修复的设备,在合同有效期内,经甲方审核,由乙方负责整体更换同型号或类似型号的产品,无法维修的设备交由甲方。
更换单个备品备件费用大于等于500元时,报甲方审核同意,备品备件费用由甲方承担;更换单个备品备件小于500元时,备品备件费用由乙方承担,质保期内由供货商(厂商)进行更换的除外。
四、资产管理
4.1对硬件设备型号、数量、版本等信息统计记录
4.2对软件产品型号、版本和补丁等信息统计记录
4.3对机房设施设备连接统计记录
4.4对综合布线系统结构图的绘制
4.5对机房更换设备连接统计记录
4.6每月向甲方上报低值易耗品记录,包括仓库存储情况、耗材使用情况。
4.7机房更新及更换设备的统计
4.8机房维护设备及备品备件的管理及记录
五、人员管理要求
参照甲方的有关工作制度进行人员管理,如作息时间、着装、考勤等。
人员派驻须经过甲方的审核,人员更换须在招标人进行备案。
对维保人员的管理员应按照甲方的要求和标准来进行执行。
人员具体职责如下:
(一)硬件维护人员岗位职责:
1、及时高效地完成分配的硬件维修等各项任务,保证硬件的正常工作。
2、维护人员要熟悉计算机原理和操作规程,熟悉仪器仪表使用方法。
维护工作应遵循微机故障与维修的操作步骤、基本原则和维修方法进行。
3、经常检查供电系统是否正常,电器连接点是否牢固,用电器温度有无异常;检查机箱、显示器上的开关是否完好。
对键盘、鼠标等易损件进行常规检查;对硬件系统进行外观和静态检查;对微机系统进行全面的动态检查,发现问题及时解决。
4、寒假、暑假或长期不用期间,要定时对其进行开机上电操作,以使机器内部保持干燥。
5、寒假、暑假或长期不用期间,要使用塑料袋将主机、显示器及网线接头等严密包裹起来,避免受潮。
6、网络连接线路在使用过程中会出现各种故障,如某一工作站不能连接上网或一组工作站不能连接上网,这需要维护人员熟悉网络拓扑结构,通过检查网线、网络连接点、网卡、服务器以及集线器、交换器等网络设备,找出故障点给予排除。
7、当硬件发生故障时,及时排除故障,尽快恢复系统的运行。
8、定期进行硬件的例行维护,建立每台机器的维护档案。
9、每次维修必须进行登记,包括更换的设备和配件。
10、积极参加业务学习,不断提高业务水平。
(二)软件维护人员岗位职责:
1、及时高效完成软件维护等各项任务,保证计算机系统的正常运行。
2、日常维护保养时,开机关机一定要严格遵守操作规程,不可随意进行,特别在微机运行过程中不能随意冷启动机器。
机器运行当中,软件维护人员应时刻观察有无异常情况,及时发现及时处理。
3、软件维护人员应备有各种工具软件、常用应用软件、操作系统软件和程序语言软件并留存实验中心一份。
4、软件维护人员平时要实时、定期对计算机病毒进行查杀。
及时对杀毒软件进行升级,保证杀毒的有效性。
要从预防病毒入手,对外来的软件或文件应事先查杀再使用。
断绝病毒传播途径。
5、积极协调硬件维护人员排除硬件故障。
6、平时应根据实验内容和计算机技术发展水平及时调整和更新网络中的各种软件,以适应运用计算机进行教学的需要。
7、平时要做好系统保护与数据备份工作,系统出现问题后能够快速恢复。
8、认真参与业务学习,不断提高自身的软件维护水平。
9、作好软件的安全保密工作。
六、定期检查方案与计划
(一)定期维修
定期维修是按时间计算,应对机房和机房设备作定期检修。
维修应包括以下内容:
1)对机房内部和周围环境作一次彻底性的清理,把卫生搞好。
2)对机房内所有设备作一次清洗,除尘。
3)对空调设备、新风设备的过滤装置作一次清洗。
4)排除设备在使用时出现的故障和缺陷。
5)检查、测试机房电源系统工作的情况,并做好登记。
6)检查、测试机房空调设备工作的情况,并做好登记。
7)其它检查。
(二)换季维修
换季维修是在每年进入夏季之前和进入冬季之前为保障机房及机房设备在盛夏和严冬能正常使用而进行的预防性检查。
换季维修应包括以下内容:
1)完成定期维修的内容。
2)对空调设备中的蒸发器、冷凝器进行一次大清洗、大检查。
3)检查并排除影响冷凝器散热效果的障碍。
4)检查空调设备加湿水的供应状况。
5)检查空调设备冷凝水的排泄管道是否畅通,有无异物堵塞。
6)检查加热装置的工作状况。
7)检查各种电缆、导线的固定,走向及通电后温升情况是否符合要求。
8)检查各种安全设备、防火设备及报警设备的工作状况。
9)夏季到来之前,还应检查机房防水(或雨水)浸入室内措施落实的情况。
10)其它检查。
(三)重大任务开始前检修在重大任务开始前,为了保障机房及设备正常运行,为顺利完成重大任务提供可靠的环境而进行的检修。
主要应包括:
1)完成季节性检查的维修内容。
2)根据任务的要求,定向检查一些有关设备的情况。
3)为了保障重大任务约完成,临时增设一些设备的安装和调试。
4)其它有关的检查维修。
(四)定期中修机房及其设备经过一段较长时间的连续使用,机件的磨损和自然老化,会使机房和设备存在一些问题,为了保障机房和设备进一步使用,必须认真地对机房和设备进行维修。
设备连续使用10000小时左右要进行中修,其主要内容有:
1)机房的结构,外部环境的检修。
机房建筑结构的变化。
机房的严密性。
从机房穿过的为楼内其它楼层使用的各种管线对机房的影响。
机房与外部各种连接用管路的畅通、密封性检修。
机房周围环境的变化情况对机房的影响。
2)机房内装修部分的检修。
机房吊顶部分要打开一些活动顶板。
检查顶部各种电缆、信号线、管道的连接、固定。
清除吊顶上的积尘。
受损吊顶的更换、调整。
对机房墙面装饰板进行全面的检查,清洁。
机房内活动地板打开一部分进行检查。
检查地板下电缆、导线、信号线各种设备使其附件的固定。
清洁地板下部的积尘。
对损坏、变色地板的更换和调整。
检查机房内各种门、窗、隔断的固定,玻璃密封条的完整性。
门和窗的关闭、开启的灵活性。
关闭时的密闭性。
对损坏灯具、门窗拉手、照明开关的修理、更换。
3)完成空调制冷系统中修的检查。
检查压缩机、排除异常情况。
清洗蒸发器、冷凝器、蒸发器,特别对室外机要重点清洗。
对润滑系统清洗,更换润滑油。
清洗、更换过滤网。
检查皮带松紧情况,调整到合适的程度。
检查电器线路的完好和控制开关的灵活性,接触的可靠性。
检查制冷剂是否泄漏,需要时予以补充。
检查冷凝管道有无损伤、变形。
检查上下水管道是否畅通,接口有无裂缝。
测试各个部位的工作性能参数。
对怀疑部位进行认真检查,消除疑点。
4)完成机房供配电系统的中修检查。
检查市电的电压是否稳定。
配电柜各接触点是否牢固,如有松动及时紧固。
调整机房内三相电源使之均衡分配。
检查电源线套管有无破损、各类开关、控制器是否灵敏,并加以解决。
各类插座有无损坏并予以更换。
整顿机房使用中用电的不规范行为。
5)完成UPS电源定期检测内容。
检查并清理使用UPS的非计算机类设备。
测量UPS的输入输出电压是否正常并加以解决。
对非免维护的UPS的电池进行一次放充电。
清理蓄电池的灰尘并检查有无泄漏情况。
6)对机房接地系统进行一次全面的检查测试。
计算机直流接地电阻小于一欧姆。
计算机交流接地电阻小于四欧姆。
计算机安全接地电阻小于四欧姆。
若使用组合接地系统,则计算机组合接地电阻小于一欧姆。
7)对安全消防系统和自动报警系统的设备和线路进行一次全面的检查、测试。
设备的固定。
线路和管路的固定和连接。
探头技术性能要进行实测。
消防系统有关附件的技术性能测试和联动试验。
检查灭火气体设备间使之符合设计要求,钢瓶压力达到技术指标。
非气体灭火的其它灭火设施,均应符合技术要求。
更换手提灭火器材。
8)中修后要对机房的状况和设备技术性能作一次全面的结论。
在结论中应有以下内容:
机房内环境的技术性能。
机房外部影响的程度。
机房设备主要技术性能参数及使用状况评估。
需要更新的机房设备。
对机房使用状况的评估。
(五)定期大修
机房及其设备连续使用30000小时左右时要对机房及其设备进行大修。
大修时除完成中修内容和排除机房内设备故障外还应增加以下内容:
1)机房的外部环境的影响
对影响机房的外部环境进行调查和测试,在调查的基础上制定改造的方案。
2)机房本身建设结构的状况对机房本身建筑的现状进行一次全面的检查评估,写出调查报告,制定整修计划。
3)机房内部装修要对机房内部装修情况进行一次全面的整修。
在整修前要对机房各部位,各方面进行检查,制定整修计划。
机房内吊顶、地板要全部打开进行检查、清洁;对吊顶、地板的平整度进行调整;更换裂缝、起鼓、脱皮、变色的微孔顶板和活动地板;补刷楼层顶板、地板的防尘漆;墙面饰板严重变形或损坏的要重新更换。
4)按大修内容完成空调制冷设备的检查,制冷系统大修就是要
对机房空调设备和新风设备进行全面的测试、调整。
重点是:
完成中修的内容。
清洗压缩机外壳的油垢和灰尘。
检查并校验温湿度探头和各类控制器的灵敏度、准确性,如果有损坏或动作失调的应予更换。
监测系统中的所有阀门并试压。
检修保温管道及绝热材料,不合格的应重新作保温。
清洗室外机、散热器,并清理其周围的杂物,保证散热充分。
清除辅助设备表面的特铁锈,吹出内部的油腻。
做好大修后的试运行和测试工作。
5)完成供配电系统全面的大修检查。
检查应符合国家和当地供电部门有关规定。
检查后应有供电部门的合格证方可重新使用。
6)对机房专用UPS电源进行全面的检查测试。
在大修中要对机房专用UPS电源作以下性能检测:
检查UPS电源内部的附件,各种电缆、信号线的固定。
对UPS电源作一次全面的清洁。
检查各接线端的可靠性,清洁各种开关、接触器的触点。
检查弹簧的强度和灵活性。
检查各种集成电路板的固定和清洁应良好。
检查蓄电池的性能对蓄电池作放电试验。
逐个测量每个蓄电池的终了电压。
对蓄电池作24个小时充电。
不合格的蓄电池要摘除,摘除蓄电池的个数不能多于UPS电源对蓄电池组的最低限度。
蓄电池组不能满足要求时要全部更新。
对UPS电源性能作全面的评估。
7)对安全消防系统进行一次全面技术性能检查。
报警系统的可靠性和准确性检验。
灭火系统管路按规定作耐压试验。
灭火剂瓶(罐)做耐压试验。
灭火药剂如果过期、压力不足应更换或补充。
对照竣工图逐个检查烟感、温感探头的灵敏性。
此项工作应由消防专业人员完成并由消防主管部门现场检查指导。
8)对接地系统进行全面测试。
如果是机房专用接地系统,在条件允许时,可抽查部分接地体在地下的锈蚀状况,接地电阻若达不到要求时,可补做或增加接地体。
9)机房大修后要进行全面验收。
机房大修应组织有机房专业装修资格的公司完成,大修完成后应按机房标准和大修要求进行检查验收。
七、UPS维护保养方案
为保证信息系统的安全,UPS间的建设尤为重要。
由于供电系统中不可避免的存在如供电中断、电压浪涌、电压陷落、波形畸变、频率漂移、持续过压、持续低压、瞬间过电压和噪声干扰等情况,这些情况中的任一出现必将造成整个供电系统的不稳定,尤其是对通信网络信息设备轻则工作出错、通信失败,重则设备损坏、数据丢失、系统崩溃。
作为网络信息系统核心的服务器及通信设备能否稳定地工作,取决于电源系统能否提供高质量、稳定的电源。
因此,UPS的日常维护及保养对于机房的重要性可想而知,我们要做到以下方面。
1、维修服务
1.1提供保修期内在系统正常使用情况下出现故障所需的维修服务。
1.2乙方接到甲方设备故障通知后应迅速作出反应,在指导甲方作简单的应急处理的同时,4小时内到达现场进行故障处理。
1.3乙方为甲方提供全天候二十四小时365天(7×24)服务,节假日和业余时间不加收服务费。
乙方应设立全天候二十四小时365天热线服务电话,并指定专人负责处理和联系。
2、维护服务
乙方应按下述要求为甲方的设备提供维护服务,并对发现的问题做及时处理。
3、服务提供商需具备专业测量仪器和专业设备
UPS专业的测量仪器检测、UPS的输入输出电压,电池的内阻和电压(万用表、电池内阻测试仪、)
UPS设备专业除尘设备和工具(鼓风机、棘轮扳手)
UPS维护保养人员须具备专业的知识和专业技能
4、日常检查的具体项目
A、检查所有电气连接
B、进行放电测试
C、检测电池运行的转换是否正常
D、清理内部灰尘杂物
E、检测内部静态旁路
F、检查内部所有控制线路及带电线路是否绝缘良好
G、断电情况下对UPS系统内部所有端子进行物理检查
H、按客户要求实施功能检测
I、应具备相应的单机/联机软件,对UPS的工作记录和报警记录进行检查,根据记录情况进行预防性维护
J、检查布线是否正确,记录相关情况
K、检查UPS设备,以确保所有连接处紧固,无松动
L、确认内部功能正常
M、检查旁路工作是否正常,包括静态旁路和手动旁路
N、记录所有显示数据和环境参数,包括:
-测量进线负载电流和接地电流
-测量配电盘承载电流
-测量支路的电压和电流
O、进行蓄电池参数测试,用专用电池测量仪表测量每块蓄电池的电压、内阻等参数,出具电池参数报告供招标方参考。
P、月度检查各项
Q、每季度现场维护后,7日内提交维修报告至招标方数,出具电池参数报告供招标方参考。
5、技术档案、交流及培训
5.1乙方应为甲方的设备建立维修维护技术档案。
每次维修维护工作结束时,乙方工程师要详细填写维护维修报告,并由甲方填写意见和签字确认
5.2乙方每季度为甲方提供一份维修维护报告,报告应包括如下内容;
维修服务内容、工作性质计服务时间统计
维护服务内容、工作性质计服务时间统计
故障处理及备件更换情况
设备状况分析及评价
对设备运行计使用的建议
6、UPS及蓄电池检查具体细节
1.电池的保养
对电池组中的电池做静态,动态测试
对电池组的联接进行检查
2.电池在UPS主机上放电测试
3.主机保养
A.检查设备的运行状况
B.对需要进行清扫的机器进行除尘清扫
C.对设备内主要部件进行静态测试
D.检测机内易损单元(逆变器,整流器,静态开关)
E.检查设备的输入,输出联接端子是否牢固
F.恢复设备运行,检测设备的输出主要性能指标
4、在质保期内服务提供商必须为最终用户提供技术服务热线(24小时),负责解答用户在设备使用中遇到的问题,并及时提出解决问题的建议和操作方法(技术服务热线支持应是中文)。
5、在UPS设备(含软件)一年质保期内服务提供商应提供(24小时)现场保修和技术支持服务,2小时内上门响应,如诊断为硬件故障,应携带备件并进行现场更换,承诺尽力在最短时间内恢复系统正常运行,如果故障不能在48小时内排除,服务提供商应提供免费替换服务(设备由服务提供商提供),如果服务提供商在接到通知后的12个小时内未作出响应,则由于故障所造成的全部损失由服务提供商承担。
6、服务提供商应每年对设备进行巡检4次,巡检内容(不少于)如下:
环境检查:
房间的清洁程度;
房间的温度:
电池房(小于25度)、UPS房(小于40度)
设备四周及上面是否有堆积物;
房间的空调通风情况;
设备上方是否有水管
是否所有金属柜、架都有地线连接;
输入滤波器检查:
物理检查:
电感
电容
机柜的清洁
连接紧密程度的检查(过热、氧化)
电感
电容
输入电压V1V2V3测量
电容器的电流
UPS工作情况的检查
整流器/充电器
物理检查
电抗
功率连接的紧密程度(过热、氧化)
信号线连接的紧密情况
板及附件的情况
风扇
输入电压:
U1-2,U2-3,U3-1
谐波含量
幅值URMS
充电电压的测量
直流电压
纹波的测量
校验情况
逆变器:
物理检查
电抗
功率连接的紧密程度(过热、氧化)
信号线连接的紧密情况
板及附件的情况
风扇
机柜的清洁
直流电容情况
直流电容上次更换的日期
逆变器电压的测量:
V1,V2,V3,U1-2,U2-3,U3-1
逆变器电流的控制
每个逆变器支路的电流波形
输出电压的测量:
V1,V2,V3,U1-2,U2-3,U3-1
输出电流的测量:
I1,I2,I3
峰值
峰值因数
校验情况
电池的检查:
电池房温度的检查
电池绝缘情况
电池物理检查
电池资料
调试日期
电池单体的电压
并联组数
串联只数
后备时间(功率因数0.8的负载)
浮充情况下电池电压的测量
记录每块电池的浮充电压
电池组放电测试
电池电压
电池内阻
放电时电池电压的测量
放电时间
放电时的负载电流
放电前的直流电压
放电结束时的直流电压
记录放电曲线
静态开关的检查
物理检查
功率连接的紧密程度(过热、氧化)
信号线连接的紧密情况
板及附件的情况
风扇
切换测试(要由客户的部门经理同意)
由UPS切换到旁路
由旁路切换到UPS