综合监控系统故障处理规程.docx
《综合监控系统故障处理规程.docx》由会员分享,可在线阅读,更多相关《综合监控系统故障处理规程.docx(9页珍藏版)》请在冰豆网上搜索。
综合监控系统故障处理规程综合监控系统故障处理规程西安地铁运营分公司标准XDY/X.00.00(V0.0)综合监控系统故障处理规程20#-#-#发布20#-#-#实施西安市地下铁道有限责任公司运营分公司目录1总则11.1目的11.2适用范围11.3编写依据12定义13服务器故障处理13.1服务器设备概况13.2服务器主要故障及应急处理措施及程序14操作员工作站故障处理24.1工作站设备概况24.2工作站主要故障及应急处理措施及程序25FEP故障处理25.1FEP设备概述25.2FEP主要故障及应急处理措施及程序36交换机故障处理46.1交换机设备概述46.2交换机主要故障及应急处理措施及程序47IBP盘故障处理47.1设备概述47.2IBP盘主要故障及应急处理措施及程序58UPS故障处理68.1设备概述68.2UPS设备主要故障及应急处理措施及程序6附记6综合监控系统故障处理指南XDY/MS-SC-ZK.00.00(V0.0)1总则1.1目的为了向综合监控系统维护人员在重要设备出现故障后,对其故障排查和检修工作进行指导和规范,提高检修质量和效率,同时保障了运营和员工的安全性。
1.2适用范围本预案适用于西安地铁二号线综合监控系统设备的故障指南,是综合监控系统应急处理设备故障排查和维修工作的基本程序和组织原则。
1.3编写依据地铁设计规范(GB50157-2003);西安地铁二号线综合监控工程技术规格书2定义本标准采用下列定义:
主控系统设备:
指维修二部自动化分部所属工作范围内的各种设备:
服务器,交换机,操作员工作站,UPS(不间断电源系统),IBP(综合后备操作盘),FEP(前端处理器)、OPS(大屏幕投影系统)。
OCC:
控制中心。
3服务器故障处理3.1服务器设备概况服务器系统分为车站级服务器和中央级服务器,中央级服务器包括两台实时服务器、两台历史服务器;每个车站的车站级服务器包括两台实时服务器。
3.2服务器主要故障及应急处理措施及程序网卡模块,内存模块,硬盘模块,CPU模块,显卡模块,基板模块、电源模块等硬件设备的处理措施及程序:
记录故障发生时间和故障现象。
提取并保存管理卡片日志,重新启动系统。
如果故障依旧,则设备断电。
更换故障模块,并保存损坏模块并做好记录。
重新启动服务器,使系统运行在双机热冗余状态。
3.2.1操作系统、Systematics应用软件、通信组件等软件故障的处理措施及程序:
提取日志文件,并妥善保存,分析故障原因。
通过备份,恢复系统。
重新启动系统。
系统冗余、系统功能性故障的处理措施及程序:
提取日志文件,并妥善保存,分析故障原因。
通过备份,恢复系统。
重新启动系统。
若故障依然,则申请系统降级运行。
4操作员工作站故障处理4.1工作站设备概况操作员工作站包括:
研华工控机主机、输入输出设备,一般用于显示综合监控系统HMI。
4.2工作站主要故障及应急处理措施及程序4.2.1电源模块、显卡模块、声卡模块、主板模块、CPU模块、硬盘模块、内存模块、鼠标、键盘、显示器等硬件设备故障应急处理措施及程序:
记录故障发生时间和故障现象。
系统运行在冗余工作站单机状态。
系统断电,更换故障模块。
如有必要,重新安装系统所需要的软件。
(比如,重新安装声卡后,需要安装该声卡的驱动程序)系统加电,恢复系统运行。
4.2.2Ubuntu操作系统、设备驱动程序、主控应用程序等软件故障应急处理措施及程序:
记录故障发生时间和故障现象。
系统运行在冗余工作站单机状态重新安装故障软件。
如有必要,重新安装与故障软件相关联的所有软件。
(具体步骤:
1安装操作系统,2安装驱动程序,3安装Systematics以及补丁,4安装相关插件,5安装HMI)系统恢复运行。
4.2.3系统冗余、系统功能缺失故障应急处理措施及程序:
记录故障发生时间和故障现象。
关闭一台工作站,使其工作在单机状态。
如果故障依然,则申请系统降级运行。
5FEP故障处理5.1FEP设备概述FEP(前端处理机)是一个专用计算机,它的功能是完成所有的通信任务,而让服务器主机来进行专门的数据处理,以减轻主机运行应用程序的负担。
FEP负责将各子系统接入主控系统,主要完成数据传送和协议转换功能。
FEP将所有子系统的数据进行集中,数据经协议转换后由FEP传送给ISCS服务器;对子系统的控制命令则由ISCS服务器发送到FEP后分发到各子系统。
5.2FEP主要故障及应急处理措施及程序5.2.1FEP死机引起FEP死机的原因可能有:
(1)FEP需要处理的数据量过大,FEP因响应速度跟不上而死机。
应急处理措施及程序:
重启FEP。
(2)配置文件错误,导致FEP无法正常启动,或者在启动vxWorks后中断启动。
应急处理措施及程序:
重新安装正确的配置文件,或重新安装FEP。
(3)FEP主板损坏。
应急处理措施及程序:
确认关闭该台FEP后,冗余FEP能正常工作。
关闭并拆卸FEP。
更换闪存。
重新配置FEP文件,把FEP重新投入工作。
5.2.2FEP通讯中断FEP通讯中断的原因可能有:
(1)FEP内置交换机损坏。
应急处理措施及程序:
确认关闭该台FEP后,冗余FEP能正常工作。
关闭并拆卸FEP。
更换内置交换机。
把FEP重新投入工作。
(2)FEP主板损坏。
应急处理措施及程序:
确认关闭该台FEP后,冗余FEP能正常工作。
关闭并拆卸FEP。
更换主板。
重新配置FEP文件,把FEP重新投入工作。
(3)网线松脱或损坏。
应急处理措施及程序:
检查网线。
插紧或更换网线。
5.2.3FEP断电FEP断电的应急处理措施及程序:
检查供应电源是否中断,若是,恢复电源供应。
检查供电线缆是否松脱或断开,若是,重新接好线缆。
检查FEP电源开关,若已关闭,确认没有不良影响下开启FEP。
若不存在以上情况,则应为FEP硬件问题,需要更换相关硬件。
6交换机故障处理6.1交换机设备概述交换机是组成网络的重要设备。
西安地铁综合监控系统采用赫兹曼工业级以太网交换机。
赫兹曼交换机的硬件组成主要有:
电源单元、风扇、基板、路由/介质模块。
6.2交换机主要故障及应急处理措施及程序6.2.1交换机部件故障交换机可能发生故障的部件有:
外部网络接头、电源单元、风扇、基板、路由模块、介质模块。
应急处理措施及程序:
通过交换机管理软件查找故障源。
确认关闭该台交换机后,冗余交换机能正常工作。
关闭故障交换机,并从网络柜移除。
更换故障部件。
必要时需对交换机进行配置。
把交换机投入工作。
6.2.2交换机通讯故障引起交换机故障的原因可能有:
(1)网线松脱或损坏。
应急处理措施及程序:
检查网线。
插紧或更换网线。
(2)光纤损坏。
应急处理措施及程序:
6.2.3交换机断电交换机断电的应急处理措施及程序:
检查供应电源是否中断,若是,恢复电源供应。
检查供电线缆是否松脱或断开,若是,重新接好线缆。
检查交换机电源开关,若已关闭,确认没有不良影响下开启交换机。
若不存在以上情况,则应为交换机电源问题,需要更换交换机电源单元。
7IBP盘故障处理7.1设备概述综合后备盘(IBP)是一种人机接口装置,设置在每个车站的车站控制室,当在中央一级发生通讯故障或在车站一级发生人机界面故障时,作为车站主控系统的后备设备,在紧急情况下使用的按键式模拟监控盘,以支持车站的关键监视和控制功能。
IBP盘物理结构包括IBP盘体(包括马赛克盘面)、落地柜体、操作台三部分,为SIG(信号)、BAS(环境与机电设备监控系统)、AFC(自动售检票)、PSD(屏蔽门)、ES(自动扶梯)、等提供一个统一的硬件安装平台。
7.2IBP盘主要故障及应急处理措施及程序7.2.1按下按钮后没有执行相应动作的应急处理措施及程序:
需要两人配合检修。
带上螺丝刀、万用表、柜体钥匙、图纸、按钮备件及其他个人工具赶往现场,同时通知相应专业的维修人员。
确认相应系统已经对IBP端子排送电。
找到该按钮控制线在后面端子排上对应的端子。
检查端子排接线及按钮后面接线有无松动、松脱。
如有,紧固端子和接线。
(1)对于常开按钮、交替按钮常开端子一人在前面盘面按压按钮(或按下端子),另一人用万用表的电阻档或短路档检测上述两个端子。
如果电阻接近0,或用短路档发出蜂鸣声,证明IBP盘内部接线良好,由相应专业人员检查其系统接线或其他原因。
如果用万用表测出开路,应为按钮损坏,更换按钮。
(2)对于常闭按钮、交替按钮常闭端子一人在前面盘面按压按钮(或按下端子),另一人用万用表的电阻档或短路档检测上述两个端子。
如果电阻由0变为无穷大,或用短路档测得开路,证明IBP盘内部接线良好,由相应专业人员检查其系统接线或其他原因。
如果用万用表测出短路,应为按钮损坏,更换按钮。
7.2.2按钮灯或指示灯不亮、蜂鸣器不响的应急处理措施及程序:
需要两人配合检修。
带上螺丝刀、万用表、柜体钥匙、图纸、按钮/灯备件及其他个人工具赶往现场,必要时通知相应专业的维修人员。
确认相应系统已经对IBP端子排送电。
找到该按钮/灯的信号线在后面端子排上对应的端子。
检查端子排接线及按钮接线有无松动、松脱。
如有,紧固端子和接线。
一人在前面按压试灯按钮,另一人用万用表的直流电压档测上述两个端子。
按下试灯按钮后测得电压为约24伏,证明IBP盘内部接线良好,由相应专业人员检查其系统接线或其他原因。
如果按下试灯按钮前测得电压不为0伏,则应为灯泡开路,需要更换该按钮或指示灯。
7.2.3不能实现屏蔽门开门的应急处理措施及程序:
需要两人配合检修。
带上螺丝刀、万用表、柜体钥匙、图纸、按钮/灯备件及其他个人工具赶往现场,通知相应专业的维修人员。
确认相应系统已经对IBP端子排送电。
8UPS故障处理8.1设备概述UPS包括主机柜和电池柜,主机柜由整流器模块、逆变器模块、充电模块、旁路模块组成,电池柜则由电池组组成。
正常情况下,低压配电提供的380V电源先经UPS主机柜整流模块整流后再经逆变器模块逆变为220V高质量电源供给负载设备,如因电源问题突然断电仍可由电池经逆变器为设备提供特定后备时间的电源,在市电恢复后可自动切换回由市电经逆变器给负载设备供电,在设备检修维护期间可通过维修旁路直接转换为市电对负载设备供电模式。
8.2UPS设备主要故障及应急处理措施及程序8.2.1电池故障因电池变形、漏液、过热等原因造成的故障,可通过电池开关将其切除,通过市电经逆变器后供给负载设备,然后对电池进行检修、维护、更换,待故障处理完毕后,再合上电池开关,使其处于浮充或充电状态。
8.2.2主机故障因主机内模块故障,不能将市电或电池提供的电能逆变供给负载,可通过维修旁路开关直接转换到由市电对负载设备进行供电,断开电池开关,然后对故障模块进行检修、维护或更换,待故障处理完毕后,再投入主机,将市电或电池提供的电源经逆变后供给负载设备。
8.2.3输入电源故障因输入电源故障,设备会自动切换到电池供电的状态,断开UPS电源输入开关,并切除一些非关键设备,保证关键设备的供电,处理电源故障,待故障处理完毕后,合上UPS电源输入开关,再由市电经逆变后供给负载,并对电池进行充电。
附附记记本标准起草单位:
西安地铁运营公司XXX部。
本标准主要起草人:
XXX、XX、XXX。
本标准审核人:
XXX、XX,20XX年X月X日。
本标准批准人:
XXX,20XX年X月X日。
本标准版本号为第X版、第X次修订(原第X版、第X次修订文件作废)。
本标准于X年X月X日发布。
本标准从X年X月X日起实施。
本标准根据标准修改通知单XXXXX进行第X次修订,修订后的内容从X年X月X日起实施。
本标准受控状态:
受控/非受控。
本标准由西安地铁运营公司XX部负责解释。
本标准由西安地铁运营公司标准化委员会提出。
本标准由西安地铁运营公司标准化工作组归口