华为告警处理入门篇.docx
《华为告警处理入门篇.docx》由会员分享,可在线阅读,更多相关《华为告警处理入门篇.docx(11页珍藏版)》请在冰豆网上搜索。
华为告警处理入门篇
要求:
熟练掌握“中继链路分配表”,这样就不需要用几个命令组合去查找相应的中继信息。
11月份开始进行华为端局升级,新版本的MSOFTX3000上告警显示的直接是到某个局向的CIC号,这样直接就可以知道是到哪个局向的第几条中继故障(0-31是第一条,32-63是第二条,依次类推)。
直接查找“中继链路分配表”就很直接。
在MSOFTX3000或者UMG上通过端口环回操作确认不是本端问题后联系传输处理或者联系对局确认是否对方做什么操作了。
常用手段就是通过端口环回确认问题出在本端:
MSOFTX3000侧命令:
环回STRPORTLOP:
;取消环回STPPORTLOP:
;这上面主要是到LSTP和本地HLR的直连中继和信令.注意:
老版本的MSOFTX3000(V100R003C07B016)到各个局向的逻辑链路也在上面,新版本(V100R005C10B019)没有
UMG8900侧命令:
环回和取消环回都是LOPE1:
;这上面主要是到各个局向的中继和信令,出现告警后,查看详细告警信息,然后查“中继链路分配表”。
了解是到那个局向的第几条中继以及上面是否带链路。
MSOFTX3000常见告警:
一:
sccp目的信令点禁止、MTP路由传输禁止、MTP目的信令点不可达、sccp子系统禁止
首先查看目的信令点编码了解是哪个局向(本例中编码为AFE10)
指令为LSTN7DSP:
;
输出界面:
由此我们初步判断是:
本端局至JNRZHLR的相关告警
由于JNRZHLR至本地端局经常出现此告警,可采用手动恢复,并清除告警。
若是至其他局向出现此告警,则需立即通知维护人员。
(此告警属于严重告警须重视)
当出现一条链路故障的告警,确认是否同时伴有中继告警,是则一般是中继故障引起,然后通过环回确认是否本端设备故障,然后联系对局确认传输或者对局是否存在问题。
一般出现到sccp目的信令点禁止、MTP路由传输禁止、MTP目的信令点不可达这些告警时,并且我其他大量异常告警,一般是对局在做操作或者设备故障导致。
联系对局确认。
UMG8900相关告警
二:
E1/T1远端告警
此类告警为传输电路告警,表示本端局至某局向电路中断或闪断
首先:
双击红色圈中的信息会弹出如下对话框:
该告警我们可以通过E1环回来确认是否本端故障:
LOPE1:
FN=1,SN=13,LOC=PORT,MODE=INERLOP,PN=31;环回以后如果告警消失,说明是设备之外部分出现问题,通知传输进行处理或者连续对局是否在做一些中继操作。
另外,如果是晚上传输暂时无法处理,又要将告警消除:
请关闭该中继的告警输出(SETE1ALM:
FN=1,SN=13,SPN=31,EPN=31,SW=DISABLE;),并手工回复该告警。
但需要做好标记,等第二天值班人员交班时记着打开告警(SETE1ALM:
FN=1,SN=13,SPN=31,EPN=31,SW=ENABLE;),后面有该操作的附图
如果问题出在MSOFTX3000上:
也有端口环回命令STRPORTLOP:
;(环回命令)STRPORTLOP:
;(解开环回命令)
下图是在MSOFT3000上查看电路状态,一般不需要。
可以了解一下
其次:
根据框、槽、端口号,可以查找电路文档信息得出进一步详细信息:
1)对端局向为:
JNIGM3,TID:
2016模块号:
29起始电路:
5408终止电路:
5439
2)交换ddf(对应传输ddf要传输人员再次确认)
以上信息均为手工录入信息,其中TID(终端标示)信息是最准确的,为确保电路文档信息正确,可在相应server下进行如下操作来进行验证:
LSTTKCBYTID(类似于exdep)
会出现如下相关信息:
(包括局向、中继群、模块号、起始电路号)
第三:
根据以上信息可以进行以下预处理:
1)查看该电路状态:
DSPN7TKC(类似于爱立信的stdep)
会出现如下信息:
电路状态是:
空闲、忙均代表正常,若是其他状态如:
闭塞、锁定、故障、未知均为故障状态
2)根据ddf,联系传输处理
3)如果出现传输闪断现象,或者传输人员正在处理该电路时,需要输入如下指令以防止告警不断出现,造成不必要的扣分。
(类似于dtfse)。
切忌:
将告警屏蔽后,一定要在文档中标注!
4)如何配合传输查看电路
一般传输人员为排查线路故障,会要求我们配合查看电路状态
一般可以从面板中直接查看电路是好是坏,或者用指令DSPE1PORT(类似于dtstp)
如图所示:
查看1框13槽23端口
绿色:
代表wo,红色:
代表abl说明电路是故障的
三:
提高篇:
链路故障SPF扣板链路故障
此告警是比较重要的告警,类似于爱立信的C7link告警
首先双击红色圈中的定位信息,进行初步定位:
查找相应的电路、ddf等信息
(mgw的告警)
1)以上红色圈中的三个参数信息是比较重要的信息:
链路名称:
JIG4-1这是说明是对端局向是到jig4的
接口班组号+E1端口号:
确定该链路所在电路,以及相关ddf信息
根据以上信息,联系传输处理该电路。
一般是由于闪断、故障等原因,导致链路故障。
2)链路故障时,在server侧也会出现相关告警
(server会出现相关告警)
用指令dspn7lnk(类似c7stp),查看链路状态
输入界面会有以下信息
信令链路选择码如果是一串序列号,表示链路状态是是好的,如果是表示该链路不正常,需继续处理
去激活链路指令:
DEAN7LNK
激活链路指令:
ACTN7LNK
另外还有一些告警:
计费中心长时间不取话单、话单服务器心跳中断、话单文件备份失败,性能统计丢失等告警,应急工作站连接失败或者数据备份失败等。
。
。
。
1、出现计费中心不取话单:
并且无其他话单服务器的告警时,一般是计费网络问题或者账务中心话单采集设备在做操作或者故障导致。
如果不是账务中心出问题请及时通知维护人员,在维护人员的指导下做一些恢复操作
2、话单服务器心跳中断:
话单服务器之间有两条心跳,断一条时基本上无影响。
可以暂时手工恢复该告警等第二天维护人员上班后处理。
如果两条都中断的话应该也会伴有服务器故障,主机到服务器中断的告警,这种情况一般是其中一套服务器故障引起。
请及时通知维护人员。
3、话单文件备份失败:
如果开局后备份正常,后来突然出现问题。
一般情况是备份话单的电脑出现问题,磁盘空间不足,或者关机了,或者网卡故障(很少),或者FTP进程因为病毒停掉了(很少)。
该问题不严重,可以手动恢复。
第二天等维护人员上班后处理
4、性能统计丢失(NSP告警平台出):
一般是局点BAM服务器的性能统计进程异常或者bam服务器死掉。
也可能是上级网管出现问题或者中间的维护网络出现问题。
通过如下操作可以确认是否前一种:
看能否PING通相应局点的维护IP地址或者登陆,可以的话表示BAM服务器正常。
然后登陆性能统计平台,如果一直无法登陆表明是统计进程异常,请通知维护人员。
其他情况一般就是上级网管问题或者网络不通,联系相关人员处理
5、应急工作站连接失败或者数据备份失败:
该问题不严重,可以手工恢复该告警,第二天请维护人员处理。
6、凌晨出现一些数据加载等告警:
这种告警不必关注,这是设备为了前后台数据一致进行的单板软件复位进行数据程序重新加载。
属于正常。
7、告警箱未连接:
手动恢复,第二天等维护人员处理
8、单板故障:
查看是否有其他相关的紧急、重要告警请及时联系维护人员。
如果可以的话,请进行单板的硬件复位操作在设备维护面板将显示红色的单板进行复位(一定要是硬件复位),看是否可以正常运行。