网元告警处理流程Word文档下载推荐.docx
《网元告警处理流程Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《网元告警处理流程Word文档下载推荐.docx(17页珍藏版)》请在冰豆网上搜索。
ACTNUMSAEBLOCKTYPECNTRTYPCURRNINEWNI
0700C7OMASELOCALCONS100
NIENIRSTATUS
00REG
END
通过该范例,可以发现需要调整的为SAE=700,BLOCK=C7OMASE,当前值为0,希望增加到的值仍为0,这是一个特例。
可以通过参考同类其他网元的相同BLOCK值。
如果当前和希望增加到的值相同,则可以通过指令<
SAALI;
RESET此告警。
2、<
SAAEP:
SAE=700,BLOCK=C7OMASE;
SIZEALTERATIONOFDATAFILESINFORMATION
SAEBLOCKCNTRTYPNINIUNIENIR
700C7OMASECONS10
3、<
SAALI;
WOWHHLR3*57/GB/0/1/06/06NVT-495TIME0208271343PAGE1
SIZEALTERATIONOFDATAFILESRESULT
SAEBLOCKNINIENIR
700C7OMASE
FAULTCODE97
NIINCREASETOZEROREQUESTED
注:
1、SAALI指令应慎用,因为该指令的作用是自动将BLOCK扩大到系统所期望的值,为避免引起不必要的SIZE调整,仍建议手工调整SAE值。
2、HLR中如果出现SAE=501,BLOCK=ASD以及SAE=261的SIZE调整告警,不要盲目调整,
这两个SIZE的NI值与系统的设计容量有关,最好以释放资源的方式消除告警。
三、IOG卷容量超过门限值告警
WHHLR*57/FC/0/1"
2730208260607
VOLUMELIMITEXCEEDED
SPGVOLUMELIMIT
0CHARVOLUME80%
此告警出现说明卷内容量超过总容量的门限值,由卷内多余文件占用硬盘存储空间引起,确认该告警产生的门限值大小,通常为总容量的80%左右。
删除部分多余文件既可。
但删除文件时应确认该文件是否有用。
<
INMCT:
SPG=0;
:
INFIP:
VOL=CHARVOLUME;
查看该卷内的文件
FILETABLE
FILEFCLASS
ICIFILE00CMP
ICIFILE01CMP
RELFSW0CMP
RELFSW8CMP
TTFILE00CMP
经确认,RELFSW8文件为CPDUMP文件,不应存储在该卷中,可以删除。
WHMSC1*57/FC/0/1"
0EXCHVOLUME2%
此告警虽然也说明卷内容量超过总容量的门限值,但显而易见,该告警产生的门限值太小,只有2%。
类似这类告警产生的门限值低于50%的告警,可以通过调整告警门限的方法来消除告警。
inmct:
spg=0;
:
invop:
vol=exchvolume;
确认告警门限值大小
VOLUMEATTRIBUTESSTATUS
REVDATETOTSIZE(KB)USEDSIZE(KB)LIMIT
2
AVAILSIZE(%)USEDSIZE(%)
973
NODE1IO1SIZE1(KB)
NODE2IO2SIZE2(KB)
INVOC:
VOL1=EXCHVOLUME,LIMIT=80;
修改告警门限值。
END;
四、CP故障告警
A3/APZC"
WHMSC6*57/GB/0/"
8060208250222
CPFAULT
此告警出现说明CP存在硬件临时或永久性错误,CP故障告警根据其严重性分为A1、A2、A3级别,告警出现后应先用指令<
DPWSP;
查看CP工作状态,通常A3级别告警不影响CP工作状态。
具体诊断修复过程如下:
REPCI;
诊断CP故障
ORDERED
CPDIAGNOSIS
TESTRESULT
FAULT
FAULTTYPE
TEMPORARY
MAGPCBREPLACEDREASON
CPU-BSTUD-2
CPU-BPOWC
此例诊断结果为一临时性错误,由DSU板故障引起,通常A3CPFAULT告警诊断结果与此类似。
临时性错误可以用指令修复或插拔板解决。
REMCI:
MAG=CPU-B,PCB=STUD-2;
根据诊断结果指令修复或插拔换板
CPMANUALINTERVENTION
INTERVENTIONPREPARATION
SUCCESSFUL
RECCI;
指令修复CP,使执行侧备用侧并边
CPREPAIR
A1、A2级别的CPFAULT须换板修复,应尽量在晚上话务量较低时执行。
五、FORLOPP告警
O1/APZ"
WHMSC4*57/GB/0/"
5300208191133
SYSTEMSTATE
LONGDURATIONTIMEFORFORLOPP
INF1INF2INF3INF4
H'
3E3H'
2CH'
18
syfap:
hours=1;
WOWHMSC4*57/GB/0/1/06/06NVT-534TIME0208231047PAGE1
ACTIVEFORLOPPS
FORLOPP-IDSTATUSNACTNPASSFLPROTYPESTARTBLOCK
0256000DNORMAL30H'
00000002020820AOT
03EE0019ABORTED104H'
000000001133C7TCP
02E1002FABORTED--H'
000000001133MRRM
02AF001DNORMAL126H'
00000008020821JOB
03E3002CNORMAL30H'
00000002020816AOT
012A0030NORMAL30H'
00000002020819AOT
syfip:
fid=h'
3e3-h'
2c;
ORDERED
HB
WOWHMSC4*57/GB/0/1/06/06NVT-534TIME0208231049PAGE1
INDIVIDUALSCONNECTEDTOFORLOPP
SEARCH
YES
FORLOPP-IDSTATUSFLPROTYPEDATETIME
03E3002CNORMALH'
000000020208161134
BLOCKFILENUMBERINDIVIDUALSTATUSFID-VAR
AUEH'
0001H'
00000000ACTIVE1H'
0051
ADEH'
0064
AOTH'
0090
LADH'
0011H'
0000007AACTIVE2H'
016B
0012H'
00000075ACTIVE2H'
016F
0000006AACTIVE2H'
0013H'
00000152ACTIVE2H'
0166
SYFRI:
FID=H'
3E3-H'
2C,BLOCK=AOT,IND=H'
0,FILENUM=H'
1;
EXECUTED
六、软件应用错误告警
A3/APZ"
WHMSC1*57/GB/0/"
4440208220841
APPLICATIONDETECTEDSOFTWAREERROR
此告警出现多由于FORLOPP非正常释放引起,该告警仅仅只是告知维护人员此问题出现过。
用指令确认后,即可去掉告警。
但是我们应该观察此告警出现频率,如果频繁出现,应通知爱立信工程师,确认是否存在深层次软件问题。
SYRIP:
SURVEY;
指令查看软件事件记录,找到状态为ACTIVE的
WOWHMSC1*57/GB/0/1/06/06NVT-745TIME0208231100PAGE1
SOFTWARERECOVERYSURVEY
EVENTTYPEEXPLANATIONEVENTCNTFRDEL
19APPLERRERRORREPORTEDBYPROCEDUREFLERROR456
18APPLERRERRORREPORTEDBYPROCEDUREFLERROR
17APPLERRERRORREPORTEDBYPROCEDUREFLERROR
16APPLERRERRORREPORTEDBYPROCEDUREFLERROR432
15APPLERRERRORREPORTEDBYPROCEDUREFLERROR167
14APPLERRERRORREPORTEDBYPROCEDUREFLERROR5
13APPLERRERRORREPORTEDBYPROCEDUREFLERROR
12APPLERRERRORREPORTEDBYPROCEDUREFLERROR138
0FORLOPPMANUALLYINITIATEDFORLOPPRELEASE0
61FORLOPPFORLOPPRELEASEREQUESTEDFROMAPPL1
53FORLOPPMANUALLYINITIATEDFORLOPPRELEASE0
48FORLOPPMANUALLYINITIATEDFORLOPPRELEASE0
44LARGEFUNCTIONCHANGEWITHSIDESWITCH
43LARGECOMMANDORDEREDRESTART
42SMALLREST.OFAPZBLOCKSINSB/SEATFC
24LARGEFUNCTIONCHANGEWITHSIDESWITCH
EVENTCODEINF1INF2INF3INF4SIDESTATEDATETIMEACTIVE
19H'
4300H'
6C02H'
0201H'
00D1H'
002EA-EXPARAL0208220841YES
18H'
002EA-EXPARAL0208220838NO
17H'
002EA-EXPARAL0208220835NO
16H'
002EA-EXPARAL0208210747NO
15H'
002EA-EXPARAL0208202259NO
14H'
002EA-EXPARAL0208202244NO
13H'
002EA-EXPARAL0208202241NO
12H'
002EA-EXPARAL0208201421NO
0H'
310CH'
0000H'
0144H'
0000A-EXPARAL0208191235NO
61H'
3100H'
0146H'
0002A-EXPARAL0208161158NO
53H'
0607H'
0000A-EXPARAL0207311619NO
48H'
000FH'
0000A-EXPARAL0207191537NO
44H'
900DH'
0000BSINGLE0207122350NO
43H'
9003H'
0000BSB-SEP0207122246NO
42H'
900BH'
0000BSB-SEP0207122243NO
24H'
0000BSINGLE0205192223NO
SURAE:
RECTYPE=APPLERR;
指令去活该记录,使其状态变为DEACTIVED
3990208231111
CCITT7SIGNALLINGLINKFAILURE
LSSPIDSLCST
2-17-255-4HLSTPB0C7ST2C-9
SDL
MLSTPB-0,C7BTC4-1
FCODEINFOREASON
100H'
0EXCESSIVEERRORRATEWHILSTIN-SERVICE
七、用户非法登陆告警
0010207132332H'
0001-0000
USEREXCEEDEDALLOWEDACCESSATTEMPTS
USERSOURCETIME
NVT-2000006300813
此告警出现说明用户登陆输入口令不正确,且输入错误达到三次以上。
通常这类告警一段时间后能自动消除,但是FORLOPP未能正常释放,所以仍然存在,为避免无意义的告警出现,可人工释放FORLOPP。
1、ALLIP:
ACL=A2,FID=YES;
显示告警的FORLOPPID,如上所示
2、SYFIP:
1-H'
0;
显示该FORLOPP的FUNCTIONBLOCK和FILENUMBER
3、SYFRI:
FID=H1-H0,FILENUM=xx,BLOCK=xxx,INT=xx;
释放FORLOPP
八、GROUPSWITCH交换矩阵告警
此告警出现说明TSM或SPM出现硬件故障,可根据告警和测试提示换板修复。
GSSTP:
TSM=TSM-B-1;
查看TSM设备状态,WO/S说明虽然是工作状态,但怀疑有故障
GROUPSWITCHSTATE
UNITSTATEBLSTATEVARIANT
TSM-B-1WO/S4
GSBLI:
闭掉该设备
GROUPSWITCHUNITBLOCKINGRESULT
UNITRESULTINFO
TSM-B-1EXECUTED
GSTEI:
用指令让交换机自行进行检测
GROUPSWITCHUNITTESTRESULT
UNITTCASEFCODE
TSM-B-1117
POSSIBLEFAULTYCARDS
UNITSUBUNITMAGCARD
TSM-B-1LMU-1
CILSU
EMC
C7ETC4-385-ETC32
检测结果说明有以上板可能发生故障,但通常TSM工作状态不正常是由TSM所连接的SNT引起,这时我们可以首先通过指令测试SNT是否有错误,然后按提示依次换板。
SNT和TSM之间会相互影响工作状态。
4、<
NTCOP:
SNT=C7ETC4-385;
根据测试结果,显示SNT连接TSM的位置确认连接关系
SWITCHINGNETWORKTERMINALCONNECTIONDATA
SNTSNTVSNTPDIPDEVDEVP
C7ETC4-3851TSM-1-1385C7B4C7BTC4-12320&
-12351
5、<
NTBLI:
闭掉SNT
6、<
NTTEI:
指令进行SNT错误测试
SWITCHINGNETWORKTERMINALTESTRESULT
SNTTCASEFCODESUBSNTFCINFO
C7ETC4-3851
NOFAULTSFOUND测试结果说明SNT没有错误
7、<
NTBLE:
解闭SNT
SWITCHINGNETWORKTERMINALDEBLOCKINGRESULT
SNTRESULTINFO
C7ETC4-385EXECUTED
8、关电,更换LMU-1板。
此示例为BYB202老硬件故障处理办法。
对于新硬件BYB501,如果测试结果为TS4B板故障,更换TS4B板时须闭掉该板上的全部TSM,一共4个和4个TSM所连接的EM,方能换板。
9、<
开电,重新进行TSM测试
TSM-B-11
NOFAULTSFOUND
10、测试无误后,解闭TSM,即恢复正常。
GSBLE:
九、网络同步错误告警(即时钟错误)
9300208281604
NETWORKSYNCHRONIZATIONFAULT
RCM/CCM/DIP/EXTSTATEFCODE
RCM-0BLOC3
此告警说明参考时钟存在硬件故障。
可以进行测试后换板修复,处理步骤如下:
NSBLI:
RCM=RCM-0;
闭掉该时钟
NSTEI:
交换机自行测试该参考时钟
CLOCK-REFERENCETESTRESULT
RCM/CCM/DIP/EXT
RCM-0
CLOCK-REFERENCESIGNALTOTALLYMISSING
POSSIBLEFAULTYBOARDS
MAGBOARD
RCM-0POU-1
POU-0
RPU
ROU
CLM-0RCU
CLM-1RCU
CLM-2RCU
测试结果说明电源故障导致参考时钟信号全部丢失,按提示关电,更换电源板,然后开电重新测试。
若错误仍然如上所失,可尝试依次更换后续板块。
如果仍然无效,用万用表测量电源线输入电压以及POU板输入输出电压是否正常。
确认是否为电源线或机框故障,然后更换相应硬件。
直至测试无误,解闭设备后工作状态正常为止。
WHMSC5*57/GB/0/"
RCM-0BLOC5
此告警说明参考时钟的振荡频率偏仪移较大,可以通过测试,指令修复,测试步骤同上,测试结果如下
CLOCK-REFERENCETESTRESULT
CLOCK-REFERENCEFAULT-FREE
RCM-0ROU
2、NSFMI:
RCM=RCM-0;
对RCM的相关频率偏移情况进行测试。
ORDERED测试结果将在30分钟或5小时后出现
CLOCK-REFERENCERESULTOFFREQUENCYDEVIATIONMEASUREMENT
PERFORMED
RELATIVEFREQUENCYDEVIATION=0(UNIT:
1/100000PPM)
3、NSDAP;
查看时钟模块的监测数据
CLOCK-REFERENCESUPERVISIONDATA
SYNCHMODESTATE
SINGLEOPERATING
STATICDATA
RCM/CCM/DIP/EXTCLREFINLREFGRPPRIFDLWDLACL
RCM-0022400020A2
2UPET111200010A2
EXT-0