LTE后台排障告警说明文档格式.docx
《LTE后台排障告警说明文档格式.docx》由会员分享,可在线阅读,更多相关《LTE后台排障告警说明文档格式.docx(20页珍藏版)》请在冰豆网上搜索。
二.NTPSystemTimeSyncFault(NTP系统时钟同步错误)
告警原因:
一般是由NTP的IP错误引起
get.NTP可以查看状态
处理方法:
将图中IP修改为正确的地址即可
三.NumberOfHwEntitiesMismatch(实际硬件数量不匹配)
SCUthatisnotconfigureddetected
基站侧更换过DU板卡,导致DU板卡识别不了机框信息。
利用moshell登入基站,重新配置。
(需要问现场督导具体机框信息)
getcabi查看机框配置信息,然后使用set指令修改,输入修改指令时,等号前后不加空格,如图所示:
四.PasswordFileFault(密码文件故障)
基站密码设置错误
重新设置密码,passwd;
rbs;
rbs
五.Plug-InUnitGeneralProblem插入单元故障
可能是RRU或者DU故障
现场检查故障原因
六.Plug-InUnitHWFailure(插入单元硬件故障)
故障描述:
SinglecoreMPHWfailure
DU硬件故障,可能出现的状态为基站无限重启
更换DU
七.PowerFailure(供电故障)
PowerFailureAlarm(PFA),id2,port1/2/3,cascadeNo1
RRU侧没有通电
让施工队给RRU加电
八.SystemClockQualityDegradation系统时钟质量降级
告警
CSystemClockQualityDegradationSynchronization=1(replaceable_unit_problem)
故障描述
getsynch
SynchronizationId1
adminQualityi[8]=1616161616161616(NOT_DEFINEDNOT_DEFINEDNOT_DEFINEDNOT_DEFINEDNOT_DEFINEDNOT_DEFINEDNOT_DEFINEDNOT_DEFINED)
degradationIsFault0(DEGR_NOT_FAULT)
featureStatePtpFreq0(DEACTIVATED)
featureStatePtpTime0(DEACTIVATED)
featureStateSyncEth1(ACTIVATED)
fixedPositiontrue
licenseStatePtpFreq0(DISABLED)
licenseStatePtpTime0(DISABLED)
licenseStateSyncEth0(DISABLED)
minQualityLevel1(QL_SSU_A)
nodeSystemClock4(FREE_RUNNING_MODE)
operQuality21(NOT_DEFINED)
selectionProcessMode0(QL_DISABLED)
sfnInitializationTime1980-01-06T00:
00:
19
syncRefActivityi[8]=11111111(INACTIVEINACTIVEINACTIVEINACTIVEINACTIVEINACTIVEINACTIVEINACTIVE)
syncRefPriorityi[8]=10000000
syncRefStatusi[8]=00000000(FAILEDFAILEDFAILEDFAILEDFAILEDFAILEDFAILEDFAILED)
syncReference[8]=
告警诱发原因
TDD站点只能是GPS出现故障导致该告警出现
FDD站点则是因为Syncheth同步出现问题,导致该告警出现
解决方法
①设备软件版本进行升级,但目前已经是最高版本故此方法只使用于低版本。
②添加GPS
③若GPS出现故障,则需要上站检查GPS硬件以及网线。
150114-11:
55:
3910.112.72.9810.0pERBS_NODE_MODEL_E_1_63stopfile=/tmp/10258
=================================================================================================================
115SystemFunctions=1,Licensing=1,OptionalFeatures=1,TimeAndPhaseSynchWithGPS=1
158TransportNetwork=1,Synchronization=1
licenseStatePtpFreq1(ENABLED)
licenseStatePtpTime1(ENABLED)
licenseStateSyncEth1(ENABLED)
nodeSystemClock2(LOCKED_MODE)
syncRefActivityi[8]=21111111(ACTIVEINACTIVEINACTIVEINACTIVEINACTIVEINACTIVEINACTIVEINACTIVE)
syncRefPriorityi[8]=12000000
syncRefStatusi[8]=33000000(OKOKFAILEDFAILEDFAILEDFAILEDFAILEDFAILED)
>
syncReference=Equipment=1,Subrack=1,Slot=1,PlugInUnit=1,TimingUnit=1,GpsSyncRef=gps
syncReference=Equipment=1,Subrack=1,Slot=1,PlugInUnit=1,ExchangeTerminalIp=1,GigaBitEthernet=1
九.TemperatureExceptionalTakenOutOfService特殊温度导致服务停止
mTemperatureExceptionalTakenOutOfServiceAuxPlugInUnit=RRU-1,DeviceGroup=ru(RUunitnon-functional)
RRU没有信号,起不来。
strru
150114-13:
59:
2510.111.87.9010.0pERBS_NODE_MODEL_E_1_63stopfile=/tmp/68
===================================================================================
ProxyAdmStateOp.StateMO
3631(UNLOCKED)0(DISABLED)Equipment=1,AuxPlugInUnit=RRU-1
3801(UNLOCKED)0(DISABLED)Equipment=1,AuxPlugInUnit=RRU-2
3971(UNLOCKED)0(DISABLED)Equipment=1,AuxPlugInUnit=RRU-3)
故障诱发原因
RRU馈线未接,馈线故障,天馈系统故障。
合路器故障以及设备高温等问题导致RRU内部高功率无法发射出去。
1lhrufmgetfaults/////先查看RRU硬件是否有问题return_loss_too_low_port_a
2cabx查看RRU温度是否正常
3以上都没问题则排查馈线及合路器部位,先检查合路器是否符合LTE频段,再用好的小区的馈线与有问题小区做调换,然后解闭小区,并重启RRU,如果问题跟馈线走,就说明是馈线原因,换馈线即可解决。
(大部分都是馈线及合路器问题)
150114-14:
2210.112.7.21810.0pERBS_NODE_MODEL_E_1_63stopfile=/tmp/26726
3511(UNLOCKED)1(ENABLED)Equipment=1,AuxPlugInUnit=RRU-1
3681(UNLOCKED)1(ENABLED)Equipment=1,AuxPlugInUnit=RRU-2
3851(UNLOCKED)1(ENABLED)Equipment=1,AuxPlugInUnit=RRU-3
十.TemperatureAbnormalPerformanceDegraded温度异常导致性能降级
mTemperatureAbnormalPerformanceDegradedAuxPlugInUnit=RRU-1,DeviceGroup=ru(Normaltemperaturetoohigh[DL/A])
RRU部分服务停滞
高温导致RRU部分服务停滞
告警解决方法
Cabx查看RRU温度
查看是否有伴随告警如下:
1.Disconnected检查DU和机框是否连接
2.FanFailure风扇故障
如果没有2中告警,则检查机房内温度是否正常。
十一.TemperatureSensorFailure温度传感器故障
告警描述
EquipmentMalfunction设备故障
①BatteryBackup备用电池故障备用电池温度传感器故障
1HwUnit硬件故障设备与外部风扇配置和控制单元的温度传感器连接出现故障
1如果为BatteryBackup则需要替换新的温度传感器
2如果为HwUnit检查SCU是否配备外部传感器。
如果有检查连接,如果没有替换SCU
十二.TimingSyncFault定时同步故障
TimingSyncFaultSubrack=1,Slot=1,PlugInUnit=1,DeviceGroup=dul(SystemclocknotlockedtoRANtime)
系统时钟不能锁定在无线网络时间的期限内(60秒)
timeAndPhaseSynchCritical
在这个mo下的EnodeBFunction的时钟被设为true。
状态时满足异步模式而不是同步模式
①DU时钟单元损坏,导致该告警出现。
②数据配置错误,导致该告警出现
检查硬件故障,如果硬件没有故障可重启基站。
如果基站重启之后告警仍然存在问题,更换DU
在这个mo下的EnodeBFunction的时钟被设为false
十三.TUHardwareFault时钟单元硬件故障
TUHardwareFault
硬件故障
DU时钟单元损坏,导致该告警出现。
十四.UpgradePackageCorrupt升级包损坏
UpgradePackageCorrupt
软件故障
DU升级包出现故障
①重启基站
②检查升级是否损坏,如有损坏需要删除升级包重新安装升级包。
十五.VswrOverThreshold天馈驻波超限
VswrOverThresholdAuxPlugInUnit=RRU-3,DeviceGroup=ru,RfPort=A(VSWRoverthreshold)
由于天馈系统,合路器,天馈接口故障
====================================================================================================================
SMNAPNPORTBOARDAuxPIUTX1(W/dBm)TX2(W/dBm)VSWR1(RL1)VSWR2(RL2)Cells(cellId,PCI)
01BXP_0_1RRUS12B3RRU-11.1(30.6)1.1(30.5)1.14(23.5)1.18(21.7)FBJ080414A1(11,470)
01BXP_1_1RRUS12B3RRU-21.1(30.3)1.0(30.1)1.39(15.8)1.12(25.0)FBJ080414B1(21,468)
01BXP_2_1RRUS12B3RRU-31.0(30.0)1.0(30.0)1.51(13.8)1.24(19.4)FBJ080414C1(31,469)
驻波值超过1.49就会出现该告警
天馈系统,合路器,天馈接口出现天馈线接入不牢固;
馈线出现折角比较小;
馈线存在积水现象。
检查天馈系统。
使用驻波表确定故障点
重新接入馈线接头;
或者重新做接头。
十六.LicenseKeyFileFault:
License文件错误或缺失
LicenseKeyFileFaultLicensing=1(Nolicensekeyfileinstalled.IntegrationUnlock=ACTIVATED,20daysremaining)
故障解释:
没有打正式license
解决方法:
打正式license
十七.LicenseKeyMissing:
许可证密钥丢失
LicenseKeyMissingLicensing=1,OptionalFeatureLicense=MultiTargetRrcConnReest(configuration_or_customizing_error)
站点已经打了的License中缺少对应的feature功能的license,请查看License文件中是否有对应的feature。
检查license文件,如果没有响应的license则关闭相关Feature。
十八.LinkFailure:
链路故障
LinkFailureSubrack=1,Slot=1,PlugInUnit=1,RiPort=A(Nosignaldetected,id1,port1,cascadeNo0,ruPortNo0)
DU至RRU链路中断,或没插光模块。
1、需要查看一下光模块是否安装或者是否掉了。
2、检查尾纤。
3、检查RRU。
十九.LinkStability:
链路稳定性故障
LinkStabilitySubrack=1,Slot=1,PlugInUnit=1,RiPort=B(HighbiterrorrateonCPRIlink,id1,port2,cascadeNo0,ruPortNo0)
光模块或光纤有问题导致误码率过高。
1、先插拔一下光模块,等15分钟以后再查看,如果还不好的话就应该换一下光模块。
2、检查一下光纤有没有受损。
3、检查一下RRU是否有问题。
二十.LossofSynchReferenceRedundancy:
同步引用冗余丢失
LossofSynchReferenceRedundancySynchronization=1(replaceable_unit_problem)
此告警是次生告警,是由MOSynchronization发出。
可以参考主告警:
TUSynchReferenceLossofSignal、NetworkSynchTimefromGPSMissing、LossofTracking、SynchReferencePathHWFault、PacketServerAvailabilityFault、SynchReferenceNotReliable、SyncReferencePDVProblem注:
目前一般是由于GPS丢失引起的NetworkSynchTimefromGPSMissing。
此告警的后果是,同步源的数量减少或者只剩一个同步源,如果最后一个同步源也丢失,系统时钟会进入”holdovermode”,然后是”free-runningmode”,这样就不能满足无线模块所要求的时钟精度。
解决方法(GPS丢失):
1、检查GPS硬件状态和物理连接。
2、删除GPS,重新加一遍,重启基站。
二十一.LossofTracking:
失去同步
LossofTrackingSynchronization=1(replaceable_unit_problem)
这个是一个主告警,和Synchronization·
MO相关。
当TU系统的时钟进入失步状态,出现此告警,同时syncRefStatus变为LOSS_OF_TRACKING。
1.accSynchronizationresetLossOfTracking看是否告警消除
2.如果不能消除建议添加GPS同步
二十二.NetworkSynchTimefromGPSMissing:
从GPS获取的网络时钟同步丢失