华为告警处理手册10.docx

上传人:b****7 文档编号:9463837 上传时间:2023-02-04 格式:DOCX 页数:87 大小:41.89KB
下载 相关 举报
华为告警处理手册10.docx_第1页
第1页 / 共87页
华为告警处理手册10.docx_第2页
第2页 / 共87页
华为告警处理手册10.docx_第3页
第3页 / 共87页
华为告警处理手册10.docx_第4页
第4页 / 共87页
华为告警处理手册10.docx_第5页
第5页 / 共87页
点击查看更多>>
下载资源
资源描述

华为告警处理手册10.docx

《华为告警处理手册10.docx》由会员分享,可在线阅读,更多相关《华为告警处理手册10.docx(87页珍藏版)》请在冰豆网上搜索。

华为告警处理手册10.docx

华为告警处理手册10

 

 

1.MSCSERVER处理分册

1.1告警箱处于离线状态

告警含义

1.告警解释

当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。

2.告警参数

无。

对系统的影响

告警箱无法正常运行,不能对BAM发送的告警做出正确响应,如不能发出声光告警。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

BAM与告警箱之间链路中断。

2.处理建议

通知分公司维护人员检查BAM和告警箱的连接。

1.2、FE端口故障

告警含义

1.告警解释

系统监测到FE端口出现故障,将产生此告警。

2.告警参数

参数名称

参数含义

板类型

发生告警FE端口所在单板的类型 

框号

该故障端口所在单板的机框号码

槽号

该故障端口所在单板的槽位号码

端口号

FE端口编号

对系统的影响

如果FE端口故障,通过该端口连接的设备之间通信中断。

系统自处理过程

系统的FE通信基于双平面,如果一个端口故障,将另一端口进行通信。

相关告警

无。

告警处理

1.可能原因

硬件故障。

2.处理建议

 对于WSMU和WIFM板,需要检查网线的连接情况。

 对于其它单板,需要检查WHSC板的运行情况。

DSPBRD:

FN=1,SLN=2;(输入单板的框号槽号)

1.3、WCKI时钟参考源丢失

告警含义

1.告警解释

当WCKI时钟参考源丢失时而产生此告警。

2.告警参数

参数名称

参数含义

框号

WCKI板所在的框号

槽号

WCKI板所在的槽号

丢失时钟源端口号

丢失的时钟参考源号

对系统的影响

可能使系统不能正常工作。

系统自处理过程

时钟参考源丢失,可能导致时钟系统不能正常工作。

相关告警

无。

告警处理

1.可能原因

∙外部时钟源工作不正常。

∙连接外部时钟源的时钟线有问题、或时钟连线不正确

2.处理建议

1.观察设备面板CKI单板BITS时钟输入端口是否正常。

2.检查外部时钟源是否工作正常,如果不正常,更换时钟源。

3.检查时钟线连接是否正确,如果连线正确,请更换时钟线。

1.4、控制框与业务框通信失败

告警含义

1.告警解释

当控制框和业务框之间的通信中断时产生此告警。

2.告警参数

参数名称

参数含义

框号

框号

对系统的影响

控制框和业务框之间的通信中断。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

∙可能控制框与业务框的HSC之间连线不正确

∙可能业务框工作不正常。

∙可能业务框没有及时发心跳消息给控制框。

2.处理建议

1.检查控制框与业务框的HSC之间的连线是否正确,或更换网线,如果问题解决,这说明是连线有问题。

2.观察业务框的WSMU板是否运行正常,如果不正常,更换WSMU单板看问题是否解决,如果仍然没有解决更换HSC板,如果仍然没有解决,那可能是背板有问题,需更换背板解决。

3.检查CPU是否被某个任务长时间占用,导致没有发送心跳消息,或者有网络风暴,导致控制框无法正常接受到消息

1.5、BAM到主机通讯失败

告警含义

1.告警解释

当BAM到主机通讯失败时,系统发出此告警。

2.告警参数

参数名称

参数含义

模块号

表示与BAM无法通讯的模块号。

对系统的影响

BAM与主机之间无法通讯。

系统自处理过程

无。

相关告警

该告警由ALM-2364BAM到主机连接中断引发,ALM-2364BAM到主机连接中断表示BAM和交换机断连,因此必然导致该告警的产生。

告警处理

1.可能原因

交换机有一个框的两个连接都断了。

2.处理建议

1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。

2、检查BAM机器网卡和LANswitchs:

3、检查BAM机器网卡和LANswitchs是否工作正常。

并保证所有网线连接正常。

告警是否恢复?

   

1.6、BAM到主机连接中断

告警含义

1.告警解释

当BAM与主机中断时,系统发出此告警。

2.告警参数

参数名称

参数含义

模块号

表示与BAM无法通讯的模块号。

IP

与BAM连接失败的模块对应的IP地址。

对系统的影响

BAM与主机之间无法通讯。

系统自处理过程

无。

相关告警

该告警连带产生ALM-2362BAM到主机通讯失败。

告警处理

1.可能原因

交换机某一个框的一个连接断开。

2.处理建议

1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。

2、检查BAM机器网卡和LANswitchs:

3、检查BAM机器网卡和LANswitchs是否工作正常。

并保证所有网线连接正常。

告警是否恢复?

1.7、与NTP服务器断连

告警含义

1.告警解释

时间同步进程与NTP服务器断连,时间同步已停止。

2.告警参数

无。

对系统的影响

系统时间无法和NTP服务器同步。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

∙NTP服务器被停止或服务被关闭。

∙系统和NTP服务器之间的网络断连。

2.处理建议

(1)、在MSOFT3000跟踪维护中用PINGNTP服务器IP地址,检查网络是否正常。

(2)检查NTP服务器是否被停止,NTP服务器的时间服务是否被关闭。

(3)检查系统和NTP服务器之间的网络是否断连。

 

1.8、Q922链路故障

告警含义

1.告警解释

系统单板之间通过Q.922链路进行通信,底层为FE。

当两个单板间的Q.922链路发生故障时,产生该告警。

当WSMU启动时,WHSC板会自动被复位,此时也会产生该告警。

2.告警参数

参数名称

参数含义

源模块号

发出告警的单板的模块号

目的模块号

Q.922链路对端模块号

对系统的影响

∙使用该链路通信的两个模块之间通信中断。

∙该链路传输的业务发生中断。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

∙Q.922链路发生故障。

∙WSMU启动。

2.处理建议

1. 检查是否复位了WSMU板?

Y=>正常告警,不用处理

N=>转步骤

(2)

2. 检查FE网口的状态是否正常?

观察设备面板HSC端口状态。

Y=>转步骤(3)

N=>更换不正常状态网口所在的单板

3. 检查单板的运行状态,如果单板发生故障,更换单板。

DSPBRD:

FN=1,SLN=2,PSN=FB;(输入HSC单板框号、槽号、前后插板)

1.9、TCP链路故障

告警含义

1.告警解释

系统监测到TCP链路出现故障时产生该告警。

WSMU板通过TCP链路与BAM和iGWB进行通信。

2.告警参数

参数名称

参数含义

模块号

产生该告警的模块号

连接类型

出现故障TCP链路的连接类型,用于定位链路。

如到BAM的链路、到iGWB的链路。

对系统的影响

∙告警模块与目的模块之间的通信中断;

∙基于该TCP链路的业务中断。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

∙网络连接网线故障;

∙网卡故障。

2.处理建议

(1)检查WHSC单板工作状态是否正常?

Y=>可能为对端设备如BAM、iGWB网卡故障。

N=>更换故障单板。

DSPBRD:

FN=1,SLN=2,PSN=FB;(输入HSC单板框号、槽号、前后插板)

(2)根据告警参数确认故障链路位置,检查TCP链路两端网卡的指示灯是否正常?

Y=>请联系华为当地办事处技术支援人员。

N=>可能是网线连接问题。

(3)判断是否网线松脱,拔插一下两端的网线接头,确保网线连接正常,检查故障是否排除?

Y=>网线连接问题,结束。

N=>可能是网卡故障。

1.10、CPU过载

告警含义

1.告警解释

单板CPU占用超过设定的阈值(使用命令SETCPUTHD设置)时,产生该告警。

2.告警参数

参数名称

参数含义

板类型

发生CPU过载的单板的类型 

框号

发生CPU过载的单板所在的机框号码

槽号

发生CPU过载的单板所在的槽位号码

位置

该单板在机框中的位置,包括前插板和后插板

过载级别

CPU过载的级别,包括1~4共四个级别

CPU占用率

告警发生时CPU的占用率。

对系统的影响

部分呼叫会丢弃,产生呼损。

系统自处理过程

系统启动流量控制机制,降低CPU占用率。

相关告警

无。

告警处理

1.可能原因

∙系统容量不足;

∙处理模块分配不合理。

2.处理建议

(1)根据告警参数确认发生CPU过载告警的单板,确认是否大部分同类型单板都CPU占用率偏高?

检查该单板的CPU大小:

DSPCPUR:

LT=MN,MN=2;(输入该单板模块号)

(2)调整业务配置,将过载单板部分业务的调整到其它单板。

1.11、单板网口协商失败

告警含义

告警解释

当单板的内网口或外网口以半双工模式工作时产生此告警。

告警参数

参数名称

参数含义

框号

单板所在的框号

槽号

单板所在的槽号

端口号

单板的网口号

3.举例

参数“框号=0,槽号=0,端口号=2”表示位于0框0槽WIFM板的第2个网口(外网口)协商失败。

注意:

系统板和WIFM板配置有3个内部端口,即端口0、1和2。

其他单板配置有两个外部端口,即端口0和1。

对系统的影响

BAM与主机之间的以太网数据包不正常丢失,可能导致系统从BAM加载文件失败。

系统自处理过程

无。

告警处理

1.可能原因

单板起来之后,会和LANSwitch进行网口工作模式协商,如果LANSwitch工作在半双工模式,单板端口也会工作在半双工状态。

2.处理建议

检查LANSwitch设置,将其设为全双工。

 

1.13、许可证文件即将失效

告警含义

1.告警解释

许可证在X天后到期。

当以下两种情况中的任意一种发生时将产生此告警:

∙MSC服务器运行在试用许可证模式下。

∙许可证文件在30天之内到期。

2.告警参数

参数名称

参数含义

文件名

许可证文件名称

位置

发出告警的位置

剩余天数

许可证文件的剩余有效天数

对系统的影响

许可证文件很快到期。

当许可证到期,MSC服务器运行在默认许可证配置下。

系统性能会降低。

系统自处理过程

无。

相关告警

1.伴随告警

无。

2.引发告警

无。

告警处理

1.可能原因

∙许可证文件很快到期。

∙MSC服务器运行在试用许可证模式。

2.处理建议

(1)、检查LICENSE状态,确认LICENSE正常使用期限。

DSPLICENSE:

;

输出结果:

(2)请及时购买许可证文件。

1.14、计费中心长时间未取话单

告警含义

1.告警解释

当计费中心长时间不取话单时,产生此告警。

 

2.告警参数

参数名称

参数含义

通道号

通道ID

服务器号

0-主机;1-备机

访问点ID

接入点ID

对系统的影响

无。

系统自处理过程

无。

相关告警

1.伴随告警

无。

2.引发告警

无。

告警处理

1.可能原因

与计费中心的连接失败。

2.处理建议

(1)检查与计费中心的连接是否正常; 

(2)检查FTP或FTAM是否运行正常;

(3)检查计费中心是否运转正常。

1.15、心跳中断

告警含义

1.告警解释

当计费网关双机之间用于心跳的私网、串口均长时间没有接收到对端发送的信号时,产生此告警。

2.告警参数

参数名称

参数含义

服务器号

0-主机;1-备机

对系统的影响

无。

系统自处理过程

无。

相关告警

1.伴随告警

无。

2.引发告警

无。

告警处理

1.可能原因

双机间用于心跳的串口、私网连接失败。

2.处理建议

检查双机各自的对端是否在运行,双机之间的串口线、私网线是否连接正确,IP地址设置是否正确。

1.16、双机倒换

告警含义

1.告警解释

当计费网关双机中的激活方无法继续工作时,产生此告警。

2.告警参数

参数名称

参数含义

服务器号

0-主机;1-备机

对系统的影响

无。

系统自处理过程

无。

相关告警

1.伴随告警

无。

2.引发告警

无。

告警处理

1.可能原因

激活方不能正常运行。

2.处理建议

请检查与此告警伴随的其他告警,并进而排除故障。

1.17、私网中断

告警含义

1.告警解释

当计费网关双机之间用于心跳的私网无法正常通信时,产生此告警。

2.告警参数

参数名称

参数含义

心跳号

0-私网1;1-私网2

服务器号

0-主机;1-备机

对系统的影响

可能引起同步操作或倒换失败。

系统自处理过程

无。

相关告警

1.伴随告警

无。

2.引发告警

无。

告警处理

1.可能原因

双机之间用于心跳的私网无法正常通信。

2.处理建议

请根据告警参数检查对应的私网网络,检查IP地址设置是否正确,网线连接是否正确。

1.18、IP资源失效

告警含义

1.告警解释

当计费网关激活方无法使用双机之间的某个虚拟IP时,产生此告警。

2.告警参数

参数名称

参数含义

IP资源号

虚拟IP的编号

服务器号

0-主机;1-备机

对系统的影响

可能引起与计费中心、主机、网管台的通信失败。

系统自处理过程

无。

相关告警

1.伴随告警

无。

2.引发告警

无。

告警处理

1.可能原因

激活方无法使用双机之间的某个虚拟IP。

2.处理建议

请根据告警参数检查具体的虚拟IP,检查网络中是否已经存在相同的IP。

1.19、备份连接失败

告警含义

1.告警解释

当计费网关侦测到连接目的机失败时,产生此告警。

2.告警参数

参数名称

参数含义

备份任务号

备份任务序列号

服务器号

0-主机;1-备机

对系统的影响

无。

系统自处理过程

无。

相关告警

1.伴随告警

无。

2.引发告警

无。

告警处理

1.可能原因

计费网关与目的机之间的连接不正常。

2.处理建议

检查计费网关与目的机之间是否连接正常。

1.20、单板故障

告警含义

1.告警解释

当系统检测到单板板故障时,产生此告警。

故障单板包括:

WSMU、WMGC、WCCU、WCSU、WCDB、WVDB、WBSG、WIFM、WALU、CPC、WEPI、WCKI

2.告警参数

参数名称

参数含义

板类型

发生告警单板的类型 

框号

该故障单板所在的机框号码

槽号

该故障单板所在的槽位号码

对系统的影响

系统自处理过程

∙该单板会重启;

相关告警

 。

告警处理

1.可能原因

∙单板发生故障;

∙单板复位。

2.处理建议

1.根据告警参数确认该故障单板的位置,检查该单板是否松动,如果松动插紧该单板。

2.打开操作维护系统的设备面板,查看该单板的运行状态(或者使用命令DSPBRD:

FN=1,SLN=2,PSN=FB;),复位该单板,查看故障是否排除?

1.插拔该单板,进行硬件复位,查看故障是否排除?

1.更换故障单板,查看故障是否排除?

1.21、许可证即将过期告警

告警含义

1.告警解释

当许可证文件剩余天数小于90天时,产生此告警。

2.告警参数

参数名称

参数含义

文件名

许可证文件名称

剩余天数

到许可证过期还剩余的天数。

对系统的影响

无。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

∙许可证文件离截止日期小于90天。

∙许可证文件运行模式为试用模式。

2.处理建议

(1)、检查LICENSE状态,确认LICENSE正常使用期限。

DSPLICENSE:

;

输出结果:

(2)请重新申请新的许可证文件。

1.22、许可证已经过期告警

告警含义

1.告警解释

当许可证文件过了运行截止日期或者试用模式的试用天数已经用完时,产生此告警。

2.告警参数

参数名称

参数含义

文件名

许可证文件名称

对系统的影响

无。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

许可证文件申请的时间已经过期。

2.处理建议

(1)、检查LICENSE状态,确认LICENSE正常使用期限。

DSPLICENSE:

;

输出结果:

(2)请重新申请新的许可证文件。

1.23、电源输出开关关闭

告警含义

1.告警解释

当电源输出开关关闭时产生此告警。

2.告警参数

参数名称

参数含义

机架号

机架号

框号

管理配电盒的WSMU的框号

开关编号

配电盒的开关号

对系统的影响

∙输出电压被关闭

∙系统的灾难恢复能力被减弱。

系统自处理过程

相关告警

告警处理

1.可能原因

∙配电盒故障;

∙配电盒输出端口故障。

2.处理建议

1.检查配电盒输入电源是否正常。

2.检查配电盒。

3.更换配电盒。

 

1.24、H.248SCTP链路故障

告警含义

1.告警解释

MSCServer同媒体网关间(Mc接口)的SCTP链路发生故障。

2.告警参数

参数名称

参数含义

MGW索引号

发生此告警的媒体网关索引号。

链路号

发生此告警的媒体网关链路号。

对系统的影响

∙H.248消息将不能在该链路上进行传输;

∙如果到指定媒体网关有多条链路,将导致其它链路的负荷增加;如果到指定媒体网关只有1条链路,则到此媒体网关的所有业务中断。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

∙数据配置不正确。

∙MSCServer和媒体网关的物理连接网线脱落或断开。

∙如果MSCServer作为SCTP的服务器端时,由于维护或者其他原因,媒体网关主动发起了SCTP连接的拆除操作。

∙如果MSCServer作为SCTP的客户端时,由于维护或者其他原因,MSCServer删除了所配置的H.248SCTP链路。

∙Mc接口的H.248SCTP链路出现了异常。

2.处理建议

(1)检查H.248SCTP相关的数据配置:

使用MML命令LSTSCTPPARA检查MSCServer使用的校验和算法是否和网关使用的一致;

使用MML命令LSTMGW检查MSCServer的SCTP的“服务器/客户端”配置是否正确:

∙如果MSCServer是作为服务器端,那么媒体网关应该是作为客户端

∙如果MSCServer是作为客户端,那么媒体网关应该是作为服务器端

使用MML命令LSTH248LNK检查MSCServer配置的H.248SCTP链路中IP地址、端口信息是否和之前与网关协商的一致;

确保相关数据正确后,检查告警是否恢复?

Y=>结束。

N=>转

(2),检查MSCServer同媒体网关间的物理连接。

(2)检查MSCServer同媒体网关间的物理连接。

如果是物理连接网线脱落或断开,确保连接正常后,检查告警是否恢复?

Y=>结束。

N=>转(3),检查是否媒体网关发起了SCTP链路的拆除操作。

(3)检查是否媒体网关发起了SCTP链路的拆除操作。

在MSCServer上跟踪SCTP链路的消息,确认是否由于媒体网关发起了链路拆除操作?

Y=>请联系MGW维护人员处理。

N=>联系华为当地办事处技术支援人员。

1.25、MGW退出服务

告警含义

1.告警解释

当媒体网关向MSCServer上报“退出服务”消息,或者MSCServer同媒体网关间的所有H.248链路中断,将产生该告警。

2.告警参数

参数名称

参数含义

MGW索引号

发生此告警的媒体网关索引号。

对系统的影响

如果媒体网关发生故障导致退出服务,MSCServer将释放所有在该媒体网关上进行的呼叫,并且不再处理任何与该媒体网关相关的业务。

系统自处理过程

无。

相关告警

无。

告警处理

1.可能原因

∙媒体网关向MSCServer报告“退出服务”。

∙MSCServer与该媒体网关之间的所有H.248链路都处于故障状态。

2.处理建议

(1)检查媒体网关是否退出服务:

检查媒体网关侧是否已经退出服务,确认退出服务的原因?

待媒体网关重新进入服务后,检查告警是否恢复?

DSPMGW:

MGWIDX=0;(输入告警MGW号)观察MGW的运行状态。

Y=>结束。

N=>转

(2)

(2)检查MSCServer同媒体网关之间的H.248链路状态:

检查MSCServer同媒体网关之间的H.248链路状态是否正常,如果不正常,则需要恢复链路。

在链路恢复正常后,检查告警是否恢复?

LSTH248LNK:

;输出H.248所在MGW号

DSPH248LNK:

MGWIDX=1;(输入以上输出的MGW号)

Y=>结束。

N=>联系华为当地办事处技术支援人员。

1.26、MTP目的信令点不可达

告警含义

1.告警解释

MTP目的信令点不可达。

2.告警参数

参数名称

参数含义

目的信令点编码

该链路所连接的远端目的信令点编码

源信令

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 成人教育 > 电大

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1