EMB5116告警处理手册.docx

上传人:b****4 文档编号:12038266 上传时间:2023-04-16 格式:DOCX 页数:37 大小:910.16KB
下载 相关 举报
EMB5116告警处理手册.docx_第1页
第1页 / 共37页
EMB5116告警处理手册.docx_第2页
第2页 / 共37页
EMB5116告警处理手册.docx_第3页
第3页 / 共37页
EMB5116告警处理手册.docx_第4页
第4页 / 共37页
EMB5116告警处理手册.docx_第5页
第5页 / 共37页
点击查看更多>>
下载资源
资源描述

EMB5116告警处理手册.docx

《EMB5116告警处理手册.docx》由会员分享,可在线阅读,更多相关《EMB5116告警处理手册.docx(37页珍藏版)》请在冰豆网上搜索。

EMB5116告警处理手册.docx

EMB5116告警处理手册

第1章GPS故障

GPS基础知识介绍

1.1.1GPS运行状态简介

状态名称

含义

告警情况

初始状态

主控板或GPS复位时GPS的初始状态

无告警

预热状态

主控板晶振在下电复位后的预热状态

首次上电,此状态会持续40分钟以上

无告警

锁定状态

GPS可用状态

无告警

HoldOver状态

GPS不可用状态不超过12小时

事件类告警,“时钟锁相环进入HOLDOVER状态”

HoldOver预警状态

GPS不可用状态在12到24小时之间

故障类告警,“GPS进入HOLDOVER预警状态”

HoldOver超时状态

GPS不可用状态超过24小时

关闭射频通道,小区退服

故障类告警,“GPS进入HOLDOVER超时状态”

不可恢复异常状态

GPS可用,但主控板锁相环不可用

关闭射频通道,小区退服

故障类告警,“时钟锁相环异常”

表21GPS运行状态表

1.1.2GPS故障状态简介

故障代码

故障名称

建议

2

GPS天线经过无源功分器

时钟源天线工作状态修改为无源

8、或2056

GPS接收机没有跟踪到GPS信号

检查工程问题

10、或2058

GPS天线开路

检查工程问题

12、或2060

GPS天线短路

检查工程问题

96、或2144

GPS接收机正在计算位置

等待45分钟

表22GPS故障状态表

1.1.3GPS搜星原理

GPS空间卫星星座由24颗卫星组成,分布在6个轨道面内,每个轨道上分布有4颗卫星。

在同一观测点,位于地平线以上的卫星数目,随时间和地点而异,但最少为4颗,最多可达11颗。

GPS定位原理要求在同一时刻,至少观测到4颗以上卫星才能定位;GPS锁星数至少为4颗就能保证GPS接收机在正常天气下可靠工作。

图21GPS卫星图

1.1.4GPS天线安装位置

GPS天线应安装在较开阔的位置上,保证周围较大的遮挡物(如树木、铁塔、楼房等)对天线的遮挡不超过30度,天线竖直向上的视角应大于120度。

为避免反射波的影响,GPS天线尽量远离周围尺寸大于20厘米的金属物2米以上。

不要将GPS天线安装在其他发射和接收设备附近,不要安装在微波天线的下方,高压线缆下方,避免其他发射天线的辐射方向对准GPS天线。

两个或多个GPS天线安装时要保持2米以上的间距,建议将多个GPS天线安装在不同地点,防止同时受到干扰。

在满足位置的情况下,GPS馈线应尽量短,以降低线缆对信号的衰减损耗。

判断GPS工作环境比较方便的办法就是观察GPS接收到的卫星信号的强度。

一般使用C/No来判断,这个值越大越好。

正常情况下至少能收到6颗卫星的C/No在38到50之间,至少有3颗卫星的C/No大于43。

图22GPS天线安装位置示意图

GPS相关告警

告警编号

名称

告警源

可能原因

处理思路

20162

GPS进入HOLDOVE预警状态

主控板

1、长时间没有捕捉到GPS信号

2、GPS信号长时间过弱

1、查看GPS状态、配置数据

2、检查GPS天馈安装环境

3、排查工程问题

4、检查设备问题

20163

GPS进入HOLDOVER超时状态

主控板

1、长时间没有捕捉到GPS信号

2、GPS信号长时间过弱

1、查看GPS状态、配置数据

2、检查GPS天馈安装环境

3、排查工程问题

4、检查设备问题

20164

时钟锁相环异常

主控板

1、主控板晶振锁定异常

1、检查设备问题

21056

管脚CDD_BOARD5V监测值超出阈值上限(附加信息是VOLT_GPS_SYSTEMAlarm;SCT5VGPSVoltage)

主控板

1、主控板卡硬件故障

1、排查工程问题

2、检查设备问题

表23GPS相关告警表

20162:

GPS进入HOLDOVER预警状态

告警编号:

20162

告警值:

255(无效)

1.1.5排障方法概述

✓查看GPS状态、配置数据

✓检查GPS天馈安装环境

✓排查工程问题

✓检查设备问题

1.1.6排障方法详述

1.1.6.1查看GPS状态、配置数据

1)在LMTB上查看“时钟源索引”:

1表示GPS,2表示北斗,3表示级联,4表示1588,参照实际情况修改。

2)在LMTB上查看“GPS故障状态代码”:

如果是2,修改“时钟源天线工作状态”为无源;如果是8、10、12或2056、2058、2060,转入“2.3.2.3排查工程问题”;如果是96或2144,等待45分钟。

3)在LMTB上查看“是否无GPS启动”:

参照实际情况修改。

1.1.6.2检查GPS天馈安装环境

1)参照“2.1.4GPS天线安装位置”检查安装环境是否满足要求,主要检查120度净空要求、周围可能存在的干扰、多个蘑菇头的放置。

2)用一个圆柱形通口的金属罩罩住GPS天线,对比GPS锁星情况,确定是否有外界干扰。

3)用GPS手持仪测试锁定情况,与基站GPS锁定情况做对比,确定是否有外界干扰。

1.1.6.3排查工程问题

1)排查节点为与GPS相关的蘑菇头天线、馈线、放大器、功分器、避雷器、接地线、GPS级联线缆等。

2)量电压:

从蘑菇头向基站方向进行测量

GPS线缆除了传输GPS射频信号外,还为GPS蘑菇头、放大器等设备供电。

可将基站假想为5.3V的直流电源,使用万用表向基站方向测量电压。

测量节点为各个接头,如GPS天线接头、分路器的GPS天馈接头、避雷器的GPS天馈接头、基站的GPS天馈接头等。

将黑(-)表笔接天线的芯、红(+)表笔接天线的屏蔽地。

各测量节点的电压值都在5V左右(此经验值需要各地项目在实际中获取);如为0V,说明开路。

测量节点离基站越远,电压值应该越小;如不符合,可能某个器件有损坏。

3)量电阻:

从基站向蘑菇头方向进行测量

使用万用表电阻档的20K量程,向蘑菇头方向测量GPS天线的等效电阻。

测量节点为各个接头,如GPS天线接头、分路器的GPS天馈接头、避雷器的GPS天馈接头、基站的GPS天馈接头等。

将红(+)表笔接GPS天线的芯、黑(-)表笔接GPS天线的屏蔽地,测量结果为R1;红(+)表笔接GPS天线的屏蔽地、黑(-)表笔接GPS天线的芯,测量结果为R2;一般来说,R1和R2的值相差不大,可以记为一个值R。

各测量节点的电阻值在150K到400K之间(此经验值需要各地项目在实际中获取);如果电阻值极大,说明开路;如果电阻值极小,说明短路。

如下是一组经验值。

万用表

档位

GPS天线类型

R1

R2

DT9204

20K

UCT

9K

3.6K

4)查馈线

线缆长度需求

线缆型号及损耗

备注

0~70m

LMR400(衰减18dB/100m)

70~110m

LMR600(衰减12dB/100m)

70~150m

LMR400(衰减18dB/100m)

增加GPS信号放大器

5)查级联线

用网线对GPS进行级联,级联线长度3~10米,可以支持3级;3米以内支持4级。

线序

级联基站时钟源

级联基站时钟源天线工作状态

上级5116,下级5116

全部直连,不对网线内部的线序作调整

2(需要与18AE统一为3)

与上一级基站配置相同

上级18AE,下级18AE

1、3号细线对调,2、6号细线对调,4、5、7、8直连

3

与上一级基站配置相同

6)查功分器

在安装的功分器上明确标明有+5V供电的接口下接的基站可以设置为有源工作方式,其它接口下的基站一定要设置为无源工作方式(如星时通公司的一分四功分器)。

在安装的功分器上没有明确标明有+5V供电的功分器下接的所有基站请设置为无源工作方式(如宁波泰立公司的一分二功分器(SP2WB136MS))。

1.1.6.4检查设备问题

1)查主控板锁相环状态

在LMTB上查询GPS故障状态,并且查询结果为GPS没有故障状态告警。

用OSPStudio登录主控板卡,此时控制台上会周期打印

0x7d4f800(tDpllMain):

ADJUSTEPLD

0x7d4f800(tDpllMain):

ResetingEpldPhaseTwice

在控制台下输入PLL_PRINT_SWITCH4后,会看到THECURRENTPP1S_REFPHASEDIFFERENCE的值一直在变化。

满足以上现象的板卡,为锁相环不正常。

如果下电复位不能解决就更换主控板。

建议联系研发支持处理。

2)查总线

通过LMTB查询各个板卡的温度为无效;通过LMTB查询风扇转速为有效。

满足以上现象,为总线挂死,上站插拔风扇并下电复位基站可以解决。

20163:

GPS进入HOLDOVER超时状态

告警编号:

20163

告警值:

255(无效)

1.1.7排障方法概述

同“2.3.1排障方法概述”。

1.1.8排障方法详述

同“2.3.2排障方法详述”。

20164:

时钟锁相环异常

告警编号:

20164

告警值:

255(无效)

1.1.9排障方法概述

✓检查设备问题

1.1.10排障方法详述

1)用OSPStudio登录主控板卡,敲命令PLL_STATE_RECOVER,如果不能解决就更换主控板。

建议联系研发支持处理。

2)查锁相环问题,转入“2.3.2.4检查设备问题”。

21056:

管脚CDD_BOARD5V监测值超出阈值上限

告警编号:

20165

告警值:

255(无效)

1.1.11排障方法概述

✓检查GPS天馈安装环境

✓检查设备问题

1.1.12排障方法详述

1)排查GPS天馈是否短路,转入“2.3.2.3排查工程问题”。

2)附加信息是VOLT_GPS_SYSTEMAlarm;SCT5VGPSVoltage,说明主控板给GPS供电有异常。

如果下电复位不能解决就更换主控板。

建议联系研发支持处理。

开站时GPS长时间不能锁定

1.1.13排障方法概述

同“2.3.1排障方法概述”。

1.1.14排障方法详述

同“2.3.2排障方法详述”。

第2章传输故障

传输及告警介绍

图31传输拓扑示意图

目前RNC侧采用155M光纤,ATM方式基站侧用每路2M的E1线缆。

基站侧最多可以支持16路E1。

基站的SCT板卡可以支持8路E1,如果要连8路以上,需要加E1扩展板ETP,而且要求所有线缆都连到ETP上,不能将E1既插在SCT又插在ETP上。

传输的拓扑如图所示,RNC的CASA或CAPA板卡每拉出一路光纤,可支持64路E1,RNC给每个站点分配的一个或两个IMA组,给基站分配这路光纤上的E1逻辑链路号,链路号可以不连续,但必需分配到一路光纤上。

RNC拉出的光纤连到ODF配线架上,然后连接到SDH传输网络的光端机上。

SDH通过分配,将某个站点的所有逻辑链路分配到一路光纤,拉到站点机房的光端机上。

基站侧一般配置一个IMA组,包含多路E1。

多路E1通过机房的DDF搭线架和光端机拉出的E1对接。

本节说的传输,主要是指基站E1底层传输和基于E1之上的IMA协议,协议层次可以参考下图:

图32链路状态表

上图可以看出,传输分为三层,E1层,TC层和IMA层,基站和RNC传输通,要求IMA组激活。

一个IMA组中可包含多路E1,IMA组激活,至少要求一路E1可用。

一路E1可用的标志,可以从Lmtb的“IMA信息”中获得。

对上图的说明:

E1层:

要求近端有信号,单帧同步;复帧失步无所谓,目前基站采用单帧同步。

TC层:

要求信元同步状态为同步。

IMA层:

要求近端IMA帧同步,远端TC同步,远端IMA帧同步,近端接收逻辑链路为RNC给基站配置的逻辑链路(就是RNC侧一根光纤中分配的E1链路的逻辑编号),近端发送接收和远端发送接收都激活,各路都有相同的IMA版本,远端操作模式为对称,远端时钟模式为ITC,远端帧长为128,远端IMA组ID为RNC给该基站分配的IMA组ID(各路必需一致),远端发送参考链路逻辑ID要求各路一致。

如果有一项不满足上述要求,该路E1有问题。

传输的告警做过多次精简,为了避免告警重复上报,目前传输发生故障,由RNC上报告警,基站侧的告警只记录到告警日志中,不上报OMCR。

基站现有传输告警有两条:

1、21502“IMA模式下IMA组内链路故障/TC模式下TC链路故障”;

2、21500“IMA组去激活”;

与传输相关告警

在IUB口协议中,IMA处于底层,如果底层出了故障,会对高层协议产生影响,会导致高层协议传输链路的故障。

图33Iub接口协议结构

下面告警与传输相关,如果基站正常启动后,传输长时间故障,必然会有下列告警:

1、20151“IPOA链路故障”;

2、20105“一条NBAP用SAAL故障”;

3、20106“NBAP用SAAL全部故障”;

4、20107“一条ALCAP用SAAL故障”;

5、20108“ALCAP用SAAL全部故障”;

6、20007“网元时间同步失败”

21502:

IMA模式下IMA组内链路故障/TC模式下TC链路故障

告警编号:

21502

告警值:

0~15(链路号)

2.1.1排障方法概述

该告警上报,表示一路传输存在问题,表示该路E1没有连接或连接后没有激活。

通过告警值确定是哪路E1。

2.1.2排障方法详述

如果某个基站的某些E1没有连接,上报这个告警无需处理。

重点看连接后连路故障的情况,可以从lmtb的IMA信息里查看该路E1的状态,参见前面的“图3-2链路状态表”。

根据链路状态表中的状态,分步排查:

1、E1层就没有信号,说明基站侧没有受到RNC端的电信号,存在两种可能:

a)收发方向接反了,倒换收发尝试。

b)从基站到光端机的某个环节没有接好,需要逐段检查。

目前最有效的逐段检查是物力打环的办法。

比如在基站的E1出口处用过E1线缆打环,看Lmtb上E1的状态,也可以用一个发光二极管将基站侧的收发连接起来,看二极管灯是否亮,如果亮说明所测试的环节线路是好的。

在基站机房,对基站侧的测试,最远只能测到DDF搭线架,如果在DDF搭线架上给基站打环,基站正常,说明问题出在搭线架的对端以后的部分。

需要找传输人员确认光端机是否工作正常。

2、TC层没有同步,外场从未遇到。

3、IMA层没有激活,需要和RNC侧以及传输机房联合定位。

a)先记录激活链路的IMA组的ID。

将已经激活的链路暂时拔除(避免该路影响问题定位),只连这路观察IMA组是否可以激活,如果可以激活,看激活的IMA组ID和之前激活时记录的IMA组ID是否一致,如果不一致,说明RNC或传输机房的连路参数错误,给该基站不同的连路分配了不同的IMA组ID,需要RNC和传输机房重新调整IMA数据。

b)如果只连路还是无法激活,在基站侧指给该路E1向基站侧打环,看是否IMA可以激活,如果可以激活,表示从基站到打环处没有问题。

c)从基站机房给RNC侧的这路打环,看RNC侧IMA是否激活,如果不能激活,说明问题出在RNC到光端机之间,需要逐级排查。

d)从传输机房给RNC侧打环,确认RNC和打环处是否正常。

总之,传输问题定位可以采用逐级打环的办法定位,

21500:

IMA组去激活

告警编号:

21500

告警值:

0~1(IMA组号)

2.1.3排障方法概述

IMA组去激活表明整个IMA组中没有一路E1可用,如果原来是激活的,突然去激活,表示基站和RNC之间的传输链路的某个环节出了问题,比如RNC复位或中间传输线缆被拽断。

2.1.4排障方法详述

如果是单IMA组,基站的IMA参数都采用默认的参数,参见下图,和下面参数相同即可,不用做再调整。

如果是双IMA组,需要根据具体需求配置双IMA组参数。

图34单IMA配置截图

图35双IMA配置截图第1部分

图36双IMA配置截图第2部分

IMA组去激活的排障方法和单路链路排障方法基本相同,有时施工不合格,将一捆E1线缆顺序弄乱,会给排障造成较大麻烦,处理方法是一路一路整理,整理好一路后作好标记,再去排除剩余的连路。

20151:

IPOA链路故障

告警编号:

20151

告警值:

255(无效)

2.1.5排障方法概述

IPOA故障,表示OMCR和基站之间的管理通道故障,根据IUB接口图可以看到IPOA在IMA之上,在OMCR和基站之间存在IPOA保活机制,需要由此入手排障。

2.1.6排障方法详述

IPOA故障主要有两类:

1、IPOA无法建立:

基站启动后给RNC发IPOA请求消息,如果RNC收到消息后,RNC给基站回响应消息,基站根据响应消息中的内容建立IPOA通道。

目前有几种情况IPOA无法建立:

a)基站的EID不正确,导致RNC收到IPOA请求消息后不回响应消息,需要根据RNC给基站分配的EID修改基站EID,修改后复位基站。

b)基站收到RNC的响应消息,但是有CRC校验错误,部分传输数据丢失,可能存在某路连路异常,RNC发的数据没有完全到达基站。

c)基站收到RNC的响应消息,从si日志中看到,基站每次打印收到消息类型为133,说明某个环节环回了,基站发出去的消息被环回给基站了。

2、IPOA闪断:

IPOA闪断主要是OMCR(NEA)每5秒钟给基站设置的存活报文没有到达基站,如果基站连续3次基站没有收到就会发起IPOA重建,体现出反复IPOA故障又成功。

这时需要从NEA-〉RNC-〉Nodeb逐个排查。

先要看NEA是否发了Set报文,再看RNC是否透传了报文给基站,基站在SCT的21号日志中记录了基站收到NEA保活消息的情况,可以参考21号日志分析。

20105:

一条NBAP用SAAL故障

告警编号:

20105

告警值:

10(Saal链路标识)

2.1.7排障方法概述

承载NBAP的SAAL链路负责基站和RNC之间传递NBAP消息,如果该SAAL链路故障,RNC和基站的NBAP过程无法交互。

一般情况IMA传输故障时间足够长,必然会导致该告警。

2.1.8排障方法详述

SAAL链路也有保活机制,目前保活周期是7秒钟,如果某条SAAL链路基站侧连续7秒收不到RNC存活消息,基站会上报SAAL链路故障。

如下情况会导致SAAL链路故障:

1、IMA故障时间超过7秒,会出现SAAL链路故障,排除IMA故障问题,参见前面章节;

2、IMA正常,基站侧有SAAL链路故障,要考虑是否某路传输出了问题,导致RNC侧给基站发的信元丢失,导致了SAAL链路闪断。

排障时要观察“IMA链路信息”中是否存在某路E1有帧失步计数;

3、需要和RNC联合定位,看RNC是否下发SAAL链路存活消息。

20106:

NBAP用SAAL全部故障

告警编号:

20106

告警值:

255(无效)

2.1.9排障方法概述

IUB口协议中,对于SAAL链路可以配置两条,也可以一条,配置两条的时候是主备备份,防止一条SAAL链路故障时影响业务。

而实际上,主备配置在两个IMA组中更有意义,如果在一个IMA组中意义不大。

所以在基站侧只配置一个IMA组的时候,只有一个承载NBAP的SAAL链路。

如果这条故障,基站承载NBAP的连路就都故障了,所以会上该告警。

2.1.10排障方法详述

排障思路同”3.6.2排障方法详述”。

20107:

一条ALCAP用SAAL故障

告警编号:

20107

告警值:

1(Saal链路标识)

2.1.11排障方法概述

承载ALCAP的SAAL链路负责维护PATH通道的删建,如果该SAAL链路故障,RNC和基站的无线链路的承载无法正常建立,一般情况IMA传输故障时间足够长,必然会导致该告警。

2.1.12排障方法详述

排障思路同”3.6.2排障方法详述”。

20108:

ALCAP用SAAL全部故障

告警编号:

20108

告警值:

255(无效)

2.1.13排障方法概述

排障思路同”3.7.1排障方法概述”。

2.1.14排障方法详述

排障思路同”3.7.2排障方法详述”。

20007:

网元时间同步失败

告警编号:

20007

告警值:

255(无效)

2.1.15排障方法概述

网元同步失败是指基站没有获取到SNTP服务器时间上报的告警,对业务没有影响。

发生告警要排查基站和SNTP服务器之间的通路。

2.1.16排障方法详述

网元时间同步失败,主要有以下基站原因:

IPOA闪断,导致基站获取网络时间失败。

OMCR规划中SNTP服务功能没有开启,需要和OMCR维护人员确认。

基站的SNTP服务器地址是从RNC的IPOA响应消息中带回的,要检查RNC给基站配置的SNTP服务器地址是否正确。

第3章主站故障

主站侧问题介绍

主站侧故障一般表现为板卡不能正常工作,小区退服,或者基站不可用。

对于单板故障,先复位板卡,如果复位后仍然无法正常启动,需要笔记本直连板卡进行单板升级,如果升级后板卡还是不能正常工作,需要更换板卡;发生小区退服时,一般是在OMT上看到的告警,基站侧没有相关的告警,此时需要检查对应小区的基带资源和射频资源是否故障,可能是单板故障导致的基带资源丢失,或者是RRU退服或故障后导致射频资源不足,从而引起小区退服;产生基站不可用告警时,是基站没有一个可用的本地小区,此时需要查看基站侧时钟信息、板卡、RRU等。

主站侧还有一些告警是与设备所处环境有关系,如机房温度过高、风扇故障导致电源模块保护频繁下电,致使基站反复重启。

主站问题相关告警

1、22000“DSP不存活”

2、60000“基站启动通知”

3、21008“光模块不在位”

4、20068“基站不可用”

5、20121“环境温度过高”

6、20120“环境温度过低”

7、20137“雷击告警”

8、20228“风扇长时间告诉运转”

9、20156“单板不在位”

10、20078“规划设备不在位”

11、20226“散热风扇故障”

12、21050“板卡温度超出上限”

13、21066“板卡温度低于下限”

22000:

DSP不存活

告警编号:

22000

告警值:

检测失败的目的处理器编号

3.1.1排障方法概述:

DSP不存活的告警原因是:

在规定时间内,BCP处理器对Dsp存活检测没有收到响应消息,产生此告警。

3.1.2排障方法详述:

DSP不存活的主要原因是个别板卡长时间工作导致软件或者硬件故障,目前采用的方法是对DSP状态进行全网轮询,通过轮询结果筛选出有DSP不存活的BPOA或者BPIA,复位对应的板卡。

如果复位后DSP仍然不存活,需更换板卡。

60000:

基站启动通知

告警编号:

60000

告警值:

255(无效值)

3.1.3排障方法概述:

此告警原因是基站复位后重新启动,通过这个告警可以推断基站启动的时间点,需要确认启动原因,排除非正常因素导致的基站启动。

通过提取基站的SI日志分析启动原因。

此告警只在频繁出现时关注。

3.1.4排障方法详述:

分析基站告警日志,找到此告警产生的对应时间点,同时查看SI日志中基站启动原因,如果为poweron,即可定位为掉电导致的基站复位,如下:

CCU(0,0)[SFW]->LastHardWareResetreason--OSP_HW_POWON_CUASE

C

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1