诺西TD基站BBP530故障处理手册.docx
《诺西TD基站BBP530故障处理手册.docx》由会员分享,可在线阅读,更多相关《诺西TD基站BBP530故障处理手册.docx(26页珍藏版)》请在冰豆网上搜索。
诺西TD基站BBP530故障处理手册
故障处理手册
1.BBP单板问题
1.1BBI板心跳检测失败
1.2BBP板心跳检测失败
1.3BBI板配置但不在位超时
1.4Q922通路检测失败
1.5BBI/BBP光口断链
1.6小结及案例
2.GPS类故障
2.1时钟源状态告警(GPS)
2.2时钟锁相环状态次要告警
2.3时钟锁相环状态严重告警
2.4没有时钟源告警
2.5GPS大频偏
2.6串口通信异常
2.7小结及案例
3.RRU类故障
3.1RRU配置但不可用超时
3.2RRU心跳检测失败
3.3RRU下行光口断链告警
3.4RRUDPD自检失败告警
3.5小结及案例
4.小区及载波类故障
4.1小区未建立
4.2小区已建立但不可用
4.3辅载2,HSPA不可用
4.4小结及案例
5.功率驻波类告警
5.1下行无可用校准通道告警
5.2上行无可用校准通道告警
5.3下行输出欠/过功率告警
5.4下行通道告警/上行通道告警
5.5下行驻波比告警
5.6发射/接收通道天线通道幅相一致性告警
5.7小结及案例
6.传输类告警
6.1E1/T1信号丢失
6.2E1/T1告警指示
6.3E1/T1远端告警指示
6.4E1/T1帧失步
6.5E1/T1环回故障
6.6E1T1高误码率门限告警
6.7小结及案例
7.信令类告警
7.1IMA链路信元定界失步故障
7.2IMA链路帧失步故障
7.3IMA链路延迟失步故障
7.4IMA链路远端接收故障
7.5IMA链路接收故障
7.6IMA组配置失败故障
7.7IMA远端组配置失败故障
7.8IMA组内激活链路数不足故障
7.9IMA远端组内激活链路数不足故障
7.10ALCAP断链故障
7.11AAL2PATH上的AIS故障
7.12SAAL断链故障
7.13NCP告警
7.14CCP告警
7.15小结及案例
8.其他故障告警
8.1PSU异常
8.2DHCP启动告警
8.3OM通道断链告警
8.4小结及案例
处理故障的原则:
处理故障前请先对告警进行分析。
准确的告警定位有助提高处理故障的效率。
处理故障请遵循从简单到复杂,从易到难。
先做工程量小的工作来帮忙定位故障。
有上站查看的话可以多查看一下站点的历史告警。
对于一些问题的发现也有很大帮助。
1.BBP单板问题
1.1BBI板心跳检测失败
可能原因:
BBI与MPT通信失败
处理步骤:
1.查看BBI是否有电。
RUN的灯状态是否正常
2.复位BBI单板
3.拔插BBI单板
4.更换BBI观察情况
1.2BBP板心跳检测失败
可能原因:
BBP与MPT通信失败
处理步骤:
1.查看BBP是否有电。
RUN的灯状态是否正常
2.复位BBP单板
3.拔插BBP单板
4.倒换BBP观察情况
1.3BBI板配置但不在位超时
可能原因:
MPT板提示BBP/BBI不可用
处理步骤:
1.检查对应BBP/BBI状态
2.拔插BBP单板
3.倒换BBP观察情况
4.检查BBP/BBI的版本状态,如果版本不一致可以通过修改MPT板的版本直至BBI/BBP可以识别到,在对应的版本下开始升级,直至单板升到最新版本。
5.若均无法识别可通过串口重定向来定位单板
6.更换故障板件
1.4Q922通路检测失败
可能原因:
BBP与BBU通信失败
处理步骤:
1.检查告警Q922对应板件是否上电。
状态是否正常
2.复位相应单板
3.拔插BBP单板
4.倒换BBP观察情况,定位故障
1.5BBI/BBP光口断链
可能原因:
与RRU连接的通路故障或不稳定
处理步骤:
1.查看指示灯
2.通过DSPPORT查看光通路状态
3.如果光路均可用则尝试复位BBI/倒换BBI
4.如果光路不可用则尝试倒换光纤2端收发观察指示灯,确认光纤是否有问题
5.倒换BBI板件
6.更换光模块
1.6小结及案例
BBI/BBP单板出现故障后,首先要定位故障。
确认是硬件问题还是软件问题。
由于目前NODEB所经历的版本较多。
所以必须在所有的版本里面确认BBP是否能够正常通信。
如果是单存的由于版本不匹配问题导致的请按步骤升级。
案例一、融侨水乡RRU配置但不可用超时、BBI光口断链告警
查询发现该站点有47RRU对应的BBI光口断链告警。
初步分析为光路故障?
对换47,48的光缆后仍是47RRU对应的BBI光口断链告警,分析RRU及光缆无故障。
问题应该是光模块及BBI。
对换47、48对应的光模块。
仍是47位置有问题。
光模块问题排除。
定位故障为BBI光口有问题。
对换0槽位与3槽位BBP后故障解决。
案例二、鼓山老年公寓Q922通路检测失败RRU心跳检测失败
上站处理首先观察BBI单板状态。
BBI的RUN灯不闪,常亮。
说明BBI板运行状态不正常。
查看该站告警后发现无告警。
BBI运行正常。
查看历史告警发现BBI存在频繁出现Q922通路检测失败告警。
说明BBI很不稳定频繁重起。
怀疑BBI故障或接触不良。
将该板件换到其他位置后现象依旧。
怀疑BBI板件有问题。
更换BBI板后故障解决。
2.GPS类故障
2.1时钟源状态告警(GPS)
可能原因:
时钟源失效
处理步骤:
1.检查GPS是否被遮挡
2.检查GPS状态是否可用,收到卫星数量是否正常。
3.LSTTIMESRC;查询网元的参考时间源是否为GPS。
4.SETTIMESRC:
TIMESRC=GPS;
2.2时钟锁相环状态次要告警
可能原因:
GPS故障或时钟源丢失,保持一段时间后会导致小区被删除
处理步骤:
该告警会伴随2.1时钟源状态告警。
请参考2.1处理方法
2.3时钟锁相环状态严重告警
可能原因:
GPS故障或时钟源丢失,会导致小区被删除
处理步骤:
该告警会伴随2.1时钟源状态告警。
请参考2.1处理方法
2.4没有时钟源告警
可能原因:
时钟源未配置或丢失
处理步骤:
1.LSTTIMESRC;查询网元的参考时间源是否为GPS。
2.SETTIMESRC:
TIMESRC=GPS;
2.5GPS大频偏
可能原因:
MPT板内时钟参数设置错误
处理步骤:
1.将单板插在基站BBU框内,接好GPS天线,上电;
2.待单板正常启动后,近端登录LMT,查看告警;
3.使用“STRCLKTST”命令打开时钟参考源质量监控,查看鉴相差值,看鉴相差值是正值还是负值;
4.使用“DSPCENTERDA”命令查看当前中心DA值;
5.使用“MODCENTERDA”命令修改当前中心DA值,在之前查询的中心DA值的基础上+1或-1;
6.查看鉴相差值的绝对值,看是否减小;
7.重复5、6两步操作,直到鉴相差值呈现正值和负值交替变化,绝对值最小;
8.查看小区是否起来,“GPS大频偏”告警是否消失?
9.完成定位后,使用“STPCLKTST”命令关闭时钟参考源质量监控。
2.6串口通信异常
可能原因:
盲起功能导致的冲突
处理步骤:
DPSGPS会显示串口通信异常,为盲起导致的,可直接起站,起完站后会自动恢复。
2.7小结及案例
对于GPS类告警主要是时钟源状态告警,大部分告警的产生均是由于GPS收到卫星数量减少或时钟源丢失导致的。
处理该类告警首先要查看下卫星是否被遮挡。
然后通过DPSGPS可以查询到GPS的状态。
能收到几颗星,GPS是否短路。
先定位故障:
一、非硬件故障
检查GPS位置。
查看GPS是否被阻挡。
检查GPS是否受干扰,干扰的时间段,频率。
可以通过历史告警来查看。
若受干扰的话可以找出干扰源,找出解决方案
二、硬件故障
基本上硬件故障的话可以通过DSPGPS来查看到。
排除的原则是从简单到复杂。
首先,检查硬件安装是否有问题。
1.防雷器是否接反。
2.各接头是否拧紧。
其次,更换GPS相关模块
1.重新做各馈线头
2.更换GPS时钟线
3.更换GPS蘑菇头
4.更换防雷器
5.更换MPT板件
案例一、兴园GPS不可用。
收到卫星为0
故障现象:
兴园站点状态正常,但是存在时钟源状态告警。
处理过程:
后台查询DSPGPS;发现GPS收到卫星为0
查看历史告警,发现该站点从4月份开始到7月份。
3个月期间每天早上8:
00左右开始到下午18:
00左右开始都会出现时钟源状态告警。
18:
00以后告警消失,站点状态正常。
因为DSPGPS的时候GPS状态是正常的。
故可以先判断GPS硬件无问题。
再告警出现的时间段比较有规律。
因此怀疑是干扰问题。
到站上拿手持GPS到天台测试发现收不到卫星。
再次验证了GSP本身并无问题。
然后到小区内部测试发现可以收到卫星。
因此问题定位在该楼屋面干扰。
通过测试发现该楼层朝南方向干扰严重,而楼层朝北方向并无干扰。
问题解决方案为:
将该站点的GPS位置更换到机房所在位置北边。
该位置可以稳定的收到卫星,且无干扰。
干扰源怀疑是南边工地白天施工时导致的。
通过修改GPS位置问题解决。
经过多日观察,该站点GPS正常。
再无出现告警。
案例二、喜盈门时钟锁相环状态严重告警
喜盈门站点出现时钟锁相环状态严重告警,初步分析为站上GPS故障
上站查询GPS发现出现GPS天线短路状态。
上天台观察GPS无异常现象。
分析可能故障为时钟线故障、GPS蘑菇头故障、1/2馈线故障。
首先更换GPS时钟线,现象依旧,初步判定时钟线无问题。
检查蘑菇头侧1/2馈线头。
发现馈线头进水,重新做1/2馈线头。
故障解决。
最好防水的处理。
3.RRU类故障
3.1RRU配置但不可用超时
可能原因:
RRU不可用
处理方法:
检查光通路状态,DSPPORT;
如果光路不通则检查BBI,光模块,光纤
如果光路可用则可以先复位RRU,观察RRU状态。
DSPRRU查看RRU状态。
可用,正常,升级RRU至最新版本
不一致,离线检查MPT与RRU版本状态是否一致。
可以选择回退MPT板,直至RRU处于正常状态后,升级RRU。
3.2RRU心跳检测失败
可能原因:
RRU通信失败
处理方法:
通过DPSPORT;检查故障RRU对应的光路。
如果光路不通则检查BBI,光模块,光纤
如果光路可用则可以先复位RRU,观察RRU状态。
更换RRU
3.3RRU下行光口断链告警
可能原因:
RRU级联下一级RRU光路不可用
处理步骤:
1.检查下一级RRU是否上电
2.查看下一级RRU的指示灯是否正常
3.倒换RRU之间的光纤,光模块
4.倒换RRU,定位故障
3.4RRUDPD自检失败告警
可能原因:
配置或定制错误
处理步骤:
重启RRU,如仍然出现,需返厂处理
3.5小结及案例
RRU为基站小区建立的重要组成部分。
如果RRU出现故障了该RRU所覆盖的区域将会出现无信号输出现象。
RRU出现故障后多数表现为,RRU不可用。
处于离线状态。
个别RRU会出现不一致现象。
分析处理RRU故障的基本步骤为:
1)检查该RRU对应的光路状态是否正常。
光路故障的请分析故障位置。
更换故障设备。
2)光路可用的RRU如果出现故障了请检查RRU的软件版本是否与MPT板软件包匹配。
如果RRU无法查询软件版本请将MPT板升级或回退。
某站点上的所有RRU处于什么版本状态下对于设备调测方都应有个详细的记录。
尽量保证所有RRU都处于最新版本。
3)对于确认RRU为硬件故障的请严格按照RRU故障判别记录表的指导做个详细记录。
案例一、金山剧院RRU心跳检测失败
OMC监控发现金山剧院有RRU心跳检测失败告警
上站发现正常无告警。
查询历史告警发现RRU频繁出现该告警。
时好时坏。
分析该RRU所处的位置温度较高导致的RRU工作异常。
现场进行简单散热措施:
打开机柜门及机房门,确认设备短时间通风;观察后2小时发现未出现之前的告警。
故障已找出。
通知移动处理机房空调问题。
案例二、金明苑写楼RRU46不可用\小区退服
检查RRU发现RRU无法上电。
测量电压发现电压正常,检查正负级发现没问题。
故障初步定位为RRU故障。
更换故障RRU后可以上电、升级。
案例三、闽江饭店RRU心跳检测失败
该站点为042升级到261后RRU不可用。
分析可能原因有:
RRU升级失败导致RRU不可用。
BBI升级后光路不可用
首先查询该站点的PORT发现该RRU对应的光路不可用。
查询BBI发现BBI正常。
故障定位为光路问题导致RRU不可用。
上站后检查光缆,光模块。
发现光模块为多模,光缆为单模,属于前期遗留问题。
更换光模块为单模后光路显示正常可用。
回退MPT到042后RRU可用,重新升级,故障解决。
案例四、仓山人武学校RRU心跳检测失败
查看PORT发现S1/S2的光路不可用,导致RRU心跳检测失败。
对换S1与S3后仍是S1光路不通。
排除光缆RRU问题。
S2也用同样方法排除。
怀疑BBI1,2两个光口故障。
将0。
3位置的BBP对换后仍是1、2两光口PORT故障。
初步分析BBP故障的可能性比较小。
怀疑问题可能出在MPT板。
尝试更换MPT板,并打上042SPC001补丁后故障解决。
4.小区及载波类故障
4.1小区未建立
可能原因:
小区建立失败,小去处于假死状态
处理步骤:
从RNC侧查看小区未建立原因:
是否数据问题。
RNC重新激活。
从NODEB查看小区未建立原因:
检查设备状态。
传输、RRU、GPS及时钟同步
检查数据。
查看各单板、小区、载波创建是否与RNC一致。
小区功率设置。
重起BBU。
4.2小区已建立但不可用
可能原因:
小区已经建立但不可用,该问题多数情况为NODEB原因
处理步骤:
从NODEB查看小区不可用原因:
检查设备状态。
特别是载波。
PATH。
重起BBU后查看设备状态。
处理相关故障单元
4.3辅载2,HSPA不可用
可能原因:
HS载波假死。
NODEB载波故障
处理步骤:
RNC侧重新激活第2辅载。
查看其他辅载状态。
分析是否是NODEB硬件故障
NODEB可先查看载波状态。
查看单板状态。
将故障单板与无故障单板对换,查看状态。
分析故障位置。
更换故障单板。
(出现过BBU背板故障现象)
4.4小结及案例
小区状态异常的告警对于用户来说是最直接,影响最大的告警。
也是我们所要处理的故障中优先级最高的告警。
因为该类告警不象其他告警一样直接指向某硬件。
影响小区不可用的因数较多。
因此处理该类告警前做个详细分析是很有必要的。
影响小区不可用的因数主要有以下几个方面:
一、硬件故障
基站侧如果出现BBP/BBI(载波)、RRU、GPS、天线PATH等硬件故障都会导致该硬件对应的小区不可用。
出现小区不可用的状态后可以优先查询下站点下相关硬件的状态。
二、数据问题
RNC侧或NODEB侧数据有问题。
如:
RNC闭琐,未激活。
NODEB存在DHCP启动告警等。
三、传输断链
可以通过查询告警及传输状态、各种信令,如:
AAL2PATH、NCP、CCP、SAALINK、IMALINK、IMAGUP等
案例一、银河大厦HSDPA第二辅载不可用
从RNC侧查看发现HS第二辅载不可用。
通过OMC查看NODEB载波。
发现载波状态正常。
重起基站后再查询载波发现正常。
但是RNC侧仍是HS不可用。
分析问题应该在RNC侧。
RNC查询该小区所有HS载波发现所有HS载波均不可用。
后通过RNC查询与HS载波相关的设置发现HSDPA时隙分配有问题。
通过RNC重新修改后故障解决
案例二、华夏图书城小区退服
上站检查传输,发现传输都是正常的。
检查所有硬件,BBP、RRU、GPS均显示正常。
怀疑基站掉死。
重起BBU后现象依旧。
通知RNC重新激活小区,显示失败,并伴随有功率不匹配告警。
检查发现该站点小区门限被修改为400,将该门限改为500后小区状态正常。
5.功率驻波类告警
5.1下行无可用校准通道告警
可能原因:
收发器失效
处理步骤:
查看告警,定位故障的跳线位置
查看故障跳线的硬件,检查馈线头。
将故障跳线与正常跳线对换,定位故障设备。
或使用Sitmaster测故障跳线。
定位故障位置
更换故障硬件
5.2上行无可用校准通道告警
可能原因:
收发器失效
处理步骤:
查看告警,定位故障的跳线位置
查看故障跳线的硬件,检查馈线头。
将故障跳线与正常跳线对换,定位故障设备。
或使用Sitmaster测故障跳线。
定位故障位置
更换故障硬件
5.3下行输出欠/过功率告警
可能原因:
收发器失效
处理步骤:
先确认RNC侧是否有做降功率操作。
复位RRU,查看状态。
如果告警依然存在请查看告警对应的馈线。
查看故障跳线的硬件,检查馈线头。
将故障跳线与正常跳线对换,定位故障设备。
或使用Sitmaster测故障跳线。
定位故障位置
更换故障硬件
5.4下行通道告警/上行通道告警
可能原因:
天馈系统故障
处理步骤
查看故障跳线的硬件,检查馈线头。
将故障跳线与正常跳线对换,定位故障设备。
或使用Sitmaster测故障跳线。
定位故障位置
更换故障硬件
5.5下行驻波比告警
可能原因:
天馈系统故障
处理步骤
查看故障跳线的硬件,检查馈线头。
将故障跳线与正常跳线对换,定位故障设备。
或使用Sitmaster测故障跳线。
定位故障位置
更换故障硬件
5.6发射/接收通道天线通道幅相一致性告警
可能原因:
收发器故障
处理步骤:
查看该站点历史告警。
大部分站点该告警都会自动恢复。
查看是否频繁出现,或出现后无法消失的。
查看故障跳线的硬件,检查馈线头。
将故障跳线与正常跳线对换,定位故障设备。
或使用Sitmaster测故障跳线。
定位故障位置
更换故障硬件
5.7小结及案例
对于该类告警,首先要明确是单PATH告警还是多PATH告警。
通过查询历史告警可以了解告警是否频繁出现。
通过查询RRU的PATH可以有效的帮助我们分析故障位置。
例如:
使用DSPRRU与DSPCARRIERRES命令检查校准结果:
如果TX值大于94,问题基本可以定位为PATH硬件故障。
通过倒换馈线可以有效的发现问题。
如果告警不随馈线走。
说明RRU侧有问题
如果告警跟随馈线走。
说明馈线或天线有问题。
此时如果PATH值固定不变说明馈线有故障。
如果PATH值有变化说明天线故障
案例一、冠雄花园(万都阿波罗)驻波比告警,第三路传输闪断
首先,检查各元器件及各个接头。
如:
RRU、馈线头、合路器。
通过详细检查发现RRU下合路器耦合器安装与设计不符合。
重新整改后告警消失。
该站传输闪断通过本端自环后初步分析为本端传输问题。
检查该站的传输头发现头子没问题。
由于该站为室外站,有使用防雷卡。
在防雷卡前端测试发现传输正常。
怀疑防雷卡故障。
尝试更换防雷卡后故障解决。
案例二、建银大厦出现大量的驻波比告警。
单小区出现大量的驻波比告警初步分析原因为:
1.RRU故障
2.天线故障
3.CAL馈线故障
首先上站检查校准线,发现该馈线头子松动,将起拧紧后所有告警消失。
重新做好防水处理,并进行拨打测试。
故障原因为馈线头松动,需要求工程队对该方面施工质量进行把关。
6.传输类告警
6.1E1/T1信号丢失
可能原因:
传输故障。
处理步骤:
从DDF侧往NODEB侧做个环回。
查看E1T1状态。
如果显示物理环回则确认基站侧传输线及MPT板无问题。
如果显示传输故障请查看传输头是否正常、相关线序是否正确。
尝试更换E1T1线或MPT,定位故障位置。
从DDF侧往RNC做个环回测试。
查看传输状态是否正常。
如果传输显示故障请与网管核对、如果传输显示正常,请将该传输断开,RNC在查看传输状态。
如果传输显示故障说明传输没问题。
如果传输仍显示正常说明传输有故障。
请与网管核对。
从DDF侧往网管做环回测试。
如果传输显示故障请要求网管查看传输数据是否完整。
必要的时候可以要求网管重新做下数据或修改个端口。
基站侧E1T1端口是否正常。
6.2E1/T1告警指示
请参考6。
1
6.3E1/T1远端告警指示
请参考6。
1
6.4E1/T1帧失步
请参考6。
1
6.5E1/T1环回故障
可能原因:
传输被环回
处理步骤:
检查基站侧传输是否被环回。
修改多余的传输数据,避免没必要的告警。
如果基站侧无问题请网管配合查找传输。
请参考6。
1
6.6E1T1高误码率告警
可能原因:
E1T1存在误码
处理步骤:
查看出告警的传输误码率
RNC侧可以先做下传输软环,并做传输误码测试。
NODEB侧也可以做下传输软环,传输误码测试。
检查基站侧传输线及传输头子,排除硬件问题。
通过对比双方的测试结果定位故障位置。
处理定位后的故障
(处理完毕后请将软环解除)
6.7小结及案例
出现传输类的告警主要原因是由于传输问题引起的。
如果一个站点的所有传输都断链了那么将会导致该站点小区不可用。
所有信令不活。
如果部分传输断链将会影响基站的业务。
因此该类告警应该优先处理。
因此传输告警的主要原因有:
传输故障
各传输头接触不良导致传输闪断。
连接传输的板件故障如MPT、UTRP
传输误码。
处理该类告警主要将处理步骤分成两块:
从DDF架到RNC侧的传输是否正常
从DDF架到NODEB侧传输是否正常
详细处理步骤可以参考6。
1
案例一、远东村E1T1告警
RNC侧查看发现该站点所有E1T1均不可用。
从RNC侧与网管核对后发现E1T1正常。
问题应该在NODEB侧。
由于是2G共站。
因此借助2G监控发现无停电告警。
但是2G传输也都出现故障。
怀疑是传输问题。
上站查看光端机有告警,未收到光。
联系网管后发现一厂至远东村的光缆断了。
通知传输处理。
案例二、三桥北E1/T1信号丢失IMA链路远端接收不可用告警
上站发现该站点的第四条传输故障。
在DDF架往NODEB侧将该传输环回。
查询E1T1后发现该传输显示存在远端接收告警,怀疑本端传输问题。
检查2M头发现焊接不牢固、且已经脱落,经重新焊接,问题解决
7.信令类告警
7.1IMA链路信元定界失步故障
可能原因:
帧丢失
处理步骤:
查看告警对应的传输是否正常
查看数据是否有问题
查看IMA组状态是否正常。
如果正常联系RNC,从RNC侧查看状态是否正常。
是否未添加到组内?
复位IMA组。
重新做数据。
7.2IMA链路帧失步故障
可能原因:
帧丢失
处理步骤:
查看告警对应的传输是否正常
查看数据是否有问题
查看IMA组状态是否正常。
如果正常联系RNC,从RNC侧查看状态是否正常。
是否未添加到组内?
复位IMA组。
重新做数据。
7.3IMA链路延迟失步故障
可能原因:
帧丢失
处理步骤:
调整延迟
7.4IMA链路远端接收故障
可能原因:
远端结点传输错误
处理步骤:
查看告警对应的传输是否正常
查看IMA组状态。
主要是RNC侧
如果2端均显示远端故障。
本端正常的话可以复位IMA组。
等待一段时间。
7.5IMA链路接收故障
可能原因:
本端传输接收故障
处理步骤:
检查本端E1T1
检查本端数据