5G优化最佳实践东莞三项八排法解决小区服务能力下降告警Word格式文档下载.docx
《5G优化最佳实践东莞三项八排法解决小区服务能力下降告警Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《5G优化最佳实践东莞三项八排法解决小区服务能力下降告警Word格式文档下载.docx(9页珍藏版)》请在冰豆网上搜索。
2.1.1告警解释
当基站射频资源或基带资源不能满足当前小区的配置规格或CA业务配置异常时,产生此告警。
例如:
当前小区的天线规格为4T4R,但是由于2个发射通道异常关闭,导致当前小区异常,为保证小区业务不受影响,小区的天线规格会降低到2T2R;
当前小区需要重建到另外一块基带板,目标基带板的基带资源不允许该小区按照原规格重建,则需要降低小区规格;
多模场景下由于共享资源受限(如频率、功率),导致部分天线资源分配失败,引起小区降规格,产生此告警;
多BBU互联场景下,不同BBU上的CaGroupCell配置不一致导致CA工作不正常,产生此告警。
2.1.2告警产生原因
当小区建立需要的射频资源或基带资源不能满足时,小区会尝试降低规格建立,比如从2T2R小区降低为1T2R小区,这时小区还是能正常建立,但是由于规格达不到配置要求,所以上报小区服务能下降告警来提示用户。
2.1.3告警恢复原理
小区服务能力下降告警需要以下两个条件都满足:
Ø
底层的射频、基带资源恢复,并满足小区配置的规格要求;
小区中没有上行同步用户;
说明:
第二个条件是为了提升用户的感受做的保护措施,因为在有上行同步用户的情况下恢复告警,小区需要自动重建,用户会掉网,用户感受会降低;
当小区中没有上行同步用户时,小区会自动重建,告警会自动恢复。
三、解决措施
“三项八排”法排查处理通道异常、基带降额和CA业务异常等问题,如下详细排查方法:
3
3.1通道异常原因分析
通道异常包括以下几个主要原因:
(1)硬件原因:
硬件故障,CPRI接口异常或硬件连接错误导致通道关闭;
(2)操作原因:
核实是否有操作,例如修改小区带宽/天线数/CPRI压缩方式,关闭RRU通道,修改RRUCHAIN的CPRI线速率等;
(3)驻波原因:
高驻波或驻波测试导致通道关闭;
(4)CPRI速率原因:
CPRI线速率不足或CPRIsharing场景背板带宽不足导致通道关闭;
(5)手动关闭通道;
3.1.1硬件排查
排查小区服务能力下降告警产生时间点前后是否存在以下根源告警,如果存在根源告警首先根据告警参考文档恢复根源告警。
26529射频单元驻波告警
26545射频单元发射通道手动关闭告警
26504射频单元CPRI接口异常告警
26532射频单元硬件故障告警
26524射频单元功放过流告警
26200单板硬件故障告警
26230BBUCPRI光模块故障告警
26232BBU光模块收发异常告警
26234BBUCPRI接口异常告警
26503射频单元光模块收发异常告警
3.1.2操作排查
此步骤主要通过基站侧的操作日志来排查,在操作日志中找到小区服务能力下降告警产生的时间点有没有人工操作,重点关注驻波比测试操作,修改小区带宽/天线数/CPRI压缩方式,关闭RRU通道,修改RRUCHAIN的CPRI线速率等。
启动驻波比测试会影响RRU通道的可用性,所以会导致小区服务能力下降,启动驻波比测试的命令:
STRVSWRTEST;
修改小区带宽/天线数/CPRI压缩方式会导致该小区需要的CPRI线速率变化,修改小区配置的命令:
MODCELL:
LocalCellId=X,UlBandWidth=X,DlBandWidth=X,CPRICompression=X,TxRxMode=X;
闭塞RRU通道会导致RRU通道不可用,关闭RRU通道命令:
MODTXBRANCH:
CN=X,SRN=X,SN=X,RXNO=X,TXSW=OFF;
修改RRUCHAIN的CPRI线速率会影响CPRI协商的线速率,如果设置过小会导致由于CPRI不满要求导致小区服务能力下降,修改RRUCHAIN的CPRI线速率命令:
MODRRUCHAIN:
RCN=X,CR=1.25;
3.1.3驻波原因排查
驻波过高会导致系统关闭发射通道,若存在射频单元驻波告警需根据告警排查指导排除高驻波问题。
启动驻波比测试时,RRU会依次上报通道不可用,当BBU收到一个通道不可用消息时即降额建1T小区。
这时如果有用户接入且不退网,即使后面RRU上报了通道可用消息给BBU小区也无法恢复为2T2R小区,必须等到小区无用户时才会恢复为2T2R。
如果存在驻波测试操作,且一直有业务则需要通过去激活激活小区恢复。
3.1.4CPRI速率原因排查
小区的建立需要占用一定的CPRI资源,比如2T2R20M小区要求的CPRI线速率为2.5Gbit/s,如果CPRI线速率不够会导致载波资源配置失败,小区就会尝试降低天线规格来适配,可以通过以下DSPCPRILBR命令查询当前CPRI的线速率:
当前链环首线速率(吉比特/秒)=2.5
当前链环首协商状态=协商完成
当前环尾线速率(吉比特/秒)=2.5
当前环尾协商状态=协商完成
如果查出来的CPRI线速率低于需要的线速率则需要确认光纤和光模块的速率规格,可以通过换光模块或光纤使CPRI速率达到要求。
3.1.5手动关闭通道排查
如3.1.2操作日志排查,闭塞RRU通道会导致RRU通道不可用。
关闭RRU通道命令:
若存在闭塞RRU通道操作可以用此命令解闭塞;
CN=X,SRN=X,SN=X,RXNO=X,TXSW=ON;
3.2基带降额原因分析
✧上行数据同步丢失排查:
基带降额原因为上行数据不同步,原因有RRU或基带板软失效、CPRI有误码。
常见原因如下:
1、CPRI链路问题导致基带检测到上行数据同步异常。
2、RRU异常导致,RRU发送的上行数据有问题,RRU常见的异常有RRU软失效和RRU内部异常。
3、组网和时钟互锁问题导致。
4、其他基带或者6601芯片问题,该类问题需要返回主控、基带和RRU的一键式日志研发分析。
3.3CA业务异常原因分析
✧不同BBU上的CAGroupCell配置不一致排查:
首先确认CA小区是否是跨BBUCA场景,通过DSPCAGROUPCELL查看配置状态是否正常。
如果状态不正常,需要通过命令LSTCAGROUPCELL查看两个BBU中的配置参数是否一致,如果不一致通过命令RMVCAGROUPCELL、ADDCAGROUPCELL修改配置,使两个BBU中的CAGROUPCELL配置一致。
✧CA建立失败排查:
CA建立失败首先排查两小区是否激活,某个小区存在未激活需排查告警及是否人工手动操作导致未激活;
其次排查基带板板型:
DSPBRDMFRINFO。
如果做跨板CA时,查询到的单板组合类型为C+D的组合,那么可能出现小区服务能力下降。
因为LBBPC板的CPU出口带宽不足,如果配置小区的带宽过大,那么由于CPU出口带宽不足,会导致CAGROUP的路由不能完全建立,产生告警为“CA业务异常”的小区服务能力下降告警。
四、典型案例
4
4.1通道异常处理案例
CPRI线速率不够导致的小区服务能力下降告警
虎门金海公馆1-2F、A-C电梯小区存在小区服务能力下降告警,小区服务能力下降告警中具体问题原因值为通道异常;
小区服务能力下降告警根据以下原因进行排查:
✧硬件排查:
检查该小区发生的小区服务能力下降告警前后时间点无相关硬件告警。
✧操作排查:
核查该小区的操作日志中在小区服务能力下降告警产生的时间点无人工操作记录。
✧驻波原因排查:
核查该小区无启动驻波比测试情况;
✧CPRI速率排查:
查询CPRI线速率协商成1.25G,不满足2T2R小区的要求,并核实该小区的配置为2T2R20M小区,需要2.5G的CPRI线速率;
✧手动关闭通道排查:
核查操作日志未发现存在RRU通道修改命令;
✧解决措施
现场更换光模块后,小区服务能力下降告警故障消除。
4.2基带降额处理案例
光纤误码导致小区服务能力下降告警
寮步万润广场二期办公楼4-5F和商场3F小区出现小区服务能力下降告警,具体原因是基带降额;
查询DSPCELL定位原因是1小区66、67号框RRU上行数据同步异常,下电复位RRU后不能解决问题。
DSP查询小区状态:
提取故障RRU的一键式日志分析,从66槽和67槽RRU日志中看出最近一直存在大量光路误码打印,从而推测是光路误码导致的上行数据同步异常,从而导致小区服务能力下降。
对于出现“上行数据同步异常”的小区工作状态,如果在光模块没有异常告警的情况下,优先考虑排查光纤链路。
最后通过更换光纤解决。
4.3CA业务异常处理案例
万江江南第一城_1小区出现小区服务能力下降告警,具体原因是CA业务异常,而万江江南第一城_1与万江江南第一城_4组成CAGROUP(20M+15M)。
✧小区状态核查:
DSPCELL核查万江江南第一城-4小区的状态为未建立,万江江南第一城-1小区的状态正常;
✧告警核查:
核实万江江南第一城-4小区存在射频单元维护链路异常告警,导致万江江南第一城-1出现小区服务能力下降告警,无法实现CA功能。
现场核实万江江南第一城-4小区停电导致,恢复供电后小区服务能力下降告警消除。
五、经验总结
“三项八排”法针对小区服务能力下降告警主要原因为小区降额问题导致的通道异常、基带降额、CA业务异常等故障形成的排查方法,本方法定位快速小区服务能力下降告警问题,符合日常排障逻辑,快速定位解决问题,可作为日常处理及排查进行经验推广。