162汕尾RRC重建指标优化案例.docx
《162汕尾RRC重建指标优化案例.docx》由会员分享,可在线阅读,更多相关《162汕尾RRC重建指标优化案例.docx(22页珍藏版)》请在冰豆网上搜索。
162汕尾RRC重建指标优化案例
汕尾VOLTERRC重建指标优化案例
2019年8月
【摘要】
终端处于连接态(RRC_CONNECTED),即与基站建立连接,并且安全已经被激活,则终端通过发起RRC重建保持与基站的连接,避免终端重新发起接入过程,但重新发起连接建立的过程,对网络指标及用户感知有一定影响,尤其是对于VoLTE网络,重建会严重影响需要语音感知。
RRC重建是由终端发起,目前商用网络终端发起重建原因在信令里仅显示为重配置失败、切换失败、Other三种原因,详细是什么原因导致发生重建,在RRC重建请求消息里并没有更多信息。
所以需要从多条基站侧信令中分析RRC重建根本原因,但是日常定位重建问题原因的方法需要逐条信令查看,并与多条切换信令相对比,不仅繁琐,且分析准确性低。
本课题提出一种创新的RRC重建原因分析定位方法,通过批量导出信令,采用信令信元匹配的方式,快速定位RRC重建原因,并找出主要问题小区信息,如切换失败次数较多的小区、无线链路失败的源小区信息等,实现RRC重建问题的快速定位和分析。
主要指标:
RRC连接请求次数(不包括重发)
RRC重建请求次数
RRC连接重建比例
切换失败触发RRC重建请求的次数
重配置失败触发RRC重建请求的次数
OTHER类触发RRC重建请求的次数
非源小区RRC重建请求次数
【关键字】RRC重建率、RRC重建比例
【业务类别】优化方法、参数优化。
一、推广背景
1.1方案实施背景
由上表看出,TOP3的地市是东莞、茂名、珠海,汕尾的指标紧跟其后,对汕尾RRC重建比例优化。
时间
省份
地市
厂家
双工模式
4GMR覆盖率
5.25无线连接成功率(%)
5.36RRC连接重建比例(%)
2019-03-0100:
00:
00
广东
潮州
华为
FDD
91.80%
99.87%
2.99%
2019-03-0100:
00:
00
广东
东莞
华为
FDD
95.25%
99.71%
5.56%
2019-03-0100:
00:
00
广东
佛山
华为
FDD
95.61%
99.65%
2.89%
2019-03-0100:
00:
00
广东
广州
华为
FDD
94.35%
99.67%
3.11%
2019-03-0100:
00:
00
广东
惠州
华为
FDD
93.46%
99.74%
2.70%
2019-03-0100:
00:
00
广东
江门
华为
FDD
93.59%
99.86%
2.69%
2019-03-0100:
00:
00
广东
揭阳
华为
FDD
92.16%
99.64%
2.74%
2019-03-0100:
00:
00
广东
茂名
华为
FDD
90.26%
99.75%
3.95%
2019-03-0100:
00:
00
广东
梅州
华为
FDD
92.90%
99.83%
3.69%
2019-03-0100:
00:
00
广东
清远
华为
FDD
92.23%
99.75%
3.60%
2019-03-0100:
00:
00
广东
汕头
华为
FDD
91.66%
99.86%
2.11%
2019-03-0100:
00:
00
广东
汕尾
华为
FDD
91.39%
99.69%
3.73%
2019-03-0100:
00:
00
广东
深圳
华为
FDD
95.86%
99.73%
2.09%
2019-03-0100:
00:
00
广东
阳江
华为
FDD
91.43%
99.86%
1.71%
2019-03-0100:
00:
00
广东
湛江
华为
FDD
91.02%
99.62%
2.76%
2019-03-0100:
00:
00
广东
肇庆
华为
FDD
91.61%
99.81%
2.85%
2019-03-0100:
00:
00
广东
中山
华为
FDD
95.23%
99.71%
3.70%
2019-03-0100:
00:
00
广东
珠海
华为
FDD
95.75%
99.48%
4.80%
二、优化原理
1
2
2.1RRC重建影响
在LTE系统中,RRC连接重建过程在保持无线链路的可靠性和保证服务的连续性方面起到了重要作用,重建比例过高可能会影响切换、重传等网络指标,同时带来用户使用感知的下降。
下图为宁夏电信全网重建次数和下行用户体验速率关联关系,两者呈负相关关系。
如下图所示:
2.2分析思维导图
⏹切换类重建:
重点围绕切换失败原因排查,包括通过配置文件基本切换参数配置以及邻区配置,其次是通过覆盖排查是否存在弱覆盖或者干扰源。
⏹重配置类问题:
重点是在UU口信令对比触发重建的重配置信令和正常信令各个信源的差异,如果是TOP终端问题,则可反馈运营商进行TOP终端处理;如果是终端兼容性问题,则可进行版本特性排查或给出规避方法。
⏹Other类问题:
(a)基于基站侧分析,如果是重建到非源小区,思路同切换类重建。
排查配置文件是否未配置邻区或者切换参数配置不合理导致无法发起切换。
或者是存在PCI混淆问题。
其次通过UU口跟踪UEinformationResponse观察是否存在服务小区信号突变。
也可以观察是否由于下行问题造成UE未收到切换命令导致重建。
(b)基于基站侧分析,如果是重建到源小区,除了覆盖分析、邻区配置分析外,需要通过UU口跟踪排查是否存在弱覆盖,或者是存在针尖效应。
另外也可能是eNodeB已释放UE上下文,但是UE没有收到最后发起重建。
三、优化思路
汕尾2/3月份的RRC重建比例平均值为4.27%;下图为汕尾地市最近4个月的重建比例分布图:
3
3.1原因分类
协议上规定,引发UE发起重建流程的原因主要有以下几点:
重建发起原因
详细原因
标口原因值
切换失败
HandoverFailure
重配置失败
ReconfigFailure
无线链路失败
上行RLC重传达到最大次数
Other
随机接入失败
T310定时器重传到最大
底层校验失败
上层检测到底层通知的无线链路失败:
UE检测到当前检测到“radiolinkfailure”,则会发起原因值为“other”的中间,通常引起RLF存在如下三种机制:
Ø上行RLC重传达到最大次数
“indicationfromRLCthatthemaximumnumberofretransmissionshasbeenreached”,包括SRB和DRB,与eNB侧下行的SRB与DRB机制相同,当UERLC发送了一个PDU之后,需要等到eNB侧反馈对应的状态PDU才能完成一次RLC的正常调度。
对于没有收到eNB状态PDU的原因有两个,一个原因为eNB侧上行根本就没有收到任何RLCPDU,也就不会响应状态PDU,另一个原因为eNB响应的状态PDU,由于下行误码的原因,没有到达UE侧。
ØMAC层SRI重传达到最大次数
在切换过程中,切换完成命令丢失后导致的PUCCH没激活,或者,在业务保持过程中由于Ta超时导致的PUCCH没激活,此时如果UE有SR发送,因为下行链路问题,UE无法收到ENB的MAC层确认,SR重传达到最大次数后触发MAC_RA_IND,上报给L3后发起重建请求。
ØUE检测到下行RLF
UEDSP每200ms对时延谱滤波值进行判断,如果满足某门限,则上报L3失步;L3在同步状态连续收到N310次L1上报的失步指示,则认为失步;同时,启动T310定时器,超时前,若收到N311次同步指示,则认为UE恢复同步状态,否则,T310超时后触发重建(包括搜索小区、同步、重建),启动T311定时器,若超时仍未重建成功,则进去IDLE态。
切换失败,重建到原小区;
UE在切换流程中,在收到了切换的重配置消息之后,会启动T304,但如果在T304超时之前UE无法完成在目标小区的随机接入,则会发起原因值为“handoverfailure”的重建
系统内或IRAT的移动性过程失败,如切换时T304超时、目标小区建立RRC连接失败、UE不适配MobilityFromEUTRACommand的配置等
底层完整性检查失败
UE无法配置RRC重配消息中的部分配置,重配失败;
UE在安全模式激活的状态下,如果收到了重配置消息后对于重配置消息内的信元无法匹配/兼容,则发起原因值为“reconfigurationfailure”的重建。
3.2RRC重建初始化流程
当出现以下任一情况是,触发RRC重建初始化:
1)检测到无线链路失败;
2)切换失败;
3)E-UTRA侧移动性失败;
4)底层制式完整性校验失败;
5)RRC连接重配失败。
在RRC重建初始化阶段,UE会执行如下操作:
●停止定时器T310,如果正在运行;
●开始定时器T311;
●挂起除SRB0之外的所有RB;
●复位MAC;
●应用缺省的物理信道配置;
●应用缺省的半持久调度配置;
●应用缺省的MAC主配置;
●释放reportProximityConfig并情况所有邻近状态报告相关的定时器;
●进行小区选择;
当选择一个合适的E-UTRA小区后,意味着RRC重建初始化完成,此时,UE将执行如下
操作:
●停止定时器T311;
●开始定时器T301;
●采用SystemInformationBlockType2中包含的timeAlignmentTimerCommon。
●初始化RRCConnectionReestablishmentRequest消息的发送;
注:
该过程同样适用于如果UE返回源小区的情况
注:
在定时器T311运行过程中,UE选择了一个不同RAT的小区时,UE将离开
RRC_CONNECTED状态,同时‘RRC连接失败’。
3.3厂家间对比
对比中兴、华为RRC重建原因:
华为设备区重配置失败导致的RRC重建请求比例较高,远远高于中兴业务区。
3.4TOP站点分析
基于重建次数较多的TOP站点CHR统计,通过分析锁定重建次数和重建比例高的异常终端型号等分析,发现主要是存在FGI=7E0FF8DE、7E1FF8DA和FE0FF8DE的TOP终端。
基于该站点的信令分析,发现FGI=7F0FF8DE的TOP用户(CallId=537328396),在切换入目标站点后,由于测量重配消息中的MeasId达到32后,基站给UE重配CDMA2000的测量时,没有配置滤波信元‘quantityConfigCDMA2000’给UE,导致该终端出现了reconfigurationFailure原因的重建。
在该站点下,同时发现FGI=7F0FF8DE的TOP用户(CallId=537262072),在切换入目标站点后,由于测量重配消息中的MeasId未达到32,因此基站给UE重配CDMA2000的测量时,基站有配置滤波信元‘quantityConfigCDMA2000’给UE,该用户未发生重建。
由于广东现网已开启了全网的移动、联通频点测量,因此现网出现MeasId达到32的比例较高,导致大部分华为设备区域RRC重建比例均较高。
由于该问题仅华为设备区出现,基本判断为华为现网设备版本与部分不兼容导致了该问题。
3.5网络重建原因
从网管指标来看,非源小区RRC重建请求的占比在60%以上,切换失败触发的RRC重建请求在35%以上,主要是这两种问题引起的重建;
跟踪TOP10小区UU口信令,分析RRC重建请求信令中的失败原因,主要为“handoverFailure”与“otherFailure”;
3.6无线环境分析:
弱覆盖、快衰、干扰、质差等
MR覆盖率:
月份
1月份
2月份
3月份
4月份
MR覆盖率(天翼蓝鹰)
89.41%
89.95%
91.13%
92.11%
干扰噪声平均值及高干扰小区比例:
日期
LTE小区组
系统上行每PRB子载波平均干扰噪声(毫秒)
2019-01
汕尾全网小区-新
-116.992
2019-02
汕尾全网小区-新
-116.9225
2019-03
汕尾全网小区-新
-117.0309
2019-04
汕尾全网小区-新
-116.7783
细分频段失败情况:
频段
求和项:
RRC重建比例(分子)
求和项:
RRC重建比例(分母)
占比
100
2643263
316977442
0.83%
1800
716682
21472249
3.34%
1825
83341693
1974523290
4.22%
2452
40826505
318227878
12.83%
四、方案实施及效果
4
5
6
7
7.1故障排查
提取全网尚未恢复的故障告警信息,对LTE业务产生影响的故障告警主要有以下四类:
1)服务质量告警:
基站退出服务、LTE小区退出服务等。
2)通信链路类告警:
光口接收链路故障、S1断链告警、以太网物理连接断等。
3)设备故障告警:
E1/T1链路断、RX通道异常、单板通讯链路断、光模块不可用、光口接收链路恶化、天馈驻波比异常、同步丢失等。
4)处理错误类告警:
RRU链路断、PB链路断、SNTP对时失败等。
梳理全网故障告警情况,存在23基站尚未恢复的故障告警信息影响LTE业务性能。
督促代维加快故障告警处理进度,截止2019年6月底已完成21个基站故障告警处理,剩余2个站点属于业主纠纷,暂未无法处理。
故障告警
完成数量
完成进度
23
21
91.30%
7.2干扰排查
提取载波平均噪声干扰(分贝毫瓦)指标(所有RB上的噪声干扰平均值)评估小区的干扰情况。
当载波平均噪声干扰(分贝毫瓦)≥-100时存在较强干扰,影响小区的信道质量,导致CQI优良比指标较低。
提取全网各小区级载波平均噪声干扰(分贝毫瓦)指标,共存在4个高干扰小区需要排查处理。
截止2019年6月底已排查2处干扰源,多为私装信号放大器导致基站干扰,目前已协调拆除。
干扰数量
排查数量
完成进度
4
4
100%
7.3邻区优化
目前电信集团系统内邻区策略为全网开启ANR功能。
LTE的ANR功能,会使系统将UE发生的所有切换小区添加为邻区,这样就会存在大量的PCI冲突,PCI冲突会导致切换成功率低,影响CQI优良比指标及用户感知等。
ANR自添加功能
系统间(L-C)邻区需要人工维护,若在L网覆盖边缘区域未添加C网邻区,未及时切换至C网,会影响L网CQI优良比指标。
因此,需定期检查新开站ANR功能开关及配置参数,对ANR自删除参数进行优化维护好系统内邻区关系;针对MR弱覆盖、高掉线、低CQI优良比小区核查L-C邻区,对漏配邻区进行添加及互操作门限优化,提升CQI优良比指标。
两个小区的信号在其覆盖区有重叠的部分,正常情况下应该定义两者的邻区关系。
邻区漏配就是两个有交叉覆盖的小区之间没有做邻区关系,会导致服务小区在小区服务质量下降后无法及切换重选至更好质量小区,造成弱覆盖、掉线、CQI值较低等网络问题。
本次冗余邻区、错误频点初步主要从邻小区配置数目方面进行评估,经分析统计共计梳理出212条冗余邻区,错误频点3个已删除,2019年6月中旬已完成邻区添加工作。
错误邻区
完成数量
完成进度
212
212
100%
7.4切换优化
汕尾华为区域于8月1号凌晨针对RRC重建参数进行参数优化,减少切换失败导致的RRC重建。
修改前后对比同期7天均值RRC重建比下降0.27%,RRC重建成功率提升6.23%,其他指标均正常波动,参数详细内容:
优化措施
优化措施简介
切换用户超小区半径接入优化
超小区半径切换时,基站错检PreambleID并不回复RAR导致切换失败重建。
优化后,对错检的PreambleID基站能够回复RAR,从而减少切换失败的重建;
支持激活态RRC重建统计
无数传重建不影响用户感受,区分有无数传重建统计;
异常终端连续重建优化
建议打开,解决部分异常终端连续重建的兼容性问题。
eNB自动识别连续重建的异常终端在一定时间内重建次数达到保护门限,进行UE释放优化动作,减少该UE的重建次数,提升重建接入比指标。
切换时携带UE不活动定时器
建议打开,站内/站间切换过程,源eNB将UE在源eNB侧的ue-InactiveTime计数值传递到目标eNB,目标小区继承源小区用户的inactivetime定时器已经消耗的时间,更快的释放。
RRCConnectionRelease消息保护
建议打开,源小区无上下文重建主要是终端没有收到eNB下发的RRCConnectionRelease消息。
调整参数使RRCConnectionRelease下发次数增多,提高UE接收RRCConnectionRelease的可靠性,减少UE重建。
RRC连接释放定时器
建议打开,源小区无上下文重建主要是终端没有收到eNB下发的RRCConnectionRelease消息。
调整参数使RRCConnectionRelease下发次数增多,提高UE接收RRCConnectionRelease的可靠性,减少UE重建。
下行RBLER增加,下行ARQ重传率增加。
定时器 301
UE在发送RRCConnectionReestablishmentRequest时启动该定时器。
定时器超时前,如果UE收到RRCConnectionReestablishment或者RRCConnectionReestablishmentReject或者被选择小区变成不适合小区(适合小区定义参见3GPPTS36.331),则停止该定时器。
定时器超时后,UE进入RRC_IDLE态。
越大减少重建失败次数。
7.5越区覆盖及重叠覆盖
TA表征的是UE与天线端口之间的距离。
UE从网络侧接收TA命令,调整上行PUCCH/PUSCH/SRS的发射时间,目的是为了消除UE之间不同的传输时延,使得不同UE的上行信号到达eNodeB的时间对齐,保证上行正交性,降低小区内干扰。
在随机接入过程中,eNodeB测量到上行PRACH前导序列,在RAR(随机接入响应)的MACpayload中携带11bit信息,TA的范围在0~1282之间,根据RAR(随机接入响应)中TA值,UE调整上行发射时间Nta=TA*16,值恒为正。
当TA=1,那么Nta=1*16Ts,表征的距离为16*4.89m=78.12m。
根据TA指标定义,可根据TA分布情况评估小区用户的接入距离,评估小区是否覆盖合理。
本次采用以下条件综合对TA接入距离进行分析:
CQI优良比低于91.50%
TA大于40占比超过30%
平均接入距离超过2km
周CQI小于7上报总次数超过100W次
按照上述标准对现网小区进行评估,评估出覆盖异常,疑是越区覆盖的小区303个。
针对越区覆盖小区进行RS功率调整、远程电下倾调整、机械下倾调整,共计完成286个小区。
重叠覆盖区域定义:
在TD-LTE同频网络中,可将弱于服务小区信号强度6db以内且CRSRSRP大于-110dbm的重叠覆盖小区数超过3个(含服务小区)的区域。
重叠覆盖对网络的影响:
重叠覆盖小区个数每增加一个,会导致终端用户的SINR值下降1.4~3db,用户的下行吞吐量下降20%~40%。
除此之外,严重的重叠覆盖还会带来TD-LTE小区间PCI的模3干扰,这种干扰会对用户的切换性能造成一定影响,特别是在网络载荷较轻时更加明显。
重叠覆盖
完成情况
越区覆盖
完成情况
完成进度
13
11
26
24
78.11%
7.6MR覆盖优化
根据MR数据筛选出弱覆盖问题点。
共计输出处弱覆盖小区34个,针对弱覆盖导致的问题路段,首先要根据现场无线环境和当前覆盖情况,确立存在覆盖问题等路段的小区,并通过减小下倾角扩大覆盖范围、调整方向角优化主瓣方向、增加功率加强深度覆盖等手段优化。
MR弱覆盖
完成情况
完成进度
34
29
85.29%
TOPMR站点处理效果:
7.7RRC重建保护定时器
【原理说明】:
网络中部分终端存在终端兼容性问题,该场景下触发UE发起RRC重建流程,当RRC重建成功之后又触发相同的重建过程,从而引发了终端连续触发重建。
该功能通过eNB自动识别连续重建的异常终端在一定时间内重建次数达到保护门限,进行UE释放优化动作,减少该UE的重建次数,提升重建接入比指标。
MODGLOBALPROCSWITCH:
RRCREESTPROTECTTHD=20,ENHANCEDRRCREESTPROTECTTHD=20;
MODRRCCONNSTATETIMER:
REPTRRCREESTPROTECTTIMER=20;
7.8UEPollingPDU重传定时器
【原理说明】:
该定时器设置过小会触发过多的PollingPDU,且连续多次触发PDU重传使ARQ重传达到最大次数,从而导致RRC重建;设置过大会导致状态报告不能及时的反馈
MODRLCPDCPPARAGROUP:
RLCPDCPPARAGROUPID=5,RLCMODE=RlcMode_AM,UEPOLLRETRANSMITTIMER=Tpollretrans_m200;
【优化效果】:
选取Top20小区参数验证,对比修改前后指标,RRC重建比例改善0.89%,相对增益2.78%,如下图所示:
7.9错误带块修改
汕尾配置导致的重建占比高,已修改全网华为区域错误带宽,指标如下:
7.10系统内切换T304定时器
【原理说明】:
“系统内切换T304定时器”参数表示系统内切换时使用的定时器T304的时长。
如果UE在该时长内无法完成对应的切换过程,则进行相应的资源回退,并发起RRC连接重建过程。
对于T304ForEutran定时器,如果UE在该时长内无法完成对应的E-UTRAN内切换过程,则进行相应的资源回退,并发起RRC连接重建过程。
“系统内切换T304定时器”的定义可以看出,适当增大该定时器,可以增大系统内切换成功的概率,从而减少RRC连接重建的次数。
【MML命令】:
MODRRCCONNSTATETIMER:
T304FOREUTRAN=ms1000;
7.11控制信道功率
【参数验证】:
抬升信道下发和反馈的可靠性来降低切换和Other的重建
参数名称
现网值
修改值
PHICH无功控时相对于RS的功率偏置
0
30
UE专有搜索空间的DCI功率偏置
-30
0
同步信道功率
0
-600
MODCELLDLPCPHICH:
LOCALCELLID=0,PWROFFSET=30;
MODCELLDLPCPDCCH:
LOCALCELLID=0,DEDIDCIPWROFFSET=0;
MODCELLCHPWRCFG:
LOCALCELLI