4G优化案例剖析VoLTE掉话参数提升用户体验.docx
《4G优化案例剖析VoLTE掉话参数提升用户体验.docx》由会员分享,可在线阅读,更多相关《4G优化案例剖析VoLTE掉话参数提升用户体验.docx(29页珍藏版)》请在冰豆网上搜索。
4G优化案例剖析VoLTE掉话参数提升用户体验
剖析VoLTE掉话参数提升用户体验
XX
XX年XX月
剖析VoLTE掉话参数提升用户体验
XX
【摘要】VoLTE具有接续时延低、视听效果高清、频谱利用率高、容量大、业务灵活等特点,但随着用户持续上涨,网络问题也不断显现,用户感知劣化、投诉等问题严重影响了VoLTE的口碑,而相对其它网络问题,VoLTE掉话对用户感知影响更明显的影响。
本文就VoLTE的掉话机制,对不同掉话首拆网元及过程深入分析、针对性从VoLTE掉话机制相关的无线链路失败掉话定时器、切换掉话定时器、CCE容量配置参数、多目标RRC重建功能参数、专载延迟释放功能参数的研究,通过大量试验,进行参数归一化,提升用户感知,以支撑VoLTE业务的蓬勃发展与推广。
【关键字】VoLTE,掉话,参数研究
一、概述
当前正处于互联网迅猛发展的时代,在线视频、文件传输和交互服务的广泛使用,VoLTE业务的蓬勃发展不言而喻,截止目前,江苏电信VoLTE活跃用户430万左右,呼叫总流量达到1041.58GB,用户的不断增长,也导致了用户感知劣化、投诉等问题的严重化,为更好的保障VoLTE的商用推广,提升用户感知质量是优化工作的重要环节,而掉话是直接反应用户感知质量状态的重要指标,减少掉话成为VoLTE研究的重要课题;
研究从本质出发,以VoLTE语音业务中的掉话机制为基础,对终端、基站、EPC域、IMS域不同的掉话首拆网元和过程的细化分析,梳理相关掉话触发机制和条件,针对性的对在掉话触发机制、条件以及增强鲁棒性方面进行深入研究,通过试验对相关无线链路失败掉话定时器、切换掉话定时器、CCE容量配置参数、多目标RRC重建功能参数、专载延迟释放功能参数进行归一化推广,减少掉话几率,提升用户感知。
二、VoLTE掉话机制
VoLTE业务会经过多个网元,每个网元都有通话异常检测机制,当各网元检测到异常的时候,都有可能触发VoLTE掉话。
网元一旦检测到异常并触发VoLTE掉话后,掉话的信令会经过多个网元层层传递下去,以便其他网元去释放为VoLTE通话而预留的资源和相关配置,比如MME和eNB会释放已建立的承载资源。
VoLTE掉话分析的重点是找到第一拆线点,也就是首先检测到通话异常的网元。
1
2
2.1VoLTE掉话场景
2.1.1终端侧触发掉话
终端侧触发的Bye消息流程如下:
参考协议24.229,终端侧触发的Bye消息原因值如下,只有第一种是正常挂断,其它都是异常挂断。
Protocolvalue
Causevalue
Reason-text
RELEASE_CAUSE
1
Userendscall
RELEASE_CAUSE
2
RTP/RTCPtime-out
RELEASE_CAUSE
3
Mediabearerloss
RELEASE_CAUSE
4
SIPtimeout-noACK
RELEASE_CAUSE
5
SIPresponsetime-out
RELEASE_CAUSE
6
Call-setuptime-out
2.1.2基站侧触发掉话流程
基站触发的上下文释放或承载释放流程如下:
基站触发的承载释放流程
2.1.3EPC侧触发掉话流程
上文中的场景③和④都属于EPC侧掉话,包括MME和PCRF触发掉话的信令流程。
MME触发的上下文释放和承载释放流程如下:
MME触发的上下文释放流程
MME触发的承载释放流程
参考协议36.413,上下文释放与承载释放的原因值一共五大类:
RadioNetworkLayercause、TransportLayercause、NAScause、Protocolcause、Miscellaneouscause,每大类都有各自的小类。
常见的大类原因是RadioNetworkLayercause,其中常见的异常小类原因是:
FailureintheRadioInterfaceProcedure、RadioConnectionWithUELost、Radioresourcesnotavailable。
对于RadioConnectionWithUELost原因,一般为无线链路失败;FailureintheRadioInterfaceProcedure可能的原因是RRC配置失败或者切换失败;Radioresourcesnotavailable一般是无线资源不足,包括PRB资源与CCE资源都有可能。
PCRF触发的ASR(AbortSessionRequest)消息流程如下:
参考协议29.214,PCRF触发的ASR(AbortSessionRequest)消息原因值主要是下面4种,其中原因值0和3是正常释放,原因值1和2都是异常释放,异常释放的常见原因是资源不足和承载资源不足。
Abort-Cause
Meaning
BEARER_RELEASED(0)
Thisvalueisusedwhenthebearerhasbeendeactivatedasaresultfromnormalsignallinghandling
INSUFFICIENT_SERVER_RESOURCES
(1)
Thisvalueisusedtoindicatethattheserverisoverloadedandneedstoabortthesession.
INSUFFICIENT_BEARER_RESOURCES
(2)
Thisvalueisusedwhenthebearerhasbeendeactivatedduetoinsufficientbearerresourcesatatransportgateway(e.g.GGSNforGPRS).
PS_TO_CS_HANDOVER(3)
ThisvalueisusedwhenthebearerhasbeendeactivatedduetoPStoCShandover.
2.1.4IMS域触发掉话流程
IMS域网元P-SBC和S-CSCF间发送的Bye消息流程(包含异常原因值)触发掉话的流程如下:
P-SBC发送的Bye消息流程
S-CSCF发送的Bye消息流程
参见协议24.229,P-SBC或者S-CSCF发送的Bye消息常见的异常值是503(ServiceUnavailable)和488(NotAcceptableHere),一般情况下无线资源不足或者承载资源都产生的是503的原因值。
2.2无线侧掉话
终端或基站原因导致基站异常释放VoLTE业务UE的上下文或承载,都称为无线侧掉话,对应上文中的场景①和②。
2.2.1承载异常释放
承载异常释放导致掉话包括QCI1和QCI5的异常释放。
触发QC1异常释放的事件主要有:
“GTP-U错误指示”、“E-RAB抢占”、“GBR拥塞触发的承载释放”,QCI5的异常释放的事件主要有“RLC重传次数达到最大”等。
2.2.2上下文异常释放
基站内部对多种无线链路进行监控,比如:
PUSCH无线链路检测、CQI无线链路检测、HARQ无线链路检测、TA失步以及RLC达到最大重传次数,对于PUSCH无线链路检测、CQI无线链路检测以及HARQ无线链路检测前面三种。
当基站检测到无线链路失败后启动无线链路失败定时器,如果在定时器超时后无线链路没有恢复就会产生掉话。
对于TA失步以及RLC达到最大重传次数这两种情况,基站会发起小区内切换,如果切换失败,就会产生掉话。
基站无线链路检测机制及触发掉话流程示意如下:
满足掉话触发条件后,基站发起UE的上下文释放以及RRC释放,释放的原因值是“RNLCauseRadioConnectionwithUELost”。
导致无线链路失败的常见原因是信号差或者干扰严重。
无线链路释放流程:
2.2.3无线侧相关定时器和常量
2.2.4无线侧相关参数
无线侧和VoLTE掉话相关的主要参数如下:
厂家
参数英文名
参数中文名
功能描述
诺基亚
gtpuPathSupint
GTPECHOREQUESTs发送的间隔
用来检测GPS隧道的状态,间隔的发送GTPECHOREQUESTs
诺基亚
gtpuT3Resp
GTPECHOREQUESTs的等待时长
GTPECHOREQUESTs的等待时长,如果超时等待时间没有收到反馈,则认为该GTP隧道终端,触发承载的释放
诺基亚
maxNrSymPdcch
PDCCH信道最大符号数
定义PDCCH信道最大符号数配置
诺基亚
actLdPdcch
PDCCH信道占用符号数自适应开关
PDCCH占用符号数会根据CCE负荷在最小符号数和maxNrSymPdcch之间自适应,尽量降低控制信道开销。
诺基亚
maxRetxThresh
RLC最大重传次数
DRBRLC重传最大次数,超过最大次数,UE侧触发重建,基站侧触发切换
诺基亚
maxRetxThreshSrbDL
下行SRBRLC最大重传次数
下行SRBRLC重传最大次数,超过最大次数,基站侧触发小区内切换
诺基亚
maxRetxThreshSrbUL
上行SRBRLC最大重传次数
上行SRBRLC重传最大次数,超过最大次数,UE侧触发重建
诺基亚
nCqiDtx
CQIDTX检测次数
如果没有检测到的CQI超过该次数,则触发无线链路
诺基亚
nCqiRec
CQIDTX恢复次数
如果没有检测到的CQI超过该次数,则链路恢复
诺基亚
taTimerMargin
周期性TA发送的间隔
如果达到了TA发送的间隔,则基站给终端发送TA命令
诺基亚
taTimer
Ta超时时长
如果在TA超时后,终端还没有收到TA命令,那么终端就进入失败状态
诺基亚
taMaxOffset
TA允许的最大偏移
如果基站检测到终端的TA超过这个最大的偏移,则立马发送TA命令给终端
诺基亚
tHalfRrcCon
RRC建立保持时长
等待RRC建立完成的时长,超时后释放UE上下文
2.3EPC侧掉话
上文中的场景③和④都属于EPC侧掉话。
如果因专用承载丢失、去激活承载消息未收到、EPC下发DetachRequest,需要跟踪MME、S/PGW、PCRF各网元的信令,查找EPC参数及设备问题原因。
如果SIP消息异常,如BYE/200OK未收到或流程异常,则需要在eNB、EPC、IMS上同步抓取信令和数据包,检查消息在哪些网元之间出现异常,并针对相关网元进行问题排查。
2.4IMS域掉话
IMS域掉话通常有以下两种原因:
•RTP检测定时器超时;当IMS域的SBC设备(P-CSCF)检测到通话中无媒体流的时间大于媒体流中断定时器,向终端和核心网设备发送BYE消息,产生掉话。
现网配置为双向检测,时长60S,即主叫和被叫在60s内均没有向SBC发送没有任何RTP包,SBC设备会向终端和核心网设备发送BYE消息,释放媒体会话资源,产生掉话。
•IMS注册失败;通话过程中,终端重新进行IMS域的注册,如果IMS域回复P-CSCF拒绝了用户的注册信息导致被叫未注册成功,将导致掉话。
2.5VoLTE掉话指标定义
2.5.1网管指标
VoLTE掉线率公式如下:
E-RAB掉线率(QCI1)=E-RAB异常释放次数(QCI1)/(QCI