VOLTE语音质量提升方案.docx
《VOLTE语音质量提升方案.docx》由会员分享,可在线阅读,更多相关《VOLTE语音质量提升方案.docx(34页珍藏版)》请在冰豆网上搜索。
VOLTE语音质量提升方案
VoLTE语音质量提升方案
2016年11月
1VoLTE网络结构
VoLTE即VoiceoverLTE,是基于LTE网络数据域的语音业务方案。
该方案基于IMS,提供全IP通话。
LTE网络是一种全IP网络,全部业务承载于数据域上,可实现数据与语音业务在同一网络下的统一。
对运营商而言,部署VoLTE将带来两方面的价值,一是提升无线频谱利用率、降低网络成本;二是提升用户体验。
VoLTE的体验明显优于传统电路域语音。
首先,高清语音和视频编解码的引入显著提高了通信质量;其次,VoLTE的呼叫接续时长大幅缩短,测试表明VoLTE比CS呼叫缩短一半以上,VoLTE网络架构如图1所示:
VoLTE业务涉及网元较多,包括现网CS域、EPS域、IMS域,以及PCC等。
IMS域主要完成呼叫控制等功能,它通过和EPS网络配合,提供和电路域类似的语音业务及其补充业务,包括号码显示、呼叫转移、呼叫等待、会议电话等。
EPC配合IMS系统完成P-CSCF发现、初始附着的信令默认承载建立、语音及视频等业务专有承载的建立等。
PCC主要联合P-CSCF(AF功能点)以及GGSN/PGW(PCEF功能点)完成策略控制决策和基于流进行计费控制的功能。
CS域通过MSC升级支持SRVCC功能。
MSC与MME之间的Sv接口实现VoLTE语音业务的连续性,满足当用户在通话过程中移出LTE覆盖区时保证业务的连续性,使通话平滑切换到2G/3G网络的基本需求。
2问题定界
VoLTE语音质量定界方案中,定界对部署方案的要求至少要保证S1-U、Mw或Gm接口至少有一个接口具有VoLTE语音呼叫媒体面测量能力。
对于VoLTE与VoLTE互通场景、VoLTE与2/3G、PSTN互通场景,探针采集节点和语音质量指标所表示的测量范围如下图所示:
对于VoLTE与VoLTE互通场景,端到端的MOS和端到端的单通是根据RTCP消息统计的,RTCP消息也是UE<->UE的E2E透传,在话音流的探针采集节点都可以完成RTCP消息的获取。
分段的IPMOS和分段的单通是根据RTP消息统计的,表示的范围为UE到RTP消息的采集节点。
对于VoLTE与2/3G、CSFB或者PSTN互通场景,端到端的MOS和端到端的单通是根据RTCP消息统计的,具有发送RTCP的报文的网元包括VoLTE侧的UE和CS域的MGW,端到端范围实际为VoLTE的UE到CS域的MGW。
分段的IPMOS和分段的单通是根据RTP消息统计的,表示的范围为UE或者CS域的MGW到RTP消息的采集节点。
对于VoLTE与VOBB互通场景,与2/3G互通场景类似。
具有发送RTCP报文的网元为VoBB侧的SBC。
端到端测量指标表示的范围为UE到VoBB侧的SBC,分段测量指标表示范围为UE或者VOBB侧的SBC到RTP消息的采集节点。
VoLTE语音呼叫关键测量点,以S1-U接口为例:
测量点1,呼叫的承载建立,用户面开始周期测量,包括周期内的RTP包数、抖动、时延和编解码信息进行测量、MOS、单通,记录开始时间
测量点2,呼叫应答,此时对振铃阶段的用户面的测量进行重置,重新开始测量周期测量,包括周期内的RTP包数、抖动、时延和编解码信息进行测量、MOS、单通。
记录语音流的开始时间
测量点3,呼叫的承载释放,用户面停止测量,记录结束时间
呼叫结束后,对周期测量的MOS、单通记录做汇聚,填写呼叫单据CDR里,并且对整条语音流的RTP包数填写到呼叫单据CDR里
接口类型
问题描述
问题引入范围
重点排查对象
其次排查对象
S1-U
上行RTP丢包
终端到SGW
无线传输、基站处理问题
下行RTP丢包
对端到SGW
对端无线传输、对端基站处理问题
EPC到IMS传输问题
下行RTCP丢包、下行RTP无丢包
SGW到对端
无线传输、基站处理问题
上行RTCP丢包、上行RTP无丢包
对端到SGW
对端无线传输、对端基站处理问题
EPC到IMS传输问题
Gm
上行RTP丢包
终端到SBC
无线传输、基站处理问题
SGW/PGW到SBC的传输
下行RTP丢包
对端到SBC
对端无线传输、对端基站处理问题
EPC到IMS传输问题
下行RTCP丢包、下行RTP无丢包
SBC到终端
无线传输、基站处理问题
SGW/PGW到SBC的传输
上行RTCP丢包、上行RTP无丢包
对端到SBC
对端无线传输、对端基站处理问题
EPC到IMS传输问题
Mw
上行RTP丢包
终端到SBC/IM-MGW
无线传输、基站处理问题
SGW/PGW到SBC的传输
下行RTP丢包
对端到SBC
无线传输、基站处理问题
EPC到IMS传输问题
下行RTCP丢包、下行RTP无丢包
SBC到终端
无线传输、基站处理问题
IMS到EPC传输问题
上行RTCP丢包、上行RTP无丢包
SBC到对端终端
对端无线传输、对端基站处理问题
SBC到IM-MGW或者SBC到SGW/PGW传输问题
3影响语音质量主要因素
根据语音包端到端传输过程,丢包分为1)eNB以上核心网、传输丢包;2)eNB以下上行/下行空口丢包;3)终端异常上行发包不连续
1)eNB以上核心网、传输丢包
此类丢包eNB侧无法侦测到,eNB可以识别发给它的包SN是否连续,但无法识别是因为核心网、传输丢包导致,还是因为对端终端上行空口丢包导致。
对于部署了SEQ平台的局点,可以分析SEQ的探针数据来确认可能发生核心网、传输丢包的问题。
2)eNB以下上行/下行空口丢包
此类丢包通过eNB的话统指标、cellDT等日志可以确认,本文主要针对空口类型的丢包描述分析指导,以及优化提升方法。
3)终端异常上行发包不连续
此类丢包无法监控,需要通过cellDT跟踪、终端日志具体分析。
影响语音质量的主要因素有语音编码、丢包率、端到端时延、抖动等因素:
1)语音编码:
考虑到当前语音编码固定为23.85K,只有eSRVCC切换到GSM后因为采用EFR/NB-AMR导致MOS低分。
2)其次空口质量和小区重载等因素会引起丢包、时延和抖动现象耦合,所以分析MOS低于3.0分的原因时,优先看丢包因素,如果一个MOS样本内丢包、时延和抖动指标都很差,那么优先归类到丢包因素内。
如果丢包指标很好(低于1%),而时延指标较差(大于200ms),那么优先归类到时延因素。
类别
原因
说明
丢包
空口持续下行质差
包括下行弱覆盖,下行干扰,漏配邻区不切换,导致连续丢包
上行干扰
上行干扰电平大于-113dBm,导致eNodeB无法正常解码PUSCH或者DTX比例较高,导致连续丢包
上行接入受限
PL大于125,在上行底噪较好的情况下,也容易出现上行接受容易受限,现象是MOS样本发端的ULMACBLER较高。
尤其是CRS功率设置大于9.2dBm
下行失步重建
UE从RRC连接态突然进入空闲态,并且无法RRC重建,导致连续丢包
小区重载
小区内RRC和激活用户数较多,导致QCI1无法及时调度,导致连续丢包
频繁切换
导致RTP短时间内连续丢包
时延
传输时延
传输引入时延大于80ms,导致端到端时延大于200ms,通过Ping包测试检测传输时延
4语音质量优化思路
影响语音质量的因素主要有语音编码、抖动、端到端时延、丢包率、设备问题(设备或IMS),针对上述五个元素,细分出弱覆盖、下行质差、邻区及频繁切换、上行干扰、RRC重建、小区重载、上行接入受限等七个方面进行优化:
MOS排查流程图:
4.1语音编码
4.1.1语音编码介绍
语音编码就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输,语音编码的基本方法可分为波形编码、参量编码(音源编码)和混合编码,波形编码是将时域的模拟话音的波形信号经过取样、量化、编码而形成的数字话音信号,参量编码是基于人类语言的发音机理,找出表征语音的特征参量,对特征参量进行编码,混合编译码是结合波形编译码和参量编译码之间的优点。
4.1.2语音编码优化方法
以ASCOM工具为例,应用POLQASWB评估方法,采用某语音样本和AMR-WB23.85kbps语音编码,MOS值最好为4.5;采用同样的语音样本和AMR-NB12.2kbps语音编码,MOS值最好为3.1。
依照移动VoLTE性能参数的推荐设置,配置都为AMR-WB23.85kbps,如果一直占用LTE网络的话不存在语音编码为AMR-NB导致的MOS低问题。
当发生eSRVCC切换后占用GSM语音编码就会变为AMR-NB12.2kbps,GSMMOS值相比较VoLTEMOS值较差,重点解决eSRVCC。
为了尽量减少eSRVCC切换次数,要确保4G网络存在连续覆盖:
◆核查4G有无漏配邻区,邻区配置是否不一致,切换参数是否正常。
◆针对弱覆盖进行RF优化、功率调整、站点整改或新建站。
◆核查eSRVCC切换门限是否合理。
空闲态或者连接态重选到2G,需要核查是否存在弱覆盖及互操作参数是否合理。
4.2RTP丢包
4.2.1RTP丢包介绍
数据在通信网络上是以数据包为单位传输的,每个数据包中有表示数据信息和提供数据路由的帧。
这就是说,不管网络情况有多好,数据都不是以线性(就像打电话一样)连续传输的,中间总是有空洞的。
数据包的传输,不可能百分之百的能够完成,因为物理线路故障、设备故障、病毒攻击、路由信息错误等原因,总会有一定的损失。
碰到这种情况,网络会自动的让通信的两端根据协议来补包。
如果线路情况好,速度快,包的损失会非常小,补包的工作也相对较易完成,因此可以近似的将数据看作是无损传输。
但是,如果线路较差(如用调制解调器),数据的损失量就会非常大,补包工作也不可能百分之百完成。
在这种情况下,数据的传输就会出现空洞,造成丢包。
丢包主要分为空口丢包、传输丢包、EPC丢包。
4.2.2RTP丢包优化方法
空口丢包主要原因有:
下行质差、频繁切换、上行干扰、RRC重建、小区重载、上行接入受限。
其中现网常见原因主要有下行质差、频繁切换、上行干扰、RRC重建。
1
2
3
3.1
3.2
3.2.1
3.2.2
4.2.2.1弱覆盖
弱覆盖严重影响VoLTE端到端感知,造成弱覆盖原因主要有站点较少、邻区问题、参数问题、越区覆盖。
结合实际测试情况及工参进行RF调整、参数调整、邻区核查、新建站。
当前VoLTE主要受限于深度覆盖,以D+F宏站为骨干网,灵活精准利用微站、小站构建底层网,另外还有室内分布分场景全面立体提升深度覆盖。
对于周围无可用的LTE小区覆盖边缘,或者例如电梯、车库、高铁等快衰落特殊场景,修改合理的eSRVCC门限使尽快切换到G网,防止出现掉话。
4.2.2.2下行质差
下行质差的原因主要有弱覆盖、重叠覆盖、模三干扰、重选、切换参数设置不合理。
◆重叠覆盖
重叠覆盖主要方案为经过RF优化调整使其有主覆盖小区。
◆模三干扰
对于模三干扰主要通过RF优化或者PCI参数调整解决。
◆越区覆盖
进行RF优化或功率参数调整控制覆盖,并完善邻区。
◆参数配置
核查重选、切换参数是否合理。
◆故障告警
核查基站是否存在告警,处理故障告警。
4.2.2.3下行质差
正常情况下,某个小区周边都存在邻区,如果无线环境不是很差,都可以通过切换的方式改变服务小区。
当某个站点缺失邻区、邻区添加不合理或者邻区外部定义错误,会导致无法切换出而掉话。
需要结合工参及站点图层核查邻区配置是否合理。
4.2.2.4上行干扰
上行干扰定义为干扰信号在移动网络上行频段,移动基站受外界射频干扰源或内部频率规划不合理产生的同邻频等干扰。
上行干扰的后果是造成基站覆盖率的降低,影响VoLTE的接通率、掉话率、切换成功率,严重影响用户感知。
目前中移动LTE网络使用F、D、E频段,各频段常见干扰情况不同,主要有以下几种干扰类型:
TD-LTE频段
干扰类型
F频段
(1880~1920MHz)
1GSM900/GSM1800系统和PHS系统带来的阻塞干扰
2GSM900系统带来的二阶互调、谐波干扰
3GSM1800系统带来的杂散干扰
4PHS系统和其他电子设备带来的外部干扰
D频段
(2570~2620MHz)
1GSM900/GSM1800系统带来的阻塞干扰
2800MTetra系统和CDMA800MHz系统带来的三阶互调干扰
3其他电子设备带来的外部干扰
E频段(2320~2370MHz)
1GSM900/GSM1800系统带来的阻塞干扰
2WLANAP带来的杂散和阻塞干扰
3其他电子设备带来的外部干扰
通过干扰排查流程排查出干扰原因,通过RF优化增加隔离度,检查天馈工艺问题、排查外部干扰源、更换24G合路天线、更换频段、增加滤波器等解决。
4.2.2.5RRC重建
当处于RRC连接状态时,如果出现切换失败、无线链路失败、完整性保护失败、RRC重配置失败等情况,将会触发RRC连接重建过程。
该过程旨在重建RRC连接,包括SRB1操作的恢复,以及安全的重新激活。
处于RRC_CONNECTED状态的UE,安全已被激活,可发起该过程继续RRC连接。
仅当相关小区是具有UE上下文的小区时,连接重建才会成功。
假使E-UTRAN认可重建,SRB1的操作会恢复,而其它RB将继续保持挂起。
如果AS安全没有被激活,UE不会发起该过程,而直接转到RRC_IDLE状态。
RRC重建导致的短时吞字,对VoLTE用户感知较大,测试上主要体现在MOS差点。
RRC重建立比例=RRC重建立请求次数/(RRC重建立请求次数+RRC连接建立请求次数)
从计算公式来看,如果要降低RRC重建立比例,最好的方法就是要降低RRC重建立请求次数。
通常情况下,触发RRC重建立的原因有以下几种情况:
1)UE检测到无线链路失败;这种失败一般又分为两种情况,一种情况是RLC达到最大重传次数,另一种情况是上/下行失步,随机接入失败。
2)切换失败,包括系统内和系统外的切换;该类失败是指如果网络侧发送给UE的RRC连接重配置消息中包含MobilityControlInfo,则执行切换。
若切换失败,UE会发起RRC重建立请求,并在重建立原因封装时携带HOfailure。
3)E-UTRA侧移动性失败;
4)底层制式完整性校验失败;该类失败不常见,多为终端问题。
原因是由于信令的完整性保护失败发生RRC重建立,例如:
UE和基站的机密算法或者完整性保护算法不一致。
5)RRC连接重配失败。
在LTE网络中优化RRC重建比例时,SINR极差点是导致RRC重建的主要原因,VoLTE优化的视角要从SINR平均值转向关注SINR极差点。
主要需要注意三个方面:
一方面是覆盖,一定要控制好覆盖,避免越区现象的发生。
另一方面是邻区,避免漏配或者错配邻区;最后需要注意的是PCI的使用,尽量避免PCI复用距离不足导致混淆或者冲突的发生;做好以上三个方面,对避免RRC重建立的发生具有举足轻重的作用。
4.2.2.6小区重载
小区内RRC和激活用户数较多或基站负载较多,CPU占有率较高或者高优先级业务的PRB占用率较高,导致部分用户的语音包无法及时调度,导致连续丢包,通过RF优化、扩容、驻留切换参数设置、负载均衡开通来进行话务分担。
且较多用户场景下需要开启时延调度等功能。
4.2.2.7上行接入受限
PL大于125,在上行底噪较好的情况下,也容易出现上行接受容易受限,现象是MOS样本发端的ULMACBLER较高。
尤其是CRS功率设置大于9.2dBm。
解决方案是功率合理设置,对于上行弱覆盖,可以调整上行功控PassLossCoeff、PONominalPusch参数。
4.3E2E时延
端到端时延(end-to-enddelay)是指IP数据包从离开源点时算起一直到抵达终点时一共经历了多长时间的时延。
1)终端的语音编解码时延:
指的是终端从话筒采集语音到编码成AMR-NB或者AMR-WB等码流;或者从AMR-NB或者AMR-WB码流解码成语音并从听筒播放的处理时延。
2)空口的传输时延:
eNodeB的调度等待时延、空口误包重传以及分段均会影响空口的传输时延。
3)EPC处理时延:
包括对语音包的转发时延,以及可能存在的语音编解码转换时延(比如LTE终端拨打固定电话,两边终端的语音编解码方式不同,需要经过核心网媒体网关的编解码转换)。
传输网传输时延:
语音IP报文在传输网设备和链路上的传输时延。
优化方法是提高X2切换占比,二是进行端到端跟踪。
4.4抖动
抖动:
顺序传递的相邻两个帧的转发时延之差的绝对值,恒为正值。
下图为抖动对MOS值影响的柱状图。
一般分为空口抖动和传输抖动:
空口抖动容易出现在大话务场景下,因为调度因素出现空口抖动,还包括空口质量问题导致MAC重传引入的抖动。
传输网络丢包或者抖动,会造成端到端抖动增加。
出现抖动等状况时,可以采取Wireshark抓包来分析事件。
4.5设备问题
其他原因主要有测试设备问题和IMS问题。
VOLTE测试设备新增MOS盒和HUB,连线较多测试设备不稳定,建议更换设备后对比测试是否设备问题,日常测试中发现MOS盒、测试手机、终端均可存在问题。
5语音质量相关KPI分析
KPI体现的是一个宏观的现象,因此KPI类语音质量问题的分析思路是选取TOP小区或典型小区,对语音业务关键指标、影响语音指标的关联KPI进行分析,确认是否是由于小区负荷、容量、干扰或RBLER等因素导致语音质量问题
5.1语音关键KPI分析
5.1.1语音业务的上下行丢包率
影响语音质量最直接因素是丢包,如果丢包率超过一定值或者存在连续丢包就会影响语音质量,对于语音质量问题可以根据如下话统日志进行确认:
指标名称
指标描述
L.Traffic.UL.PktLoss.Loss.QCI.1
小区QCI为1的DRB业务PDCPSDU上行丢弃的总包数
L.Traffic.UL.PktLoss.Tot.QCI.1
小区QCI为1的DRB业务上行期望收到的总包数
L.Traffic.DL.PktUuLoss.Loss.QCI.1
小区QCI为1的DRB业务PDCPSDU下行空口丢弃的总包数
L.Traffic.DL.PktUuLoss.Tot.QCI.1
小区QCI为1的DRB业务PDCPSDU下行空口发送的总包数
L.PDCP.Tx.Disc.Trf.SDU.QCI.1
小区QCI为1的业务PDCP层下行丢弃的业务SDU数
ØQCI1业务上行空口丢包率=[小区QCI为1的DRB业务PDCPSDU上行丢弃的总包数]/[小区QCI为1的DRB业务PDCPSDU上行期望收到的总包数]
ØQCI1业务下行空口丢包率=[小区QCI为1的DRB业务PDCPSDU下行空口丢弃的总包数]/([小区QCI为1的DRB业务PDCPSDU下行空口发送的总包数]-[QCI为1的业务PDCP层下行丢弃的业务SDU数])
上行丢包在eNodeBPDCP层根据语音包的PDCPSN号统计。
举例:
基站收到第一包数据的SN号是1,下一包数据期望收到的SN号是2,但实际收到的数据的SN号是3,此时认为数据包SN号为2的丢弃。
因为上行是对最终接收到的结果进行统计,所以各种原因(PDCP超时丢弃类、重传达最大次数类)导致的丢包都包含在里面。
下行由于在终端侧进行接收,eNodeB无法统计到最终的丢包结果,只能根据处理过程进行统计。
下行丢包分两部分统计,两部分是独立的,第一部分是空口丢包,如果HARQ超过最大重传次数仍然发送失败,则统计为空口丢包;第二部分是eNodeB的PDCP缓存超时丢包,即在空口下发之前,由于PDCP丢弃定时器超时等原因导致的eNodeB内部丢包。
5.1.2语音业务建立成功率
通过如下性能指标可以监控VoLTE业务的承载建立成功率:
指标名称
指标描述
L.E-RAB.AttEst.QCI.1
小区发起建立QCI为1的E-RAB的尝试次数
L.E-RAB.AttEst.QCI.5
小区发起建立QCI为5的E-RAB的尝试次数
L.E-RAB.SuccEst.QCI.1
小区发起建立QCI为1的E-RAB的成功次数
L.E-RAB.SuccEst.QCI.5
小区发起建立QCI为5的E-RAB的成功次数
QCI1承载建立成功率=L.E-RAB.SuccEst.QCI.1/L.E-RAB.AttEst.QCI.1
QCI5承载建立成功率=L.E-RAB.SuccEst.QCI.5/L.E-RAB.AttEst.QCI.5
5.1.3语音业务掉话率
通过如下性能指标可以监控VoLTE业务的掉话率:
指标名称
指标描述
L.E-RAB.Rel.S1Reset.eNodeB.QCI.1
eNodeB发起的S1RESET导致的QCI为1的E-RAB异常释放次数
L.E-RAB.AbnormRel.eNBTot.QCI.1
eNodeB触发的QCI为1的业务E-RAB异常释放次数
L.E-RAB.AbnormRel.HOOut.QCI.1
切换出QCI为1的E-RAB异常释放次数
L.E-RAB.SuccEst.QCI.1
QCI为1的业务E-RAB建立成功次数
L.E-RAB.Left.QCI.1
QCI为1的遗留E-RAB个数
L.E-RAB.SuccEst.HOIn.QCI.1
QCI为1的切换入E-RAB成功建立次数
("L.E-RAB.Rel.S1Reset.eNodeB.QCI.1"+"L.E-RAB.AbnormRel.eNBTot.QCI.1"+"L.E-RAB.AbnormRel.HOOut.QCI.1")/("L.E-RAB.SuccEst.QCI.1"+"L.E-RAB.Left.QCI.1"+"L.E-RAB.SuccEst.HOIn.QCI.1")*100
5.1.4呼叫平均保持时长
通过该指标可以显示小区的VoLTE话务模型
指标名称
指标描述
L.E-RAB.SessionTime.QCI1
小区QCI为1的业务有数据传输总时长
L.Traffic.DRB.QCI.1
小区QCI为1的DRB的个数
小区内的平均通话时长时间=L.E-RAB.SessionTime.QCI1/L.Traffic.DRB.QCI.1
5.1.5下行语音包处理时延
通过如下性能指标可以监控VoIP业务下行包处理平均时延,时延指标是影响语音质量的重要因素,时延指标是影响语音质量的重要因素,时延越大包延时大影响感知:
指标名称
指标描述
L.Traffic.DL.PktDelay.Time.QCI.1
小区QCI为1的业务下行数据包处理总时延
L.Traffic.DL.PktDelay.Num.QCI.1
小区QCI为1的业务下行成功发送的PDCPSDU的包数
QCI1业务下行包处理平均时延=L.Traffic.DL.PktDelay.Time.QCI.1/L.Traffic.DL.PktDelay.Num.QCI.1,当语音业务打开DRX时下行平均时延会增加。
上行由于是终端发送所以无法统计。
5.1.6VoLTE用户数监控
可以用L.Traffic.DRB.QCI.1这个指标观测:
指标名称
指标描述
L.Traffic.User.VoIP.Avg