CS域掉话分析.docx
《CS域掉话分析.docx》由会员分享,可在线阅读,更多相关《CS域掉话分析.docx(36页珍藏版)》请在冰豆网上搜索。
CS域掉话分析
CS域掉话分析
中兴通讯学院
目录
第1章概述1
第2章掉话定义3
2.1用户主动释放信令3
2.2路测指标定义4
2.3网管指标定义4
第3章掉话分析7
3.1常见掉话原因7
3.1.1网络覆盖差掉话7
3.1.2邻区漏配掉话8
3.1.3切换掉话8
3.1.4干扰掉话9
3.1.5扰码复用冲突掉话11
3.1.6异常原因掉话11
3.2常用掉话分析方法11
3.3掉话率优化手段15
3.3.1调整工程参数15
3.3.2调整无线参数15
3.3.3掉话相关定时器和计数器17
第4章案例分析19
4.1邻区优化-1(邻区关系重整)19
4.2邻区优化-2(邻区漏配)22
4.3扰码复用优化24
4.4软切换参数优化29
4.53G-2G操作中数据配置优化31
第一章概述
无线通信系统中,掉话率是个很重要的指标,它可以被终端用户直接感知从而影响到用户对网络的使用感受。
掉话是网络问题的表象,可以引起掉话的因素非常多,本文总结了ZTEUMTS网络多年运营优化的经验,对网络CS域业务掉话进行详细描述,用于指导日常网络优化工作。
第二章掉话定义
掉话率指标的获取有路测和后台网管统计两种途径。
路测指标主要通过测试工具获取,而网管统计指标是对海量数据的分析得到。
首先介绍正常的通话释放信令流程。
二.1用户主动释放信令
Uu口信令如下:
图2.11UE主动释放信令流程图
图2.12放大图
二.2路测指标定义
路测指标定义和测试工具关系紧密,CNT/CNA中对单业务掉话的定义算法为:
◆掉话率=掉话次数/呼叫成功建立次数
收到"Alerting"消息后,呼叫成功建立次数加1;
在Alerting之后,没有收到ConnectACK就收到SYSTEMINFORMATION消息,则算掉话;
在ConnectACK之后,若收到SYSTEMINFORMATION消息,而后的5秒内没有收到E_S_radioBearerReconfigurationComplete,E_S_physicalChannelReconfigurationComplete,E_S_transportChannelReconfigurationComplete,E_S_rrcConnectionRelease,E_S_rrcConnectionRelease_CCCH消息,则认为掉话;
在ConnectACK之后,若收到E_S_rrcConnectionRelease,E_S_rrcConnectionRelease_CCCH消息,而在此之前没有收到Disconnect消息,则认为掉话。
在实际使用中,工具会在L3消息中显示掉话位置。
二.3网管指标定义
网管统计的掉话定义如下:
◆无线掉话率=(RNC请求释放的电路域掉话的RAB数目
RNC请求释放电路域Iu连接对应的RAB数目
+RNC请求释放的分组域掉线的RAB数目
+RNC请求释放分组域Iu连接对应的RAB数目)
/(电路域总共释放的RAB数目
+分组域总共释放的RAB数目)×100%
主要有信令面掉话和用户面掉话。
从信令流程上看,信令面掉话是RNC发起了Iureleaserequest,用户面掉话是RNC主动发起RABreleaserequest。
具体的掉话原因细分计数器及说明见下表(V3.07.300)。
表2.31网管统计的掉话原因
释放
类型
计数器
计数器说明
相关原因
Iurelease
C301230315
IuconnectionreleaserequestbyUTRANforCSdomainincell,RepeatedIntegrityCheckingFailure
重复的完整性检查失败
C301230316
IuconnectionreleaserequestbyUTRANforCSdomainincell,ReleaseduetoUEgeneratedsignallingconnectionrelease
UE产生的信令连接释放
C301230317
IuconnectionreleaserequestbyUTRANforCSdomainincell,RadioConnectionWithUELost
失去与UE的无线连接
C301230318
IuconnectionreleaserequestbyUTRANforCSdomainincell,TRELOCoverallexpiry
重定位完成定时器超时
C301230319
IuconnectionreleaserequestbyUTRANforCSdomainincell,FailureintheRadioInterfaceProcedure
无线接口流程失败
C301230320
IuconnectionreleaserequestbyUTRANforCSdomainincell,O&MIntervention
操作维护干预
C301230321
IuconnectionreleaserequestbyUTRANforCSdomainincell,ReleaseduetoOverloadControl
过载控制导致的释放
C301230322
IuconnectionreleaserequestbyUTRANforCSdomainincell,UnspecifiedFailure
不确定失败
C301230323
IuconnectionreleaserequestbyUTRANforCSdomainincell,UTRANGeneratedReason
UTRAN发起
RABrelease
C301230361
RABreleasenumberrequestbyUTRANincellforCSdomain,RABpre-empted
RAB抢占
C301230362
RABreleasenumberrequestbyUTRANincellforCSdomain,ReleaseduetoUTRANincellGeneratedReason
UTRAN产生的释放原因
C301230363
RABreleasenumberrequestbyUTRANincellforCSdomain,IuUPFailure
IuUP失败
C301230364
RABreleasenumberrequestbyUTRANincellforCSdomain,ReleaseduetoOverloadControl
过载控制导致的释放
C301230365
RABreleasenumberrequestbyUTRANincellforCSdomain,UnspecifiedFailure
不确定失败
第三章掉话分析
网络中很多因素都可能导致掉话,而掉话现象只是网络问题的一个表现形式。
本章主要从常见掉话原因、常用掉话分析方法和主要的掉话率优化手段三方面进行介绍。
三.1常见掉话原因
三.1.1网络覆盖差掉话
网络覆盖定义中,某个采样点是有效覆盖点的要求是RSCP和Ec/Io均好于特定门限值。
这里所说的覆盖差是指RSCP不好(有个例外,在网络边缘,由于小区数目少可能会产生RSCP不好但Ec/Io好的现场,也应属于覆盖差)。
UMTS网络中不同业务的发起和保持对覆盖的要求不一样,下表给出参考值:
表3.11业务RSCP和Ec/Io门限值要求
业务类型
RSCP要求[dBm]
Ec/Io要求[dB]
AMR12.2K
-105
-13
CS64K
-100
-11
PS384K
-95
-10
HSDPA
-90
-8
具体判断网络上行覆盖差还是下行覆盖差的问题需要通过掉话前上行或者下行的专用信道功率来确认,需要采用以下的方法来确认:
如果掉话前的上行发射功率达到最大值,并且上行的BLER也很差或者从RNC记录的单用户跟踪上看到NodeB上报RLfailure,基本可以认为上行覆盖差导致的掉话;如果掉话前,下行发射功率达到最大值,并且下行的BLER很差,基本可以认为是下行覆盖不行导致的掉话。
在链路平衡性较合理且上下行没有干扰的情况下,上行和下行发射功率会同时受限,此时无需严格区分哪一方先出现受限;如果上下行严重不平衡,则初步判定为受限方向存在问题。
确认覆盖的问题简单直接的方式是直接观察Scanner采集的数据,若最好小区的RSCP和Ec/Io都很低,就可以认为是覆盖问题。
三.1.2邻区漏配掉话
邻区优化是无线网络优化中非常重要的环节。
邻区漏配会直接引起掉话,也会导致网络中干扰水平升高,影响到系统容量,邻区优化是工程优化阶段的一个主要工作内容。
介绍几个判断同频邻区漏配方法:
1.在路测过程中,移动台从基站得到邻区列表,而Scanner持续在对512个主扰码进行扫描测量,并把其Ec/Io记录下来。
如果发现某个主扰码并不在邻区列表中,但其强度却超过了某门限值,且这一现象连续出现(持续几秒钟以上),则认为此主扰码的小区为缺加邻区;
2.如果发生掉话,UE驻留的小区扰码和掉话前的扰码不一致,也可以怀疑是邻区漏配问题,通过检查掉话前测量控制消息中的邻区列表来进一步确认是否为邻区漏配;
3.有些UE会上报检测集(DetectedSet)信息,如果掉话发生前检测集信息中有相应的扰码信息,也可以确认是邻区漏配的问题。
异频和异系统邻区漏配判断方法类似。
三.1.3切换掉话
问题原因:
切换的问题一般在于切换区的长度和切换区里各个信号的强弱变化。
如果切换区太小,或者激活集小区信号陡降,可能没有足够的时间完成切换流程,从而导致切换失败;而切换区太大,则有可能过多占用系统资源。
此外如果切换区里各个信号强弱变化太频繁,不是普遍的一个信号慢慢变弱另一个慢慢变强的话,则切换也会频繁发生,产生乒乓效应。
这样一方面过多占用系统资源,另一方面也容易增加掉话的几率。
失败信令描述:
1.来不及完成切换。
一般在掉话前手机上报了邻区的1a或者1c测量报告,RNC也收到了测量报告,并下发了ActiveSetUpdate消息,但由于下行链路质量迅速恶化,UE收不到此消息导致加腿失败掉话;
2.乒乓切换。
乒乓切换导致的掉话表现为某个小区刚刚从激活集删除,马上又请求加入,此时收不到RNC下发的ActiveSetUpdate消息。
问题分析:
对于切换问题,关键在于控制切换区的位置和长度,并尽量保证在切换区里参与切换的信号强度能够平稳的变化。
对于切换区的位置和长度,应该在规划时就有初步的考虑。
优化时要根据实际的环境加以调整,考虑完成一次切换所需要的平均时间和一般在此区域的车速来确定切换区的长度。
切换区的位置应该尽量避免在拐角,因为拐角本身的阻挡会带来额外的传播损耗并造成信号的迅速衰减从而减小切换区的长度。
如果无法避免的话,应该尽量保证拐角处的信号强度有足够的余量来应对拐角的损耗。
也不要把切换区放在十字路口、高话务地区以及VIP服务区。
对于异频切换和系统间切换,在切换前需要通过启动压缩模式(2D事件)来进行异频或者异系统测量。
如果压缩模式启动太迟,可能导致UE来不及测量目标小区的信号,从而产生掉话;也可能UE完成了测量,但不能正常接收系统下发的异频或者异系统切换请求而导致掉话。
另外如果异频消息过大,造成下行信令拥塞,也会导致空口掉话。
三.1.4干扰掉话
区分上下行干扰。
下行干扰的产生主要有两个原因,一是导频污染区,二是邻区漏配引起的。
邻区漏配问题上面已经说过,不再重复;导频污染区的典型为区域中的小区信号较多,且RSCP足够好但是Ec/Io很差,UE会频繁重选或者切换,同时呼入呼出困难。
通常有三个因素会在网络中形成导频污染区:
1.高站越区覆盖;
2.基站环形布局;
3.街道效应、强反射体等原因导致的信号畸变。
下行干扰掉话的信令典型特征为RNC下发了ActiveSetUpdate消息但UE收不到,最终RLFailure掉话。
Updata
上行是否存在干扰主要通过OMC-R中小区AverageRTWP和MaxRTWP来判断。
小区空载AverageRTWP正常在-105dBm水平,对应50%上行负荷在-102dBm附近,如果AverageRTWP在网络闲时超过-100dBm,同时MaxRTWP在-90dBm水平,可以认为存在上行干扰。
举例:
图3.11干扰掉话路测数据分析图
掉话时下行信号的RSCP和Ec/Io都很好,但是上行发射功率不断攀升,直到达到最大值附近,形成掉话。
表明手机信号已基本无法被上行接收到。
此时观察SIB7里面的ULinterference一项,为-93dBm,证明上行RTWP很高。
基本可认为是上行干扰导致的掉话。
同时,用OMC的RTWP统计,也可辅助证明站点存在干扰。
如下图所示。
图3.12小区RTWP统计图
三.1.5扰码复用冲突掉话
站点密集分布的地区可能会进行扰码复用。
如果复用距离不够,或者将不常发生切换的小区(扰码复用小区之一)配置了邻区关系,就会生成不合适的邻区列表从而导致掉话。
分析此类型掉话时注意:
邻区关系是依据CellID进行标识的,如果单纯看掉话信令,经验不足者会仅关注扰码而漏过这一细节,注意甄别。
三.1.6异常原因掉话
在排除了以上的原因之后,其他的掉话一般需要怀疑设备的问题,需要通过查看设备告警信息和系统日志进一步来分析掉话原因。
如:
NodeB异常引起同步失败,导致的链路不停增加和删除;射频模块异常引起的下行信号差掉话;手机不上报1a测量报告导致掉话等。
需要注意的是,海外很多国家的传输条件不好,稳定性差,由于传输问题导致的掉话一般影响较大。
三.2常用掉话分析方法
优化常用的分析方法有:
多维分析、趋势分析、意外分析、比较分析、排名分析、原因和影响分析等。
◆多维分析
“维”是指处理问题的着眼点和解决问题的方向,多维分析就是从多个不同的角度及其组合来分析数据。
遇到掉话问题,不能仅仅关注掉话,因为可能引起掉话的原因很多,还应同时关注接入、切换、话务、时间、RTWP等关联项。
如后台统计报表的掉话分析中,一般会同时体现以下指标:
表3.21小区掉话统计数据表
CellID
CellName
CSCallDropRate[%]
NumberofSuccessfulCSRABestablishment
TotalAbnormalRelease
AbnormalIuReleasedNumber,byCause
RepeatedIntegrityCheckingFailure
RadioConnectionWithUELost
TRELOCoverallexpiry
FailureintheRadioInterfaceProcedure
UnspecifiedFailure
UTRANGeneratedReason
AbnormalRABReleasedNumber,byCause
ReleaseduetoUTRANincellGeneratedReason
IuUPFailure
UnspecifiedFailure
CSTraffic[Erl]
PSTraffic[Kbyte]
HSDPARLCThroughput[Mbps]
MaxCellFreqRTWP[dBm]
AverageCellFreqRTWP[dBm]
MaxCellFreqTcp[dBm]
AverageCellFreqTcp[dBm]
MaxHSDPAusersincell
AverageHSDPAusersincell
MaxHSUPAusersincell
AverageHSUPAusersincell
◆趋势分析
从时间序列分析随时间的变化趋势,找出其规律。
如下图
图3.21掉话率随时间的变化趋势图
如有需要可从更大时间粒度分析变化趋势是否具有规律性等。
◆意外分析
从大量数据中找出过高、过低、变化幅度过大等异常情况数据,并进一步进行影响原因的数据挖掘。
如图:
图3.22高掉话率及时段统计示意图
掉话率异常高,需要关注该时段是否存在问题。
可按照如下思路排查问题:
1.查看指标变差时间段的设备告警和系统日志,排除硬件问题;
2.查看该时间段传输情况;
3.该时间段有无升级、闭塞小区等动作;
4.该时段是否有突发性高话务,如演唱会、球赛、展览等。
◆比较分析
从相同的角度去对不同数据集合进行对比,找出差异所在,并可进一步深入挖掘差异原因,一般在信令流程分析中使用较多。
◆排名分析
从大量数据中找出按某种分类方法的TopN或BottomN数据,这些数据需要特别关注,比如常用的最坏小区法。
图示为语音切换失败统计的例子:
图3.23语音切换失败原因统计图
◆原因和影响分析
对于已产生的某个特定结果,从大量数据中挖掘出影响因素,并且分析不同因素或组合的重要程度。
如小区呼叫阻塞,原因可能是硬件容量不足、下行链路容量不足或上行链路容量不足,需要仔细进行分析。
需要注意的是,每种方法都有其分析问题的针对性和局限性,要具体定位设备问题、参数配置问题(工程参数和无线参数)以及网络资源利用率等问题,依靠单一的分析手段是很难做到的,以上的各种分析方法要结合使用。
三.3掉话率优化手段
三.3.1调整工程参数
调整工程参数是工程优化的工作重点,目的就是调整网络覆盖,在保证信号强度的同时尽可能减小干扰。
主要调整手段包括:
天线方向角和下倾角,天线摆放位置,天线类型,基站发射功率,天线挂高,站点位置,覆盖增强手段和新增站点。
具体的工程优化请参考《WCDMA无线网络RF优化指导书》。
三.3.2调整无线参数
本节仅列举与CS掉话相关的无线参数。
三.3.2.1软切换事件监测与上报时间差TimeToTrigger
TimeToTrigger是监测到事件(1A,1B,1C和1D)与事件上报的时间间隔,TTT的设置会影响切换的及时性。
切换的参数的调整主要把握两个思路,一个要保证小区信号有绝对的重叠区,然后通过调整相应的无线参数,使得UE穿越切换区的时间大于系统整个的切换时延,进而保证业务的连续性;另一个就是信号和无线参数共同确定的切换区不能太大,避免使得切换的开销增大和资源利用率降低。
对于街道拐角等信号变化剧烈的区域,需要减小1A触发时间、增大1B触发时间,同时调整相应邻区的CIO,使得1A尽早发生、1B较晚发生,来保证切换的顺利完成。
对于高速公路场景,因小区少且跨度大,车速过快时如果不能及时加入新小区将会导致掉话,其调整思路和密集城区街道拐角的思路相同,使得信号好的小区尽快加入到激活集,来保证业务的连续性。
对于相关参数的调整,目前的操作方式是通过增加一个对应参数的测量配置号,并将其应用到目标小区。
三.3.2.2邻小区偏置CIO
该值与实际测量值相加所得的数值用于UE的事件评估过程。
UE将该小区原始测量值加上这个偏置后作为测量结果用于UE的同频切换判决,在切换算法中起到移动小区边界的作用。
该参数设置越大,则软切换越容易,处于软切换状态的UE越多,但占用资源;设置越小,软切换越困难。
CIO作用于非最好小区,即对1A事件,CIO在邻区中设置起效,对1B事件在即将删除的小区设置起效。
公式如下:
1A事件触发公式
其中,Mnew是进入报告范围小区的测量结果;
Mi是一个激活集内小区的测量结果;
NA是当前激活集内小区数目;
MBest是激活集内最强小区的测量结果;
W是RNC发送给UE的权值参数;
R1a是从RNC发送给UE的报告范围常量;
H1a是事件1A的迟滞值。
1B事件触发公式
其中,MOld是离开报告范围小区的测量结果;
Mi是一个激活集内小区的测量结果;
NA是当前激活集内小区数目;
MBest是激活集内最强小区的测量结果;
W是RNC发送给UE的权值参数;
R1b是从RNC发送给UE的报告范围常量;
H1b是事件1B的迟滞值。
三.3.2.3压缩模式启动/关闭门限
频间切换和系统间切换需要用到压缩模式。
压缩模式在切换前启动,系统利用压缩模式所产生的时间空隙对异频或异系统目标邻区进行信号质量测量。
在目前系统实现中,是通过2D事件启动压缩模式,2F事件关闭压缩模式。
系统中可以选择测量量为RSCP或是Ec/Io,目前默认采用RSCP【采用Ec/Io启停压膜,适用于密集城区或者RSCP比较接近、主导频不突出的覆盖弱区】。
一般情况下,压缩模式需要测量目标小区(异频或者异系统)的质量并获取相关信息,同时由于移动台的运动导致当前小区的质量恶化,所以压缩模式的启动门限一般要求在当前小区的质量下降到导致掉话之前能够及时测量到目标小区的信号并完成上报完成切换为要求,对于停止门限则要求避免压缩模式的频繁启动和停止。
在密集城区,要尽量保证3G的连续覆盖,以避免不必要的系统间切换增加系统负荷;而对于3G边缘及高速公路场景下,应该在3G信号产生深衰落之前尽快切换到2G,这就需要提高2D的触发门限,使UE尽早启动压缩模式。
三.3.2.4无线链路最大下行发射功率
如果小区由于覆盖原因产生大量掉话,可以适当增加业务最大下行发射功率,风险是当用户在边缘时就可能消耗大的功率,从而对其他用户造成影响,降低系统的下行容量;对负载过高导致较多接入失败的小区,可以考虑适当降低该参数—注意,由于功率参数为全网参数,此操作存在很大风险,需格外慎重。
三.3.2.5异频/异系统门限
当异频/异系统邻区信号测量值超过设置的门限值后满足切换条件。
结合压缩模式的启动停止门限来配置该参数,如果配置较小的值,可以提早触发切换事件;如果配置较大的值,可以延迟切换。
三.3.3掉话相关定时器和计数器
UE定时器和计数器
表3.31UE定时器和计数器
名称
解释
取值范围
默认值
T312Connected
连接模式的T312,UE开始专用物理信道建立时等待L1的同步指示的时间
(1..15)s
1s
N312Connected
连接模式的N312,UE在专用信道建立成功前应从L1连续收到的同步指示的数目
(1,2,4,10,20,50,100,200,400,600,800,1000)
1
T313
CELL_DCH状态已建立的DPCCH信道失去同步后的等待时间
(0..15)s
3s
N313
UE从L1连续收到的失步指示的最大数目
(1,2,4,10,20,50,100,200)
20
T314
无线连接失