GSM日常KPI指标分析与优化方法.docx
《GSM日常KPI指标分析与优化方法.docx》由会员分享,可在线阅读,更多相关《GSM日常KPI指标分析与优化方法.docx(37页珍藏版)》请在冰豆网上搜索。
GSM日常KPI指标分析与优化方法
GSM日常KPI指标分析与优化方法
课程目标
学完本课程,您将能够:
KPI指标的定义
拥塞、切换、掉话等KPI优化指标思路
最坏小区的处理方法
典型案例分析
一、KPI及指标定义
二、话务统计的采集方式
三、随机接入失败率分析与处理
四、T话音相关指标分析与处理
五、S信令相关指标分析与处理
六、越局切换分析思路
七、干扰的分析思路
八、SQI的分析思路
九、小练习
第一节KPI及指标定义
1、所谓KPI:
KeyPerformanceIndication关键指标。
关键指标
基准值
挑战值
分值
网络话音质量投诉比
1%
0.8%
1
掉话率
广州、深圳、东莞、佛山、惠州、中山、江门、汕头、珠海
1.1%
0.9%
1
其它市公司
1.3%
1.1%
小区完好性
99.85%
99.9%
1
无线接入性
98%
99%
1
彩信端到端成功率
70%
75%
1
载波启用率
93%
96%
1
直放站故障率
2%
1.5%
1
故障工单处理及时率
95%
98%
1
投诉工单处理及时率
95%
98%
1
生产任务完成及时率
98%
100%
1
资源平衡系数
80%
90%
(1/考核月数)分
网络接通率
91%
94%
(1/考核月数)分
拥塞率
>5%
最坏小区
Ø数据来源:
从省公司网管系统按月提取市公司本地相应指标
Ø计分规则:
当指标值不高于挑战值时,得满分;高于基准值时,得0分;高于挑战值但不高于基准值时,按如下公式计算得分:
得分=满分×{60%+40%×SQRT((基准值-指标值)/(基准值-挑战值))}
Ø考核频度:
每月考核
2、话务统计的几个专业名词
1、OBJECTTYPE
是某一类型计数器的集合。
每个OBJTYPE包含一套计数器。
比如统计TCH指标的CELTCHF。
一定类型的设备(包括硬件和软件),例如中继组;或者一种功能,例如系统寻呼可以被定义成OBJECTTYPE。
OBJECTTYPE有唯一的一组COUNTER处理,去测量指定的设备或功能。
2、7c)f*K-G\;mi2S`lOBJECT
OBJECTTYPE中包含一定数量、相互独立的OBJECT。
统计的个体单元,比如统计的每一个小区名或是切换统计中的每一个切换关系。
举例说明如下:
CELTCHF:
是统计TCH话务的OBJTYPE,它包含系列COUNTER:
TFCALLS:
试呼次数;
TFNDROP:
掉话次数;
TFCONGSAS:
指配拥塞次数;
3、OBJECTGROUPL^
~sru]t8l@y4p4_QMSC&BSC移动通信论坛| 民间的通信技术论坛
在同一个OBJECTTYPE中一定数量OBJECT的子集
4、COUNTER
计数器。
比如CELTCHF中统计掉话数目的TFNDROP。
4A'YS~2JP*i1E爱立信,中国移动,诺每个COUNTER都有自己的名字,COUNTER由OBJECTTYPE和自己的名字来相互区分(不同的OBJECTTYPE可能有相同的COUNTER名字,但这些COUNTER的测量是不同的)。
COUNTER名字不可以更改,COUNTER是属于STS以外的功能块的。
3、指标定义
指标定义指标
1)、随机接入成功率
随机接入成功率=随机接入成功次数/随机接入试呼次数*100%
即:
CNROCNT/(CNROCNT+RAACCFA)
同理:
随机接入失败率=随机接入失败次数/随机接入试呼次数*100%
即:
RAACCFA/(CNROCNT+RAACCFA)
2)、话务量
话务量=全速率话务量+半速率话务量
即:
TFTRALACC/TFNSCAN+THTRALACC/THNSCAN
3)、T信道完好率
T信道完好率=可用信道/定义信道*100%
即:
100*CLTCH.TAVAACC/(CLTCH.TAVASCAN*CLTCH.TNUCHCNT)
4)、T接通率
TCH接通率(含切换)=成功建立的指配数/总的申请数*100%
即:
(TFMSESTB+THMSESTB)/(TFCALLS+THCALLS)
5)、话音信道T拥塞率
话音信道拥塞率=话音信道溢出总次数/话音信道试呼总次数*100%,即:
(TFCONGSAS+TFCONGSHO+THCONGSAS+THCONGSHO)/(TFCALLS+THCALLS)
6)、话音信道T掉话率
话音信道掉话率=忙时话音信道掉话总次数/忙时系统应答总次数×100%
即:
(TFNDROP+THNDROP)/(TFMSESTB+THMSESTB)
7)、SDCCH拥塞率
!
Q+N.T:
O&[5Z/{%u,[*SDCCH拥塞率=SDCCH信道溢出总次数/SDCCH信道试呼总次数×100%
即:
CCONGS/CCALLS
4、常用指标的计算公式
常用指标的计算公式
指标名称
计算公式
TCH的话务量
TFTRALACC/TFNSCAN+THTRALACC/THNSCAN
TCH半速率话务比例
(THTRALACC/THNSCAN)/(TFTRALACC/TFNSCAN+THTRALACC/THNSCAN)
TCH每线话务量
(TFTRALACC/TFNSCAN+THTRALACC/THNSCAN)/(TAVAACC/TAVASCAN)
TCH分配成功率
TCASSALL/TASSALL
TCH接通率(含切换)
(TFMSESTB+THMSESTB)/(TFCALLS+THCALLS)
TCH拥塞率(含切换)
(TFCONGSAS+TFCONGSHO+THCONGSAS+THCONGSHO)/(TFCALLS+THCALLS)
TCH掉话数
TFNDROP+THNDROP
TCH掉话率(含切换)
(TFNDROP+THNDROP)/(TFMSESTB+THMSESTB)
TCH掉话率(不含切换)
(TFNDROP+THNDROP)/(TFCASSALL+THCASSALL)
SDCCH话务量
CTRALACC/CNSCAN
SDCCH每线话务量
(CTRALACC/CAVASCAN)/(CAVAACC/CNSCAN)
SDCCH接通率
CMSESTAB/CCALLS
SDCCH拥塞率
CCONGS/CCALLS
SDCCH掉话率
CNDROP/CCALLS
无线接入性
TFCONGPGSM/(CNROCNT+RAACCFA)*(TCASSALL/TASSALL)
SQI
(TSQIGOOD+0.5*TSQIACCPT)/(TSQIGOOD+TSQIACCPT+TSQIBAD)
随机接入成功率
CNROCNT/(CNROCNT+RAACCFA)
切换成功率
HOVERSUC/HOVERCNT
第二节话务统计的采集方法
1、统计信息的定义采集方式有两种
Ø一、定义要采集的计数器Counters,把它们形成组RPTID,然后定义定时程序通过AT终端输出、或者是直接通过指令SDTDP实时打印输出统计结果。
Ø二、把要采集的计数器Counters所在的OBJTYPE形成RPTID,关联到定义的IOG文件,然后以文件形式输出统计报告。
这种方式可以采集OBJTYPE中每一个计数器Counter的数值。
目前客户使用的STS采集方式是第二种:
把定义输出的统计文件通过OSS的网络自动传送到OSS的服务器,然后后台处理文件,形成各种需要格式的统计报表。
我们日常的网络优化工作中,两种方式都可能采用!
2、实时打印统计报告
APG即时统计
APLOC;
CDS:
\STS\DATA\DELIVERYDIR
stmfo-i-d09171000-fsybase-e-p60-b200909171000-s200909171100-o
S:
CD09171000
TYPECLTCH.DATA(打印CLTCH的所有小区的所有COUNT的统计数值)
…
EXIT;
3、获取定时输出统计报告的方法
●从FTP上取原始统计,用工具解析出各个OBJTYPE进行分析
●BO
●各个地市开发的统计工具(例如东莞的TCS)
●各家通信公司自主开发的软件工具(贝讯的易优网优平台)
●广东公司话务网管(四期):
省公司网管系统,用于考核各地市的指标。
其实也就是亿阳网管,用同一个指标定义的标准去考核各地市。
KPI指标的各种COUNT和公式计算,可以参照TcsClinet中的公式定义。
下面主要讲解T话音指标:
三大类指标,即R随机接入失败率,T话音指标,S信令指标。
第三节随机接入失败率分析与处理
Ø随机接入成功率分析思路
网络的随机接入失败率正常水平在0.1%以下,接入失败数小于20次/小时,但是有些小区的随机接入失败次数较高,且有一定的规律性,对小区及整个BSC的随机接入指标产生了较大影响。
解决可从以下几点分析:
1.参数设置导致
检查小区参数MAXTA设置是否正常(RLLDP):
当MS所处位置超出MAXTA时,系统会拒绝MS接入;通话的MS会出现掉话。
TALIMIT:
当MS所处位置超出TALIMIT时,系统会要求MS切换到其他小区
2.检查小区附近是否存在同BSIC同BCCHNO
可以尝试修改问题小区BSIC,验证是否有效。
如果还不行,可以进一步更换主频BCCHNO。
现网中很多小区通过更换主频和BSIC都可以得到解决。
3.小区存在严重的外部干扰
如果存在严重的干扰,从排除干扰入手进行分析
4.硬件故障
通过闭解载波看是否存在硬件故障。
案例1:
参数设置错误
YJBBSC2随机接入成功低,且主要是南鹏岛3,长期以来随机接入失败次数非常多,随机接入成功率只有1%,且其他BSC的相邻小区无法切换到该小区。
检查发现该小区开启了扩展小区功能,但MAXTA、TALIM设置为64、63,将MAXTA、TALIM修改为218、216后,该小区的随机接入成功率,仍至该BSC的随机接入成功率均恢复正常。
案例2:
参数修改
小区DDBLCN3:
谢岗黎村在(10:
00-17:
00),随机接入失败率较差并且对整个BSC的指标产生了较大影响。
(RANDOMACC-RATRHFAEMCAL)
从随机接入原因分析:
从24小时随机接入的原因分类图可以看出话务量高峰期其他原因(主要为位置更新、用户开关机)引起的RA占总接入次数近80%,并且全天平均高于80%。
这种情况说明在DDBLCN3(谢岗黎村)中的位置更新过多,有可能给系统性能带来负面影响。
(RANDOMACC-RATRHFAEMCAL)
将DDBLCN3(谢岗黎村)的BSIC从10改为46,避免小区误接入,随机接入失败率有得到改善。
同时该小区地处比较偏远,随机接入申请次数较少也造成随机接入失败率高将。
对DDBLCN3(谢岗黎村)CRH从4调整为8,每小时信令掉话次数和信令申请次数均得到大幅的降低。
案例3:
新开小区同频同BSIC导致R接入失败率高
10月26号开始长安镇的乌沙路口2(G30WSK2)突然出现R接入失败率数多,R接入失败率高的现象,同时T接通率及切换指标都出现异常现象。
对小区做一致性检查发现,长安镇的乌沙路口2(G30WSK2)与26号新开小区乌沙蔡屋2(73/12)同频同BSIC导致R接入失败数大量增加,各项指标恶化。
MCOM地图上明显可见:
乌沙路口2(G30WSK2)与26号新开小区乌沙蔡屋2(73/12)同频同BSIC,且互为邻区,同时覆盖方向打向同一个方向。
更换新开小区乌沙蔡屋2的主频和BSIC后,乌沙路口2(G30WSK2)的R随机接入失败数大大减少,其他各项指标也恢复正常。
第四节T话音相关指标分析与处理
ØT话务量为0
除去特殊小区后,通过前后日期对比,话务量在话务忙时段突然出现话务量为0,或很少的情况下(东莞的天网系统是由专门对话务量指标等波动较大的小区进行监控),要重点关注此小区,对小区进行分析问题点所在。
1.直放站故障
一般在问题小区只与直放站设备连接的情况下,很大可能是直放站设备故障,例如:
直放站停电/直放站不工作/参数设置等问题导致。
2.基站硬件故障(DXU/TRU/CDU故障/天线)
可以通过更换主频位置或小区重LOAD来定位问题点。
如果是软件吊死,通过重LOAD小区一般可以恢复话务。
如果是硬件问题的话,一般在重LOAD时会出现基站FCODE,如:
TF出现FOCDE:
1B1,主频所在的载波故障无法开启,或CDU所对的多个载波有FOCDED而导致BLOCKED。
一些告警(CF2A7893339等)
3.版本与旧硬件不兼容
很多网元在升版到DGM03B2R12/HD/07B/3/20后,出现部分小区经常性突然没有话务接入和数据业务接入的情况。
此种情况目前通过打爱立信拓补丁已解决问题。
案例1:
DXU故障导致TF:
1B1
厚街镇的沙塘路口D3(D50SAK3)出现话务量忙时出现话务为0的情况,通过查历史告警,发现基站曾经出现过TF:
1B1告警。
对小区进行重LOAD,ACTIVE小区时TF出现1B1告警,且小区一直处于UNUSED状态,TF:
BLOCKED,无法开启。
派单基站更换DXU硬件后小区故障消除。
话务指标恢复正常。
ØT信道完好率(指的是在99%左右的现象)
T信道完好不率足会造成小区的其他种指标恶化:
T掉话率、T接通率、小区的丢包数,当小区经常出现完好率不足的时候就需要分析其问题所在。
1.TRU故障
可以通过历史告警(ERRORLOG或ALV等其他手段)来定位是否存在某个载波出现经常问题而又自动恢复正常。
如果有,可更换此载波。
(MOTS等)
2.DXU故障
在小区传输没有误码的情况下,可考虑更换DXU硬件。
3.传输高误码
小区所用的传输存在高误码的情况下,基站的时隙会出现同步失败或BLOCKED而导致T完好率不足。
可用指令:
DTQUP在现网查询基站所用的传输是否存在误码。
4.传输连线故障
由于光端机到DXU之间的传输连线,从光端机到DXU之间的连线总共有4个节点。
这些点的连接质量会影响小区的传输质量,从而导致T完好率不足。
如下图:
(基站结构)
解决方案:
可以基站人员在现场由D->A点重新插拔光端机到DXU的连线。
5.传输采用信令压缩方式
LAPDMPLEXING和LAPDCONC是一种节省传输设备的技术,但是也有其弊端,即引起信道损坏和高掉话。
当传输采用信令压缩的时候,当小区SDCCH申请数猛增时,就很可能出现了载波自动闭塞、TS时隙同步失败,信道损坏等问题,引起SUDDENLOST和不明掉话次数突增,影响话务掉话比和掉话率;同时信道完好率有类似传输“闪断”(即统计的可用信道数有小数点)的情况出现。
这种情况在高配置高话务量的小区中更为突出。
随着半速率比例使用率的逐渐上升,信令压缩的这种缺陷尤为明显。
目前在传输充裕的情况下,一般已经不采用这种方式。
案例1:
光端机传输线接头损坏
富康路2(G50FKL2)出现断续的T完好率不足的现象,同时T掉话严重,最高可达96次/小时。
其中大部分是不明原因的掉话。
(涉及到的OBJCLTCHDRF)
查看小区传输质量,观察一段时间,传输正常,没有出现高误码的现象。
然后逐个查询小区的载波等硬件单元,也没有明显故障。
怀疑是DXU硬件故障或传输连线故障导致T完好率不足。
于是派单给相关人员更换DXU硬件及检查DF架到DXU的传输连线。
基站人员到站更换DXU硬件后,故障现象没有消除,T高掉话仍然存在。
可见此故障与DXU硬件无关。
剩下的就是光端机到DXU之间的传输连线,从光端机到DXU之间的连线总共有4个节点。
如下图:
基站人员在现场由D->A点重新插拔光端机到DXU的连线,当插拔到光端机的A点时,无论是接通或断开接头,传输都出现ABL中断状态。
基站人员在现场重新做传输接头后,传输终于恢复WO正常状态。
ØT接通率
对小区接通率指标进行纵横对比,同一项指标不同日期、不同时段的比较分析。
如该问题是由于小区偶发原因引起,可不进行调整,继续观察后续几天情况。
导致接通率低的原因,常见的有如下6种:
1.由于话务拥塞导致TCH接通率过低
由于话务拥塞导致TCH接通率过低分析思路可参考TCH拥塞的分析思路
如小区存在1800或900同向覆盖小区,则应通过参数均衡进行话务分流。
如果小区长期存在拥塞,话音接通率一直较低,需要从容量上进行调整。
2.基站设备吊死引起:
通过重启小区解决
3.由于硬件损坏导致TCH接通率过低
判断是否由于硬件损坏导致的信令接通率过低比较困难,我是对问题小区作CTR、CER、MOTS,分析其结果来加以判断(也可以在小区覆盖范围内作DT、拨打测试来发现)。
如果是有载波故障,一般该载波上的掉话次数较多,分配失败也多集中在该载波上。
硬件故障包括:
载波、天线、DXU、CDU等
4.由于误码率过高导致TCH接通率过低
信令的传输对误码率的要求较高,很多小区的TCH接通率问题都是由于误码过高而引起的。
引起误码过高的原因,常见的有频率干扰和传输质量(可查看LAPD统计)两种。
5.参数设置错误引起TCH接通率过低
检查参数设置,包括:
T3212和BTDM/GTDM的对应关系、BSC和MSC对TRAU版本设置的对应、切换关系,其内容包括:
邻区、同频同BSIC的干扰、MBCCHNO和OFFSET/HYST的对应定义。
一般来说,交换机整体参数设置问题会导致全部小区的指标都差。
6.直放站/塔放故障
如果该小区有带直放站,还需判断直放站是否存在故障或频点设置错误。
带了塔放的要判断塔放是否存在问题,还有一些塔放不是支持1800的高端频点。
所以还要看是否由于频点设置不当引起。
7.上行干扰
小区存在上行干扰也会导致T接通过低。
常见的干扰原因:
频点干扰/直放站干扰/外部干扰
ØT拥塞率
拥塞分为:
切换拥塞、起呼拥塞,其中起呼拥塞指在该小区起呼被拒绝的情况,切换拥塞指由别的小区切换到该小区而被该小区拒绝的情况,这两者之和统计为“拥塞率”。
在分析时必须对目标小区进行多天、不同时段的纵横对比分析,避免因为偶发话务引起。
导致TCH拥塞的原因,常见的有如下5种:
1.载波故障
检查小区信道可用率,判断是否因载波退出服务导致。
2.越区覆盖严重
分析MRR数据并结合小区的高度、下倾角设置,判断是否存在过覆盖现象
3.拨号器引起
检查小区的平均通话时长,如果平均通话时长远低于正常小区的通话时长(正常小区通话时长约为每呼叫20-30秒),且其他服务统计数量非常大,可判断为拨号器引起小区拥塞。
4.参数设置错误引起
如小区切换数据缺失、LAYER、半速率的开启及所占比例、R12开始的新参数HRTRX(支持半速率载频的个数),等参数设置不当。
5.载波配置不足
正常话务增加,检查小区拥塞是由于载波配置不足引起的,可通过加大使用半速率或扩容载波处理。
6.TRAPOOL满负荷
案例1:
现象:
09月4号厚街家具展中:
应急通信车1/2/3/4区非常拥塞,但是它的半速话务非常少量,大部份都是全速话务。
半速率参数是正常打开的,你们说这是为什么?
是由于现在BSC的最新版本升级为:
DGM05B1R12/HD/07A/2/13,半速率的开启跟HRTRX有关。
如下图(错误的参数设置):
HRTRX:
表示可用于半速率的载波数量(一般等于载波数量,表示所有的载波都能用于半速率)
0:
表示没有载波可用于半速率,会导致小区无法使用半速率,造成拥塞严重。
1:
有1个载波可用于半速率
将应急车参数更换为如下:
修改后小区立即能占用半速率,如下图:
ØT异常率
这个跟接通率的分析思路类似
ØT掉话率
目前省公司规定:
T掉话率超过3%的是最坏小区,分析掉话可先从掉话原因中入手,由掉话原因来定位具体的故障。
每种掉话原因的主因分析总结如下:
1.突然掉话
突然掉话主要的原因有下行干扰、强烈的上行干扰如干扰器、用户突然进入信号盲区、切换过程中的丢失、直放站问题、用户行为(手机没电等)、载频问题、传输闪断,、TRA设备故障等。
2.上行弱信号掉话
上行弱信号掉话和上下行弱信号掉话,其原因主要有越区覆盖、天线分集接收性能不好或者没有增益、邻区关系不完善、参数设置不当等。
3.下行质量掉话
下行质量掉话产生的原因大部分是因为干扰(主要是同频干扰)和硬件问题,特别是TRU问题和直放站问题,可通过关闭直放站或TRU后跟踪话务统计的办法进行定位。
4.上行质量掉话
上行质量掉话产生的原因主要有频率干扰、TRU坏、CDU问题、直放站问题等。
对应每一个问题,我们可以有相对应的查找定位办法,并制定措施。
案例1:
传输隐性故障导致突然掉话
从上图的指标情况看,该小区信道完好率不足,TCH异常率高是造成小区掉话,接通率,切换成功率低的“祸首”,查询该小区没有硬件包括载波的故障告警,实时查看时隙工作也正常。
对该小区所用传输进行跟踪观察,发现该小区所用传输存在大量误码。
通知相关人
员现场处理,发现该传输有一段走的是微波,对应的微波端口有问题,导致传输产生大量误码,更换微波端口后传输误码消失,随后,小区指标也恢复正常。
案例2:
切换失败导致上下行弱信号及下行质差掉话
虎门大桥D2(D50HMQ2)、蛇头湾D1(D50STW1)和蛇头湾1(G50STW1)的总掉话和掉话率偏高,主要掉话是由下行质差和上下行弱信号引起,而且伴随着切换成率偏低。
由于切换成功率偏低,继续观察故障小区的切换统计,发现故障小区切向邻市番禺小区PN1GKQ3的切换申请数都为0,而出现大量的切换原因减申请,怀疑与切换相关的参数设置不合理造成。
由于三个故障小区都存在切换邻市邻区的故障,初步怀疑公共的切换参数设置存在问题。
经逐步排查,发现各个小区邻区定义正常,参数设置合理,但是在故障小区的HOME-MSC(SZS66)找不到邻区PN1GKQ3的相邻位置区号(46000272F)
此定位到故障原因所在,我市漏定邻市相邻的LAC(46000272F),在SZS66上补定GZS16管辖的位置区46000272F。
补定后3个小区到番禺的切换正常,切换正常后,小区的掉话率指标也恢复正常。
如下:
案例3:
漏定义重要邻区导致上行弱信号掉话
新开小区虎门大桥D1开通后掉话率很高,掉话主要集中在上行弱信号掉话。
对小区做NCS邻区优化及结合MCOM地图,发现原因是虎门大桥D1漏定义虎门大桥D2小区的邻区,导致无法切换。
补定后切换正常,掉话消除。
案例4:
干放隐性故障导致下行弱信号掉话
统计发现第一国际第1小区DGJDYJ1掉话较多,掉话主要集中为下行弱信号掉话,下行质差掉话和上下行弱信号掉话。
测试发现占用J2第一国际1小区扩展架上的两个载波(频点为84,95)时,信号强度比其他六个载波弱20dbm左右.
对小区扩展架的硬件进行检测,没有发现存在硬件故障问题。
查资料发现,小区是经过干放再接到天馈线系统上,怀疑是由于干放故障导致弱信号。
到现场检查发现,小区的两个基架各接了一个干放,但在干放机房测试发现扩展架所带干放并