GSM日常指标监控及设备预防性维护.docx
《GSM日常指标监控及设备预防性维护.docx》由会员分享,可在线阅读,更多相关《GSM日常指标监控及设备预防性维护.docx(35页珍藏版)》请在冰豆网上搜索。
GSM日常指标监控及设备预防性维护
日常指标监控及设备预防性维护
第一节指标观测与信令分析介绍
指标(PerformanceIndicator)是对网络中发生的事件进行统计运算,包括两个部分:
计算公式和用来统计某件事情发生次数的计数器(counter),指标反映了网络的服务质量、实际运行状态。
其中我们将某些对客户感知影响较明显、或是对网络影响较大的指标定义为关键指标(KeyPerformanceIndicator),大多无线侧的信令流程都与厂家设备内部的计数器有对应关系(文中所出现的厂家设备计数器均为我省大量采用的北方电讯设备内部所定义的计数器),而性能数据中各种指标是设备内部计数器经过一定运算得出的实际衡量网络运行状态的结果,因此在网络优化中应该特别强调对信令分析、计数器和NMO数据中各种指标采取综合分析的方法.
信令采集网络数据有着方便、快速、准确、覆盖面广的特点,通过借助专用的软件分析这些数据,能够及时了解用户具体通信行为、终端信息,网络质量和存在问题等,可以为下一步网络规划和业务发展提供依据,目前我省建有专用的中兴公司开发的信令采集平台,通过这套系统,已基本实现了信令数据采集的智能化,因此努力专研相关信令知识,提高自己的优化水平,将是我们优化人员面临的一项长期任务。
1.信令分析与NMO、DT数据指标进行结合
1.1下面针对呼叫建立过程SD信道的分配流程,阐述三者之间的紧密关系
图1SDCCH信道的分配流程和计数器对比图
Channelrequist这条信令触发的计数器是C1026,它是在Rach信道传送的,与其相关的是Rach信道的不可解码电平,对于NMO数据中不可解码电平这项指标有计数器C1033可查,Channelrequired这条信令是在Abis口传递的,它触发的总计数器是C1027,对应的各种原因的子计数器是C1191/0~7,这条信令中包含发起此次呼叫的原因,如移动台主叫发起、移动台被叫回答寻呼、移动台紧急呼叫或位置更新、呼叫重建等等。
各种原因都会和C1191/X对应。
当BSC收到此条信令后下一步就会给移动台分配SDCCH信道。
以上信令流程中在NMO数据观测中最关键的体现就是SDCCH信道的拒绝分配率,此项指标在信令上的对应是Channelrequired和immediateassignmentcommand之间的差值,对应的子计数器是C1161/0~7其中网络中BSC拒绝分配SDCCH信道的原因多集中于C1161/1、C1161/6等:
在SDCCH分配阶段要注意:
失败如果产生在信令消息Channelrequired和immediateassignmentreject之间即SDCCH的拒绝分配率,要观察计数器C1161/X;如果SDCCH分配阶段失败产生在信令消息immediateassignmentcommand之后,要观测计数器C1163/5及C1163/17。
问题:
我省某地市个别基站持续SDCCH分配失败率较高,约在20%,影响了无线接通率指标的提升。
分析:
从该扇区忙时NMO报告可看出C1191/X(Channelrequired)=C1192/X(Immediateassignment)=1059,此阶段呼叫未受损,在从C1192/X(Immediateassignment)到C1195+C1196(EstablishmentiND)期间呼叫从1059损失到965次。
呼叫损失94次,因此这一步是引起SDCCH分配失败的主要原因。
在这阶段主要由t3101超时引起,查看t3101触发的计数器C1163/5其值为95,基本与受损呼叫吻合。
结论:
此小区90%因RACH重发二次分配引起SD分配失败,这种情况不但对接通率有影响,还会增加系统控制信道的负荷,需要对RACH控制参数和重发时间间隔进行适当调整。
1.2后续的TCH分配、挂机释放等信令流程中都对应大量指标和相关计数器,也可参照以上方法分析,具体如下:
在SDCCH信道建立后(Establishmentind)直到系统释放SD信道,在这期间用于传送鉴权、加密信息在此阶段的如果产生掉话就为信令信道掉话,对应的子计数器为C1163/X(除过C1163/5,C1163/20),信令信道的掉话总和计入C1778,
在下面的信令流程就是TCH信道的分配了,这和NMO方面的TCH分配失败率和TCH溢出率都有关系。
A接口传送的assignmentrequire消息,在此消息里含有请求信道的类型,触发的计数器是C1841/0,BSC收到后将为呼叫分配资源,若BSC无资源将会向MSC返回ResourceFailure消息,如果允许排队的话,BSC将向MSC发出Queuingindication消息,并将此次assignmentrequire消息放入排队队列并启动定时器T11,如果超时将向MSC发出ClearRequest,并将触发计数器C1163/30,如果有资源BSC在激活资源后将向BTS发出assignmentcommand消息,并触发计数器C1049同时启动定时器t3107,如果BSC收到返回的assignmentcommplete消息将触发计数器C1050,并将T3107置位。
在此阶段如果有干扰或硬件问题造成手机无法占用指定信道引起话音信道分配失败,手机将向BSC发回assignmentfailure消息,并将触发计数器C1055。
以上过程中和NMO有关的指标如下:
(1)TCH试呼次数,计数器为C1841/0,信令消息为assignmentrequire
(2)TCH溢出次数(含切换):
计数器为C1039+C1163/30,即:
BSS方面TCH溢出和A接口assignmentrequire消息排队超时之和
(3)BSS方面TCH分配失败次数,计数器为C1055
(4)A接口方面assignmentrequire的失败次数C1842/0
特别应关注TCH阻塞率和TCH分配失败率,对于分配失败率要考虑是否存在载波硬件故障或干扰。
1.3信令分析在DT测试中的作用
DT测试可以发现网络中存在的很多问题,主要对网络的下行覆盖、话质等情况进行评估、并及时发现网络中存在的掉话、阻塞、切换失败等现象。
Um口物理层为TDMA帧,链路层采用Lapdm协议,网络层分为无线资源管理(RR)、移动性管理(MM)和呼叫控制三部分(CC),每次通话建立都有物理层和链路层的一个建立过程,在此基础上在和网络侧建立第三层的通信,因此对测试结果进行分析时一定要结合空间接口的三层消息,这样可以更进一步发现网络中存在的问题,
1.4日常优化需要重点观测的指标与计数器
计数器(counter)的值来自OMC的数据库相应表格的相应字段的值,是BSC的测量的结果。
BSC和MSC负责测量网络中发生的各种事件的次数,并以一定的时间间隔来上传给OMC,上传成功后将计数器清零。
OMC中用来保存BSC测量的表格如rawreport报告等。
我们日常关注的关键指标有TCH掉话率、上下行质量、切换失败率、TCH拥塞率和SDCCH拥塞率等,下面是这几个关键指标的计算公式:
Ø话音信道掉话率是指话音信道掉话次数所占话音信道占用次数的百分比。
话音信道掉话次数北电小区级RAWREPORT报告共有30个掉话计数器,根据集团公司下发的掉话采样点要求,目前话音信道掉话次数采集如下共7个计数器之和:
C1164/8+C1164/13+C1164/14+C1164/16+C1164/17+C1164/24+C1164/25
各计数器说明:
C1164/8:
指传输闪断引起的掉话。
C1164/13:
指无线接口失败引起的掉话。
C1164/14:
指无线链路失败引起的掉话。
C1164/16:
指异常释放引起的掉话。
C1164/17:
指T200超时引起的掉话。
C1164/24:
指t3103切换超时引起的掉话。
C1164/25:
指T8超时引起的掉话。
话音信道占用次数分为含切换和不含切换两种,一般计算小区级话音信道掉话率采用不含切换的话音信道占用次数,具体计数器如下:
C1841/0TCH占用次数(不含切换)
C1609/0TCH占用次数(含切换)
Ø切换成功率是指切换成功的次数占所有切换请求的百分比。
切换成功次数=C1083+C1067+C1073+C1068+C1074
C1083:
intraBSC小区内切换成功次数
C1067:
intraBSC小区间出切换成功次数
C1073:
intraBSC小区间入切换成功次数
C1068:
interBSC小区间出切换成功次数
C1074:
interBSC小区间入切换成功次数
切换请求次数=C1081+C1075+C1069+C1076+C1070
C1081:
intraBSC小区内切换请求次数
C1075:
intraBSC小区间出切换请求次数
C1069:
intraBSC小区间入切换请求次数
C1076:
interBSC小区间出切换请求次数
C1070:
interBSC小区间入切换请求次数
ØTCH拥塞率是指因为拥塞造成的话音信道溢出次数占所有话音信道试呼次数的百分比。
不含切换:
话音信道溢出次数=C1039-(C1069-C1071)-(C1070-C1072)-(C1081-C1082)+c1163/30
话音信道试呼次数=C1841/0
含切换:
话音信道溢出次数=C1039+C1163/30
话音信道试呼次数=C1841/0+C1069+C1070+C1081
ØSDCCH拥塞率是指因为拥塞造成的SDCCH信道溢出次数占所有SDCCH信道试呼次数的百分比。
SDCCH信道溢出次数=c1161/1
其中有如下原因可引起SDCCH信道分配异常,但仅有C1161/1为资源缺乏引起:
+---------------------------------------------------------------------------+
|NUMBEROFIMMEDIATEASSIGNMENTREJECT|
|TRAFFICWITHMSC|LACKOFRADIO|RECEIPTOFA|NORESPONSETO|
|CLOSED|RESSOURCE|CHANNELACTNACK|CHANNELACK|
|C1161/0|C1161/1|C1161/2|C1161/3|
+------------------+------------------+-----------------+-------------------+
|bsc100(WY3BSCE301)|btsSiteManager2(micro95RuYiDaSha)|bts0(micro95_0)
|0|0|0|0|
+------------------+------------------+-----------------+-------------------+
|TRAFFICOVERLOAD|TIMINGADVANCE|OTHERCASES|
|TRAFFIC|||
|C1161/5|C1161/6|C1161/7|
+------------------+------------------+-----------------+
|bsc100(WY3BSCE301)|btsSiteManager2(micro95RuYiDaSha)|bts0(micro95_0)
|0|0|0|
+------------------+------------------+-----------------+
SDCCH信道试呼次数=c1191/0+c1191/0+―――+c1191/7
各种SDCCH试呼的计数器具体如下:
NUMBEROFCHANNELREQUIRED|
|ALLOTHERCASES|NONSIGNIF.|NONSIGNIF.|NONSIGNIF.|PHASEI
|ORLOC.UP&OTHER|OR|OR|OR|
|PROC.ONSDCCH|ANSWERTOPAGING|MOCTCH/HalfRate|CALLRE-ESTABTCH/H|PHASEII
|C1191/0|C1191/1|C1191/2|C1191/3|
+------------------+------------------+-----------------+--------------------+
|bsc100(WY3BSCE301)|btsSiteManager22(XA706(ZhuQueMaoYi))|bts0(XA706_0)
|2345|2|0|0|
+------------------+------------------+-----------------+--------------------+
|bsc100(WY3BSCE301)|btsSiteManager22(XA706(ZhuQueMaoYi))|bts1(XA706_1)
|1043|10|0|0|
+------------------+------------------+-----------------+--------------------+
|bsc100(WY3BSCE301)|btsSiteManager22(XA706(ZhuQueMaoYi))|bts2(XA706_2)
|592|7|0|0|
+------------------+------------------+-----------------+--------------------+
|ANSWERTOPAGING|EMERGENCYCALL|RE-ESTABLISHMENT|OTHERMOCSERVICES|PHASEI
||||OR|
||||MOCTCH/FullRate|PHASEII
|C1191/4|C1191/5|C1191/6|C1191/7|
+------------------+------------------+-----------------+--------------------+
|bsc100(WY3BSCE301)|btsSiteManager22(XA706(ZhuQueMaoYi))|bts0(XA706_0)
|654|6|0|836|
+------------------+------------------+-----------------+--------------------+
|bsc100(WY3BSCE301)|btsSiteManager22(XA706(ZhuQueMaoYi))|bts1(XA706_1)
|487|51|0|478|
+------------------+------------------+-----------------+--------------------+
|bsc100(WY3BSCE301)|btsSiteManager22(XA706(ZhuQueMaoYi))|bts2(XA706_2)
|285|1|0|310|
+------------------+------------------+-----------------+--------------------+
第二节日常指标监控
我们知道了指标的公式,以及计数器的来源,便可以计算各项指标的值。
我们通常通过在OMC上定制任务产生原始计数器报告,通过在工作站上编制相关AWK和SH程序,运算出观察小区性能的各项支指标。
由于BSC的测量周期一般是一个小时,即BSC每小时向OMC上传一次,我们便可以在下个小时开始5分钟左右取到前一个小时的指标情况。
通过指标监控,我们可以实时掌握网络运行的状况,在网络出现故障时及时发现并解决。
根据指标统计的事件所发生的时段,又可以将指标分为全天指标、早忙时指标、晚忙时指标、考核时段(集团公司定义的对指标进行考核的时段)指标等。
比如早忙时全网掉话率,就是指上午10点~11点一个小时内,全网掉话次数(非正常释放的呼叫)占全部呼叫次数的百分比数。
对于不同的指标,我们关心的时段也不同,掉话率的考核时段为8~11、18~21点,每天共6个小时;最坏小区的考核时段为7~21点,每天14个小时;切换失败率的考核时段为全天24小时。
根据指标统计的事件范围,我们可以将指标分为全网级别、区域级别(市区,郊区)、BSC级别、小区级别等。
对于日常指标监控,我们要有一个层次的概念,从高层到低层,逐步定位问题所在,即着眼于全网指标,从小区开始处理。
对于关键指标我们需要每日统计,统计时段依具体情况而定,如果全网或部分BSC性能出现明显恶化时要及时上报,并进行分析。
每天观察基站性能,按照掉话率、TCH拥塞率、SDCCH拥塞率、切换失败率等指标分别进行排序,对性能异常,如掉话、拥塞等突然上升,并有较大影响的基站要及时处理。
2.1高掉话小区的处理
每小时关注前一小时各小区的掉话率和掉话次数,对于掉话次数大于100次小区需要及时处理,每天处理前一天掉话TOP10的小区。
掉话是指通话过程中的通道非正常释放,通常掉话有3个主要原因:
∙无线链路失败(北电系统中的无线链路超时)
∙切换计时T3103超时,除BSS内切换。
∙其它系统故障
∙无线环境引起T200超时
∙异常释放
以上各种原因都可能产生掉话,处理高掉话小区时,需要分析掉话的原因,然后针对具体情况提出解决方案。
问题描述
a)无线链路超时
移动台不能发出SACCH(测量报告消息),或者在规定时间内没有被网络(BTS)译码,也无法执行其它切换,这就是无线链路超时掉话,计数器C1164/13和C1164/14统计由于无线接口失败和无线链路失败所引起的连接失败。
b)T3103超时:
ChannelActivateAck
HandoverCommandSetT3103
HandoverCommand
HandoverAccess
Handoverdetection
PhysicalInfo(TA)
SABM
UAEstablishIndication
Handovercomplete
HandovercompleteResetT3103
当BSC将HandoverCommand信息发送到BTS时,BSC启动定时器T3103。
在BSC收到来自切换目标小区的Handovercomplete或者来自源小区的HandoverFailure时将T3103复位,若T3103到时而BSC仍未收到任一种消息时,BSC就判断在源小区发生了无线链路失败,进而释放源小区的信道并记录一次掉话。
计数器C1164/24是用来统计T3103超时的次数的,因此它可以反映切换由于T3103超时而造成的掉话数量。
c)系统故障
掉话也有可能是由系统故障引起。
如由于操作维护的原因造成的掉话,和BSSMAP定时器不匹配造成的掉话,但是这些原因与无线接口没有直接的相关性,涉及到BSS和NSS之间的配合问题。
掉话分析:
良好的维护可预防和解决绝大多数掉话问题,特别是高掉话小区(例如8%以上¨),应首先检查是否有设备故障。
在排除了系统因素后才应考虑无线原因。
掉话主要由以下原因引起
覆盖问题:
∙真正没有信号覆盖的地方,比如因基站太少导致覆盖不连续。
∙另一种是切换不及时。
在一些信号会迅速减弱的地方(隧道,门厅,地铁...),如果切换反应速度过慢,可能在通话还未接入新的信道之前,原来的信道已经衰落到无法正常译码信令,从而导致掉话。
∙覆盖空洞也可能是由于某个小区出现了问题(例如因设备故障造成小区瘫痪)。
∙覆盖空洞还可能是由于丢失邻小区定义或定义不全,此时,系统会保持通话在现有小区中,直到超出该小区覆盖边缘而掉话。
干扰问题:
干扰有来自内部(网络造成),和外部其它系统交调造成。
当网络中存在干扰,BTS和MS由于误码率高而不能解出SACCH内容,无线链路超时,从而中断通话。
干扰对切换也有负面影响,因为下行链路误码率高,移动台就无法解出BTS发出的切换请求命令。
在由T3103超时引起的掉话在OMC-R中有记录。
为了确认小区干扰,可以检查统计项 “AverageLevelofNondecodedRACH” (反映上行链路干扰),“RatioofHOonULQuality ”(反映上行链路高误码率)和“RatioofHOonDLQuality ”(反映下行链路高误码率)以及Band级别反映空闲信道上行干扰情况。
解决措施
∙如果掉话率突然上升并且本站工作正常,检查相邻小区此时是否工作(见TCH可用性)。
∙检查在OMC数据库中定义的相邻小区是否互为对称关系,是否邻小区表定义不全。
∙路测(采用扫描方式)并与无线设计人员共同检查是否确有覆盖空洞存在。
∙检查是否存在特殊原因:
隧道,大型建筑入口(商业中心...),地铁入口,大斜坡(和汽车速度,一天中的交通流量有关,一般来说,掉话多集中于一段时间和某个方向)。
最好的解决办法是先检查地图,听取工程人员和无线工程师建议,并进行现场勘察。
∙利用路测检测邻小区丢失的情况。
进一步作Abis接口测试或呼叫路径跟踪,对找到问题很有帮助,需注意从测量结果中分析连接失败前的时间提前量(TA)以发现孤岛效应。
Ø上下行低电平导致的掉话
由于上下行电平值较低导致的掉话,一般发生在电梯、地下停车场、隧道等存在覆盖漏洞的地方。
掉话的原因主要是Radio_Fail和RF_HO,从报告中可以看到平均电平值较低,切换的原因只要集中在上/下行电平引起的切换。
我们通过路测和用户投诉,可以定位这些网络中弱覆盖的区域。
解决的办法主要是增强覆盖,如增加直放站、换高增益天线、对全向站实施O改S、在室内增加天线分布系统、或者增加新站。
Ø邻区拥塞导致掉话
在这种情况下,由于最好的邻区存在拥塞,用户不能切换到最好的邻区去导致掉话。
从统计指标可以看出,邻区话务量较高、存在TCH拥塞、切换失败率较高,而本小区存在大量的切换掉话。
这种情况的解决办法就是减小邻区的拥塞(具体方法在拥塞小区解决办法中有介绍),减少向拥塞邻区的切换。
Ø上下行质量差导致掉话
上下行质量差的原因可能是硬件问题、外部干扰或是频率规划问题,这种掉话小区一般6~7级质量所占比