华为设备GPRS日常故障及指标异常处理措施精.docx
《华为设备GPRS日常故障及指标异常处理措施精.docx》由会员分享,可在线阅读,更多相关《华为设备GPRS日常故障及指标异常处理措施精.docx(15页珍藏版)》请在冰豆网上搜索。
华为设备GPRS日常故障及指标异常处理措施精
华为设备GPRS日常故障及指标异常处理措施(精)
华为设备GPRS日常故障及指标异常处理
措施
整理:
中国联通广西分公司网优中心文档技术支持:
华为技术有限公司
日期:
2009年2月
一、概述:
GPRS话统指标异常处理措施
3
一)、资源利用率分析
4
二)、接续性能分析
……5
三)、掉话性能分析
……6
四)、传输性能分析
……6
二、日常故障异常处理措施
7
1)104
PCU所有PBSL链路故障7
2)105
PBSL链路单通8
3)106
PCIC校验不一致9
4)127
BSC未配置电路告警(Pb接口)9
5)128
PCU未配置电路告警10
6)134
BSC闭塞PCIC电路失败告警10
7)135
BSC解闭PCIC电路失败告警11
8)293
Gb接口承载通道故障告警11
9)331
NSVC中断告警12
10)332
NSVL故障告警12
11)333
NSE故障告警13
12)340
小区分组业务故障13
13)343
NSVL动态配置流程失败14
说明:
为方便各分公司网优中心对日常GPRS
业务的投诉、故障、统计指标性能下降等的问题处理,网优中心收集、整理了华为设备对相应问题处理的技术文档,给各分公司进行参考,但在处理重大问题上应结合实际情况咨询华为工程师。
GPRS关键网络指标:
上/下行TBF建立成功率、上行重传率
GPRS
优化主要在保障资源的情况下,尽可能的提升无线环境质量,提升资源利用率,提升核心网性能
、概述:
GPRS话统指标异常处理措施
GPRS系统提供了完善的性能测量管理系统,完成对CPU
性能、Um接口性能、PCU整体性能等方面的测量。
这对了解GPRS
系统的性能、优化整个GPRS系统以及对整个GPRS
系统进行故障定位提供了强有力的数据支持。
图1GPRS话统分析思路
进行GPRS话统数据分析,主要是达到故障处理、网络性能优化和建立分组话务模型的目的。
GPRS话统分析的整体思路如图1所示。
其原则是:
结合PCU话统KPI基线,从BSC整体到小区局部,从底层链路到上层业务,从异常现象定位到分析话务模型的步骤逐层深入。
在话统分析之前,应该对PCU数据配置、小区PDCH配置、分组数据话务量分布等GPRS网络参数设置有基本的了解。
由于GPRS网络和GSM之间的不可分割性,因此也需要对GSM网络结构有一定了解,尤其与GPRS相关的网络参数设置,以及GSM电路域话务量状况等。
在GPRS运营初期,分组业务尚无成熟的话务模型理论支撑,需要着重进行分组话务模型相关数据的积累和分
PCU
话统分析主要包括资源利用率、接续性能、掉话性能(保持性、传输性能(Um口、
G-Abis口等四个方面。
主要的KPI指标和相关的GPRS话统项如下表所示。
指标分类名称参考公式原始COUNTER
PDCH占用率
占用PDCH个数/可用PDCH个数占用PDCH个数;可用PDCH个数
资源利用率
BSC回收有负载动态PDCH比率
BSC回收有负载动态PDCH次数/BSC回收动态PDCH次数
BSC回收有负载动态PDCH次数;BSC回收动态PDCH次数
上行TBF建立成功率
上行TBF建立成功次数/上行TBF建立尝试次数
上行TBF建立成功次数;上行TBF建立尝试次数
下行TBF建立成功率
下行TBF建立成功次数/下行TBF建立尝试次数
下行TBF建立成功次数;下行TBF建立尝试次数
上行TBF拥塞率无信道资源导致上行TBF建立失败次数/上行TBF
建立尝试次数
上行TBF建立尝试次数;无信道资源导致上行TBF建立失败次数接续性能
下行TBF拥塞率无信道资源导致下行TBF建立失败次数+/下行TBF
建立尝试次数
下行TBF建立尝试次数;无信道资源导致下行TBF建立失败次数上行TBF
掉话率
(N3101溢出导致上行TBF异常释放次数+N3103溢出导致上行TBF异常释放次数/上行TBF建立成功次数
上行TBF建立成功次数;
N3101溢出导致上行TBF异常释放次数;N3103溢出导致上行TBF异常释放次数掉话性能
下行TBF掉话率N3105溢出导致下行异常TBF释放次数/下行TBF建立成功次数
下行TBF建立成功次数;
N3105溢出导致下行异常TBF释放次数上行GPRSRLC数据块重传率
1—BSS侧接收到的上行GPRSRLC数据块总数/MS发送的上行GPRSRLC数据块总数
MS发送的上行RLC数据块总数;BSS侧接收到的上行CS1~4BRLC数据块数Um口
下行GPRSRLC数据块重传率
1—MS接收到的下行GPRSRLC数据块总数/BSS侧发送的下行GPRSRLC数据块总数
BSS侧发送的下行RLC数据块总数;MS接收到的下行CS1~4的RLC数据块数传输性能
G-Abis
口
G-Abis口误帧率
接收校验错帧的个数/接收正常帧的个数
接收正常帧的个数;接收失步帧的个数;接收校验错帧的个数;发送有效帧
的个数;发送空帧的个数
一)、资源利用率分析
资源利用率KPI分析的是PDCH信道数据,主要用于判断GPRS系统是否超负荷运行。
通过资源利用率KPI分析,可以建立网络PDCH资源使用模型,或根据已有的模型对PDCH配置进行规划和调整。
1.
PDCH占用率(%
含义:
该指标主要反映了正在使用的PDCH信道数占可用PDCH
信道数的比例。
参考值:
无
影响:
从该指标可以看出小区分组业务的忙闲状况,在一定程度上反映了小区的分组业务忙闲状态。
如果此指标的值接近100%,说明当前小区的分组业务较忙,需要增加PDCH信道数目。
2.BSC回收有负载动态PDCH比率(%
含义:
BSC将有负载的动态PDCH转换为TCH的比例。
参考值:
无
影响:
通过该指标可以了解电路业务对分组业务的抢占情况。
如果此值过高
,说明当前小区CS业务与PS业务量都很大,配置的动态PDCH信道已经无法正常被PS业务占用,需要推动扩容,并在扩容的基础上增加静态PDCH信道的配置数目。
二)、接续性能分析
接续性能KPI
主要是判断当前小区分组业务接入性能的指标。
它与数据配置、网络容量、信道质量、电路业务繁忙程度和分组业务繁忙程度等多方面因素相关。
其中需要强调
的是,关于拥塞率的统计中,将无信道导致的TBF
异常释放记入其中,目的是为了拥塞后的指标表现更明显,但也可能导致拥塞率统计指标偏高,引起客户不满,所以在运用这一KPI
指标计算公式时,需要根据现场情况灵活处理。
1.上行TBF建立成功率
含义:
上行TBF建立成功占整个上行TBF建立请求的比例。
参考值:
>=90%
影响:
该指标值可用来反映小区的GPRS
服务质量。
如果其值较低,说明无线环境、网络参数配置、网络资源配置、网络设备等可能存在问题,需要优化。
A类网络中,上行TBF建立成功率一般在95%以上,C类网络一般在90%左右。
2.下行TBF建立成功率
含义:
下行TBF建立成功占整个下行TBF建立请求的比例。
参考值:
>=88%
影响:
该指标值可用来反映小区的GPRS
服务质量。
如果其值较低,说明无线环境、网络参数配置、网络资源配置、网络设备等可能存在问题,需要优化。
另外需要说明的是,一般正常网络中此指标只能达到80%左右,因为部分下行指配消息”下发后,会由于MS位置的改变而得不到MS的回应,导致下行TBF
建立失败。
所以此指标比上行指配成功率指标稍低。
A类网络中,上行TBF
建立成功率一般在92%以上,C类网络一般在88%左右。
3.上行TBF拥塞率(%
含义:
该指标反映了无信道资源导致的上行TBF建立失败次数占上行TBF建立尝试总数的比例。
参考值:
<=1%
影响:
如果该值较高,可能是因为小区的无线信道资源不足或无线信道故障。
也可能是因为无线信道故障频繁或人工操作闭塞信道。
只要保证足够的静态和动态PDCH信道的数目,此KPI一般小于1%,处于比较良好的水平。
4.
下行TBF拥塞率(%
含义:
该指标反映了无信道资源导致的上行TBF建立失败次数占上行TBF
建立尝试总数
的比例。
参考值:
<=1%
影响:
如果该值较高,可能是因为小区的无线信道资源不足或无线信道故障。
也
可能是因为无线信道故障频繁或人工操作闭塞信道。
只要保证足够的静态和动态P
DCH信道的数目,此KPI—般小于1%,处于比较良好的水平。
三)、掉话性能分析
掉话性能(保持性KPI分析主要是分析网络掉话率。
由于目前GPRS
网络没有实现小区切换,完全是手机自主重选小区,若在传输中重选小区必然造成掉话。
只是由于TBF
传输时间原本较短(平均2~3秒,因此掉话率虽比语音系统相对要高一些,但对业务的影响较小。
分组掉话率高与小区的无线质量、话务量、手机的行为都有密切的相关,需要结合各种可能的因素进行具体分析。
1.上行TBF掉话率(%
含义:
上行链路监控计数器N3101和N3103溢出导致TBF
异常释放的次数占上行TBF建立成功次数的比例。
参考值:
<=8%
影响:
TBF异常释放的原因有多个方面,如动态PDCH信道被CS
业务抢占,MS发起小区更新等原因,但此KPI关注的是无线质量导致的TBF掉话,如果该值较高,可能是因为小区的无线质量不好。
2.下行TBF掉话率(%
含义:
下行链路监控计数器N3105溢出导致TBF异常释放的次数占下行TBF建立成功次数的比例。
参考值:
<=8%
影响:
TBF异常释放的原因有多个方面,如动态PDCH信道被CS
业务抢占,MS发起小区更新等原因,但此KPI关注的是无线质量导致的TBF掉话,如果该值较高,可能是因为小区的无线质量不好。
四)、传输性能分析
小区传输链路指从手机到GPRS核心网的整条传输路径,包括:
小区的Um
接口、G-Abis接口、Pb接口和Gb
接口。
链路传输质量是业务性能的基础,特别是分组业务,如果链路质量不好,必然影响GPRS/EGPRS网络整体性能,对分组用户的感受造成负面影响。
3.
上行GPRSRLC数据块重传率(%
含义:
BSS侧接收到的上行GPRSRLC数据块(CS1〜4的重传率。
参考值:
<=2%影响:
该指标反映了Um口和G-Abis
的传输质量。
如果此指标较差,说明Um口质量或者BSC与PCU之间的地面链路质量较差,结合G-Abis接口误帧率KPI分析,就能得出Um口无线质量的好坏。
4.上行EGPRSRLC数据块重传率(%
含义:
BSS侧接收到的上行EGPRSRLC数据块(MCS1〜9的重传率。
参考值:
<=2%
影响:
此KPI
指标的影响与上面的类似,不同之处在于它的统计对象为EGPRS
无线块,对无线环境质量的要求更高。
5.下行GPRSRLC数据块重传率(%
含义:
MS侧接收到的下行GPRSRLC数据块(CS1〜4的重传率。
参考值:
<=8%
影响:
此KPI
指标的影响与上面的类似,反映链路传输质量的好坏。
由于PCU
产品中引入了下行TBF
延时释放流程,在延时释放的时间内,网络侧需要重传最后一个数据块,导致下行数据块重传率的值可能偏大,但对网络性能没有影响。
6.下行EGPRSRLC数据块重传率(%
含义:
MS侧接收到的下行EGPRSRLC数据块(MCS1〜9的重传率。
参考值:
<=5%
影响:
此KPI指标对网络性能的影响与3中类似。
7.G-Abis口误帧率(%
含义:
接收校验错帧的个数占接收正常帧的个数的比例。
参考值:
<=0.05%
影响:
该指标反映了网络链路层的传输质量。
正常情况下误帧率都小于10e-5
,即万分之一。
如果此KPI值过大,说明当前Pb
接口链路质量不好,对数据的传输性能影响将会非常大,需要联系BSS
工程师协助检查链路质量,改善地面链路的传输。
二、日常故障异常处理措施
1)104PCU所有PBSL链路故障
告警解释:
BSC和PCU之间的所有PBSL链路故障
对系统的影响:
该PCU所带小区下的用户无法进行分组业务
系统自处理过程:
BSC内部停发GPRS系统消息;BSC内部释放PDCH信道。
可能原因:
Pb口E1/T1线路故障;?
接口板(GEIUP/GOIUP)运行异常;?
本端和PCU端链路配置数据不一致;?
PCU侧信令链路人工闭塞,或阻断;?
PCU设备故障。
处理步骤
1.查看是否有E1/T1相关故障告警(20081E1/T1信号丢失告警(LOS,20082E1/T1帧
失步告警(LOF,20083E1/T1远端告警(RAI,20084E1/T1告警指示信号(AIS。
Y=>有,参见E1/T1相关故障告警修复建议;
N=>没有,转步骤2。
2.检查本端和PCU端的接口板是否运行正常。
Y=>本端和PCU端的接口板正常,转步骤3;
N=>本端和PCU端的接口板不正常,复位单板,观察告警是否恢复,如果告警未恢复,联系华为客户服务中心。
3.检查本端和PCU端链路配置数据是否一致。
Y=>数据不一致,PCU或BSC修改数据,保证两端一致;
N=>数据一致,转步骤4
4.请联系PCU维护工程师进行确认PCU侧信令链路是否人为阻断。
Y=>人为阻断,告警正常,告警处理结束;
N=>不是人为阻断,转步骤5。
5.请联系PCU维护工程师检查PCU设备是否故障。
Y=>PCU设备故障,告警正常,告警处理结束;
N=>PCU设备未故障,联系华为客户服务中心。
2)105PBSL链路单通
告警解释:
BSC与PCU之间的某条PBSL链路存在单通现象
对系统的影响:
如果PCU设备运行异常,将会造成该PCU
所带小区下的用户无法进行分组业
系统自处理过程:
系统自处理过程继续在该条链路上发送单通检测消息
可能原因
?
BSC打开了“P链路单通检测”功能,但PCU
设备的版本不支持此项功能(不影响该PCU所带小区的分组业务;?
PCU
设备运行异常。
处理步骤
1.检查BSC的“P链路单通检测”是否打开并且联系PCU维护工程师检查PCU
版本是
否不支持此功能。
Y=>在BSC上关闭PB链路单通检测功能或联系PCU维护工程师安装支持PB链路单通检测的PCU版本。
N=>PCU设备故障,转步骤2
2.请联系PCU维护工程师检查PCU设备是否故障。
Y=>PCU设备故障,告警正常,告警处理结束;N=>PCU设备未故障,请联系华为客户服务中心。
3)106PCIC校验不一致
告警解释:
BSC与PCU之间的某条PBSL链路PCIC校验不一致
对系统的影响:
该E1端口上的分组业务信道数量受到影响
系统自处理过程:
闭塞与PCU侧不一致的PCIC
可能原因:
BSC侧和PCU侧配置的起始PCIC不一致
处理步骤:
检查本端和PCU端链路配置数据是否一致。
Y=>数据不一致,PCU或BSC修改数据,保证两端一致;
N=>数据一致,请联系华为客户服务中心。
4)127BSC未配置电路告警(Pb接口)
告警解释:
BSC侧未配置告警标识的电路,而PCU侧配置了该电路。
对系统的影响:
该电路无法分配
系统自处理过程:
不做处理
可能原因:
BSC与PCU配置的PCIC不一致(配置的PCIC数目或者PCIC范围);
BSC与PCU电路配置状态不一致。
处理步骤:
01.检查BSC与PCU配置的PCIC是否一致(配置的PCIC数目或者PCIC范围)。
丫=>一致,转步骤2。
N=>不一致,在PCU侧删除多配置的PCIC电路数据,或者在BSC侧增加缺少的PCIC电路数
02.检查BSC与PCU配置的PCIC状态是否一致。
Y=>一致,请联系华为客户服务中心。
N=>不一致,修改BSC或者PCU的PCIC状态,保证两端一致;
5)128PCU未配置电路告警
告警解释:
PCU侧未配置告警标识的电路,而BSC侧配置了该电路。
对系统的影响:
无
系统自处理过程:
不做处理。
可能原因:
BSC与PCU配置的PCIC不一致(配置的PCIC数目或者PCIC范围);
BSC与PCU电路配置状态不一致。
处理步骤:
01.检查BSC与PCU配置的PCIC是否一致(配置的PCIC数目或者PCIC范围)。
丫=>一致,转步骤2;
N=>不一致,在BSC侧删除多配置的PCIC电路数据,或者在PCU侧增加缺少的PCIC电路数据。
02.检查BSC与PCU配置的PCIC状态是否一致。
Y=>一致,请联系华为客户服务中心;
N=>不一致,修改BSC或者PCU的PCIC状态,保证两端一致。
6)134BSC闭塞PCIC电路失败告警
告警解释:
BSC向PCU发送电路闭塞消息,连续发送n次都没有收到PCU的应答消息,此时会产生此告警。
其中,n是从LMT
读取“P接口维护消息最大重发次数”参数n设置:
LMT->配置BSC属性->软参)。
对系统的影响:
BSC和PCU电路状态不一致,如果PCU
分配此电路进行分组业务,则此次业务会失败。
系统自处理过程:
不做处理。
可能原因:
BSC和PCU之间的LPAD信令链路故障。
处理步骤:
01.查看是否有E1/T1相关故障告警(20081E1/T1信号丢失告警(LOS,20082E1/T1帧失步
告警(LOF,20083E1/T1远端告警(RAI,20084E1/T1告警指示信号(AIS。
Y=>有,参见E1/T1相关故障告警修复建议,此告警处理结束;
N=>没有,转步骤2。
02.联系PCU维护工程师检查PCU侧信令链路是否人为阻断。
Y=>人为阻断,告警正常,告警处理结束;
N=>不是人为阻断,转步骤3。
03.请联系PCU维护工程师检查PCU设备是否故障。
Y=>PCU设备故障,告警正常,告警处理结束;
N=>PCU设备未故障,联系华为客户服务中心