1、华为设备GPRS日常故障及指标异常处理措施精华为设备GPRS日常故障及指标异常处理措施 整理:中国联通广西分公司网优中心 文档技术支持:华为技术有限公司日期:2009年2月目录一、概述:GPRS话统指标异常处理措施.3一)、资源利用率分析.4 二)、接续性能分析.5 三)、掉话性能分析.6 四)、传输性能分析.6 二、日常故障异常处理措施.71)104 PCU所有PBSL链路故障.7 2)105 PBSL链路单通.8 3)106 PCIC校验不一致.9 4)127 BSC未配置电路告警(Pb接口).9 5)128 PCU未配置电路告警.10 6)134 BSC闭塞PCIC电路失败告警.10 7
2、)135 BSC解闭PCIC电路失败告警.11 8)293 Gb接口承载通道故障告警.11 9)331 NSVC中断告警.12 10)332 NSVL故障告警.12 11)333 NSE故障告警.13 12)340 小区分组业务故障.13 13)343 NSVL动态配置流程失败.14说明:为方便各分公司网优中心对日常GPRS 业务的投诉、故障、统计指标性能下降等的问题处理,网优中心收集、整理了华为设备对相应问题处理的技术文档,给各分公司进行参考,但在处理重大问题上应结合实际情况咨询华为工程师。GPRS 关键网络指标:上/下行TBF 建立成功率、上行重传率GPRS 优化主要在保障资源的情况下,尽
3、可能的提升无线环境质量,提升资源利用率,提升核心网性能。一、概述:GPRS话统指标异常处理措施GPRS 系统提供了完善的性能测量管理系统,完成对CPU 性能、Um接口性能、PCU整体性能等方面的测量。这对了解GPRS 系统的性能、优化整个GPRS 系统以及对整个GPRS 系统进行故障定位提供了强有力的数据支持。 图1 GPRS 话统分析思路进行GPRS话统数据分析,主要是达到故障处理、网络性能优化和建立分组话务模型的目的。GPRS话统分析的整体思路如图1所示。其原则是:结合PCU话统KPI基线,从BSC整体到小区局部,从底层链路到上层业务,从异常现象定位到分析话务模型的步骤逐层深入。在话统分析
4、之前,应该对PCU数据配置、小区PDCH配置、分组数据话务量分布等GPRS网络参数设置有基本的了解。由于GPRS网络和GSM之间的不可分割性,因此也需要对GSM网络结构有一定了解,尤其与GPRS相关的网络参数设置,以及GSM电路域话务量状况等。在GPRS运营初期,分组业务尚无成熟的话务模型理论支撑,需要着重进行分组话务模型相关数据的积累和分析。PCU 话统分析主要包括资源利用率、接续性能、掉话性能(保持性、传输性能(Um口、G-Abis 口等四个方面。主要的KPI 指标和相关的GPRS 话统项如下表所示。 指标分类名称参考公式 原始COUNTERPDCH 占用率占用PDCH 个数 / 可用PD
5、CH 个数 占用PDCH 个数;可用PDCH 个数资源利用率BSC 回收有负载动态PDCH 比率BSC 回收有负载动态PDCH 次数 / BSC 回收动态PDCH 次数BSC 回收有负载动态PDCH 次数; BSC回收动态PDCH 次数上行TBF 建立成功率上行TBF 建立成功次数/上行TBF 建立尝试次数上行TBF 建立成功次数;上行TBF 建立尝试次数下行TBF 建立成功率下行TBF 建立成功次数/下行TBF 建立尝试次数下行TBF 建立成功次数;下行TBF 建立尝试次数上行TBF 拥塞率 无信道资源导致上行TBF 建立失败次数 / 上行TBF 建立尝试次数上行TBF 建立尝试次数;无信道
6、资源导致上行TBF 建立失败次数 接续性能下行TBF 拥塞率 无信道资源导致下行TBF 建立失败次数+ / 下行TBF 建立尝试次数下行TBF 建立尝试次数;无信道资源导致下行TBF 建立失败次数 上行TBF 掉话率(N3101溢出导致上行TBF 异常释放次数 + N3103溢出导致上行TBF 异常释放次数/上行TBF 建立成功次数上行TBF 建立成功次数;N3101溢出导致上行TBF 异常释放次数;N3103溢出导致上行TBF 异常释放次数 掉话性能下行TBF 掉话率 N3105溢出导致下行异常TBF 释放次数 / 下行TBF 建立成功次数下行TBF 建立成功次数;N3105溢出导致下行异常
7、TBF 释放次数 上行GPRS RLC数据块重传率1BSS 侧接收到的上行GPRS RLC数据块总数 / MS发送的上行GPRS RLC数据块总数MS 发送的上行RLC 数据块总数;BSS 侧接收到的上行CS14的RLC 数据块数 Um 口下行GPRS RLC数据块重传率1MS 接收到的下行GPRS RLC数据块总数 / BSS 侧发送的下行GPRS RLC数据块总数BSS 侧发送的下行RLC 数据块总数;MS 接收到的下行CS14的RLC 数据块数 传输性能G-Abis口G-Abis 口误帧率接收校验错帧的个数 /接收正常帧的个数接收正常帧的个数;接收失步帧的个数;接收校验错帧的个数;发送有
8、效帧的个数;发送空帧的个数一)、资源利用率分析资源利用率KPI 分析的是PDCH 信道数据,主要用于判断GPRS 系统是否超负荷运行。通过资源利用率KPI 分析,可以建立网络PDCH 资源使用模型,或根据已有的模型对PDCH 配置进行规划和调整。 1. PDCH占用率(%含义:该指标主要反映了正在使用的PDCH 信道数占可用PDCH 信道数的比例。 参考值:无影响:从该指标可以看出小区分组业务的忙闲状况,在一定程度上反映了小区的分组业务忙闲状态。如果此指标的值接近100,说明当前小区的分组业务较忙,需要增加PDCH 信道数目。2. BSC回收有负载动态PDCH比率(%含义:BSC将有负载的动态
9、PDCH 转换为TCH 的比例。 参考值:无影响:通过该指标可以了解电路业务对分组业务的抢占情况。如果此值过高,说明当前小区CS 业务与PS 业务量都很大,配置的动态PDCH 信道已经无法正常被PS 业务占用,需要推动扩容,并在扩容的基础上增加静态PDCH 信道的配置数目。二)、接续性能分析接续性能KPI 主要是判断当前小区分组业务接入性能的指标。它与数据配置、网络容量、信道质量、电路业务繁忙程度和分组业务繁忙程度等多方面因素相关。其中需要强调的是,关于拥塞率的统计中,将无信道导致的TBF 异常释放记入其中,目的是为了拥塞后的指标表现更明显,但也可能导致拥塞率统计指标偏高,引起客户不满,所以在
10、运用这一KPI 指标计算公式时,需要根据现场情况灵活处理。 1. 上行TBF建立成功率含义:上行TBF 建立成功占整个上行TBF 建立请求的比例。 参考值:=90影响:该指标值可用来反映小区的GPRS 服务质量。如果其值较低,说明无线环境、网络参数配置、网络资源配置、网络设备等可能存在问题,需要优化。A类网络中,上行TBF 建立成功率一般在95以上,C类网络一般在90左右。 2. 下行TBF建立成功率含义:下行TBF 建立成功占整个下行TBF 建立请求的比例。 参考值:=88影响:该指标值可用来反映小区的GPRS 服务质量。如果其值较低,说明无线环境、网络参数配置、网络资源配置、网络设备等可能
11、存在问题,需要优化。另外需要说明的是,一般正常网络中此指标只能达到80左右,因为部分“下行指配消息”下发后,会由于MS 位置的改变而得不到MS 的回应,导致下行TBF 建立失败。所以此指标比上行指配成功率指标稍低。A类网络中,上行TBF 建立成功率一般在92以上,C类网络一般在88左右。 3. 上行TBF拥塞率(%含义:该指标反映了无信道资源导致的上行TBF 建立失败次数占上行TBF 建立尝试总数的比例。参考值:=1%影响:如果该值较高,可能是因为小区的无线信道资源不足或无线信道故障。也可能是因为无线信道故障频繁或人工操作闭塞信道。只要保证足够的静态和动态PDCH 信道的数目,此KPI 一般小
12、于1,处于比较良好的水平。 4. 下行TBF拥塞率(%含义:该指标反映了无信道资源导致的上行TBF 建立失败次数占上行TBF 建立尝试总数的比例。参考值:=1% 影响:如果该值较高,可能是因为小区的无线信道资源不足或无线信道故障。也可能是因为无线信道故障频繁或人工操作闭塞信道。只要保证足够的静态和动态PDCH 信道的数目,此KPI 一般小于1,处于比较良好的水平。三)、掉话性能分析掉话性能(保持性KPI分析主要是分析网络掉话率。由于目前GPRS 网络没有实现小区切换,完全是手机自主重选小区,若在传输中重选小区必然造成掉话。只是由于TBF 传输时间原本较短(平均23秒,因此掉话率虽比语音系统相对
13、要高一些,但对业务的影响较小。分组掉话率高与小区的无线质量、话务量、手机的行为都有密切的相关,需要结合各种可能的因素进行具体分析。1. 上行TBF掉话率(%含义:上行链路监控计数器N3101和N3103溢出导致TBF 异常释放的次数占上行TBF 建立成功次数的比例。参考值:=8%影响:TBF 异常释放的原因有多个方面,如动态PDCH 信道被CS 业务抢占,MS 发起小区更新等原因,但此KPI 关注的是无线质量导致的TBF 掉话,如果该值较高,可能是因为小区的无线质量不好。2. 下行TBF掉话率(%含义:下行链路监控计数器N3105溢出导致TBF 异常释放的次数占下行TBF 建立成功次数的比例。
14、参考值:=8%影响:TBF 异常释放的原因有多个方面,如动态PDCH 信道被CS 业务抢占,MS 发起小区更新等原因,但此KPI 关注的是无线质量导致的TBF 掉话,如果该值较高,可能是因为小区的无线质量不好。四)、传输性能分析小区传输链路指从手机到GPRS 核心网的整条传输路径,包括:小区的Um 接口、G-Abis 接口、Pb接口和Gb 接口。链路传输质量是业务性能的基础,特别是分组业务,如果链路质量不好,必然影响GPRS/EGPRS网络整体性能,对分组用户的感受造成负面影响。 3. 上行GPRS RLC数据块重传率(%含义:BSS侧接收到的上行GPRS RLC数据块(CS14的重传率。参考
15、值:=2% 影响:该指标反映了Um 口和G-Abis 的传输质量。如果此指标较差,说明Um 口质量或者BSC 与PCU 之间的地面链路质量较差,结合G-Abis 接口误帧率KPI 分析,就能得出Um 口无线质量的好坏。4. 上行EGPRS RLC数据块重传率(%含义:BSS侧接收到的上行EGPRS RLC数据块(MCS19的重传率。参考值:=2%影响:此KPI 指标的影响与上面的类似,不同之处在于它的统计对象为EGPRS 无线块,对无线环境质量的要求更高。5. 下行GPRS RLC数据块重传率(%含义:MS侧接收到的下行GPRS RLC数据块(CS14的重传率。参考值:=8%影响:此KPI 指
16、标的影响与上面的类似,反映链路传输质量的好坏。由于PCU 产品中引入了下行TBF 延时释放流程,在延时释放的时间内,网络侧需要重传最后一个数据块,导致下行数据块重传率的值可能偏大,但对网络性能没有影响。6. 下行EGPRS RLC数据块重传率(%含义:MS侧接收到的下行EGPRS RLC数据块(MCS19的重传率。参考值:=5%影响:此KPI 指标对网络性能的影响与3中类似。 7. G-Abis口误帧率(%含义:接收校验错帧的个数占接收正常帧的个数的比例。参考值:有,参见E1/T1相关故障告警修复建议;N=没有,转步骤2。2. 检查本端和PCU端的接口板是否运行正常。Y=本端和PCU端的接口板
17、正常,转步骤3;N=本端和PCU端的接口板不正常,复位单板,观察告警是否恢复,如果告警未恢复,联系华为客户服务中心。3. 检查本端和PCU端链路配置数据是否一致。Y=数据不一致,PCU或BSC 修改数据,保证两端一致;N=数据一致,转步骤4。4. 请联系PCU 维护工程师进行确认PCU 侧信令链路是否人为阻断。Y=人为阻断,告警正常,告警处理结束;N=不是人为阻断,转步骤5。5. 请联系PCU 维护工程师检查PCU 设备是否故障。Y=PCU设备故障,告警正常,告警处理结束; N=PCU设备未故障,联系华为客户服务中心。2)105 PBSL链路单通告警解释:BSC 与PCU 之间的某条PBSL
18、链路存在单通现象对系统的影响:如果PCU 设备运行异常,将会造成该PCU 所带小区下的用户无法进行分组业系统自处理过程:系统自处理过程继续在该条链路上发送单通检测消息可能原因BSC 打开了“PB链路单通检测”功能,但PCU 设备的版本不支持此项功能(不影响该PCU 所带小区的分组业务; PCU 设备运行异常。处理步骤1. 检查BSC 的“PB链路单通检测”是否打开并且联系PCU 维护工程师检查PCU 版本是否不支持此功能。Y=在BSC 上关闭PB 链路单通检测功能或联系PCU 维护工程师安装支持PB 链路单通检测的PCU 版本。N=PCU设备故障,转步骤22. 请联系PCU 维护工程师检查PC
19、U 设备是否故障。Y=PCU设备故障,告警正常,告警处理结束; N=PCU设备未故障,请联系华为客户服务中心。3)106 PCIC校验不一致告警解释:BSC 与PCU 之间的某条PBSL 链路PCIC 校验不一致对系统的影响:该E1端口上的分组业务信道数量受到影响系统自处理过程:闭塞与PCU 侧不一致的PCIC可能原因:BSC 侧和PCU 侧配置的起始PCIC 不一致处理步骤:检查本端和PCU 端链路配置数据是否一致。Y=数据不一致,PCU或BSC 修改数据,保证两端一致;N=数据一致,请联系华为客户服务中心。4)127 BSC未配置电路告警(Pb接口)告警解释:BSC 侧未配置告警标识的电路
20、,而PCU 侧配置了该电路。对系统的影响:该电路无法分配系统自处理过程:不做处理。可能原因:BSC 与PCU 配置的PCIC 不一致(配置的PCIC 数目或者PCIC 范围);BSC 与PCU 电路配置状态不一致。处理步骤:01. 检查BSC 与PCU 配置的PCIC 是否一致(配置的PCIC 数目或者PCIC 范围)。 Y=一致,转步骤2。N=不一致,在PCU 侧删除多配置的PCIC 电路数据,或者在BSC 侧增加缺少的PCIC 电路数02. 检查BSC 与PCU 配置的PCIC 状态是否一致。Y=一致,请联系华为客户服务中心。N=不一致,修改BSC 或者PCU 的PCIC 状态,保证两端一
21、致;5)128 PCU未配置电路告警告警解释:PCU 侧未配置告警标识的电路,而BSC 侧配置了该电路。对系统的影响:无系统自处理过程:不做处理。可能原因:BSC 与PCU 配置的PCIC 不一致(配置的PCIC 数目或者PCIC 范围);BSC 与PCU 电路配置状态不一致。处理步骤:01. 检查BSC 与PCU 配置的PCIC 是否一致(配置的PCIC 数目或者PCIC 范围)。 Y=一致,转步骤2;N=不一致,在BSC 侧删除多配置的PCIC 电路数据,或者在PCU 侧增加缺少的PCIC 电路数据。02. 检查BSC 与PCU 配置的PCIC 状态是否一致。Y=一致,请联系华为客户服务中
22、心;N=不一致,修改BSC 或者PCU 的PCIC 状态,保证两端一致。6)134 BSC闭塞PCIC 电路失败告警告警解释:BSC 向PCU 发送电路闭塞消息,连续发送n 次都没有收到PCU 的应答消息,此时会产生此告警。其中,n是从LMT 读取“Pb接口维护消息最大重发次数”(参数n 设置:LMT-配置BSC 属性-软参)。对系统的影响:BSC 和PCU 电路状态不一致,如果PCU 分配此电路进行分组业务,则此次业务会失败。 系统自处理过程:不做处理。可能原因:BSC 和PCU 之间的LPAD 信令链路故障。处理步骤:01. 查看是否有E1/T1相关故障告警(20081 E1/T1信号丢失告警(LOS,20082 E1/T1帧失步告警(LOF,20083 E1/T1远端告警(RAI,20084 E1/T1告警指示信号(AIS。Y=有,参见E1/T1相关故障告警修复建议,此告警处理结束;N=没有,转步骤2。02. 联系PCU 维护工程师检查PCU 侧信令链路是否人为阻断。Y=人为阻断,告警正常,告警处理结束;N=不是人为阻断,转步骤3。03. 请联系PCU 维护工程师检查PCU 设备是否故障。Y=PCU设备故障,告警正常,告警处理结束;N=PCU设备未故障,联系华为客户服务中心。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1