华为OMC话统分析流程汇总.docx
《华为OMC话统分析流程汇总.docx》由会员分享,可在线阅读,更多相关《华为OMC话统分析流程汇总.docx(26页珍藏版)》请在冰豆网上搜索。
华为OMC话统分析流程汇总
华为OMC分析流程
华为技术服务有限公司
2019年1月5日
一、OMCR分析总体流程图
否
是
图1OMCR总体流程图
二、网络评估和检查
1、网络评估流程图
图2网络评估流程图
2、网络结构分析
采集本业务区和相邻业务区的相关信息表,包括BSC号、LAC号、基站号、Cell_id、载频数、硬件配置、经纬度等相关信息;同时将这些信息集中在一个数据库文档中。
这份数据库文档为后续性能指标分析、最差小区分析等工作提供分析依据和数据。
采集本业务区和相邻业务区的行政电子地图;同时依据数据库文档中的基站信息表,制作相应的Mapinfo图层,例如:
按归属业务区、归属MSC、归属LAC,制作对应的专题图层,按本业务区及相邻业务区基站的分布及MSC间切换区域、BSC区域、LAC区的划分等等。
MSC、BSC、LAC区的容量分布尽量做到均匀,结构简单,清晰。
基站分布尽量呈网格结构,BSC,MSC、LAC区边界尽量避开话务密集区或重要的地区。
3、网络性能评估
整个OMC的分析思路是:
从面到点的进行问题定位和分析。
在了解一个网络的网络质量时我们一般都先通过话统来了解其网络运行情况,先对BSC整体性能/C1报表这个统计功能子项进行研究和对比分析,如果在BSC整体性能/C1报表统计中发现某个重要指标(如掉话率、切换成功率)有异常情况时,我们再对其相应更详细的内容具体分析。
分析网络性能的时候不能只看某一天和某一段时间的话统数据,这样分析比较片面。
而应该分析一段时间内的话统指标。
一般我们取一周的忙时话统数据平均值来把握网络的性能,同时观察在话务量基本稳定的情况下,有无明显的指标波动情况存在。
●系统性
→自上而下,从整体到局部
●整体性
→查看一周以上的指标变化趋势和每天的变化趋势
●相关性
→各种话务统计指标之间的联系
指标名称和评估标准:
如切换成功率、掉话率、拥塞率、无线接通率等指标。
表1KPI指标
KPI
指标含义
测试方法
参考值
1
TCH拥塞率
TCH占用成功次数/TCH占用请求次数×100%
OMC
<3%
2
SDCCH拥塞率
SD占用成功次数/SD占用请求次数×100%
OMC
<0.8%
3
掉话率
TCH掉话次数/TCH占用成功次数×100%
OMC
<1.2%
4
切换成功率
切换成功次数/切换请求次数×100%
OMC
>92%
5
无线接通率
(1-TCH拥塞率)*(1-SDCCH拥塞率)
OMC
>99.2%
4、告警检查及硬件排障处理
网络优化通常应当是在硬件设备运行正常的前提下进行,但是由于网上设备的突发故障,无法保证运行正常,但往往硬件故障将会对网络指标有很大影响,所以我们在明确整网运行情况后,需要对告警信息进行查阅,以便及时发现问题进行故障排除。
BSC告警模块接收各个应用层发送过来的告警信息,对之进行分析,去掉已屏蔽的信息,然后产生相应的告警和告警恢复信息下发到告警箱和下发给后台显示。
BSC告警系统实现原理:
分散控制,集中管理。
如下图所示:
图3告警分析流程图
目前BAM对故障告警有过滤机制,原理是:
BAM中有一个故障告警队列,当前台将故障告警发到BAM后,BAM首先检查自己的故障告警队列,看是否有同样故障告警在队列中,如果队列中已经有了该故障告警,则BAM认为该故障告警为重复故障告警将其丢弃,如果队列中没有该故障告警,则将该故障告警写入队列,同时将该故障告警转发到SERVER上去;当前台将恢复告警发到BAM后,BAM首先检查自己的故障告警队列,看是否存在与其对应的故障告警在队列中,如果队列中没有与其对应的故障告警,则BAM认为该恢复告警为重复恢复告警将其丢弃,如果队列中存在与其对应的故障告警,则从队列中清除与其对应的故障告警,同时将该恢复告警转发到SERVER上去。
告警按照功能类型可分为四类,分别是:
电源类、模块功能类、告警箱类、外部环境类。
告警信息按故障的严重程度,告警信号的性质可分为四级:
紧急告警:
需紧急处理,否则会影响重要功能实现。
对应红色指示灯,急促铃。
重要告警:
需要及时处理,否则会影响重要功能实现。
对应红色指示灯,次急促铃。
一般告警:
发送此类告警的目的是提醒维护人员及时查找告警原因,消除故障隐患。
对应黄灯,断续铃。
提示告警:
对此类告警,维护人员不用及时处理,只要对交换机的运行状况心中有数。
对应绿灯,单次铃。
通常我们要关注有没有BSC的一些故障告警、CPU占用情况和BTS的一些可能会影响业务的告警,如时钟失锁、TRX通信故障、分集接收通道告警、驻波比告警、无线链路告警、Lapd告警、OML断链告捷等,并结合BSC、BTS维护台观察单板状态是否正常、查询单板软件是否正确、时钟是否正常、信道占用是否正常。
通过结合分析指标很差的小区,可以较快的确定一些硬件及软件故障,通过换板、软件重新加载等手段排除故障、改善指标。
5、网络参数检查
可以按功能分为四大类:
网络识别参数、系统控制参数、小区选择参数和网络功能参数。
6、邻区检查
定期邻小区检查的方法。
方法一:
华为NASTAR网优工具检查
方法二:
华为BSC一致性工具检查
三、发现网络问题
◆网络问题分析步骤
→了解一个网络的网络质量时,我们可以通过对BSC整体性能/C1报表这个统计功能子项进行研究和对比分析
→如果在BSC整体性能/C1报表统计中发现某个重要指标(如掉话率、切换成功率)有异常情况时,我们再对其相应更详细的内容具体分析。
→检查单项指标超标、故障绝对次数(掉话、拥塞、切换失败等)多的小区
→综合百分比、故障绝对次数(掉话、拥塞、切换失败等)这两个参数来决定是否进一步处理。
发现网络问题可以从两个方面重点分析收集:
设备告警信息和用户投诉信息及话务统计。
设备告警可以从维护台上的告警台上显示,同时华为提供声光告警,可以及时了解到设备硬件问题。
用户投诉一般通过服务热线1001得到。
话务统计通过
◆常见网络问题列表
→BTS硬件故障、驻波比告警等
→小区掉话率高
→小区切换差
→小区拥塞,包括SDCCH拥塞和TCH拥塞
→小区覆盖差
→小区上下行不平衡
→小区存在干扰
→用户投诉话音质量差、单通、串话等话音问题。
四、分析和解决问题
1、分析和解决问题的流程
实际工作中,可灵活应用此问题分析树,结合网络的其他特征,快速定位问题。
同时和其他网优手段的结合:
●路测:
模拟用户在移动中通话
●分析对象:
覆盖、质量、切换、信令
●CQT测试:
在不同地点大量拨打电话
2、掉话问题分析流程
掉话分析思路图:
图4掉话分析思路图
掉话分类
●掉话大体分为4种,特征如下:
→边缘掉话:
接收电平低、TA值大
→近端电平低掉话:
接收电平低,TA值小
→质量差掉话:
接收电平高,接收质量差
→突然掉话:
开始一直正常,突然掉话
根据四种掉话特征,再分别查看相关话统项。
如边缘掉话要分析是否漏做邻区、邻区是否太忙等。
近端低电平掉话则要查看是否存在覆盖不足的问题。
质量差掉话的重点是查找、解决干扰问题。
突然掉话有一定偶然性。
◆边缘掉话
产生原因:
→MS超出了基站的有效覆盖区,孤站、漏做邻区导致的孤站、过覆盖导致的孤岛效应。
解决方案:
→增加基站,形成连续覆盖;
→补作邻区关系,使手机可以切换到其他小区;
→提高天线挂高、使用高增益天线、调整天线下倾角;
→修改参数,如“SACCH复帧数”、“下行链路失效计数器”、“边缘切换门限”,“切换统计时间”等,部分的改善掉话性能。
核心是形成良好覆盖,消灭孤岛,使切换快速执行。
◆近端低电平掉话
产生原因:
→密集楼群,复杂地形导致覆盖不好
解决方案:
→增大有效辐射功率
→调整方位角和下倾角,将天线主瓣对准主要用户群
→调整与掉话相关参数
注明:
这种掉话一般不会太多,市区产生的这种掉话可能是为了降低干扰而降低了基站发射功率或者增大天线下倾角。
增大有效辐射功率时要考虑对其他小区的干扰。
◆质量差掉话(电平高)
产生原因:
→上行或下行存在干扰
→传输误码较高。
干扰源:
→不同频段直放站
→雷达、热溶机等设备产生的干扰
→频率计划不合理
→设备故障产生的干扰。
干扰是造成掉话的主要原因。
解决方案:
→排除网外干扰;
→优化频率计划;
→调整天线方位角、下倾角,减少越区覆盖;
→解决传输误码问题。
针对不同的原因,或调整频率计划避开干扰,或请用户督促有关部门解决网外干扰。
直放站和越区覆盖是最常见的干扰原因。
掉话指标查找:
●找出掉话率高小区;
●检查高掉话小区的话务量和掉话次数;
●在“掉话性能测量”任务中,查看其掉话性能;
●查看“干扰带分布情况”;
●根据掉话的4种典型特征,给该小区的掉话情况分类;
引起掉话的主要原因:
●干扰(网内干扰、外界干扰、设备本身的干扰)
●覆盖不好(盲区、孤岛)
●切换不合理(相邻小区的规划、切换的参数)
●上下行不平衡(塔放、功放、天线方向)
●参数设置不合理(无线链路失效计数器,SACCH复帧数)
●设备问题(载频板、功放、塔放
这是造成掉话的几个原因,根据怀疑的原因,查看有关话统项,去逐步排除。
◆干扰(网内干扰、外界干扰)
查看话统项:
→分析话统中的干扰带出现的规律:
随时间、话务量的变化。
→轮流关闭载频观察话统项干扰带变化。
→因质量差而发生的切换占全部切换的比例。
接收质量性能测量:
针对载频,统计平均接收质量等级,作为参考。
→掉话性能测量:
记录了掉话时的平均电平与质量,作为参考。
如果有一个以上空闲信道出现在干扰带三、四、五中,一般就有干扰。
若是网内干扰,一般都会随着话务量的增加而增大,通常情况下若是网外干扰,与话务量增加没有关系。
这里还需要说明干扰带是基站载频信道在空闲状态下通过射频资源指示消息向BSC上报的,若当前信道忙也难以上报资源指示消息,因此干扰带的统计也应结合话务量综合考虑。
小区性能测量/小区间切换性能测量,或出小区切换性能测量中,统计了各种原因引起的出切换尝试次数,如果质量差引起的切换次数过多,说明有干扰,而且上行质量差切换过多,说明有上行干扰,下行过多,说明有下行干扰。
解决方法:
→进行实际路测,检查干扰路段和信号质量分布。
→使用频谱仪分析查找。
→开启跳频,DTX,功率控制等手段降低干扰。
→解决设备问题(如:
TRX板自激、天线互调)。
分析是哪些小区信号的重迭覆盖引起的干扰。
根据实际情况,通过调整相关小区的基站发射功率、天线倾角、邻区关系、切换参数,或调整频点规划等避免干扰。
◆覆盖(盲区、孤岛)
检查话统项:
→功率控制性能测量中,平均上、下行信号强度过低;
→接收电平性能测量,接收电平低的次数所占比例过大;
→小区性能测量/小区间切换性能测量中,发起切换时电平等级过低、平均接收电平过低;
→掉话性能测量中,掉话时电平过低,掉话前TA值异常;
→定义邻近小区性能测量,可以定位到哪个邻区的平均电平过低;
判定是覆盖问题导致掉话后,要确认确实存在覆盖问题还是人为因素引起的覆盖问题,如天线指向不合理造成孤岛、漏做邻区、切换参数不合理导致未能及时切换掉话。
判断方法:
→定义邻近小区性能测量,定义邻小区平均接收电平过高(过覆盖);
→功率控制性能测量,MS与BTS的平均距离,是否与设计思想不符
→功率控制性能测量,MS与BTS的最大距离,连续多个时段超常;
→出小区切换性能测量,到某邻区的切换成功率低。
解决方法:
→在估计覆盖差地区进行路测。
→根据路测结果,调整网络参数:
→基站发射功率,天线倾角及高度,手机最小接入电平,小区相邻关系,切换侯选小区最低接入门限。
→增加基站。
◆切换不合理(相邻小区的规划、切换的参数)
判断方法:
→检查切换参数,看是否存在不合理的参数设置;
→小区间切换性能测量:
切换失败但重建也失败次数过多;
→小区间切换性能测量:
切换次数过多,重建成功也多;
→未定义邻近小区性能测量:
未定义邻区电平及测量报告个数超标;
→出小区切换性能测量:
出小区成功率低(针对某小区),找出切向哪个邻小区的成功率低,进一步从目标小区查找原因;
→入小区切换成功率低,对方小区切换参数设置不合理;
→TCH性能测量:
切换次数与TCH呼叫占用成功次数不成比例。
(切换/呼叫>3)
切换的一个重要目的就是延续通话,当切换不能正常进行时,掉话难以避免。
切换失败的原因有:
数据错误,手机在一个错误的小区上发起接入、目标小区忙、干扰、两个小区覆盖区交叉范围小,借助于话统,可以判定切换失败的原因。
解决方法:
→合理增加邻区。
→调整切换参数。
◆4.上下行不平衡(塔放、功放、天线方向)
判断方法:
→分析“上下行平衡性能测量”,分析是否确实上下行不平衡;
→查看“掉话性能测量”,分析掉话时平均上下行电平和上下行质量;
→查看“功率控制性能测量”,分析上下行平均接收电平。
上下行不平衡造成掉话的本质在于手机在一个并不合适的小区上发起呼叫,或切换到这么一个小区。
因为手机的重选和切换都是只测量了下行电平,上下行差距过大时,往往导致掉话、切换失败。
◆无线参数设置不合理(无线链路失效计数器,SACCH复帧数)
问题定位:
→检查有关的参数配置:
→系统消息数据表:
无线链路失效计数器;
→小区属性表:
SACCH复帧数,无线链路连接定时器。
解决方法:
→修改上述参数的不合理配置。
◆设备问题(载频板、功放、塔放)
判断方法:
→TCH性能测量:
TCH可用率异常
→TCH性能测量:
地面链路断掉话次数多
→上下行平衡测量:
同一小区内各载频上话务量有明显差异
→BSC整体性能测量:
指配失败(设备故障)
解决方法:
→观察传输和单板告警(TC板故障,A接口PCM失步告警,LAPD断链,功放板,HPA,TRX板告警,CUI/FPU告警),根据告警数据,分析是否传输断或有故障单板存在(如载频板坏或接触不良)。
TCH可用率异常说明有时隙故障,地面链路断掉话次数多和A接口失败次数多则提示传输或接口电路异常,需要查看告警,检查设备。
3、切换问题的分析流程
切换分析思路图
图5切换分析思路图
切换分析的总体思路是先区分出、入失败,再区分对所有邻区还是个别邻区,再结合TCH性能测量、告警等因素确认原因。
切换问题分类
总的分析思路:
→存在切换问题的小区:
所有小区、个别小区
→小区切换问题的方向:
出小区切换失败和入小区切换失败
→切换失败的对象:
服务小区和多个小区之间、和个别小区之间
切换指标查找:
●查找低切换成功率小区
●查找切换失败次数多的小区
●分析出小区切换失败次数和入小区切换失败次数,确定哪类切换失败占主要因素
●登记出、入小区切换性能
●观察切换失败的特点:
对所有邻区还是个别邻区、所有条件触发的切换成功率低还是部分触发条件切换的成功率低;
这是查找切换失败的基本步骤。
影响切换成功率的可能原因:
●切换参数不合理
●设备问题(个别载频板等损坏)
●拥塞
●干扰
●覆盖
●上下行不平衡
●时钟问题(基站变为内时钟、上级时钟不稳或偏移较大)
切换问题不是孤立的,往往伴随其他问题的发生。
切换参数不合理:
边缘切换电平过低(无PBGT切换)、负荷接收门限设置过低、P/N时间太长等。
时钟是引起切换失败的常见因素。
◆切换不合理(相邻小区的规划、切换的参数)
定位和解决方法:
→检查TA、BQ等切换门限,切换功能开关等设置是否合理。
→切换次数与TCH呼叫占用成功次数不成比例。
如果切换/呼叫>3,很可能存在乒乓切换现象,应检查切换参数配置并调整(层级设置、层间切换磁滞、小区间切换磁滞、PBGT门限等)。
→小区间切换性能测量:
发起切换时平均电平过低,有可能是边缘门限等切换门限设置过低。
◆设备问题
分析对象:
→入小区切换成功率低小区
→出小区切换成功率低小区的邻区
问题定位:
→目标小区有信道激活但NACK,TIMEOUT。
→TCH可用率异常。
→地面链路断掉话次数多。
→若该小区的掉话率和拥塞率一直很高,则该小区可能有部分设备故障。
→观察传输和单板告警检查是否有时钟告警。
→对于基站切换接入受接入电平及质量限制的情况,应注意相应参数的设置情况(RACH接入门限、随机接入错误门限)
→要检查的单板和告警信息:
TC板故障、A接口PCM失步告警、LAPD断链、功放板、HPA、TRX板告警、CUI/FPU告警),根据告警数据,分析是否传输断或有故障单板存在(如载频板坏或接触不良)。
◆拥塞
分析对象:
→入小区切换成功率低小区
→出小区切换成功率低小区的邻小区
问题定位:
→排除上面的参数配置不合理与设备故障问题后,如果有
→入小区切换性能测量:
入小区切换失败(由于拥塞)过多;
→小区间切换性能测量:
出小区切换尝试次数-出小区切换次数过大,说明在目标小区申请不到信道,可能目标小区已拥塞。
→有上述现象应从TCH性能测量中TCH处于忙状态的最大数目,全忙的时间等确认存在拥塞,并按下面办法解决。
话统项里切换失败(无可用信道)表示因目标小区忙而导致的切换失败。
问题解决:
→调整小区覆盖(调整基站发射功率,调整手机最低接入电平,调整RACH接入门限、调整随机接入错误门限,调整天线倾角)。
→调整小区主要参数(调整CRO,开启负荷切换,调整小区优先级,小区切换参数)。
→扩容或调整忙闲小区载频配置。
◆其它
→排除参数配置、设备故障、拥塞的问题后,可参考TCH掉话率分析,对邻小区分别进行参数配置、干扰、覆盖、上下行平衡方面的分析解决。
4、TCH拥塞的分析流程:
TCH拥塞分析思路图
图6TCH拥塞分析思路图
造成拥塞的可能原因
●系统容量不够
●干扰过大
●覆盖
●天馈原因
●参数设置不合理(系统消息)
◆系统容量不够或话务不均衡
判断方法:
→每信道话务量过高(每信道话务量>0.6);
→占用遇全忙次数过多,出现长时间的全忙;
→话务不均衡(一个站点三小区话务不均衡,或几个站的话务不均衡);
→入小区切换性能测量统计中,入小区切换失败次数(由于拥塞)次数过多。
解决方法:
→扩容,或调整忙闲小区载频配置。
→调整小区覆盖(调整基站发射功率,调整天线方位角、倾角、高度等)。
→调整小区主要参数(CRO,手机最低接入电平,开启负荷切换)。
→调整小区优先级,小区切换参数。
◆干扰(网内干扰、外界干扰)
→干扰大到一定程度,满足不了系统对载干比的要求时,误码率急剧升高,指配命令和指配过程受到干扰,是造成占用失败的重要原因。
→空闲状态下的下行干扰,迫使MS的DSC计数器减少为零,MS重选到一个电平较低的小区下,是干扰造成占用失败的另一个可能。
→TCH占用失败次数(包括切换)-TCH占用遇全忙次数,即不是由于信道分配不到的指配失败,如果过多,则网络可能存在干扰。
判断和解决方法:
见TCH掉话率中干扰专题的判断方法与解决方案。
干扰往往伴随着掉话存在。
外界干扰以直放站最为常见。
◆天馈原因
判断方法:
→小区频点扫描:
主集、分集接收天线对同一频点的测量结果值
→上下行平衡测量:
测量报告数量
解决方法:
→检查天线方位角、倾角、天馈连接。
网络开通初期,天线接错是常见的问题。
在使用双发天线的小区里,两面天线的指向、增益、倾角不一致也是造成指配失败的原因之一。
◆参数设置不合理
判断方法:
→检查参数手机最低接入电平的数据配置、有关重选的参数。
解决方法:
→调整不合理参数配置。
避免手机驻留在一个电平很低的小区内,均衡话务的同时注意最低接入电平的设置。
位置区交界处运营商为了争抢话务量,往往会把CRO设置的很大,手机被吸引到一个电平很低的小区内,造成拥塞、掉话、切换成功率低等问题。
◆覆盖(盲区、孤岛)
判断和解决方法:
见TCH掉话率中覆盖专题的判断方法与解决方案。
5、SDCCH拥塞分析流程
SDCCH拥塞分析思路图
图7SDCCH拥塞分析思路图
◆引起SDCCH拥塞的几个因素
→参数设置不合理(系统消息)
→系统容量不够
→位置区划分不合理
→存在干扰
●参数设置不合理
判断方法:
●随机接入性能测量:
→立即指配成功次数/立即指配次数>85%
→上述公式表示的是手机上报的est_ind与发下去的立即指配命令之比,一般应达到85%以上,如果该比值异常,说明系统消息数据表中相关的参数配置可能不当。
解决方法:
→调整参数(随机接入错误门限,RACH接入门限),最大重发次数,扩展传输时隙数)。
→位置更新的参数设置(双频网1800参数设置,CRO,小区重选滞后参数,周期位置更新时间等)。
→在双频网中,也可能是局间切换过多导致位置更新过多,此时应调整双频网1800切换参数设置,CRO等。
●系统容量不够
特殊情况下的容量问题:
→位置区交界处、火车道旁,瞬间的大量位置更新。
→应增加SDCCH配置数目或开启动态SDCCH分配功能或增加TRX。
●位置区划分不合理
不合理的位置区边界:
→如以某条街道为界,人员在街道上的移动、多径传播的影响导致频繁位置更新。
尽量避免在一个中小城市市区设置两个位置区,或者位置区不规则,相互交错。
●存在干扰
→RACH门限设置偏低,同时存在干扰,系统误认为有大量的SDCCH占用请求。
6、接入类问题分析流程
◆接入问题分类
→寻呼
→立即指配
→TCH指配
→位置更新
具体问题分析需要登记以下话统
→随机接入性能测量
→SDCCH性能测量
→小区性能测量
◆随机接入问题分析
→主要关注RACH过载次数,如果较多则可能有误接入,需要进行干扰检查和参数门限检查,在排除干扰的情况下可以适当提高RACH忙门限、RACH最小接入电平、扩展传输时隙数,以避免误接入和减少随机接入碰撞几率。
同时需要结合话务量、干扰带、上下行平衡情况来分析。
注意排除基站上行接收通道故障、时钟等问题。
◆立即指配问题分析
→主要关注SDCCH的拥塞、SDCCH掉话率、立即指配请求次数、立即指配成功次数、立即指配成功率。
并且需要对主要的话统统计点有较清楚的认识,以便理解和分析问题。
◆寻呼问题分析
→主要观察PCH过载次数,寻呼请求次数,MSC发来的寻呼次数,A接口寻呼成功率,用户投诉的寻呼无响应情况等。
如果有PCH过载情况发生,就需要考虑是否位置区划分不合理、话务量是否太大而寻呼信道配置太小、是否覆盖存在忙区等问题。
◆TCH占用问题分析
→主要观察BSC整体的指配次数、指配失败次数、各种指配失败的原因,小区性能测量中的TCH占用失败的各种分原因项的统计。
相应的考核指标为TCH拥塞率。