经典案例无线集智维护平台支撑一线高效运维.docx

上传人:b****7 文档编号:9170226 上传时间:2023-02-03 格式:DOCX 页数:19 大小:3.80MB
下载 相关 举报
经典案例无线集智维护平台支撑一线高效运维.docx_第1页
第1页 / 共19页
经典案例无线集智维护平台支撑一线高效运维.docx_第2页
第2页 / 共19页
经典案例无线集智维护平台支撑一线高效运维.docx_第3页
第3页 / 共19页
经典案例无线集智维护平台支撑一线高效运维.docx_第4页
第4页 / 共19页
经典案例无线集智维护平台支撑一线高效运维.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

经典案例无线集智维护平台支撑一线高效运维.docx

《经典案例无线集智维护平台支撑一线高效运维.docx》由会员分享,可在线阅读,更多相关《经典案例无线集智维护平台支撑一线高效运维.docx(19页珍藏版)》请在冰豆网上搜索。

经典案例无线集智维护平台支撑一线高效运维.docx

经典案例无线集智维护平台支撑一线高效运维

 

无线集智维护平台,支撑一线高效运维

 

一、摘要

2018年10月,中国电信VoLTE即将进入试商用,LTE小区频繁退服是导致VoLTE掉话的主要原因之一,影响用户感知。

目前,LTE退服率与退服历时是CDMA的两倍,LTE批量退服是CDMA的50倍,因此,LTE退服改善是支撑VoLTE业务发展的重要内容。

此外,移动网络规模不断发展扩大,网络结构日益复杂,目前江苏电信已达到9万站址,40万的基站小区,对无线网络的维护与管理质量的要求也越来越高。

然而,就当前的无线网络维护和管理情况而言,还存在着无线网络设备的维护和管理不到位,维护人员相对缺乏,代维人员的素质参差不齐的情况,一线的维护工作任务多且担子重。

在节约成本、提升效能的前提下,为了进一步提升无线网络维护工作质量与效率,改善以上存在的问题,江苏公司无线网络优化中心经过深入调研,从一线需求出发,利用IT与数据分析手段自主研发了“无线集智维护平台”,平台融合了无线、传输、自有动环、铁塔动环的基础数据、告警数据,无线话统数据等九维数据,并设计了23套监控、定位算法,为一线提供移动网一站式智能监控解决方案:

通过打通相关专业数据库,实现高度关联分析,实时发现障碍并有效定位诊断,提升一线排障效率;设计算法,自动筛查天线、设备、接电、备电、高温、水浸等十四大隐患,实现网络智能诊断;通过大数据分析等IT化手段,自动预警IPRAN、集中机房等集中风险,以问题为导向指导一线提升网络健壮性。

支撑好基础维护工作是无线网稳定运行的重要保障。

江苏公司力争以支撑一线工作为本,开拓思路,多措并举,引导分公司主动开展维护工作。

2018年6月江苏公司A\B类小区平均退服时长为50.96分钟,较2017年6月有效压降57%,C\D类小区平均退服时长为54.83分钟,较2017年6月有效压降73%,退服指标改善显著。

2018年7月至8月间,台风“安比”、“云雀”、“温比亚”登录江苏,部分区域连片退服,无线集智维护平台作为全省监控的重要平台,通过监控全网、五高一地退服指标和批量退服,推进传输、备电、天馈、高温隐患整治、站址巡检等,进一步提升无线网络维护质量,有效提升4G与VoLTE用户感知。

二、经验与亮点

(一)一站式智能监控服务

因缺乏相关专业数据,一线维护部门无法及时掌握传输、动力等问题引发的基站障碍。

因缺乏统一的监控界面,一线维护人员需登录多套网管才能及时发现无线网络隐患。

为进一步推动主动维护能力,提升维护效率,省无线网优中心通过自主研发打造了“无线集智维护平台”,通过融合无线、传输、动环、铁塔相关数据,设计23套监控与定位算法,为一线提供一站式智能监控能力,隐患识别与主动防治能力大幅提升。

(二)建立网络评价体系,自动识别网络短板

1.移动网健壮性八维评价体系

为支撑分公司及时发现网络短板,“无线集智维护平台”建立了移动网健壮性八维评价体系,包括了退服、群障、巡检、备电、传输、集中机房、隐患、配置等八个方面。

基于针对以上各方面的八套算法,分别给予打分,通过雷达图的方式,直观地体现出本地的网络短板环节,引导分公司主动支撑。

2.主动识别隐患:

网络隐患自动全面排查,支撑主动维护

随着网络规模的不断扩大,网络结构的日益复杂,可能出现隐患的环节也越来越多,且在日常维护工作中容易被忽略。

为了克服这个难点,省网优基于前期的一线调研,自主开发了“无线集智维护平台”解决了主动识别隐患的问题。

平台将网络中可能出现隐患的环节,以拓扑图的形式,直观地呈现出当前网络健壮质态。

目前网络拓扑中包含的环节有:

机房外

传输

BBU与RRU之间的告警(含光衰大、误码高、抖动等)

A设备

IPRAN-A设备集中风险隐患

IPRAN-A设备环路集中风险隐患

B设备

IPRAN-B设备对集中风险隐患

天线

驻波、GPS、RCU告警,以及RSSI过高问题

直放站

直放站轮巡失败

RRU

C/L网RRU退服数

机房内

BBU

C/L网BBU退服数

高温

高温告警(含电信/铁塔动环、A设备、无线设备高温告警)

水浸

水浸告警(含电信/铁塔动环)

接电

接电不稳

备电

蓄电池老化或动力不足

集中机房

集中机房电源或传输隐患

今日巡检

今日完成巡检的站址数

巡检问题

巡检发现的问题数

Ø接电

算法规则:

统历史四周站址掉电次数大于10的站址。

主要功能:

动态监控频繁掉电站址(排除规律性拉电),自动识别常掉电站址,协助地市解决站点接电不稳问题。

平台支持省-市-县三级钻取,通过点击拓扑图中的“接电”,即可查看全省各地市接电问题数的柱状图,切换“清单”按钮可查看详单。

Ø备电

算法规则:

统计蓄电池有效服务时长小于30分钟的站址数,计算公式为:

蓄电池有效服务时长=动环告警中的蓄电池欠压告警时间或无线网退服告警时间-交流停电时间

主要功能:

省内部分站址备电效果差,一方面BBU集中布放导致集中机房设备数量和负荷暴增,配套蓄电池容量不足,另一方面部分CL共站站址中新建的L网设备未改造接入备电保护,或已接入但站址蓄电池老化、备电容量不足。

通过打通自有和铁塔动环告警接口,融合关联动环告警与无线告警,识别自有和铁塔权属蓄电池老化、容量不足问题,及时整治蓄电池质差站点。

平台支持省-市-县三级钻取,通过点击拓扑图中的“备电”,即可查看全省各地市备电问题数的柱状图,切换按钮可查看详单。

Ø传输隐患

算法规则:

传输告警包括BBU与RRU之间的告警(含光衰大、误码高、抖动等)。

主要功能:

传输是移动网络的神经系统,20%基站退服由传输线路障碍引起。

需要加强传输线路健壮性保护,避免出现集中风险点,缩短线路障碍处理历时。

通过打通传输与无线的数据库,实现基础数据与告警数据的有效关联,有效识别出各类传输告警。

平台支持省-市-县三级钻取,点击网络拓扑中的“传输”,即可查看全省各地市传输问题数的柱状图,切换“清单”按钮可查看详单。

Ø天线隐患

算法规则:

天线问题包括驻波、GPS、RCU告警,以及RSSI过高问题。

主要功能:

天线的驻波、干扰、接反等障碍影响用户感知,且易被忽视。

通过及时监控,并提醒及时整治障碍,引起分公司关注。

点击网络拓扑中的“天线”,即可查看全省各地市天线问题数的柱状图,切换“清单”按钮可查看详单。

Ø直放站脱管

算法规则:

一周内三次轮巡失败的直放站数。

主要功能:

通过无线集智维护平台通报的直放站问题数,可给代维公司下发整治计划,并督促及时整治。

点击拓扑图中的“直放站”,即可查看全省各地市直放站问题数的柱状图,切换“清单”按钮可查看详单。

Ø高温告警

算法规则:

包括电信/铁塔动环、A设备、无线设备等高温告警。

主要功能:

随着高温雨季的来临,火灾、雷击、水浸、高温、大风、断电等问题对通信设备的影响压力骤增,高温告警较平常增加3-5倍,基站小区退服告警较平常增加50%。

为支撑一线及时整治高温隐患,通过点击网络拓扑中的“高温”,即可查看全省各地市高温问题数的柱状图,切换“清单”按钮可查看详单。

Ø自动识别短板

在“主要问题”模块,通过设计算法,在该模块自动提醒主要障碍,通过高亮字体提醒重大障碍,障碍解决后提醒自动清除,形成闭环。

(三)跨专业融合四类数据,集中风险主动预防,重大障碍精准定位

1.集中风险预警:

跨多专业关联融合,自动识别集中风险

(1)IPRAN集中风险

基于基础数据关联,识别B设备对、A2环路等挂载BBU或RRU过多的高集中风险。

IPRAN集中风险隐患类型

问题描述

B设备对

挂载BBU数超120个

A2环路

挂载RRU数超120个

(2)BBU集中隐患

1)温度过高:

基于动环、无线设备、A设备高温告警,及时监控解决高温问题。

2)违规接电:

基于障碍告警的关联定位已能识别相关问题,另外联合动力专业梳理BBU集中机房接电隐患,加强机房建设改造监管。

2.故障精确定位:

重大障碍及时监控定位,缩短排障历时

目前通报“批量退服”的时延相对较长,且缺乏精准定位,影响一线排障效率。

为了及时发现批量退服并,自主研发了“批量退服”实时短信邮件提醒功能,通过邮件方式第一时间通知退服数量,以及定位退服原因。

(1)“批量退服”实时短信邮件提醒

该功能主要监控了C、L网络下的BBU和RRU,通过一定的预警条件——五分钟内大于20个BBU同时退服或大于40个RRU同时退服。

当判断满足预警条件时,系统会在一分钟内自动发送邮件和短信到维护负责人。

后续当90%的网元恢复时,系统会再次短信邮件提醒。

最后,所有退服数据会自动入库,形成闭环跟踪。

(2)设计算法,智能定位障碍原因

为了降低排障历时,在批量退服发生后尽快诊断出退服原因。

通过与相关部门协调沟通,省网优中心打通了无线、动环(铁塔/自有)、传输告警数据库,将相关告警融合关联分析,实现智能定位。

ØBBU批量退服原因分析优先级:

1)掉电:

50%以上告警原因为掉电

2)A设备:

90%以上BBU退服指向某一特定A设备

3)BBU集中机房:

90%以上BBU退服指向某一特定BBU集中机房站址

4)A环:

90%以上BBU退服指向某一特定A环(B设备对+环号)

5)B设备:

90%以上BBU退服指向某一特定B设备

算法按照以上优先级顺序对BBU退服数据进行分析,初步判断退服原因,系统自动通过邮件和短信将退服详单及原因发送至地市维护负责人。

ØRRU批量退服原因分析优先级:

1)掉电:

50%以上告警原因为掉电

2)A设备:

90%以上退服RRU的BBU指向某一特定BBU集中机房站址

算法按照以上优先级顺序对RRU退服数据进行分析,初步判断退服原因,,系统自动通过邮件和短信将退服详单及原因发送至地市维护负责人。

(四)移动网代维能效管理

由于代维人员参差不齐,流动性大,工作质量、效率不高,缺乏有效管理手段,无线集智维护平台通过代维能效五维管理,提升代维人员质量,通过大数据手段,有效识别出工作质量、效率较低的人员,通过回炉重造提升技能。

通过建立代维能效管理体系,综合考虑网络规模、网络质量、网络巡检、排障历时、队伍能力五大维度,按下图评估模型为分公司代维队伍打分,通过雷达图直观体现代维管理中的短板环节。

Ø网络规模

通过评估当地站址数酌情评分。

Ø网络质量

网络质量综合考虑退服指标和障碍重复率。

指标

权重

退服指标

60%

障碍重复率

40%

Ø网络巡检

(1)远程维护作业计划执行

无线专业集约化维护后,省网优负责全省远程维护作业计划的执行工作,为提高作业计划的执行效率,省网优开发了自动作业计划模块,自动远程提取设备状态、性能及负荷情况,每天维护人员按时巡检结果即可。

对于月度、季度及年度作业计划均派发到人,需要按时在工单中填写执行结果并闭环回单。

(2)对于基站现场作业计划,省网优整合关联了全省的物理站址,开发了基于站址的巡检模块。

巡检人员巡检时点击相应站址巡检,自动根据站址内所含设备生成巡检清单,巡检人员逐项填写记录即可。

巡检模块涵盖全省物理站址,自动关联相关设备信息和站址信息,巡检人员根据站址等级进行巡检周期规划,按时点击巡检生成巡检记录。

Ø排障历时

通过评估排障历时酌情给分。

Ø队伍能力

分公司通过自行组织代维月度会议和技能竞赛,考核代维人员技能水平,对于不达标的人员通过回炉重造、再次培训的方式,通过考试后再次任用。

指标

权重

技能考试

60%

每百站址人员配置

40%

三、应用与成效

(一)应用推广

无线集智平台自上线后,省网优中心为包括省市县公司的无线中心分管副总、无线中心主任、维护主管、一线维护人员,共计206人开通了平台账号。

分公司已将无线集智维护平台嵌入生产,每日登陆,主动支撑一线维护工作。

无线集智维护平台,作为领导的好帮手,网络的智慧医生,已经成为了无线维护工作中不可或缺的环节。

其中,苏州、无锡分公司将无线集智平台嵌入生产,每日登陆整治网络隐患,并投在大屏上实时监控网络质态。

目前,无线集智维护平台作为退服指标发布的唯一平台,五高一地重保的监控平台,以及它的日报推送功能,每天上班前自动发送邮件,第一时间将24小时内的问题隐患呈现到维护人员手上,起到提醒的作用。

发生批量退服后,会有实时的短信邮件提醒。

(二)应用成效

截至2018年9月中旬,无线集智维护平台累计支撑一线及时发现19类问题2999个,解决问题率达90%。

通过组织并指导市公司合理建设5983处站址备电、整治6231处蓄电池老化问题、主动排查193处IPRAN传输集中风险、解决337处BBU集中机房风险,并在高温雨季前组织“高温雨季巡防整治专项工作”,2018年6月江苏公司A\B类小区平均退服时长较2017年6月有效压降57%,C\D类小区平均退服时长较2017年6月有效压降73%,成功应对“安比”等三大台风,进一步夯实了无线网络基础,提升了无线网络健壮质态。

1.支撑扬州分公司——直放站托管问题整治

扬州公司基于“无线集智维护平台”,积极推动直放站脱管问题整治,成效显著。

扬州直放站脱管问题数从4月1209个下降至8月170个,无锡运用大数据分析手段识别并解决直放站在线不工作问题40个,正在试点全省推广。

2.支撑常州分公司——严控无线网群障

常州多措并举,严控无线网群障。

常州无线中心使用无线集智维护平台,协同网维、接维等部门,共同开展同路由整改、C网汇聚点双挂改造、BBU集中机房配套能力评估、下挂超120个RRU的A2拓扑环优化等专项整治工作,并严格管控光缆障碍历时,加强备电保护,严控无线网群障。

3.支撑淮安分公司——专项整治BBU集中机房

1月~5月间,淮安发生多次机房批量退服:

退服数量

退服原因

涟水军民局21台BBU

BBU集中机房用电与照明为一路电,更换楼顶电子大屏空开时批量退服1小时33分钟

淮安区施河、泾口23台BBU

朱桥至车桥光缆断,施河、泾口B对全阻累计13分钟(3次)

市区水渡电信大厦24台BBU

开关电源工作电流超过标称值,导致最上级引入交流开关(40A)跳脱,累计退服29分钟(2次)

通过无线集智维护平台,淮安分公司积极开展隐患排查和整治工作,截至目前已完成378个BBU集中机房方案会审,已梳理市区BBU集中机房需替换/增加7200W空调7台、组合开关电源模块6个、300AH蓄电池8组和500AH蓄电池11组;完成市公司950B设备全部组环,A设备双路由隐患分析,避免A设备不耐高温引发群障。

4.支撑全省——全力应对台风

2018年7月至8月间,“安比”、“云雀”、“温比亚”等台风登陆江苏,从期间退服RRU数来看,全网退服整体较为平稳,局部区域退服有所增加。

无线集智维护平台作为重要监控平台,期间支撑全省实时关注退服情况,保证第一时间发现批量退服并定位,提升排障效率,确保4G用户感知

2018年7月22日台风“安比”登录江苏南通,造成南通631个站点停电,部分区域连片大面积停电,但实际退服站点仅97个,不足停电站点的15%,这与南通在日常工作中以问题为导向,备电工作扎实,积极使用无线集智维护平台,及时整治备电站址常掉电、蓄电池老化或容量不足等问题密切相关。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1