大数据分析在移动通信网络优化中的应用研究.docx
《大数据分析在移动通信网络优化中的应用研究.docx》由会员分享,可在线阅读,更多相关《大数据分析在移动通信网络优化中的应用研究.docx(23页珍藏版)》请在冰豆网上搜索。
大数据分析在移动通信网络优化中的应用研究
本科毕业论文(设计)
论文(设计)题目:
大数据分析在移动通信网络优化中的应用研究
学院:
________
专业:
________
班级:
________
学号:
________
学生姓名:
________
指导教师:
________
年月日
大数据分析在移动通信网络优化中的应用研究
摘要:
随着新的移动通信技术的应用及移动互联网的发展,我国的移动通信用户已经达到了10亿级规模。
由于移动互联网应用的快速发展,例如QQ、微信、微博等,移动通信用户对于移动通信数据业务的需求越来越多,进而要求也越来越高。
我国移动通信网络建设经历了建设期、发展期后,己经步入了稳定期。
但是,稳定期需要的是创新,稳定期用户基数大,需求多,感知要求高。
因此,基于大数据分析技术的应用及基于数据库技术的存储与分析体系需求就应运而生,传统的人力优化方法及粗浅的计算机技术应用已经不能满足当前移动通信网络用户的需求,使得移动通信网络优化工作达到了一种瓶颈。
目前,某地区移动通信网络用户需求主要在于网络信号的覆盖以及网络下载速率的感知等方面。
针对移动通信网络优化的工作吸引大量的网络咨询公司、大数据处理公司及相关研究机构的重视。
本文主要针对日常移动通信网络优化工作的三个方面:
道路测试、后台数据分析、网络投诉处理进行基于大数据分析技术的优化应用研究,提出由点及线、由线到面的多纬度优化方案。
这样可以全方位、多角度的对移动通信网络优化工作中存在的瓶颈进行综合分析,并提出相应的解决措施及辅助应用工具,从而节约网络优化人员的时间和精力,提高其工作效率。
关键词:
大数据分析;移动通信;网络优化;应用研究
Abstract:
Becausethecolorofjadeisverygoodandcanbedisplayedbytheowneris2290generous,lovemanypeople,inthemodernsocietyisverypopular,butintheperiodofQingDynasty,jadejewelryisveryprosperous,inordertofindthereasonsoftheprosperityofQingDynastyjadejewelry,sofordifferentperiodsofQingDynastyanalysisplaysanimportantroleinthedevelopmentofthehistoricalprocessofChinajadejadeinhisdevelopmentisveryearly,thanthebronzeculturedevelopmentearlier,andintheYangtzeRiverandthetheYellowRiverrivernearthejadecultureisveryprosperous,theformaljadeculture,bettermakeagreatcontributiontothedevelopmentoftheQingDynastyjadejewelry,jadejewelryintheQingDynastyiswidelypopularinthefolkandtheroyalfamily,thepopularityisnotOftenthewideuse,andthisjadejewelryisalsoverywide,especiallyintheQingDynasty'spolitics,weknowthatthelateQingDynastyisverytroubled,sotheQingDynastyrulersinordertoreassurethepublic,sothattheQingDynastyrulersinordertobetterstability,sostrongtheimplementationofjadejadecultureandprosperitysoastovigorouslypromotethejadejewelryintheQingdynasty.Thisarticlemainlytakethehistoryastheclue,bettertoanalyzehowthejadejewelryprosperousintheQingdynasty.
Keywords:
jadeitejade;QingDynasty;reason;analysis.
目录
1绪论1
1.1.研究背景1
1.2研究意义2
2基于矩阵分析的路测数据预测2
2.1路测数据问题预测分析3
2.2干扰矩阵分析概述4
2.2.1什么是手机测量数据4
2.2.2为什么使用手机测量数据4
2.3基于矩阵分析的路测数据预测方案5
2.4基于矩阵分析的路测数据预测模型5
2.4.1路测数据采集5
2.4.2干扰数据采集6
2.4.3建立矩阵分析模型6
2.4.4路测数据分析预测6
3基于聚类分析的后台数据优化7
3.1后台数据分析的困境7
3.2后台数据库与网络结构8
3.3基于聚类分析的后台数据优化方案9
3.4基于聚类分析的后台数据优化模型9
3.4.1后台数据采集9
3.4.2后台数据分类10
3.4.3建立聚类分析模型11
3.4.4后台数据自动优化11
4.基于关联规则的网络投诉数据分析12
4.1网络投诉工作的困境12
4.2投诉分析与问题定位13
4.3基于关联规则的网络投诉分析模型13
4.3.1网络投诉数据采集13
4.3.2用户业务数据采集14
4.3.3建立关联分析模型14
4.3.4网络投诉问题自动定位15
4.4基于关联规则的网络投诉分析的应用15
参考文献17
辞谢18
1绪论
1.1.研究背景
随着移动通信技术的发展与国家对通信产业的布局,我国移动通信网络建设规模与用户数量均达到了世界上的顶级水平。
移动通信网络的发展必须经历的流程就是规划、建站、测试、维护、优化等。
不过,移动通信网络的发展不是一践而就的,而是循环往复的,优化工作虽然处于最后阶段,却与规划工作密不可分,形成移动网络建设的衔接部分。
移动网络优化工作是与广大用户交互最广泛的环节,是移动运营商掌握网络运行状态以及获取用户信息与服务需求的门户。
目前国内某地区移动通信网络中用户规模发展迅速,达到了200万。
而且每年呈10%左右的速度增长,其网络设备建设规模也保持8%左右的高速增长率。
在这种情况下,移动通信运营商与移动用户之间的矛盾也逐渐凸显,尤其是网络快速发展过程中可能忽略的区域及可能忽略的服务质量,导致移动通信网络投诉量急剧增加,移动通信网络投诉处理工作压力空前。
由于移动网络规模逐渐增加,移动网络用户的业务也逐渐变化,就导致了移动网络优化工作的内容及工作重心也随之产生相应变化。
目前某地区移动通信网络优化人员需要花费大量的时间和精力对网络运行情况进行测试和分析。
由于网络数据量的指数级增长及工作内容的增加,移动通信网络优化人员的工作压力逐渐上升,而工作效率却不见增长反而下降,这样就不利于移动通信网络的发展及用户感知的提升,继续保持目前状况则会导致运营商的用户增长缓慢甚至下降。
在认真研究并调查某地区移动通信网络优化工作现状的基础上,本文采用大数据分析技术,利用数据挖掘、文献调查、聚类分析、关联分析等研究方法,为某地区移动通信网络发展中存在的问题进行“把脉”,重点通过大数据处理技术与计算机运算技术及数据库技术建立网络大数据分析与处理模型,通过定性与定量分析,不但可以及时发现网络中的现有问题,而且可以预测分析并预防网络潜在问题点及可能产生的问题。
为提升移动通信网络用户感知,提高网络服务质量提供了高效且精准的网络优化工具。
为某地区移动通信运营商的业务发展及服务内容提供了参考和依据。
1.2研究意义
本文基于我国目前移动通信网络的迅速发展阶段,从大数据分析的角度对移动网络优化工作进行定量与定性分析,以期通过大数据存储、分析与处理技术,使得移动网络优化工作的工作量得到降低、优化效率得到提升、有限的资源得到最佳利用,从而为移动运营商的业务发展提出预测性建议、为移动网络优化工作提供高效的分析处理方案。
通过大数据存储技术的支撑、大数据分析技术与大数据处理技术的应用,我们期望移动网络优化工作可以由点发展到线、面,由传统的单点故障处理、个别问题定位向网络整体分析、矢量问题定位等方向发展。
移动通信运营商可以由传统的被动提供业务、服务向主动提供服务、定制服务方向发展。
为移动通信运营商的业务提供更多可选类型,深入挖掘用户潜在需求,提供盈利新的增长点。
随着移动互联网的发展及新的移动通信技术的应用,移动通信网络用户对于移动通信网络质量与业务内容的要求越来越高,尤其是移动同行用户对于移动互联网速率及信号覆盖的要求,是移动通信运营商需要关注和解决的瓶颈所在。
但是网络规模与用户规模均高速增长,在网络和用户发展的过程中产生了大量的基础数据并未得到合理的利用和挖掘[[5]。
本文则基于移动通信网络的基础数据、道路测试数据及用户感知情况,综合利用大数据分析技术,通过数据挖掘、文献调查、数据库存储与处理、聚类分析、关联分析等方法,为移动通信网络发展过程中产生的问题进行定性和定量化分析,并建立相应的数据模型,为移动通信网络优化提供分析处理工具,进而针对具体的移动网络提出优化建议以及网络未来发展的参考。
这首先需要采集大量的数据,其次对这些数据进行处理及分析,最后通过分析结论提出优化建议和措施,最终建立几个具有实践意义且通过有效性验证的评估与应用体系,为移动通信运营商的网络优化工作节省大量的人力资源、时间和精力,有利于提高移动通信运营商的整体服务水平和用户感知。
2基于矩阵分析的路测数据预测
通过对道路测试数据进行矩阵分析,目的在于对移动通信网络的道路覆盖与移动性进行优化,矩阵分析的流程分为三个阶段,即网络建模、系统分析、优化方案实施。
整个过程可以通过下图展示:
图2-1矩阵分析流程
2.1路测数据问题预测分析
在移动通信领域,网络优化工作中,必不可少的一项工作就是道路测试。
通过道路测试,可以发现网络移动性能的好坏,可以发现移动网络覆盖的盲区,可以发现哪些区域或哪些路段信号服务质量较差,甚至可以直接测试到哪些点出现掉话,无法接通等道路测试时间。
从而可以为移动通信网络服务质量进行考核,来评估某一地区移动通信网络运行情况,从而综合点线面数据进行整体对比分析来发现点线面三种层次的问题来指导全国范围内的移动运营商进行业务质量优化与服务水平提升。
但是,传统的道路测试及问题分析都是“亡羊补牢”类的行为。
都是在发现问题,分析问题,解决问题的流程上进行的。
如此以来,就使得移动通信网络优化工作中的道路测试与分析工作呈现出一种滞后性,也就是说问题已经存在了,发生测试事件了移动通信网络优化人员才能发现网络问题,进而去解决发生问题的点。
无论是从优化工作的困难和工作量来看,还是从用户对移动通信运营商直观业务感知角度出发,抑或是从运营商集团对某地区移动通信运营商考核角度评估,这都是一种被动的现状,主动的成分欠缺。
而且,对于覆盖面较大的地区,有上万个基站,服务上千万人口的地方,道路测试工作的成本也是居高不下。
随着通信网络的发展和移动用户的巨量增长,针对这种现状和瓶颈,迫切的需要移动通信运营商和移动网络优化人员转变思想,利用现在比较成熟的一些计算机技术和数据库技术等通过后端,也就是通过分析网络基础数据从而对道路覆盖问题点,道路测试故障点进行一定程度的预测分析,从而较为全面的分析预测网络问题,也节省大量的劳动力资源,达到国家对于节能减排的倡议要求。
我们对于某地区的道路数据问题预测分析,主要从两个角度出发。
一是通过搜集必须的网络测量数据以及己经收集到的网络业务数据,来对网络整体进行业务及服务建模,通过建立的模型对网络整体进行面的分析和评估及定位;二是通过一定次数的道路测试数据来获取网络动态业务模型及状态,毕竟道路网格的测试数据是最能体现一般情况下的网络道路服务质量的。
最后我们需要做的就是结合网络测量模型与道路测试数据,进行综合分析,通过己经发生问题的点,路段,区域来结合网络数据进行反向推理,从而验证发生问题的点,路段,区域是否真正存在问题;进而进行正向预测分析,来列举出网络中存在的隐患路段或区域,为后续优化工作提供良好的、行之有效的建议和预测分析数据。
2.2干扰矩阵分析概述
在阐述干扰矩阵理论之前,必须先说明一下手机测量的定义。
前面移动通信理论己经简要说明了移动通信中的主要设备就是基站和手机,平常移动用户手持的终端也就是手机是与移动通信基站直接进行通信的,也就是两者之间直接进行信息交换。
这里涉及到两个问题:
2.2.1什么是手机测量数据
手机在通话过程中持续上报测量信息给基站,这些数据保持在OMC的数据库中并且实时更新,手机上报的信息包括RXLEV,C/I,令口区列表,TA值等。
2.2.2为什么使用手机测量数据
因为手机测量数据反映了最真实的信息,反映了用户的动态信息,可以同时提供室内和室外的数据,可以实现话务量和质量的位置关联,也能提供最精确和最可靠的数据源,当然也不需要大量人力资源和特别的投资,最重要的是可以实现7*24小时实时可用,可以用来分析任何时间段的网络性能,比如忙时、特殊时段、夜间、节假日等等。
了解了手机测量的概念及原因之后,我们就很容易理解干扰矩阵的概念。
干扰矩阵,故名思议,是关于网络干扰情况的一个矩阵分析模型,也就是把网络的整体干扰情况进行模式化分析和处理,不但定性,而且定量,从而真实直观有效地反映网络的干扰情况。
干扰矩阵的建立来源是网络基础测量数据,这些数据就是有成千上万的移动终端,也就是手机搜集并上报给基站,然后存储于网络OMC中的数据。
收集测量之前需要在移动通信网络中打开DAC与CF测量。
这两种测量DAC代表DefinedAdjacentCells和ChannelFinder。
分别表征了网络中定义的邻区关系和实时测量发现的信号较强的小区。
通过搜集这两种测量数据,经过大数据分析,尤其是聚类和关联分析,可以为网络干扰情况做出评估模型,从而量化网络干扰情况,为网络问题定位和路测数据预测提供最准确和有效的支撑。
2.3基于矩阵分析的路测数据预测方案
通过对手机测量与网络干扰矩阵的理解,我们基本把进行网络矩阵分析来预测路测数据情况的必须基础给夯实了。
接下来的工作就是基于矩阵分析来制定路测数据预测方案。
本文所采用的预测方案是在建立矩阵分析模型,并获取了至少三轮道路测试数据的基础上制定的。
其中用来建立干扰矩阵的网络测量数据进行了7*24小时的收集,也就是一周的网络基础测量数据,从而来保证网络信息的真实有效。
通过DAC与CF测量生成网络干扰矩阵以后,结合某地区网络中每个小区正在使用的频点来计算出每个小区级别的干扰值和小区内每个载频的干扰值,以泰森多边形的形式来展示,从而迅速找到网络中干扰问题小区,可以定位到干扰小区的干扰载频。
在移动通信领域,网络产生干扰的原因主要就是两个方面,一是频率选择不合理;二是越区覆盖导致。
在900M与1800M双频网络中,我们针对两个频段分别进行干扰定位分析,找出强干扰小区列表,给出相应的优化建议。
进而通过覆盖优化和频率优化降低目标小区或目标区域甚至是全网的干扰值。
2.4基于矩阵分析的路测数据预测模型
2.4.1路测数据采集
路测数据来源为某地市的主干道道路测试情况,数据采集时间为移动用户使用量较大的时段,即忙时。
一般情况下为早八点至晚八点。
通过专业的道路测试软件,如华星、日讯、鼎利、TOM,TEMS等对覆盖主要干道的移动通信基站信号进行业务测试并收集测试过程中所采集的采样点,保存为特定格式的数据,便于通过专业软件进行历史记录回放与分析工作。
2.4.2干扰数据采集
网络干扰数据的来源为一段时期内,一般情况下为一周,所收集的网络底层干扰数据。
本文所采集的数据是通过对某地市移动通信网络开启DAC(DefinedAdjacentCells)与CF(ChannelFinder)两项测量搜集的基础数据。
分别代表了网络中定义的邻区配置数据与网络中未定义但信号强度较强的附近小区。
通过采集这两种测量的大量样本数据,来建立矩阵分析模型,对网络干扰情况进行综合分析。
2.4.3建立矩阵分析模型
干扰矩阵分析模型的建立,主要是通过测量申请、数据采集、数据存储、算法导入、模型建立等五个步骤。
由于在网络中开启测量收集数据会占用较多的网络资源,因此默认情况下非必须测量是未开启状态。
因此建立矩阵分析模型的第一步是申请相关测量开启,这一步需要明确测量周期,目的在于尽可能完整的搜集网络基础测量数据,使其有效性最佳。
其次是数据采集与数据存储,这两个步骤互相交叉,同时进行,因为数据收集以后是直接存储于OMC数据库中。
而在进行前三个步骤之后,我们就获取了比较全面的网络干扰测量数据,在收集完毕数据之后,结合某地区网络的当前频率资源使用与配置情况,导入干扰矩阵算法后,就形成了网络干扰矩阵模型。
模型建立之后是以泰森多边形的界面来展示网络干扰情况的。
通过直观的展现,我们可以结合地理信息工具对某地区网络的单个小区及其载频的干扰情况进行定位和分析,从而节省大量的人力资源。
2.4.4路测数据分析预测
干扰分析和优化
通过使用FEP测量生成网络干扰矩阵(同时支持。
AC/CF测量生成网络干扰矩阵),结合现网中每个小区正在使用的频点计算出每个小区的干扰值和小区每TRX干扰值,以泰森多边形形式展示,迅速找到网络中干扰问题小区。
通过使用最新的干扰矩阵生成方式,即FEP模式,能彻底解决双频网自动优化问题,无需人工调整BALIST,可以大幅缩短采集数据时间。
分别对网络中GSM900频段和DC51800频段的干扰进行分析,找到强干扰小区列表,给出相应的优化建议。
可以通过覆盖优化和频率优化降低网络干扰值。
产生网内千扰的主要原因包括:
频率选择不合理导致干扰,越区覆盖导致干扰。
栅格干扰矩阵分析
路测栅格干扰矩阵展示的是每个栅格内的所有小区都满功率、全负荷情况下的干扰情况。
这些干扰带来的潜在质量问题(如起呼失败、掉话等)是多次路测都无法全面遇到和重现的。
路测栅格干扰矩阵是将一次或多次路测LOG合并后按照N*N(其中N的默认值为50米)的正方形进行栅格化,通过独有的算法计算生成路测栅格干扰矩阵。
路测栅格干扰矩阵输出的主要数据是每个栅格的C/1、RX_QUALITY,服务小区出现次数、RXLEVEL,干扰小区出现次数、干扰频点和RXLEVELo
路测栅格干扰矩阵的优势在于:
(1)高效、准确找到路测中潜在质差点
(2)全面提升道路优化质量
(3)减少不必要的路测数量,节约人力资源
(4)基于路测栅格干扰矩阵的分析和优化必将成为三方保障的有力支持
3基于聚类分析的后台数据优化
后台数据是相对于道路测试数据而言的。
一般来说,在移动通信网络优化领域,按工作内容和工作职责来说,分为前台和后台两种。
前台主要是指道路测试,定点测试,现场调整等工作类型;而后台则主要是指网络KPI分析与优化,故障排查与定位,告警监控与处理等工作类型。
本文提出的后台数据优化就包括了以上几种后台工作类型。
提出了基于聚类分析来对纷杂的后台数据进行处理和优化,从而提升网络KPI,提高用户感知度的一种移动通信网络优化方法。
3.1后台数据分析的困境
在目前移动通信网络优化工作中,纵观全国范围内运营商业务部门设置与网络优化工作人员工作内容安排及工作效率与实施周期等,尤其是随着网络规模与移动用户的突增,网络优化工作尤其是后台数据分析工作已经达到了一种瓶颈。
主要原因在于建网之处,网络规模小,用户数量少,一些数据的维护与告警的监控及故障的排查通过人力完全可以解决,随着网络的增加,相应部门人员也呈现增加的趋势。
但是,由此带来的并不是工作与优化效率的等比提升,相反确是存在移动的冗余与混乱,不单单是工作分工的明确与否,还涉及网络建设与优化的整个流程,毕竟每个步骤都不是单独存在的,需要前后步骤的衔接以及周围环境的沟通协调。
尤其是数据量特别巨大的时候,仅仅依靠人力很难统筹兼顾所有。
举例来说,某地时建网初期有100个基站,5万用户,一般情况下故障站点1%左右,也就是一两个基站有问题,可能影响500个用户;但是网络发展后,有了1000个基站,100万用户,故障率维持1%的情况下就有10个基站有问题,影响约一万个用户群体。
因此,建网之初与网络高速发展之后单从数字数量级开看,几乎是几何增长,由故障与问题所带来的影响已经不是单靠几个人或几十人所能解决的。
虽然目前移动通信运营商也有一些管理平台投入使用,但是其效率与效用确实有待提升,最简单的一点就是管理平台不统一,数据共享不充分,由此造成了信息冗余与混乱,不但无法提升工作效率,反而有所降低。
目前移动通信网络优化所面临的这些困境,就迫切需要提出一种基于网络数据的新的管理办法与分析处理手段,进行统一规划,集中整理,需要明确规则,需要确定方法,通过层级管理与分析模式,以一种清晰明确的网络结构来进行管理和优化,从而提升效率,提高移动通信产业的生产力。
3.2后台数据库与网络结构
通过前述部分对移动通信网络结构的说明,我们可知,移动通信网络优化人员主要接触与操作维护的为OMC数据库部分。
某地市移动通信网络OMC数据库由ORACLE数据库厂家提供。
因此,在针对某地市移动通信网络优化过程中,大量基础数据与测量数据的存储与提取均通过ORACLE数据库进行。
在移动通信网络结构中,后台数据库属于OSS(OperatingSubSystem)。
对于某地市既定网络模型与数据库结构,主要涉及以下内容:
数据库建表
在数据库中创建表是移动通信网络优化的后台数据库常用操作,在网络建设完成投入运行以后,数据库结构是固定的,这时就需要往空洞的数据库中添加一些必须的数据,以方便监控网络运行状态并及时发现网络问题。
在某地市移动通信网络中,我们需要创建的表有网络基础配置表、网络新能表、网络告警表、网络网元表等各种不同专业的表格,分别对应网络基础数据、网络测量与KPI数据、网络告警数据以及网络组成单元的数据等等,这些纷杂的数据就构成了宏大的移动通信网络OMC数据库,是整个网络运行及状态的数据集成,重要度很高。
数据库查询
数据库查询操作在移动通信网络优化中也是频繁操作类型。
数据库查询是建立在数据库数据充分、有效、及时的基础上的。
通过创建查询表,可以从数据库的各种表中取出所需要的数据,比如某地市移动通信网络在春节前后的业务量情况、告警出现情况以及网元配置情况等。
最有效的操作就是从不同表中查询所需要的信息组成一个新的表格,来直观的提炼有效数据并直观展示,这样,就节省了大量的人力资源,基本可以通过计算机的自动计算能力得出所需要的结果。
数据库更新
数据库更新是整个移动通信网络OMC数据库部分的重要功能。
由于移动通信网络是在动态建设和发展中,并且移动通信用户的业务模型与用户行为也随时间变化而变化。
因此,对于移动通信网络优化的数据有效性与及时性要求就特别高,这就要求网络OMC数据在特定的时间点,或固定的