IP城域网接入网 最后一公里质量及用户感知评价系统解决方案Word文件下载.docx
《IP城域网接入网 最后一公里质量及用户感知评价系统解决方案Word文件下载.docx》由会员分享,可在线阅读,更多相关《IP城域网接入网 最后一公里质量及用户感知评价系统解决方案Word文件下载.docx(32页珍藏版)》请在冰豆网上搜索。
1)解决“最后一公里”的维护问题
填补目前“最后一公里”维护空白,通过部署不同种类的测试探针设备,全面针对全用户类型进行监测,形成“以测代管”方式方法有效解决“最后一公里”的维护死角。
通过主动监测模式,实时感知网络承载业务的质量,在网络用户发现问题之前将网络出现的质量下降情况报告给网管系统。
同时还可为网络的客户提供主动的服务,降低问题发现和解决的时间,降低客户的投诉率,提高用户的满意度,提升管理水平。
2)完善宽带新装机流程
目前的宽带及宽带相关业务新装机采用比较简单的业务开通测试,没有形成完善新装机指标测试体系,导致很多新装机用户的投诉,以及维护人员针对新装机用户的二次上门排障工作,浪费了大量的人力物力,并导致新装机用户的满意度下降,这使运营商针对完善宽带及宽带相关业务新装机流程需要重点考虑和完善。
通过多种形式的测试探针,完成宽带及宽带相关业务新装机的基础链路质量测试、带宽验证、数据业务测试、IPTV业务测试等测试数据及指标,填补目前宽带新装机流程中测试方面的工作环节和指标的缺失,提高宽带新装机工作效率,提高新装机用户的满意度,降低新装机用户的二次申告和维护成本、降低新装机用户的退网率。
3)建立完善用户感知评估体系
为进一步完善用户感知评价体系,采集与客户感知密切相关的指标参数,实现宽带接入业务实现过程中的全程质量测试和评估,城域网及接入网链路质量的全程测试和评估,需建立一套用户感知评估体系。
4)完善运营商故障申告及故障处理流程
完善目前故障申告和故障处理流程,加大用户端测试能力,改善目前运营商“10010平台、10086平台、10000平台、10050平台”等的“记录—派单—处理—反馈”的流程模式,加入“故障预警—用户端测试”等关键步骤,提高故障预判效率,提高客户故障处理方面的满意度,减少由于服务引发的离网的机率,提高运营商整体故障处理的效率。
2.“最后一公里”部署建议
1.1.设备部署示意拓扑图
1.2.设备部署说明
➢机架式硬件探针:
多用于在城域网的BRAS侧、汇聚节点、核心节点、OLT侧进行部署,通过多端口的接入方式,完成运营商城域网的日常网络质量及业务质量监测工作,同时也是底端用户侧探针的测试目的端。
➢微型硬件探针:
多用于在运营商接入网机房、FTTB的ONU侧进行部署,模拟测试覆盖区域内的一个宽带数据用户进行日常及故障排查测试。
➢手持测试探针:
常态仪表形式的测试探针,通过仪表屏幕直接显示的方式,用于用户新装机和日常上门维护工作中,直观的测试和数据输出。
➢Web软件测试探针
安装于客户PC机上的支持windows操作系统的软件测试探针,由客户进行界面操作,并且直观显示测试结果,可以用于宽带新装机测试以及日常故障处理。
➢家庭网关嵌入式探针
依托家庭网关的硬件设备,以软件嵌入方式实现测试探针基本功能的嵌入式探针,由于家庭网关具有在线率高的特点,用于联机数据拨测和故障处理数据采集等相关工作,有效解决FTTH模式下用户端链路质量和业务的监测工作。
➢机顶盒(STB、MC)嵌入式探针
机顶盒(STB、MC)作为IPTV系统的业务终端,以软件嵌入方式实现测试探针基本功能的嵌入式探针,由于该业务和该设备只在IPTV系统使用时才在线的特点,只用于针对IPTV业务的基础数据采集和故障处理数据采集工作。
3.方案详解
1.1.解决“最后一公里”的维护问题
针对现有运营商不同接入方式的匹配不同测试探针类型,达到针对“最后一公里”的监测目的。
1)接入方式全覆盖
a)FTTH接入方式
通过在光接入家庭网关ONT设备中嵌入“家庭网关嵌入式探针”进行部署,理论上能够达到FTTH用户的全覆盖工作,有效弥补目前FTTH用户无法测试的空白,由于ONT设备具有在线率高的特点,可用于联机数据拨测和故障处理数据采集等相关工作。
b)FTTB接入方式
此接入方式多采用PON+LAN,以楼道ONU方式进行接入,监测的方式采用在楼道的信息箱中部署微型硬件探针的进行测试采样点,模拟本ONU区域或者OLT某一方向的数据监测,作为现有FTTB接入方式的用户接入质量和感知评价的监测方式,用于联机数据拨测和故障处理数据采集等相关工作。
c)DSLAM接入方式
在DSLAM接入网机房中部署微型硬件探针进行测试采样点,模拟本DSLAM覆盖用户区域的监测采样,作为现有DSLAM接入方式的用户接入质量和感知评价的监测方式,用于联机数据拨测和故障处理数据采集等相关工作。
2)常规监测
每种测试任务类型,设置相同的任务参数和测试调度时间间隔,并根据不同的接入方式和不同网络层面的接入环境,设置不同的告警阈值门限。
测试结果自动每周以统计报表形式汇总给相关维护人员,同时告警信息实时发送给相关维护人员,以方便维护人员统计常态网络质量和突发问题事件。
3)故障监测
a)网络基础质量
✓PING测试,可增加到问题节点的逐跳节点IP的监测,并缩短测试调度时间间隔即增加测试密度,以定位问题网络。
✓吞吐量测试,可临时定制吞吐量测试,已协助维护人员掌握当前测试探针的接入带宽情况。
b)宽带业务质量
✓到相关业务服务器的基础网络质量监测:
可临时增加到问题业务服务器的基础网络质量测试,以定位是否网络故障。
✓临时增加问题业务测试的测试密度
1.2.宽带及宽带相关业务新装机流程
1)宽带及宽带相关业务新装机流程与现有流程的优势:
a)增加现场装机人员的现场测试工具:
手持测试探针、WEB软件测试探针;
b)现场测试数据的传递工作:
但现场测试数据合格的情况下,上传至测试数据服务器,完成新装机工作流中新装机基础数据的完善工作;
c)现场排障工作:
现场针对用户后台数据和链路问题进行针对性的测试,完成一次新装机的成功率和客户满意度,加入综合网络/业务的测试工作;
d)完善新装机失败分析工作中的数据支持。
2)现场宽带新装机流程中使用的新工具
a)手持测试探针
b)WEB软件测试探针
3)现场宽带新装机测试的重点指标
a)到接入层设备和汇聚层设备的连通性;
b)到指定服务器的上传/下载质量;
c)到指定层面探针的带宽;
d)到指定web服务器的网页浏览业务质量;
e)到指定邮件服务器的邮件业务质量;
f)特殊业务(如IPTV等)的平台交互性质量
1.3.建立完善用户感知评估体系
1)模型构造
✓针对接入网网络及所承载的业务特点进行网络质量和业务质量进行分解;
✓规划网络基础质量的具体指标及权重;
✓规划所承载各业务质量的具体指标及权重;
✓规划各维度(时间、地域等)的权重;
✓规划网络质量及业务质量的权重;
✓建立多维度评估“地域、链路、时间段、业务”等的模型;
✓建立全网质量评价体系的模型;
2)多维度分析
✓地域
✓接入方式
✓忙/闲时
✓业务
3)优化后效果验证
针对某专项进行优化后的效果,进行网络质量和业务质量全方位的评估验证工作,提高优化前后的对比分析。
1.4.完善运营商故障申告及故障处理流程
1)故障申告及故障处理新流程设计目标
a)完善“客户中心”故障初期测试职能;
b)完善综合网管系统的测试功能;
c)建立针对终端用户的网络质量和业务质量拨测功能模块;
d)建立出口网网络/业务质量拨测功能模块;
e)建立城域网网络/业务质量拨测功能模块;
f)建立承载网网络/业务质量拨测功能模块;
g)针对关键平台交互类业务质量拨测功能模块;
h)建立并完善围绕“终端客户”为核心的故障申告及故障处理新流程;
2)现有宽带用户接入方式全覆盖
a)DSLAM接入方式:
以接入网机房为采样点进行数据采集,实现DSLAM用户的测试覆盖方式;
b)FTTB接入方式:
以“小区、楼道”为数据采样点,合理进行覆盖选点,实现FTTB用户的测试覆盖方式;
c)FTTH接入方式:
以“家庭”为单位,在入户设备上嵌入软件测试探针的方式,实现FTTH用户全覆盖。
3)新流程部署的优势
a)客户故障申告的现象重现;
b)实现已客户描述为辅,以测试为主的记录模式;
c)共性问题及时答复;
d)个性问题单独定位与分析;
e)提高用户一次申告满意度;
f)提升故障处理解决时效与问题定位的精准度;
4.测试触发网络优化机制
测试数据统计间隔,指标质量持续多久下降,如何结合其他指标或借助其他手段进行问题定位,对网络优化提供数据支撑。
1.1.网络基础质量优化
1.1.1.时延指标
结合接入层、汇聚层和核心层测试时延指标结果对比,定位故障网络。
1.接入层时延质量问题:
DSLAM接入质量问题,优化末端接入线路质量、改善DSLAM设备转发性能、扩容DSLAM上行链路带宽。
PON接入质量问题,优化PON末端光缆光功率、优化PON无源光网络分光网络结构、扩容OLT上行链路带宽。
2.汇聚层时延质量问题:
优化汇聚交换机性能、优化汇聚交换机上行链路质量
3.核心层时延质量问题:
结合IP综合网管,优化城域网核心出口链路质量、优化核心出口带宽管理机制等
1.1.2.丢包率指标
结合接入层、汇聚层和核心层测试丢包率指标结果对比,定位故障网络。
1.接入层丢包率质量问题:
2.汇聚层丢包率质量问题:
优化汇聚交换机性能、优化汇聚交换机上行链路质量、扩容汇聚交换机上行链路带宽
3.核心层丢包率质量问题:
1.1.3.吞吐量测试结果指标
监测接入层实际带宽分配情况。
该指标不达标,需要优化接入层网络链路质量,结合IP综合网管监控接入层设备上行链路带宽占用情况,如果确为上行链路带宽不足则需要对上行链路带宽进行扩容。
1.1.1.1.通过不同指标组合和指标间的对比可以协助定位主要故障点,给出处理或优化建议
指标
现象
故障分析
优化方案
时延、抖动、丢包率
指标质量下降
结合接入层、汇聚层和核心层的测试结果对比分析
接入层质量差、汇聚层和核心层质量较好
优化接入层网络质量
接入层、汇聚层质量较差,核心层质量较好
优化汇聚交换机或BRAS的上行链路质量
接入层、汇聚层和核心层质量均较差
优化核心层出口链路带宽分配策略或进行链路扩容
吞吐量测试结果
小于3.2M
结合综合网管及Radius系统,核实账号实际开通带宽,是否带宽受限
开放带宽到要求标准
结合IP综合网管查看是否接入线路质量问题
优化接入线路质量
4M带宽,丢包率指标较差
结合IP综合网管查看接入层设备上行链路带宽占用情况,是否上行链路带宽满载
优化上行链路,重新定义带宽分配策略或扩容上行链路带宽。
1.1.1.2.结合汇聚层和核心层的测试结果定位存在丢包的网络:
(1)接入层丢包,汇聚层和核心层无丢包
检查相关接入层网络质量,DSLAM接入需要查看DSLAM接入线路质量,并结合IP综合网管查看相关DSLAM设备状态,定位故障点;
PON接入需要查看PON末端光网络的光功率是否符合要求、结合IP综合网管查看OLT上线链路带宽占用率及PON设备状态,定位故障点。
(2)接入层、汇聚层丢包,核心层无丢包
配合IP综合网管,查看测试探针所在汇聚交换机及BRAS的上层路径质量,定位故障点
(3)接入层、汇聚层和核心层均存在丢包现象
结合IP综合网管,查看核心网络质量,定位故障点
(4)优化监控部署
增加临时PING测试任务,测试接入层到BRAS的通断质量,每次测试发包个数可以调整为5-10个包,测试间隔可减少到2-3分钟,在常规测试故障高发期期间进行测试。
1.1.1.3.通过不同指标组合和指标间的对比可以协助定位主要故障点,给出处理或优化建议
丢包率
100%
查看测试探针端口是否中断
处理物理线路故障
查看测试探针接入端口是否拨号失败
结合IP综合网管查看接入设备相应端口
拨号业务数据是否正常
调整业务数据,使业务恢复正常
全天持续丢包
查看接入线路的质量,包括DSLAM的外线质量和PON的末端光功率是否符合要求
优化外线质量及PON光传输链路质量
业务高峰期出现丢包
配合IP综合网管,查看业务高峰期时接入设备的转发性能及上行链路带宽占用率。
优化接入设备上行链路,调整带宽分配策略或扩容上行链路带宽
1.1.1.1.
1.1.4.用户测速达标率的支撑
1.1.1.2.测速达标率的统计原理机制
用户在测速网站点击开始测速后,用户PC会和就近的测速服务器建立TCP链接,测速服务器给用户进行TCP的吞吐量测试,最终得出用户PC与测速服务器间的实际带宽。
N=实际带宽/用户开通带宽,当N大于集团要求则达标,否则不达标。
测速达标率=达标测试次数/总测试次数
导致不达标的原因:
用户与测速服务器间网络质量差、网络带宽存在瓶颈
1.1.1.3.哪些指标的异常会导致用户实际带宽下降
探针到省公司的实际TCP吞吐量值、到就近测速服务器的TCP连接质量及网络开销
故障表象指标
吞吐量
故障分析指标
TCP连接时延、延时
1.测试结果分析
(1)根据接入层吞吐量测试结果,查看接入层实际宽带是否符合集团标准要求
(2)接入层、汇聚层丢包,核心层查看服务可用性中TCP连接时延指标及PING测试中的时延指标结果对比,可以查看测速服务器响应性能及不同网络层次到测速服务器的网络开销质量。
(3)优化监控部署
增加临时PING测试任务,测试接入层到测速服务器间各跳节点质量,每次测试发包个数可以调整为1000个包,测试间隔可减少到60分钟,在常规测试故障高发期期间进行测试。
新增临时吞吐量测试任务,测试接入层到汇聚层探针(即省干)的TCP吞吐量质量。
1.2.互联网业务质量测试
1.1.1.DNS测试
1.1.1.1.影响DNS测试质量的指标
DNS解析时延
网络时延
1.体现业务质量指标:
2.DNS解析时延指标问题
(1)结合接入层、汇聚层和核心层测试结果对比,查看时延变化明显的网络,找到时延增大明显的网络。
(2)结合针对DNS的PING测试,判断是否网络问题。
如果DNS解析时延指标质量下降,PING测试时延指标结果无明显变化,则为DNS服务器响应问题,需要优化DNS服务器;
如果DNS解析时延指标质量下降,PING测试时延指标结果也存在明显的下降趋势,则为网络基础质量下降导致。
1.1.1.2.通过不同指标组合和指标间的对比可以协助定位主要故障点,给出处理或优化建议
网络时延较好,DNS解析时延较差
DNS服务器对测试网站的响应性能较差
优化服务器响应性能
网络时延较差,DNS解析时延较差
结合接入层、汇聚层和核心层的DNS及PING测试结果对比分析,定位故障网络
接入层差,汇聚层和核心层较好
接入层和汇聚层差,核心层较好
结合IP综合网管,对汇聚交换机上行链路级BRAS的上行链路进行优化
接入层、汇聚层和核心层都较差
增加到DNS的逐跳节点IP的PING测试,查看具体故障网络,并结合IP综合网管进行网络优化。
1.1.2.WEB访问测试
1.1.1.2.影响WEB访问测试质量的指标
下载速度、总时延
网络时延、DNS解析时延、连接时延、首字节达到时延、传输页面文件时延、传输页面元素时延
1.体现用户感知指标
2.体现业务质量指标
DNS解析时延、连接时延、首字节达到时延、传输页面文件时延、传输页面元素时延
3.下载速度指标问题
受该指标影响的其他指标有:
传输页面文件时延、传输页面元素时延、总时延
(1)结合接入层、汇聚层和核心层测试下载速度指标结果对比,判断是否WEB服务器限制下载速度,优化WEB服务器页面信息下载限制策略
(2)结合基础网络质量测试中的吞吐量测试,判断是否接入带宽受限,优化方案详见4.1.3
4.总时延指标问题
影响该指标的其他指标有:
连接时延、首字节达到时延、传输页面文件时延、传输页面元素时延、下载速度
(1)下载速度慢,造成传输页面文件时延和传输页面元素时延变大,导致总时延质量差,优化方案
(2)连接时延和首字节到达时延慢,结合临时部署探针到目的网站的网络基础质量测试,定位是否是网络质量问题。
是网络质量问题,则针对TRACEROUTE结果中每一跳节点IP进行PING测试,根据测试结果对比,定位问题网络,进行网络优化。
不是网络质量问题,则为服务器性能响应问题。
(3)传输页面文件时延和传输页面元素时延慢,查看下载速度指标,如果下载速度指标慢,则根据下载速度的问题定位及优化方案进行处理;
如果下载速度没问题,则查看是否待下载元素资源较多即页面过于华丽导致;
如果待下载元素资源不是很多,则是服务器响应问题。
总时延
下载速度慢;
ISP运营商本地网内
结合接入层、汇聚层和核心层测试下载速度指标结果对比,判断是否WEB服务器限制下载速度
针对问题网站的所有测试下载速度均较慢
优化网站服务器的限速策略
接入层下载速度慢,汇聚层和核心层较好;
吞吐量测试不达标
根据吞吐量优化方案进行优化。
吞吐量测试正常
结合IP综合网管对接入设备及接入层链路进行优化
ISP运营商外省网内、网外
结合接入层、汇聚层和核心层测试下载速度均慢
结合到问题网站逐跳的PING测试结果,出省后时延指标下降明显
优化省际电路质量
结合到问题网站逐跳的PING测试结果,互联互通时延指标下降明显
优化互联互通质量
增加到DNS的逐跳节点IP的PING测试,