单站业务类问题定位手册定点下行速率类文档格式.docx
《单站业务类问题定位手册定点下行速率类文档格式.docx》由会员分享,可在线阅读,更多相关《单站业务类问题定位手册定点下行速率类文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
汪江波
V1.0.01
修改以及增加
目录
引言4
编写目的4
预期读者和阅读建议4
参考资料4
缩写术语4
LTE峰值速率调测4
1.峰值数据参考数据4
2.业务速率问题定位流程6
3.业务速率问题定位步骤6
3.1基站/小区配置和状态检查6
3.2终端和测试电脑、服务器问题排除7
3.3核查基站配置参数7
3.4基站和空口环境问题排7
3.3.1.在线用户数查询7
3.3.2.空口无线环境差8
空口环境差—主要为BLER高8
小区重叠覆盖高—系统内干扰高9
3.5传输带宽问题排除10
3.5.1.镜像抓包方法和简单分析10
3.5.2.业务CDL日志分析方法:
12
3.5.3.71号日志分析S1丢包方法15
附1:
空口信号好点的选取16
附2:
wireshark数据典型问题分析17
引言
编写目的
在中国移动/电信LTE一期新建设项目中,各地需要针对新开通的LTE站点,面向客户进行相关的业务演示,各种演示方案的基础是单小区性能调试到最优。
预期读者和阅读建议
LTE项目网络优化经理、单站优化测试人员、系统技术人员。
参考资料
《TD-LTE业务演示参数配置指导手册》《TD-LTE业务业务速率定位方法》
缩写术语
BO:
BufferOccupied
LTE峰值速率调测
1.峰值数据参考数据
1、理论峰值数据表:
商用终端峰值速率列表:
商用终端UE能力等级为3
传输模式
上下行子帧配比
上行峰值
(96PRB)Mbit/s
下行峰值(100PRB)
TM1
2U2D
19.57Mbit/s
39.528Mbit/s
默认:
10:
2:
2,Dwpts有数据
1U3D
9.7872Mbit/s
54.6032Mbit/s
(96PRB)
下行峰值(SFBC)
下行峰值(SDM)
TM3
59.57Mbit/s
79.98Mbit/s
1U3D(双模)
45.2256Mbit/s
61.2288Mbit/s
双模,3:
9:
2,Dwpts无数据
商用终端UE能力等级为4
下行峰值(100PRB)
79.056Mbit/s
109.2Mbit/s
90.4512Mbit/s
2.业务速率问题定位流程
3.业务速率问题定位步骤
3.1基站/小区配置和状态检查
通过OMC或LMT查询eNB是否有影响业务性能的异常告警(例如小区降质、部分RRU通道异常等),如果有类似告警,先处理清除相应告警后查看业务峰速是否能达到正常。
如果峰速测试任务比较紧急,某些告警清除短时间内不能快速清除,建议可通过复位基站直接排除相应告警后进行峰速测试。
如果峰值速率仍然偏低,可进一步查询eNB的基本数据配置是否合理。
3.2终端和测试电脑、服务器问题排除
现场有条件的话,可以基站进行测试,如果其它基站下速率都正常,可以排除测试终端,测试笔记本、服务器等因素;
反之,逐一排除。
3.3核查基站配置参数
通过参数一键恢复功能排除可以排除一些基站未按照参数模板设置或者人为的修改操作导致的速率问题,建议参考一键参数恢复功能完成或者更换基站参数模板。
3.4基站和空口环境问题排
3.3.1.在线用户数查询
通过OMC或LMT查询当前小区是否有其他用户接入占用了部分资源;
如果经过上述排查后,用户峰值速率仍然偏低,则建议先进行基站侧的问题排查,先通过在eNB侧打BO进行测试,用以排除峰值速率偏低是否与eNB有关。
eNB侧打BO后,如果速率正常,证明基站处理和空口没有问题,则可以进一步排查其他网元或传输网、服务器的配置
当小区内用户多时,如何确认测试用户的UE索引ID
1、打开LMT工具→TDL专用功能→UE业务面显示当测试用户在小区3时,设置如下图所示选择按照小区查询/小区索引(0~12设置3)然后查询
2、确认核心网给测试用户分配的IP地址(如10.240.163.51)对应如下图小区内的UE索引就是192
3、打下行BO的方法
打开节点TD-LTE小区→测试开关→MACBO测试开关修改对应小区(如下图)小区3下行BO开关状态由关闭改为打开,UE起始索引191UE数目设置1其它参数默认即可
4、发PDCP真实数据的方法与打BO方法一样,将BO开关有关闭改为发PDCP真实数据即可
5、终端侧可以看到打MAC层以及PDCP层的下行吞吐量大于80M左右
6、通过打BO来分析空口速率是否可以达到峰速,如果打BO后UE可以到达峰速,说明非基站问题,需要排查其他网元或传输网、服务器等的配置是否合理;
如果不能到达预期的峰速,则需要对空口信号质量进行排查。
3.3.2.空口无线环境差
排查以上因素,打BO后小区的MAC层速率依旧很低,怀疑空口环境差导致
✧空口环境差—主要为BLER高
当速率低时空口环境排查首先关注BLER,尤其是残留BLER。
由于FTP是双向的,因此上下行BLER都需要关注。
如果初始BLER大于10%或者有残留BLER,需重点关注。
对于下行BLER高,需要先确认终端侧是否也有BLER。
如果终端侧没有bler,则可能是基站ACK译码错误或终端没有检到PDCCH,首先检查测试小区是否配置了异频临小区,如果配置了,需确保“MAC测试开关”中的“测量GAP处理开关”为“打开”。
如果终端侧的BLER与基站侧BLER接近,需要确认是否空口环境较差,查看终端侧的SNR和RSRP,好点SNR应大于20;
也可尝试基站关闭下行AMC,固定MCS为较低等级看BLER是否消除,如果bler随MCS降低而降低,则可基本确认是环境问题。
如果BLER与MCS无关需查看是否有时钟相关告警,通过LMT查看RRU底噪,上下行增益等。
对于上行BLER高,通过LMT查询上行IOT信息确认是否有干扰,也可以通过关闭上行AMC,固定MCS为较低等级看BLER是否消除,如果BLER随MCS降低而降低,则基本确认是环境问题。
如果BLER不变,需要PL同事定位
通过提取Ping日志(L2Ping过程日志及PDCP数据内容日志)和业务CDL日志进行进一步分析定位。
✧小区重叠覆盖高—系统内干扰高
在SINR好点、MCS等级太低(无法采取64高阶调制方式导致速率很低),若此时闭掉同站其余2个小区,MCS瞬间提升(基本全部采取64QAM),下载速率瞬间大幅提升(如下图关闭基站内另外2个小区后速率正常)
查看小区子帧2/7的IOT指标比较高
小区重叠覆盖问题解决方法
调整天线方位角以及降低小区的参考信号功率
相反无线环境非常好,打BO后MAC层速率正常,请按照下一章节内容进行操作定位。
3.5传输带宽问题排除
首先,建议对传输带宽和业务服务器的带宽是否受限进行确认。
如果说传输对终端业务峰值速率有影响,一般表现在端到端链路的业务带宽上,为了排除传输的问题,需要逐个节点排查,找出所有节点中传输带宽最小的一个,作为整条业务链路的传输带宽。
只要链路的传输带宽大于峰值速率两倍以上,应该就不会影响峰值速率。
其次,传输带宽问题一般使用Wireshark镜像抓包或者业务CDL日志的数据分析进行排查确认相关的问题,如果通过抓包数据分析或者业务CDL日志分析,确认在基站入口以上的数据存在较多的丢包重传现象,可以确认此问题为传输侧或者服务器侧存在丢包情况,需要通知传输相关人员定位。
特别说明:
外场反馈的速率问题主要和传输带宽受限相关,本文进行了介绍,其他影响速率的因素还包括时延抖动较大或者服务器能力受限,本文未进行相关说明。
下面分别介绍了抓包方法和简单分析以及业务CDL日志的提取方法和分析:
3.5.1.镜像抓包方法和简单分析
在LTE的LMT-B上选择“传输管理->
镜像功能”,右键点击将镜像开关设置为打开,这样在基站的外部调试网口就镜像了S1口的收发数据,抓取对应的数据相当于获得了外部网元与基站的所有交互数据。
通过基站侧镜像抓包获得的内容如图所示,抓到的数据包源IP和目的IP均为基站内部IP包的协议类型为UDP。
启动wireshark跟踪;
(要抓到终端TCP连接建立过程中的消息);
Capture的optiong选择设置每个包存100字节,这样可以减少log的大小。
此时需要选中其中一条报文,右键选择“DecodeAs”,选择按照GTP报文协议进行解析。
按照GTP协议解析后,数据包的源IP和目的IP变为了真正的服务器与终端的IP,例如下图中序号7的数据包为从服务器112.15.166.94发往终端172.16.0.76的下行GTPU包,长度为1450字节。
分析方法见附录2。
在LTE的LMT-B上选择“小区”>
>
选择小区>
右键>
“修改CDL开关”>
三个开关全部置为“打开”。
测试后由CDL服务器提取业务CDL文件。
通过CDLBrowser工具(伴随版本发布的CDL工具)打开,如下图:
CDL日志打开后,点击“事件名称”尖角符号,选择“GTPU_DATATCPANALYSIS”,过滤出所有TCP分析消息,该消息每个承载10秒一次性上传10条,10条的记录间隔为1秒,如下图:
根据消息时间查找测试时间段消息,根据服务器IP和终端IP或承载TEID查找测试用户。
如图:
分析下行重传率:
DlRetranNum/DlTotalRecvNum,其中DlRetranNum为下行重传报文数,DlTotalRecvNum为下行总报文数。
重传率大于万分之一为影响下载速率,若大于百分之一,在5下载线程情况下,速率只能达到峰速的1/2左右。
分析重传大致原因:
DlDataLostNum为下行丢数据报文导致的快速重传次数,DlDataLostAckNum为超时重传次数。
分析乱序率:
DlDataUnorderNum/DlTotalRecvNum,乱序一般不会影响速率,除非乱序非常严重。
分析下载速率和线程数:
速率DlDataRate,单位KB,线程数TreadCount,需要说明的是无论丢包率多高,只要空口质量良好,均可以通过增加线程数使得速率达到峰速,因此,线程数是速率的前提,定义现网峰速概念:
即现网可以达到的较理想速率,约为理论峰速的80%-90%,根据现网测试情况如下,可作参考。
a)5线程,重传率小于万分之一,空口BLER平均在3%以内,下载可以达到现网峰速。
b)5-10线程,重传率约千分之一,空口BLER平均在3%以内,下载速率可以达到1/2现网峰速。
c)30-50线程,重传率千分之二以内,空口BLER平均在3%以内,下载速率可以达到现网峰速。
d)50线程以上,重传率千分之三以内,空口BLER平均在3%以内,下载速率可以达到现网峰速。
3.5.3.71号日志分析S1丢包方法
提取日志方法:
使用LMT提取打开LMT在线模式→日志管理→ENB日志→板卡日志→板卡名称→处理器名称SCP右边信息框选择71DD驱动日志上传至PC机路径
上传的71号日志格式enb_874768_20150323053605+8_00000100071
解析日志方法:
打开LMT软件中的LmtZip.exe工具将enb_874768_20150323053605+8_00000100071
解压缩,解压后文件为enb_874768_20150323053605+8_00000100071
.log使用UltraEdit打开
分析方法:
71号日志记录了基站与核心网之间S1信令承载协议SCTP的心跳记录以及信令重传状态。
因此,可以通过SCTP心跳收发率评估基站与核心网间PTN承载网的丢包率。
方法如下,打开71号日志,搜索“36412”,可以找到S1链路信息,以偶联编号(No.)为关键字搜索,如下图以“ddfd5311”搜索。
找到如下图所示S1链路SCTP偶联详细信息,其中sctp_ctlchk_hbchknum
373331为发送心跳请求次数,sctp_ctlchk_hbackchknum
373323为接收到的心跳响应次数。
两者之差为丢包数目。
据此可以统计出S1链路传输丢包率。
空口信号好点的选取
如果发现CQI、RSRP、SNR、BLER不满足好点的要求,则建议先进行好点的选择。
好点的标准:
好点:
好点PDCP速率>
38Mbit/s(RSRP=-85~-95dBm;
SINR=15~20dB)
第一步:
避开阻挡。
在目前的LTE系统中,D频段穿透能力较弱,实测结果看来很难在穿透一栋普通楼宇后还能获得近20dB的SNR。
因此,对于好点的选择,我们首先需要避开阻挡,最好是LOS环境,考虑到实际情况,绕射环境也可接受。
第二步:
沿着服务小区法线方向寻找,尽量避开干扰小区法线方向。
考虑到目前同频组网的LTE系统为干扰受限的特性,获得较高的业务信道SNR才是速率达标的最大保障。
因此我们需要尽量在服务小区主瓣方向选点并且尽量避开干扰小区信号,此时沿着服务小区的法线方向去找点的成功率会较高。
第三步:
适当利用极好点做文章。
在找到极好点后,可以充分利用周边凉亭、雕塑、树林等自然景观进行遮挡,增加无线信道衰落。
一般情况下,只需微调即可获得好点位置。
wireshark数据典型问题分析
常见的业务速率低问题在问题复现时可以上站抓包分析,同时终端侧在对应时间段也可进行抓包分析。
下面是xx站点在复现下行FTP业务速率低时的基站侧抓包结果,复现时该站点小区中仅有一个UE在进行测试,此时基站侧上下行残留bler为0。
服务器侧IP为112.15.166.94,终端侧IP为172.16.0.47。
该抓包针对GTP类型包进行了过滤,并选择了streamindex=5的数据包。
其中序号(No)为28743和28770两行是基站侧连续收到的这个stream线程的两个GTP包,其包序号(Sequencenumber)分别为179521和183601,差值为4080,约为3个GTP包,因此抓包显示TCPPrevioussegmentnotcaptured,仅基站的上一级节点PTN设备存在丢包。
此时终端发起了TCPDupACK,要求重传包序号为180881的GTP包,参见28821行,此后服务器重发了180881和182241两个GTP包,参见28856和28857行。
基站将此数据包正确的发送给了终端,在此之后未再次见到序号为180881的GTP包,这说明基站的正常转发没有问题,之前的丢包现象确实是丢在基站外侧,而非空口环节。