MA5300常见故障处理指导.docx
《MA5300常见故障处理指导.docx》由会员分享,可在线阅读,更多相关《MA5300常见故障处理指导.docx(34页珍藏版)》请在冰豆网上搜索。
MA5300常见故障处理指导
第2章 MA5300常见故障处理指导
SmartAXMA5300多业务接入设备是华为技术有限公司自主开发的IP-DSLAM(DigitalSubscriberLineAccessMultiplexer)产品,MA5300提供ADSL、ADSL2+、SHDSL、VDSL等丰富的业务接入手段,系统集成度高、业务接口丰富、组网灵活,可以满足多种需求。
然而,随着业务量的不断增加及应用的复杂化,可能会产生一些新故障问题。
我们认真分析和总结一些常见的故障问题,并且对这些问题的现象、原因以及处理措施进行了分类和归纳。
希望这篇文档能够帮忙MA5300的维护工程师对缩小故障判断的范围,加快定位问题的速度,并提高故障定位的准确性有所帮助,进而提高维护技术水平,提高故障处理的时效性等。
本章主要介绍MA5300(V100R006版本)的主机系统、ADSL/ADSL2+/SHDSL/VDSL等xDSL业务、以太网业务、VLAN业务特性、组播业务等常见故障进行的处理指导。
详细描述了故障处理流程、故障判断定位方法以及故障处理常用操作等。
希望通过这些内容能够有效地帮助工程师提高MA5300的维护技术水平。
2.1 维护工具使用和常见维护方法
2.1.1 Ethereal抓包工具使用
Ethereal视目前业界普遍流行的抓包工具,详细的功能介绍上可以从专业的网站找到相关说明,在此不再详细说明。
Ethereal抓包工具设置:
在进行Ethereal抓包操作之前应该先将作好物理连接:
把用来抓包的计算机上面的小网网线插到主控板电口上。
双击Ethereal.exe文件打开,选择菜单Capture-->Start,在如图所示的界面上进行设置,"interface:
"栏里选择 计算机与主控板电口相连的IP地址,下拉列表里可以选择,其他的选用默认的,选OK即可。
2.1.2 查看和分析基本信息
1.了解故障现象
针对问题所呈现的现象进行描述,要求尽量描述详细,对每一个细节和每一种情况的具体现象都要进行描述(包括已经作过的操作,以及引起什么样的结果等)。
2.查看主机版本、补丁信息
主机版本:
命令:
MA5300(config)#showversion
补丁信息:
命令:
MA5300(config)#showpatchall
3.组网信息
组网信息对与网络类以及业务类问题的分析很重要。
主要是对出现问题的MA5300设备在整个网络中的一些相关设备进行信息收集,包括与整个流程相关的设备的详细信息、相关连的业务等信息进行收集,最好能够具体了解和分析上行的IP网络设备,用户终端设备,业务特点等。
4.告警信息
命令:
MA5300(config)#show alarmhistoryall
通过上述命令可以查看历史的告警信息的,通过查看告警信息,对故障进行了解和初步
判断。
5.操作日志
有些问题是由于误操作引起,因此有必要通过查看历史操作来定位和处理故障。
命令:
MA5000(config)#showlogall
6.配置信息
配置信息是分析问题必不可少的材料:
命令:
showrunning-config
2.1.3 查看和分析详细信息收集
了解了一些基本信息如果还不能定位问题,就需要进一步的查看更多地详细信息来帮助判断故障点。
在这里列举一些常用的信息搜集命令,更具体可以参考MA5300的随机手册。
MA5300(config)#showtime //系统时间
MA5300(config)#showversion0 //版本
MA5300(config)#showboard0 //单板信息
MA5300(config)#showemu0 //环境监控,如风扇框
MA5300(config)#showcpu0/7 //cpu占用率
MA5300(config)#showinterfaceethernet7/2/0//查看上行链路信息
MA5300(config)#showrunning-config //查看配置
MA5300(config)#showinterfaceadsl0/0/1 //查看业务端口信息
MA5300(config)#showadsllinestateadsl0/0/1//查看ADSL线路信息
MA5300(config)#showarp //查看ARP表
MA5300(config)#showmac-address-table//查看MAC地址表
MA5300(config)#showiproute //查看路由表
MA5300(config)#showterminaluserall //查看当前终端用户
2.2 常见故障处理指导
图2-1典型故障处理流程图
2.2.1 系统常见故障分类及其原因分析
序号
常见故障分类
可能的原因
1
单板无法注册
主机的flash中没有保存ma53io.bin接口板程序。
单板版本和主机版本不配套。
电源、温度、风扇故障。
单板损坏。
所插槽位原来已经注册有单板,并且不支持前后两种单板之间的升级。
单板所在插槽位松动。
2
带内网管不通
网管和设备版本不配套。
上层设备故障。
上行板故障。
传输线路问题。
网管数据配置错误(如团体名、访问列表、MTU等)。
设备和网管之间没有路由。
传输格式兼容问题。
PVC设置问题。
主机上配置了ACL限制访问设备的IP地址。
3
主控板反复重启
主控板组件损坏。
背板插针损坏。
环境、风扇问题。
用户环网问题。
主控板没有插紧。
主机flash中无程序文件。
CPLD、BIOS和程序加载不正确。
4
倒换不成功
主备软件版本不一致。
主备硬件版本不一致。
主备扣板不一致。
备用板故障或者上行端口故障。
系统正在保存配置数据。
2.2.2 系统故障相关案例分析
1.RadiusServer侧数据配置不合理导致PPPoE拨号用户无法通过服务器认证
1) 故障现象
ADSL用户上网,利用PPPoE进行拨号认证,使用的是正确的用户名和密码,但拨号程序返回认证失败的告警信息“authenticationfail”。
过了一个小时再进行拨号,认证通过,可以上网。
RadiusServer侧对帐号可以同时使用的人数可以做限制,并且对异常断链退出的帐户核对时间也可设置。
?
此处由于RadiusServer侧对帐号可以同时使用的人数限制为1,同时核对更新时间由设置的较长。
所以当用户上网时,由于计算机故障或其他非正常原因导致用户侧上网异常中止时,服务器侧还保留有此帐号的上网信息。
?
当用户再次进行拨号时,服务器仍记有此帐号的使用信息,因此认为是非法的访问(使用人数>1),禁止拨号通过,返回认证失败的告警。
?
但过了设定的更新时间后,服务器没有收到用户的任何上网信息,就自动中止了此帐号的上网进程,因此再次拨号就又可以认证通过了。
2) 操作步骤
1. 在RadiusServer侧手工中止此帐号的上网进程。
2. 或者把RadiusServer侧的帐号设置属性里把可以同时使用此帐号的人数加大。
3. 或者缩短RadiusServer侧的用户信息更新时间,例如5min。
2.单板类型不匹配导致无法注册
1) 故障现象
某单板反复重新启动,用户无法正常上网。
在现场定位时发现,单板起来以后,过几分钟自己又重新启动,周而复始。
串口连接到主板,用showversion命令查看版本信息,显示Boardfailed。
使用showboard命令查看单板信息,发现该槽位的单板配置类型与设备面板上显示的单板类型不匹配。
说明:
如果工程师无法去现场查看单板面板,则可以使用showalarmhistory命令查看告警记录,检查该槽位的告警记录,也可起到定位问题的作用.
2) 操作步骤
1. 使用boarddelete命令删除原来的单板。
2. 使用boardadd命令添加单板类型为面板上显示的类型或等待单板起来,使用boardconfirm命令确认单板。
2.2.3 ADSL/ADSL2+业务故障处理
1.ADSL/ADSL2+业务故障常见分类和原因
序号
常见故障分类
可能的原因
1
Modem无法激活或者频繁去激活
ADSL单板故障
ADSL端口状态异常
局端配线问题
用户外线线路问题
户内布线问题
客户端故障
局端和客户端配合问题
2
不能打电话、不能上网
一般为线路故障
3
能打电话、不能上网
Modem故障
线路故障
用户端设备问题、用户使用问题或上行端口问题
4
上网速度慢
线路问题
线路配置模板参数问题(交织深度)
用户终端(Modem、PC等)问题
上行接口节点速率瓶颈问题
5
上网时经常中断
线路太长
Modem前端是否连接其他话音设备
分离器安装问题
其他设备干扰
端口的连接参数问题
外线问题
2.2.4 ADSL/ADSL2+业务故障相关案例分析
1.电话有拨号音,但是不能上网
1) 故障现象
开通MA5300ADSL业务,用户反映电话有拨号音但是不能上网。
首先通过查看ADSLModem的ADSLLink灯的状态,判断Modem所处的状态。
如果ADSLLink灯常亮,则表示Modem已经激活。
问题可能出在用户拨号软件或PC机设置方面;如果ADSLLink灯快速闪烁,则表明Modem还未被激活。
问题可能出在硬件方面。
说明:
Modem所处的状态不同,采用的故障处理方法也不同。
2) 操作步骤
1. 当Modem处于激活状态时,应检查用户的拨号软件安装是否正确,PC机的设置是否正确。
2. 当Modem处于未被激活状态时,首先检查对应ADSL端口的状态。
如果端口处于去激活状态,应激活端口。
如果问题仍没解决,则需要对硬件进行检查。
检查方法如下:
?
先确定Modem能够正常工作。
?
检查用户线缆的插针。
如果发现对应的插针弯曲,应将其矫正后接好。
?
拔插一下ADSL单板,检查该单板与MA5300背板接触是否牢靠。
?
如果插拔ADSL单板后问题仍未解决,则换一块无故障的ADSL单板进行测试。
2.打电话时ATU-R容易出现去激活现象
1) 故障现象
当有电话打入或主动拍叉电话机时ATU-R出现去激活现象。
引起ATU-R去激活的原因主要有两种:
一种为ATU-R故障,另一种为线路故障。
由于ATU-R去激活现象集中发生在打电话振铃或拍叉电话机时,因此基本上可以将问题定位为用户侧线路不符合规范要求,应着重对线路的规范性进行检查。
2) 操作步骤
1. 更换用户侧的ATU-R,问题未解决。
排除了ATU-R的问题。
2. 断开用户家的线路,在机房配线架边模拟使用电话对ATU-R的影响,没有出现去激活现象。
3. 在用户侧配线架上模拟同样的情况,也未出现ATU-R去激活现象。
4. 此时可以断定是用户家中的布线的问题。
检查用户家中的线路进线盒,发现使用的一对电话线中的白线接错了线对,相当于地线是悬空的,导致了ADSL线路不断去激活。
重新连接电话线的进线后,去激活问题得到解决。
3.网卡软硬件设置不一致导致上网速度很慢
1) 故障现象
某ADSL用户的计算机上网速度很慢,下载的速率只有约1Kbit/s,甚至只有几百字节每秒。
重启主机多次,问题依旧。
用户发Ping包,发现有丢包现象。
一般有以下几种原因可以导致ADSL用户上网速度慢。
1. 用户计算机问题。
用户计算机问题一般表现在以下几个方面。
?
计算机配置太低。
?
计算机系统问题。
?
计算机网卡软硬件设置问题。
2. ADSLModem的问题。
有时ADSLModem质量差或与MA5300配合得不好都会导致用户上网速度慢。
3. 物理线路存在问题。
电话线质量差会导致数据包丢失。
4. MA5300端口带宽设置不正确。
MA5300侧端口带宽值设得太小也会影响用户的上网速率。
2) 操作步骤
1. 使用另一台计算机进行测试。
没有发现丢包现象。
用户上网正常,下载速度在150Kbit/s左右,点播VOD也很流畅。
因此断定问题出现在用户计算机上。
2. 检查用户的计算机。
?
检查用户计算机的配置
用户的主机配置:
奔腾II-750MHZ、256MRAM、10M/100M三合一自适应网卡。
排除了因计算机配置太低而导致用户上网速度慢的可能。
?
检查用户计算机系统
用户计算机系统刚重新安装过,因此排除系统由于使用时间长而出问题的可能性。
?
检查用户计算机网卡软硬件设置
网卡速率被用户强制转换为10Mbit/s,其它设置也正常。
重启计算机再试,问题仍在。
向用户了解到该网卡是重装系统后更换的新网卡。
由于该网卡与前一块网卡型号完全相同,用户在换上新网卡后没有重装网卡驱动程序。
由于新网卡出厂时速率缺省设置为10M/100M自适应,而用户的计算机系统的网卡设置为10Mbit/s,即出现了系统网卡速率设置与网卡硬件的速率设置不一致问题。
将计算机系统网卡速率设置为10M/100M自适应,并重启计算机。
用户上网和点播VOD等均恢复正常。
4.用户线连接错误导致Modem不能激活
1) 故障现象
完成MA5300局端数据配置,以及ADSL端口、ADSLModem、PC机、用户线缆的连接,进行近端0km的ADSL业务的调试。
调试发现ADSLModem无法激活。
在MA5300侧查询对应的ADSL端口状态为“Activating”。
由于在距离为0km处进行调测,不存在线路问题。
因此线路无法激活一般是由线缆连接错误导致。
2) 操作步骤
1. 检查局端、终端数据配置,确认配置正确。
2. 检查用户线与配线架的连接,确认连接正确。
3. 检查ADSL单板、SPL板的连线,发现工程师将用户线直接接在ADSL单板的ADSL接口上。
按照工程规范用户线应该连接SPL板的LINE接口,ADSL单板的ADSL接口应使用DSL线缆连接SPL单板的ADSL接口。
4. 按照工程规范调整线缆连接后,发现ADSLModem的LINK指示灯常亮。
从网管查询,该端口处于激活状态。
5. 在PC机上进行拨号上网测试,业务验证正常。
5.分离器板接线故障导致用户上网中断
1) 故障现象
一个ADSL用户上网时频繁中断。
检查用户端和局端布线均正确,检测线路质量也较好,更换ATU-R,但问题依然存在。
通过分析,唯一没有检查的是用户电缆与单板的连接部分。
当拔下电缆发现该用户的分离器板LINE、PSTN和ADSL线缆对应插针明显插歪,引起线路不稳定。
2) 操作步骤
1. 将线缆插针全部拨正后插入,该用户业务中断情况明显改善。
2. 但当该用户使用电话(呼出或有电话呼入时)中断的概率有50%。
更换ADSL端口后,用户上网稳定。
6.分离器板接线错误导致ATU-R无法激活
1) 故障现象
在开通ADSL业务时,用户ATU-R始终无法激活。
SPL板上PSTN和LINE口的接线接反,电话可通,但ATU-R却无法激活。
2) 操作步骤
1. 检查数据正常。
2. 在配线架测试,ATU-R也无法激活,但用电话听拨号音正常。
这说明线路是通的。
ATU-R不能激活的原因可能是配线架到MA5300的线路质量太差,或者接线有误。
3. 检查SPL板上的PSTN出线与LINE的出线,发现两路接线接反了。
对调接头后,ATU-R正常激活。
7.高频干扰源导致电话有杂音
1) 故障现象
ADSL用户上网正常,但是在打电话的时候,发现有很严重的杂音。
导致电话有杂音的原因有以下几种:
?
分离器问题。
?
接入网侧输出电频偏高,或者输出阻抗不匹配。
?
ADSL线路附近有高频干扰源。
2) 操作步骤
1. 检查分离器,没有问题,但电话有杂音。
2. 更换不同的电话机,还是有杂音。
3. 从接入网侧直接接电话,没有杂音。
但是SPL板的LINE口一接上用户电缆,就会有杂音。
更换SPL板,仍有杂音。
4. 发现MA5300附近有一个电源柜,怀疑是因为干扰太大,导致电话杂音问题。
5. 断开MA5300的LINE、PSTN的接头,在配线架测试,还是有杂音;在配线架的内线处,把PSTN的跳线断开,再在MA5300前拉一根用户电缆打在内线架,故障消除。
3) 总结
本案例中,由于电源柜和MA5300靠的太近,而且用户电缆走线靠近电源柜一侧,引起干扰,导致杂音。
直接在MA5300前面拉一根用户电缆,避免了这样的高频干扰。
8.话音分离器不适合当地频段造成用户话机无来电显示
1) 故障现象
ADSL用户开通了来电显示功能后都反映无来电显示。
由于ADSL用户可以正常上网,可以排除是高频信号出问题的可能性。
由于话音分离器所设置的频段与当地的信号频段不匹配,导致低频信号出现问题。
修改话音分离器的频段后,用户端话机能进行正常的来电显示了。
2) 操作步骤
1. 首先检查用户家中是否接话音分离器。
经检查,用户家中统一安装某品牌的话音分离器。
2. 检查用户家中的接线方法。
经检查,话机与话音分离器连接正确。
3. 在用户配线架上做测试,发现在接了话音分离器后无来电显示,而不连接话音分离器来电可显示,故定位为话音分离器的问题。
4. 做现场测试,发现该话音分离器频段和该局不一致,统一发售的话音分离器无法使用。
扩宽该品牌话音分离器的频段后,用户话机能正常显示来电。
9.配线架打线错误导致ADSL用户打电话有杂音
1) 故障现象
设备开通几个月后,维护人员反映有一个用户突然出现打电话有杂音的情况。
具体现象为:
不上网时,打电话正常,只要上网打电话就有“吱吱啦啦”的杂音。
打电话有杂音是因为有干扰信号掺杂进了话音信号。
在本案例中,用户不上网时打电话正常,只要一上网打电话就出现杂音,说明上网业务导致了话音信号中出现了干扰信号。
那么,只要查清楚干扰信号从哪里串入,就可以定位解决问题。
用户原来使用正常,后来突然出现的异常,说明可能是某些器件损坏或是线缆连接关系发生了改变导致的问题。
问题的切入点通常选在分离器上,可能是分离器的滤波功能不好导致高频数据信号串入话机。
2) 操作步骤
1. 更换用户家中的语音分离器,问题依旧。
这说明不是分离器的问题,也说明该噪音不是高频数据信号。
因为对于一个正常工作的语音分离器来说,其低通滤波器对高频信号呈高阻抗,使高频信号无法通过低频接口。
2. 检查入户线的连接情况,不存在接线不良的情况。
3. 更换用户的电话机,问题依旧。
若话机的特征阻抗与线缆的阻抗特征阻抗不匹配会出现信号反射,产生噪声。
4. 在直列配线架上打线测试,问题依旧。
5. 在ADSL横列端子板上打线测试,发现只能上网不能打电话,说明低频语音信号没有过来,打线有问题。
6. 检查端子板的连线关系,发现直列配线架到原交换机横列配线架的跳线没有拆除。
正确连线后,问题得到解决。
10.通道方式设置不当导致上网速度慢
1) 故障现象
MA5300的ADSL单板出用户线接ATU-R,提供ADSL高速上网业务。
在调试过程中发现上网速度比较慢。
从MA5300的上行口连接PC1。
ATU-R所连PC上PingPC1,发现Ping包长度为缺省的32byte时,时延为41ms左右。
显然这个时延是MA5300产生的。
2) 操作步骤
1. 检查ADSL单板端口的配置参数。
2. 将ADSL通道方式从交织方式修改为快速方式,此时时延减小到了7ms,问题得以解决。
总结
ADSL端口可工作在交织和快速两种通道方式下,其中快速方式省略了交织解交织的过程,所以处理后的时延可以大大减小。
在ADSL业务对时延要求较高的场合,可以考虑采用这种模式。
11.上行速率设置低影响下行速率
1) 故障现象
下行速度较低。
在一个ADSLModem所带的局域网用户数量较多或用户打开的网络应用很多的情况下,产生的TCPSession的数量也很多。
这会造成许多TCP接收方同时发送“确认”报文,使上行拥塞、延时,从而导致发送方重发TCP报文,使得实际使用下载速率也上不去。
因此建议上行速率最低不小于128Kbit/s。
2) 操作步骤
1. 查看端口参数发现MA5300的ADSL单板端口的上行速率为64Kbit/s,下行速率为960Kbit/s。
2. 将上行速率改为256Kbit/s,下行速率正常。
12.交织时延设置不当导致PPPoE/PPPoA业务经常中断
1) 故障现象
MA5300的ADSLPPPoE/PPPoA用户在上层BRAS上实现认证上网。
开通后用户反映经常有业务中断的现象,但中断后马上能够重新拨号实现上网。
1. 到用户端监测发现问题确实存在,且期间Modem并没有去激活。
2. 由于部分用户端组网是Modem+HUB+PC,怀疑HUB性能问题导致在有大的数据交换的时候,导致HUB阻塞。
更换HUB后问题依然存在。
3. 怀疑上层BRAS的CPU的占用率太高导致,查看CPU占用率仅为19%,排除这种可能性。
4. 检查MA5300的数据配置,发现端口工作模式为交织,交织时延64ms。
在用户端监测过程中,发现Ping包规律性的抖动,即每7~8个稳定Ping包后就出现一个时延比较大的Ping包。
而在PPPoE/PPPoA接入方式下,BRAS会定时向客户端软件发送PPPECHO报文,检查PPP用户是否存在。
如果重传一定次数后无任何响应,则BRAS挂断用户。
怀疑由于交织时延过大,导致BRAS向客户端拨号软件发送的PPPECHO报文丢失,致使用户被BRAS挂断。
2) 操作步骤
1. 将端口参数的交织时延改为16ms,经监测发现问题现象得到明显改善。
2. 进一步将交织时延改为8ms,经长时间监测,问题得到彻底解决。
13.调整参数设置提高上网速率或者线路稳定性
1) 故障现象
某局多数ADSL用户的上网最高速率均能达100Kbit/s~200Kbit/s,唯独最远的一户上网最高速率仅为12Kbit/s,此用户距MA5300约3km。
端口的速率训练值大而实际值小通常是由于线路距离较远,环阻较大,同时噪声容限设得大所造成的。
2)