ADSL故障判断标准现象及原因v3.docx
《ADSL故障判断标准现象及原因v3.docx》由会员分享,可在线阅读,更多相关《ADSL故障判断标准现象及原因v3.docx(13页珍藏版)》请在冰豆网上搜索。
ADSL故障判断标准现象及原因v3
ADSL故障诊断维护手册
目录
第一类:
用户不能打电话也不能上网3
第二类:
用户能打电话但不能上网3
一、用户认证失败4
二、用户认证通过,但不能上网5
三、DSLAM不能接入BAS(找不到BAS)5
四、Portal用户强制页面故障6
五、只有少数用户PPPOE软件能找到服务6
第三类:
用户上网经常断线7
第四类:
用户反映上网慢7
一、一直慢7
二、突然慢8
三、一段时间内持续慢8
第五类:
访问网页正常,视频流断续。
9
第六类:
Radius反属性问题9
第七类:
基于各种业务的故障分析10
第八类:
对于ADSL专线方式上网的用户所引起的故障现象10
附件:
常见故障分析及相关命令11
第一类:
用户不能打电话也不能上网
引起原因:
1、线路接口问题,如接口松动不能正常连接电话网。
先排除线路故障,使电话可正常使用后,再次检查能否上网。
2、用户终端设备问题,如电源问题(设备是否正常加电)。
第二类:
用户能打电话但不能上网
总体来说,分为以下3种原因:
1、物理层问题:
在电话线路正常的情况下,检查ADSLModem的线路连接是否正常;PC机与ADSLModem的连线是否插好。
2、链路层问题:
PPPoE软件是否正常。
3、网络层问题:
认证问题、地址问题、DNS问题、路由问题(局端问题)、网卡问题。
此类为比较典型的故障。
故障原因与宽带网络层次结构中的所有设备或环节都可能有关系,包括MA5100的上行ATM节点、宽带接入服务器、ADSL业务中的局端设备的ADSL端口、ATU-R、用户计算机、线路等环节。
通过了解用户ADSLModem指示灯状态、用户计算机的操作和设置等,结合网管功能所能查询的信息,进一步定位故障原因。
看ADSLModem的LINK灯是否常亮还是闪烁,闪烁一般可判定为未找到服务,即在拨号软件处看不到BAS的Hostame。
这种情况一般是BAS数据和DSLAM不匹配。
细分第二类故障现象:
一、用户认证失败
引起原因:
1、帐号/口令不对(用户PC上的CapsLock键处于按下状态)。
Debugaaaauthentication,将会发现authenticationfailed信息。
同时在RADIUS上会看到RADIUS认证包,并用户认证失败,检查用户的用户名口令是否正确。
2、IP地址池数量不足。
在REDBACK上,使用showlog可以看到用户得到的地址是0.0.0.0,同时在相应的CONTEXT下,使用命令showippool可以看到地址池的使用情况。
3、帐号唯一性上网,端口/VLAN捆绑。
在RADIUS上可以查到此信息。
4、用户终端配置协议不当。
PPPOE协议问题,重新安装PPPOE软件
5、BAS到RADIUS故障。
BAS无法找到RADIUS服务器,首先使用ping命令检查到RADIUS的连通性,然后通过使用命令debugradiuspacket命令可以检查到RADIUS的端口1812和1813的连通情况,同时确认redback上关于使用RADIUSSERVER的配置信息是否正确,下面是一个配置例子。
aaaauthenticationsubscriberradius
aaaaccountingsubscriberradius
contextlocal
radiusserver192.168.17.1keyredback
radiusserver192.168.17.37keyredback
6、RADIUS本身故障。
检查RADIUS本身的故障,REDBACK以下列命令配合
debugradius{accounting|attributes|authentication|authorization|packet}
二、用户认证通过,但不能上网
引起原因:
1、DNS引起的故障。
如果用户通过IP地址能够访问INTERNET,说明DNS故障,检查到DNS的连通性和DNS的可用性,建议使用备用的DNS。
(通常情况下建议配置primary和seccondry的2个DNS)
2、BAS到骨干网故障。
通过ping检查BAS到骨干的连通性是否,检查骨干网中关于BAS设备地址的路由和相应CONTEXT中的缺省路由。
3、用户的地址池的路由出现问题,无法访问外网。
通过ping检查BAS到骨干的连通性是否,检查骨干网中关于BAS用户地址池的路由,和相应CONTEXT中的缺省路由
首先怀疑为BAS的出口有问题,如果其他点存在同样问题,则可能为BAS出口问题;如果业务不通,但PPPoE连接成功,说明从终端拨号到BAS这一段在通路上不存在问题。
如果这里是单点问题,则应检查终端是否存在PROXY等软件等影响PPPoE软件。
三、DSLAM不能接入BAS(找不到BAS)
引起原因:
1、跟用户使用的客户端软件、操作系统有关。
重新安装PPPOE软件
2、DSLAM与BAS的链路问题。
检查互连端口是否正常,端口的配置是否正确
3、BAS负荷过大不能响应用户的请求。
在REDBACK上使用下列命令
debugaaaauthentication
看看有没有其他用户上来,如果有说明BAS的负荷没有问题。
根据PPPOE的工作原理,用户不可能由于BAS的符合过大而不能找到BAS的服务。
由于这一过程处于PPPOE的发现阶段,是用户发起的广播包,符合过大是指PPPOE的SESSION数过多。
4、PPPoE拨号用户的用户名和密码均正确,但无法通过服务器认证。
检查开户信息是否正确,用户到VLAN和PVC的绑定和实际使用的是否一致。
四、Portal用户强制页面故障
引起原因:
1、REDBACK采用SUBSCRIBERDEFAULT设置用户强制页面,检查CONTEXT下的此项配置是否正确即可。
2、用户浏览器工作不正常,不能正常显示服务页面。
重新安装浏览器
3、用户输入的账号、密码不正确,不能通过验证。
若是强制页面本身问题,不影响上网。
五、只有少数用户PPPOE软件能找到服务
从这点说明能够确认二层正常。
引起原因:
1、帐户/密码不对。
2、帐户唯一性。
如果在REDBACK上使用pppauthenticationmax1,则不能有1个以上的用户PPPOE软件在这一PVC上同时找到服务。
3、PPPOE配置不当。
4、BAS服务器负荷过大,不能正常响应用户连接的请求。
第三类:
用户上网经常断线
引起原因:
1、线路问题(包括线路质量不好或线路过长、线路噪声过大、线路接触不好等)。
这是主要的故障原因,主要检查MODEM到DSLAM的线路,如112测试。
2、BAS负荷高,BAS板卡不好。
通过命令shportcounters,showportinfo,和showlog来检查板卡和端口的转发状态是否饱和。
另需要注意掉线是普遍现象还是集中在某个板卡。
3、DSLAM问题。
新装用户和已使用的用户有区别。
第四类:
用户反映上网慢
分为一直慢、突然慢和一段时间内持续慢。
一、一直慢
引起原因:
1、如果一直很慢,上网速率在60kbit/s以下,一般为线路问题。
可以通过网管查看物理连接速率,端口是否限制速率,速率限制多少等等。
2、如果物理连接速率较高,则不是线路问题,问题可能是宽带接入服务器端口没有扩容;另外,如果上网速率已经达到端口限制速率,则是由于端口速率受限所致。
∙线路很短,但上网速率根本就达不到2Mbit/s,则通过网管首先查看该端口的物理连接速率以及线路衰减。
∙如果物理连接速率达到2Mbit/s或限速速率,则表明线路正常,这时则需查看交织深度设置,如果交织深度为64,由于TCP/IP协议地限制,TFTP文件传输速率最多只能到1.5Mbit/s。
∙可以通过数据局查找该端口的物理连接速率,如果物理连接速率与文件传输速率相差较大,物理连接速率是正常的话,一般为上行接口节点速率瓶颈问题。
∙线路较长,或线路噪声较大、入户线质量不好等也可引起上网速率慢。
二、突然慢
引起原因:
1、与BAS有关。
检查BAS上的转发性能指标是否饱和SESSION数。
命令为showsubsumall,showportcounters,showportcounterslot/port,showportinfo.
2、攻击或病毒原因。
检查CPU是否偏高,并在城域网中抓包分析,showprocpu.Showmem
3、检查BAS出口或入口的负荷是否很重,达到瓶颈。
Showportcounters,showportcountersslot/port
4、检查出入口的端口是否有丢包。
Showportcounters,
与具体的被访问网站也有关
三、一段时间内持续慢
引起原因:
1、检查BAS的CPU,MEM,包转发,交换能力是否在正常范围。
Showprocesscpu,showmem,showportcounters,检查相关参数。
2、骨干网路由故障或拥塞。
2、某个板卡故障或转发到极限。
Showcmtable,showporttable,showportinfo,检查相关参数
4、某局向线路质量不好,达不到所需带宽。
5、与网络出口的带宽应用率有关。
6、与BAS设备的负荷有关。
7、数据配置问题导致上网速度慢。
8、MTU设置不当,导致ADSL用户上网速度缓慢。
9、ADSL用户由于内部局域网设置问题,导致上网速率不稳定。
10、用户HUB网线接错导致丢包、上网速度慢。
11、法兰盘没有插紧,使ADSL用户下载速率很小。
第五类:
访问网页正常,视频流断续。
引起原因:
1、防火墙设置问题。
PAT与视频流的端口有冲突。
2、MTU问题。
3、带宽是否满足要求。
4、视频服务器忙,不能正常响应用户的请求。
5、网络拥塞,从用户到视频服务器的网络存在瓶颈。
6、终端软件设置问题也可造成这种现象,如REALONE设置成MODEM方式。
第六类:
Radius反属性问题
引起原因:
Radius配置的用户信息和用户实际开户信息不一致(配置错误)。
第七类:
基于各种业务的故障分析
各种影响如MPLSVPN,VPDN等业务的故障分析。
VPDN业务:
pppoe+L2TP。
引起原因:
1、pppoe问题(PPPoE拨号不成功)。
2丢配置。
Showl2tpinfo,showl2tpcounters,shoconfig
3、LAC或LNS动态建立L2TP故障。
Debugl2tpall
4、RADIUS关于L2TP配置信息不正确。
第八类:
对于ADSL专线方式上网的用户所引起的故障现象
慢、丢包、路由、不能上网。
引起原因:
1、线路不同步或质量不好。
2、用户路由通告故障。
3、REDBACK到RADIUS的间接绑定故障,没有绑定。
4、用户擅自更改自己的IP地址。
由于REDBACK支持IPSECURED-ARP,所以用户擅自更改地址,将不能上网,用户必须使用分配给自己的地址。
5、DSLAM故障。
6、用户终结用户路由的三层设备故障。
7、终端染病毒。
8、用户HUB网线接错导致丢包、上网速度慢。
9、ADSL网吧用户因PC机网卡中断冲突,造成上网频繁中断。
10、IPoA+HUB组网的限制,导致网吧用户掉线和上网速度慢
附件:
常见故障分析及相关命令
BAS故障检查及处理办法
故障现象描述
定位故障方法和思路
具体操作命令或LED
用户PPPOE软件不能找到服务(BAS的ID)
说明是BAS以下的问题,问题可能来自DSLAM、电话线路、MODEM、用户PC机,建议首先确认用户PC机无故障,然后看MODEM是否故障,看线路是否同步,检查DSLAM用户端口是否正常。
由于是BAS往下的问题,2层以下不通,BAS上没有太多手段,如果是DSLAM到BAS的通路故障,可以使用以下命令查看端口状态:
showportinfoslot/portshowportcountersshowporttableshowportcountersslot/port
BAS运行环境问题:
包括机房温度过高,湿度过大,电源故障或者不稳
在BAS上通过命令,查看温度,电源,和风扇是否正常,及时更换
showenvmon或LED是否正常,绿色常亮正常,否则为故障
个别的用户PPPOE软件能找到服务,但不能通过认证
有2种可能:
1、用户名密码不对2、已经有一个同名用户在使用,此种问题可能出现在IPDSLAM用户,因为不能做到每VLAN一个用户,对于ATMDSLAM用户,由于有PVC绑定,所以合法用户不会出现此问题
debugaaaauthenticationdebugaaaauthorization
具有规律的部分用户PPPOE软件能找到服务,但不能通过认证
检查投诉用户是否集中在某个局向或某个BAS,检查BAS上相关部分的端口上是否一个用户也没有,对于redback来说,由于是整机全局用户认证,如果是端口上一个用户也没有,检查端口上的相关端口配置和PVC或dot1qvlan的配置是否正确
showconfigportslot/port
整个BAS或所有BAS用户PPPOE软件能找到服务,但不能通过认证
检查REDBACK和RADIUS之间是否通讯正常,包括1812,1813,1645,1646端口等,同时检查省局RADIUS是否故障
pingip-addresstracerouteip-addressdebugaaaauthenticationdebugaaaauthorizationdebugradius
个别专线用户不能上网,且不能PING通网关
由于对于专线用户启用了ipsecured-arp,所以首先检查专线用户是否使用了我们分配给他的合法地址,如果地址正确,如果同时排除了DSLAM往下的2层问题,检查BAS上PVC的配置和绑定状态
showconfigportslot/portshowbindingboundshowbindingsubscriber
具有规律的部分专线用户不能上网,且不能PING通网关
检查投诉用户是否集中在某个局向或某个BAS,检查BAS上相关部分的端口上是否一个用户也没有,对于redback来说,由于是整机全局用户认证,如果是端口上一个用户也没有,检查端口上的相关端口配置和PVC或dot1qvlan的配置是否正确,检查专线的INTERFACE是否故障,且相应interface下的IP网段的路由是否正常
showconfigportslot/portshowbindingboundshowbindingsubscribershowconfigcontextcontext-namepingip-addressshowiproute
所有专线用户不能上网
2种可能,1、redback的绑定状态变为unbound2、专线网段的路由故障
showbindingboundshowbindingsubscribershowconfigcontextcontext-namepingip-addressshowiproute
pppoe能认证,但是不能获得地址
检查ip地址池是否用尽,检查BAS上相关IPPOOL的配置是否正确
showippoolshowconfigcontextcontext-name
能认证并获得地址,但不能上网
检查BAS的用户路由是否正确,IP层面是否正常
showiproute
ping;traceroute
用户能够上网,但是没有获得相应的权限,如带宽或网址限定
检查用户的开户属性是否正常
检查用户PVC和用户地址路由或用户后缀是否正确
showconfigcontextcontext-name
用户正在上网,但异常断线
在排除2层可能的问题基础上,检查BAS的用户数处理能力达到极限,是否同时还有新的用户同时上来,接口板的处理能力和容量是否正常
showportcountersslot/portshowpppoeshowdiagshowportinfoshowsubsumallshowprocpushowmem
用户异常断线后,不能立刻重新拨号上网
在排除2层可能的问题基础上,检查BAS上PPPKEEPALIVE时间是否过长,设置为1分钟
pppkeep-aliveinternalmin1
部分用户能上网,但是速度慢
检查BAS网关到用户是否有大的延迟或丢包,如果有,说明DSLAM或线路质量问题,
检查相应端口的流量和包转发是否饱和,需要升级
用户段或网络中是否有攻击或病毒。
pingip-addresstracerouteip-addressshowportcountersslot/portshowportinfoshoprocpu
所有用户能上网,但是速度慢
检查BAS出口端口工作是否正常,包括流量,端口丢包等,设备CPU,内存使用情况
showportcountersshowportinfoshoprocpushowmem
BAS自动启动
通过命令找出原因
showversionshowhardwareshowlogshowloginactiveshowstackshowtech
某个板卡停止工作或工作不正常
通过命令找出原因
showdiagshowhardwareshowlogshowloginactiveshowtech
L2TP用户故障
首先看L2TP隧道是否建立,然后看认证是否通过,并获得相应的地址
debugl2xshowl2tpcountersshowl2tpinfoshowl2tpgroupshowiphost
GRE用户故障
首先检查GRE通道是否正常工作,通过命令找出原因
showconfigtunnelmapshowgrecountersshowgreinfoshowgretunnelcountersshowgretunnelinfopingip-addresscleargrepeer
802.1qVLAN故障
通过命令找出原因
showdot1qcountersshowdot1qinfoshowdot1qpvc
不能TELNET到BAS上进行管理
确认在IP允许范围内后,检查是否有超过5个用户在上面,并没有悬挂用户
showadministratorshowipsocket
cm故障
通过命令找出原因,看看是软件问题,硬件问题,还是到了转发极限
shocmtableshowcmstatsshowportcounters