设备常见故障排查手册.docx

上传人:b****7 文档编号:9973811 上传时间:2023-02-07 格式:DOCX 页数:28 大小:697.34KB
下载 相关 举报
设备常见故障排查手册.docx_第1页
第1页 / 共28页
设备常见故障排查手册.docx_第2页
第2页 / 共28页
设备常见故障排查手册.docx_第3页
第3页 / 共28页
设备常见故障排查手册.docx_第4页
第4页 / 共28页
设备常见故障排查手册.docx_第5页
第5页 / 共28页
点击查看更多>>
下载资源
资源描述

设备常见故障排查手册.docx

《设备常见故障排查手册.docx》由会员分享,可在线阅读,更多相关《设备常见故障排查手册.docx(28页珍藏版)》请在冰豆网上搜索。

设备常见故障排查手册.docx

设备常见故障排查手册

设备常见故障排查手册

南京智达康无线通信科技股份有限公司

二零一零年八月

目录

设备常见故障排查手册1

南京智达康无线通信科技股份有限公司1

二零一零年三月1

WLAN运维阶段FAQ3

Q1.用户无线网卡无法搜索到无线信号?

3

Q2.为什么无线信号会非常微弱?

4

Q3.无线信号很强,但终端无法成功连接?

4

Q4.无线终端无法正确获得IP地址?

4

Q5.用户上网过程中,出现网络中断问题?

5

Q6.用户上网过程中网速很慢?

5

Q7.忘记设备的IP地址、账户或密码?

5

Q8.设备升级失败无法工作?

6

Q9.设备本地连接时通时断,本地ping设备丢包率高,无线部分正常?

6

Q10.AC的“瘦AP在线列表”显示AP在线,但无法正确显示“版本”和“信道”?

6

Q11.网管服务器无法接收到trap告警?

6

WLAN网络建设阶段7

Q12.AP插上POE电源或接入到POE交换机时,AP不上电,状态指示灯不亮?

7

Q13.一个VLAN里的AP无法上线?

7

Q14.瘦AP无法正常关联AC问题?

7

Q15.无线终端可以获取到地址,但推送不出portal页面?

8

Q16.无线终端可以获取IP地址,能打开Portal认证页面,无法认证成功?

9

Q17.无线用户非正常下线,已经超过了“闲置认证时间”为什么网络未断开?

10

WLAN常见案例7

案例1、用户侧无法正常获取地址3

案例2、用户无法正常打开portal服务器4

案例3、WLAN放号过程中,用户反映速率低的故障5

案例4、APDHCP方式无法上线,手动指定IP地址能够正常上线6

案例5、POE交换机下AP无法正常供电8

案例6、AC页面里无法显示上线AP的版本和信道9

案例7、唐山AP退服故障10

案例8、ONU设备丢弃分片包引起无线故障11

案例9、AP反复上下线问题故障14

图目录

图1无线网络连接3

图2网络认证方式8

图3Web认证9

图4访问控制9

图5RADIUS设定10

WLAN运维阶段FAQ

Q1.用户无线网卡无法搜索到无线信号?

请参考以下方法解决:

1、检查AP是否正常供电工作,指示灯是否正常。

2、无线网卡关闭或驱动未正确安装或无线连接被禁用,请打开无线网卡开关、安装正确驱动、启用无线连接,确认PC机的WirelessZeroConfiguration服务已经开启。

3、开启了无线网卡软件配置客户端,例如是Intel网卡、当其开启了Intel配置网卡软件和其它无线网络配置软件,那么可能在Windows无线网络配置栏中显示:

图1无线网络连接

此时可以使用网卡自带的配置软件来配置,如果需要使用windows来配置无线网络需要在网卡中勾选“用Windows配置我的无线网络设置”即可。

4、无线网卡损坏,更换无线网卡或用其他卡片测试验证。

5、AC或AP的参数设置将信道设为12或13信道,但终端不支持,请将信道设置为1-11。

6、AC或AP的参数设置错误,射频开关被关闭,检查射频指示灯是否正常,若被关闭,请打开设置。

7、AC或AP的参数设置中无线模式设置为“仅802.11g模式”,而终端为11b网卡,请将无线模式设置为混合模式。

8、AC或AP的参数设置错误,SSID被禁止广播,请启用SSID广播。

9、AC或AP的参数设置错误,安全配置文件未启用,请打开安全配置文件。

10、天馈系统故障导致AP发出信号非常弱,用户无法搜到无线信号,请检查合路器、功分器、馈线等无源器件。

Q2.为什么无线信号会非常微弱?

请参考以下方法解决:

1、AC或AP的参数设置中调低了设备的发射功率。

2、AP的天线松动。

3、AP的天线接口与天线或馈线的接口不匹配,如接头均使用了母头。

4、天馈系统中无源器件故障。

5、终端与天线距离较远或因阻挡导致的衰减过大使信号微弱。

Q3.无线信号很强,但终端无法成功连接?

请参考以下方法解决:

1、AC或AP的参数设置中开启了基于用户数的用户控制模式,此时关联AP的终端已达上限导致终端无法连接,请将接入控制功能关闭或将用户数设置数值做更改。

2、AC或AP的参数设置中开启了基于流量的用户控制模式,此时AP的流量已达上限导致终端无法连接,请将接入控制功能关闭或将流量设置数值做更改。

3、AC或AP的参数设置中开启了基于MAC的访问控制,并且未将其终端的MAC加入,请关闭此功能或正确添加MAC。

4、AP为带放大器设备,终端与发射源过近导致信号强度超过终端的接收阈值,请将终端远离发射源。

Q4.无线终端无法正确获得IP地址?

请参考以下方法解决:

1、无线网卡损坏,更换无线网卡或用其他卡片测试验证。

2、业务VLAN没有透传到城域网出口设备,需要运营商数据部门配合。

3、AC或AP软件设置错误,模版中没有添加正确的业务VLANID。

4、AC或AP软件设置错误,瘦AP在线列表中没有选用所对应的模板。

5、DHCPserver地址池中地址用完,更改DHCPserver的租约时间。

6、认证方式采取PPPOE拨号而非DHCP方式获取IP地址。

7、非明文无线网络由于加密认证信息错误导致。

8、AP与AC之间有三层设备并且未开启DHCPRelay,正确配置即可。

Q5.用户上网过程中,出现网络中断问题?

请参考以下方法解决:

1、检查用户上网位置环境是否发生较大变化、检查环境信号强度和质量是否降低。

2、用户无线网络环境突然存在干扰,无线网卡附近存在微波炉,开启了其它AP设备或其它无线客户端设备(客户端存在ADHOC的干扰情况)。

3、无线网卡是否还连接在无线网络上,是不是已经切换到其它SSID。

4、提示“系统检测连接已断开”,重新认证是否能恢复,如果能恢复需要在portal认证服务器上查找账号异常或失败的记录。

5、在AC上查看用户是否正常连接。

6、检查是否跨越不同VLAN漫游造成,FATAP只能二层漫游。

7、检查是否由于周围无线用户P2P下载造成。

Q6.用户上网过程中网速很慢?

请参考以下方法解决:

1、用户上网位置环境发生较大变化、环境信号强度和质量降低。

2、用户无线网络环境突然存在干扰,无线网卡附近存在微波炉,开启了其它AP设备或其它无线客户端设备,无线路由器等。

3、一台AP上接入用户数量超过了15个用户,此现象可以在IMC网管上设置条件形成告警提示。

4、有线网络带宽问题,上层设备是否有带宽限制,如果存在带宽限制,则可能造成网速变慢。

5、有线网络质量差存在丢包,可以尝试pingAP或交换机管理地址来判断。

6、确认AP的配置是否存在带宽限制的配置,与标准配置比较,AP默认不会设置带宽限制。

7、用户上网位置环境发生较小的变化,但环境信号强度降低,portal认证服务器故障。

Q7.忘记设备的IP地址、账户或密码?

请参考以下方法解决:

1、AP请采用硬件恢复的方式,设备带电情况下按住复位键15秒左右即可。

2、AC请在设备开机后通过串口进行复位操作,rescue后恢复出厂操作系统后再进行最新版本的升级。

Q8.设备升级失败无法工作?

请参考以下方法解决:

1、AP升级失败后请通过TFTP方式对设备进行升级。

2、AC升级失败后请在设备开机后通过串口进行复位操作,rescue后恢复出厂操作系统后再进行最新版本的升级。

Q9.设备本地连接时通时断,本地ping设备丢包率高,无线部分正常?

请参考以下方法解决:

1、检查设备(天线)、三相插座、所连交换机的接地是否良好,可考虑将所有接地逐步去除通过排除法查找原因,有条件可检查接地电阻大小,电阻大小尽可能小,建议5欧姆以下。

2、可测量设备、交换机外壳与保护地之间是否存在电压差,若有请检查干扰源或接地是否良好。

3、检查三相插座的零线和接地线之间是否存在电压,如果电压大于3V,表示三相插座线路存在问题或地线的接地没做好。

Q10.AC的“瘦AP在线列表”显示AP在线,但无法正确显示“版本”和“信道”?

请参考以下方法解决:

1、检查AP与AC的软件版本是否兼容,若不兼容请升级。

2、检查AP与AC之间的物理链路是否通信正常,通过ping包方式进行检测,若有丢包情况,请检查网线与水晶头制作。

Q11.网管服务器无法接收到trap告警?

请参考以下方法解决:

1、AC或AP的参数设置错误,没有正确设置trap服务器地址、端口等信息。

2、网管服务器trap端口等设置错误,请检查并与AC/AP一致。

3、AC或AP与网管服务器不在同一管理VLAN。

WLAN网络建设阶段

Q12.AP插上POE电源或接入到POE交换机时,AP不上电,状态指示灯不亮?

请参考以下方法解决:

1、检查POE电源适配器工作是否正常,POE电源模块指示灯是否常亮,尝试更换POE电源适配器。

2、检查AP的220V供电是否正常。

3、检查POE电源模块与设备的网线连接是否正确。

4、尝试更换POE电源模块和连接网线。

5、检查AP与POE交换机连接网线的两端水晶头制作是否标准。

6、检查POE交换机端口POE供电功能是否启用。

7、尝试更换POE交换机端口以及AP与POE交换机间连接网线。

Q13.一个VLAN里的AP无法上线?

请参考以下方法解决:

1、检查AP接入交换机数据配置如何。

尝试给瘦AP配置静态地址,是否能够从AC上ping通AP,或者用笔记本尝试access端口pingAC。

2、抓包分析链路,在AP采用DHCP获取地址方式下检查AP与AC建立交互的四个过程,dhcpdiscover、offer、request、ack过程是否完整,查看是否中间环节哪个设备由于协议、策略问题将其中部分报文丢弃过滤导致。

3、通过交换机的风暴侦测机制检查是否由于广播风暴导致。

4、通过交换机的环路检测功能检查链路中是否有环路。

5、排查交换机工作是否正常,指示灯闪烁是否正常等。

Q14.瘦AP无法正常关联AC问题?

请参考以下方法解决:

1、是否AP供电发生变化导致,例如POE交换机或本地供电盒损坏。

2、观察连接AP交换机的指示灯,是否有频繁切换的现象或指示灯狂闪的现象,需要排除是否有网络广播风暴或环路的可能。

3、AC和AP的版本是否正常匹配,AP版本和AC版本如果相差太多,会导致AP关联不上AC

4、AP是否正确获取到了AC的DHCP地址池的地址。

5、检查AP和AC间的交换机数据配置是否正确,AP的DHCP请求通过交换机是否可以到达AC的LAN口。

6、检查AC的DHCP地址池设置是否正确,“瘦AP端口IP地址1”是LAN口的地址,“DHCP状态”应为“打开”,如果AP与AC跨三层关联,AC上还要设置“静态路由”。

7、通过抓包捕捉AC与AP间的数据交互,可以比较准确的定位AP的DHCP请求到哪个设备,判断出故障所在。

Q15.无线终端可以获取到地址,但推送不出portal页面?

请参考以下方法解决:

1、用户浏览器故障或其它设置导致如开启代理服务器功能,请恢复浏览器默认设置或重启PC尝试解决。

2、将AC的web认证关掉后,检查用户是否能正常上网。

3、检查AC上关于portal认证的设置是否正确。

1)虚接口应该开启web认证:

图2网络认证方式

2)web认证选项中“web模式”选择“外部portal服务器+外部Radius服务器”,URL配置格式一般如http:

//211.138.17.40/index.php(PORTAL服务器对接时,可以向portal服务器厂商了解具体的URL)。

“ACName”是运营商用来定义运行AC,有时也会以IP地址的形式出现。

“闲置认证时间”是AC检测到用户在如下的时间没有流量,即强制AC下线,以分为单位。

图3Web认证

3)“web认证前IP访问控制”,需要将portal服务器和Radius服务器的地址添加进来。

AC开启了web认证后,AC作为一个接入认证点,无线用户将无法访问没有添加进“web认证前IP访问控制”的公网地址,“允许访问控制列表”要选中,无线用户能pingPortal服务器和Radius服务器的地址。

图4访问控制

Q16.无线终端可以获取IP地址,能打开Portal认证页面,无法认证成功?

请参考以下方法解决:

1、账号或密码输入错误,重新输入以确认。

2、检查AC上的“Radius设定”配置是否正确,“Radius认证模式”项选择“Radius认证”,检查认证主机IP地址等运营商给的数据是否正确,检查密钥有没有填写,填写是否正确。

图5RADIUS设定

Q17.无线用户非正常下线,已经超过了“闲置认证时间”为什么网络未断开?

请参考以下方法解决:

1、检查电脑上的即时通讯工具是否关闭,AC只有检测到用户在闲置认证的时间没有流量才会强制用户下线。

即使少量的上传、下载流量,AC就不会强制用户下线。

 

Q18.案例1、用户侧无法正常获取地址

【问题描述】

终端STA连在wlan上无法正常获取公网地址。

网络架构图如下:

【解决过程】

确认用户是否开启DHCPclient。

本地转发的架构下,可测试有线是否存在该问题。

笔记本需配置与业务vlan相同的vlanID。

1、若有线可正常获取公网地址

可通过串口查看AP的SAP0进程是否还在,若不存在,可手动加载SAP0进程,彻底解决该进程问题,需提交给PM。

若存在,可将AC和AP重启,查看问题是否仍在,与此同时,可将AC的版本重新升级一下,仍不行。

填写相关故障报告;

2、若有线无法正常获取地址

此时,可在局方的配合下,笔记本连接在交换机上进行相应的抓包。

查看DHCP的Discover的报文是否有回包。

没有,可逐一排除交换机,直至到达最终BRAS。

【经验总结】

可先排查有线故障。

Q19.案例2、用户无法正常打开portal服务器

【问题描述】

用户投诉无法正常打开portal所推送的web页面。

网络架构图如下:

【解决过程】

检查用户是否正常接入wlan网络中,在命令提示符中敲入ipconfig/all,检查正常获取公网地址;若正常获取公网地址之后,仍无法打开网页,查找BRAS是否做地址指向。

检查该用户电脑的IE浏览器问题,降低其IE浏览器的安全防范级别,并允许正常弹出窗口程序。

【经验总结】

可先确认学生笔记本IE浏览器问题。

Q20.案例3、WLAN放号过程中,用户反映速率低的故障

【问题描述】

用户投诉wlan速率不稳定,经常出现上网掉线,ping包延时很大后者直接丢包。

【解决过程】

首先检查用户使用wlan网络位置是否离天馈过远,或者中间存在大量遮挡物,影响wlan信号强度值。

通过NetworkStumbler软件扫描测试点所连接AP的信号强度值,若过低,速率同时也会降低;

其次检测有线网络是否存在该问题。

在现场维护中,曾发现wlan网络速率不稳定之际,有线网络也同时不稳定;

可以通过管理地址登录AC,查看该用户接入的AP是否已接入大量用户,或在AP的串口下,敲“getwlanassociation”可显示出该AP上连接的用户及用户的收发包数,存在因用户比较集中,致使过多的用户接入单台热点AP;造成上网速率降低;

在AP下方,通过无线空口抓包,查看报文中是否存在54、48、36等大速率存在,若没有,可检查相应的AC设置是否出错,若AC配置正常,可向PM反馈问题。

【经验总结】

WLAN上网速率低,一直是通病。

排查问题,也可以多方面去检查。

并且在日常wlan测试和验收中,建议大家用单线程下载进行测试。

Q21.案例4、APDHCP方式无法上线,手动指定IP地址能够正常上线

【问题描述】

AP通过DHCP方式无法上线,通过PC配置与ACLAN口地址相同网段的地址pingLAN口地址,检测链路正常。

同时,AP配置静态地址,可以正常上线。

架构图如下:

【解决过程】

在现场遇到DHCP无法上线,可以先确认传输链路是否畅通,最简单的办法笔记本配置与ACLAN口同一网段的地址,pingLAN口。

以排除传输链路不通的故障因素。

将AP直接连接在AC的LAN口上,AP零配置。

查看是否能够上线,以排除我司版本的问题。

此时,可通过配置AP静态地址,接在POE交换机上查看是否能够正常上线,可以确认DHCP过程有问题,进一步缩小问题的范围。

此时,应在POE交换机和AP之间进行抓包,确认DHCP的五个交互过程。

若发现有Discover报文,没有Offer报文。

可至上一层交换机进行抓包,直至DHCP的四个报文Discover报文、Offer报文、Request报文、Ack报文全部存在。

可确认下一层交换机存在问题,经现场经验的反馈,可确认该交换机是否开启DHCPSnooping功能。

此时,可将该功能关闭,或者将下行连接AP或前端POE交换机端口设置为trust,也可解决该问题。

【经验总结】

DHCPSNOOPING介绍

DHCPSnooping技术是DHCP安全特性,通过建立和维护DHCPSnooping绑定表过滤不可信任的DHCP信息,这些信息是指来自不信任区域的DHCP信息。

DHCPSnooping绑定表包含不信任区域的用户MAC地址、IP地址、租用期、VLAN-ID接口等信息。

  当交换机开启了DHCP-Snooping后,会对DHCP报文进行侦听,并可以从接收到的DHCPRequest或DHCPAck报文中提取并记录IP地址和MAC地址信息。

另外,DHCP-Snooping允许将某个物理端口设置为信任端口或不信任端口。

信任端口可以正常接收并转发DHCPOffer报文,而不信任端口会将接收到的DHCPOffer报文丢弃。

这样,可以完成交换机对假冒DHCPServer的屏蔽作用,确保客户端从合法的DHCPServer获取IP地址。

Q22.案例5、POE交换机下AP无法正常供电

【问题描述】

AP采用POE方式供电。

在AP施工完之后,发现POE交换机并不能对AP正常供电。

【解决过程】

先检查交换机是否开启供电功能,在辽宁地区常用的交换机来看,华三和华为交换机默认开启POE供电功能,中兴交换机默认关闭供电功能;

随即检查该POE交换机功率值是否满足满配AP的总的功率值,在实际应用中,发现部分交换机的功率值过低,因而无法满配(AP满配下,无法供电的分析原因);

检查网线是否严格按照ANSI/TIA/EIA568-B的标准来制作,在POE的供电标准中,网线要求按照此标准来做;

检查POE交换机是否做接地线,因接地不好,POE交换机上产生大量的静电,影响对设备的正常供电;

分布型AP可检测室内分布系统,检测天馈系统的接地性能是否良好,室分馈线是否和强电走同一槽位,与此同时,可用专门仪器去检测天馈系统的衰减及信号的正常性。

【经验汇总】

AP供电排查中,首先确认集成商侧没有任何问题,即网线制作、交换机接地等没有问题,再继续检查其他可疑存在的因素。

Q23.案例6、AC页面里无法显示上线AP的版本和信道

【问题描述】

AP能够正常上线,却无法显示版本和信道,从AC侧通过SSH登录到AP到上查看,发现版本仍未最初的出场版本。

【解决过程】

首先若小部分AP未显示出版本和信道,可先通过AP串口线登录到AP上,重启wltps进程,若是大部分AP为显示出版本和信道,可重启AC的wltps进程,接着观察一段时间,查看AP是否升级。

AP仍不能显示出版本和信道,此时可让集成商协助检查网线。

现场中发现网线制作的线序存在问题,即普通的两边线序一样的直通线,只能让AP供电,且上线,可无法升级版本,故网线需按照ANSI/TIA/EIA568-B的标准来制作。

检查完网线之后,AP仍不能上线。

可在AC的full_control的模式下,ping–s1500X.X.X.X(X.X.X.X.为不显示版本和信道APip地址)。

若不通,说明AP与AC之间的MTU值存在问题。

接着可将ping包1500减小继续pingAP,直至ping通。

此时得出的值即为该链路的MTU。

接着修改AC瘦AP端口的MTU值,命令为:

ifconfigbr1mtu*(*为反复ping试出的mtu值)。

此时,AP可正常升级版本,不过因该方法,重启AC之后,AC的MTU值会恢复成默认的1500,故要彻底解决该问题,需更改传输链路的MTU值。

此时可在AC侧ping-s1472X.X.X.X(X.X.X.X为传输链路中各交换机的ip地址),ping至哪台交换机不通,可确认该台交换机MTU值存在问题。

或通过PC设置好适当的IP地址执行:

ping-f-l1472*.*.*.*(和AC里的命令有点区别)。

如果出现:

PacketneedstobefragmentedbutDFset.表示数据包需要拆开来发送。

此时,减少数据包长度,再执行上面的ping命令。

从1400到1472之间多试几次,就能找到合适的数据包长度了,把数据包长度加上数据包头28字节,就得到MTU的值。

【经验总结】

解决AP版本和信道不显示的问题,首先确认网线制作,排除之后,可确认MTU值是否存在问题。

Q24.案例7、唐山AP退服故障

【问题描述】

1.APRF灯亮,但是不闪烁;

2.APLan灯亮,闪烁;

3.串口没有任何信息;

4.ssid中不包含该故障接入点的信息;

5.通过抓包,发现故障AP不向外广播beacon、管理帧、控制帧;

6.从外网ping正常AP,能通;ping故障AP,不通;

7.该AP上联网线重新拔插几下,或者直接重启AP,该故障AP就可以恢复正常;但是通过uptime查看,均有重启迹象;

8.将ONU上联光纤重新拔插一下,AP没有任何反应;

【解决过程】

因问题涉及产品面问题,可以咨询PM或者研发。

研发分析认为在异常出现时,设备的核心代码仍在工作,但应用层代码已经无法正常运行,我们的设备有一套设备异常监测和修复机制,该机制在内核层和应用层均设有检测点,通过代码分析,这是我们对异常判断设计的缺陷引起的小概率事件。

在异常出现时,由于核心监测点仍旧能够正常工作,导致异常监测守护进程未能及时侦测和修复。

通过版本升级优化异常检测机制解决该问题。

【经验总结】

遇到该类问题,可先求助公司的专家小组。

确认是否为版本问题。

Q25.案例8、ONU设备丢弃分片包引起无线故障

【问题描述】

AP正常上线,并广播SSID,用户可正常接入,可是游览网页和下载速率很差,新扩容的AP可以正常上线,可以无法升级,显示不出信道和版本。

现网网络架构图如下:

现网链路简单配置:

各区域的瘦AP通过二层交换机与AC通讯。

二层交换机配置AC与AP的管理VLAN(VLAN-I

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1