ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:409.43KB ,
资源ID:4411419      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4411419.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(EOS业务现场故障处理指导.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

EOS业务现场故障处理指导.docx

1、EOS业务现场故障处理指导EOS业务故障处理指导目 录1、EOS故障处理思路 21.1、EOS业务典型网络排障经常用到的信息 21.2、故障处理流程图 31.3、流程说明 41.3.1 详细了解现场情况,确定故障严重程度 41.3.2 检测设备工作状态和各接口连接情况 41.3.3 判定故障是数据层面还是传输层面 41.3.4 通过各种方法,缩小故障范围,定位故障原因 52、EOP故障排查常用命令 82.1查看槽位运行状态 82.2查看系统当前告警 92.3查看SDH接口告警 102.4查看SDH接口开销设置及状态 102.5交换盘和汇聚盘的MAC地址表信息 122.6交换盘交换端口的统计信息

2、 142.7以太接口的统计信息 152.8 EOS接口的统计信息 152.9交换盘环回检测状态 173、故障信息反馈 171、EOS故障处理思路注意:在处理业务中断或其它紧急问题时,需要注意以下几点:1)、以尽快恢复业务为原则。2)、应先分析故障现象,定位原因后再进行处理。在原因不明的情况下应避免盲目操作, 导致问题扩大化。3)、处理过程中一定要作好故障记录,保存好故障的原始数据,如果当时不能处理,为后续研发进行分析提供原始资料。1.1、EOS业务典型网络排障经常用到的信息图:EOS业务典型网络排查故障经常用到的信息板卡当前的状态和告警。MSAP的板卡前面板的指示灯,包含板卡系统灯、电源指示灯

3、、总告警指示灯,还有接口的状态指示灯,这些指示灯状态需要特别的关注和确认。还有,系统的当前告警和状态也需要检查。如果有了上述信息,可以通过告警分析法,按照先高级、后低级,先高阶、再地阶的原则进行处理。EOS接口、交换以太端口统计和SDH的性能统计。端口的数据统计,包含收发的数据统计,还包括一些错误帧的统计。通过对这些端口统计的查看,对业务流的状态就有了清晰的了解,然后结合一些故障排除方法,例如环回测试法,就可以逐段缩小故障反馈,从而进一步找到故障点,进而排除故障。MAC地址表。MAC地址表可以在一定程度判断业务是否正常。例如,在汇聚交换板卡上查看MAC地址表,可以清楚的看到相应端口和VLAN下

4、面的MAC地址,如果某个业务接入通道有问题或业务接入终端设备有问题,就不能学到相应业务接入终端的MAC地址,可以粗略的判断业务是否正常。环回检测状态。MSAP的EOS汇聚板卡支持环回检测功能,可以检测出传输通道是否有环回,然后把相应环回的交换接口关闭掉,直到环回解除,这样可以保护其他的业务分支业务的安全性。板卡软硬件版本信息。查看现网的设备的版本信息,以便确认是否存在功能缺陷,或者为公司故障排查协作部门进一步分析问题或验证故障现象提供必要数据。通过上述的信息,结合一定的故障排除方法,可以解决一些常见的故障,或者可以确认故障的范围,为后续排查提供参考。所以,工程师要牢记这些常用的信息的查看方法,

5、并且掌握如何应用这些信息。1.2、故障处理流程图1.3、流程说明1.3.1 详细了解现场情况,确定故障严重程度处理故障之前,详细了解故障的现场情况是前提。例如,需要详细确认: 网络的拓扑情况,包括使用的设备型号,及对接设备型号,还有相应的连接关系; 业务全部中断,还是部分中中断; 如果是业务丢包,丢包的严重程度或丢包率,如果是视频业务的话,图像的状态如何,视频的业务占用带宽是否超过传输带宽;详细了解了上述情况后,就可以采取相应的措施处理故障。1.3.2 检测设备工作状态和各接口连接情况这一步是根据观察法来判断故障原因。可以从下面几个方面进行判断设备的状态: 网管上的当前告警列表或命令行下的sh

6、ow current-alarm,可以查看到设备的当前告警情况。根据告警分析法来判断相应的告警,进行判断故障点。 通过命令行下全局模式下show slot命令可以查看板卡个工作状态,例如是在工作状态还是在注册或上电状态,网管盘对业务盘的轮询状态等。 MSAP的板卡前面板的指示灯。包含板卡系统灯、电源指示灯、总告警指示灯,还有接口的状态指示灯,这些指示灯状态需要特别的关注是否有异常,如果是以太网业务卡要注意协商的状态,如果有数据收发灯,观察是否闪烁或闪烁频率。1.3.3 判定故障是数据层面还是传输层面图:EOS业务的数据层面和传输层面示意图EOS业务是将以太网业务承载到传输网上进行传送,自然分为

7、两个大层面:一个是数据层面,另外一个是传输层面。在出现业务异常的时候,建议先排查传输层面的问题,是因为传输层面有问题,通常会有明显的告警,通过告警分析法就可以逐个解决故障。 传输层面常见的故障主要包含以下几个方面: 交叉连接配置错误,包括MSAP交叉连接错误和传输友商的交叉连接错误; 传输线路损伤,例如光纤断或连接错误、光接口没接触好、光衰耗过大等; EOS业务对接问题,例如V5/K4字节不匹配,封装协议配置错误,LCAS设置不匹配等; 业务板卡单盘故障或设计缺陷;判断传输层面的故障重点查看以下命令信息:在群路盘端口模式下show sdh-alarm(可以查看传输层面的告警信息)和show i

8、nterface(可以查看传输上的开销设置和实际状态信息)。 Show crossconnect或show crossconnect slot X(槽位号),如果打印的信息中显示的交叉连接前面为“-”,一般情况是时隙指派问题,正常时应为“*”。另外特别要注意时隙编号与友商设备对接的顺序。Show timeslot或show timeslot slot X(槽位号),重点检查时隙指派是否正确。 数据层面常见的故障主要包含以下几个方面: 数据配置错误,例如VLAN配置、链路聚合配置、USE-CORE-TAG配置等; 网络中产生环回,导致影响整个数据网络; 以太接口自协商问题或网线制作和接触问题;

9、业务板卡单盘故障或设计缺陷。检查数据层面的常用的命令是:show running slot X(槽位号)可以检查某个槽位的配置是否正常;show loopdetection 可以检查某个槽位的环回检测情况;在以太端口模式下执行show interface 可以查看端口的性能统计信息,为排查故障提供重要参考。1.3.4 通过各种方法,缩小故障范围,定位故障原因 通过上一步的初步判断,可以通过一些简单的方法,仅可能的逐步缩小范围,一步一步找到故障点,进而进行相应的措施,排除故障。 传输层面问题常用排查思路:通过分段环回查看Jx和V5K4字节信息判断传输问题原理介绍:SDH的开销Jx、V5、K4一般

10、有三个值,发送值、期望接收值和实际接收值。如果通过逐段环回的方面,判断这些开销字节的发送值和实际接收值是否一致,就可以粗略判断被环回的段是否正常。图:通过分段环回查看Jx和V5K4字节信息判断传输问题举例说明:例如上图,如何判断传输两侧的MSAP中间的传输是否正常,可以在汇聚侧的群路盘看某路VC12的j2字节状态,进入相应的群路口通过show interface可以查看开销情况,假如这路VC12的J2字节的发送值是raisecom-opcom,通过线路不同环回点环回后,实际接收值也应该是raisecom-opcom,如果一致说明相应的传输线路是正常的,如果不一致则说明还有问题存在,则需要再进一

11、步进行环回。上图中共示意了5个环回点,按照环回点1的示意直接在汇聚侧的光口或某路VC12进行环回,可以判断汇聚侧MSAP是否正常;按照环回点5的示意,可以判断接入侧MSAP到汇聚侧MSAP的传输均没有问题。排除故障时建议先从环回点5开始,然后逐步进行缩小环回范围。如果通过环回测试,确认了接入侧和汇聚侧的传输没有问题,后续就需要再进行排除对接问题或数据层面的问题了。经验:通过交叉连接也可以起到环回的作用,但一定要先删除原有交叉再做如下交叉连接:Raisecom(config)# crossconnect vc12 source 6/3/1 sink 6/3/1,如果在接入端的MSAP做上面的交叉

12、,产生的效果是相应的VC12向线路侧环回,在汇聚侧的群路盘上会看到环回,如果查看J2和V5的接收值和发送值是否一致就可以判断线路状态了。 数据层面故障常用排查思路:通过业务流各点数据统计判断故障范围原理介绍:MSAP的EOS板卡和交换汇聚板卡均可以进行端口的性能统计。例如交换盘SUB-ESW-2GE和8EOS-FE板卡,可以通过进行交换端口使用show interface命令查看交换端口的收发包统计;对于8EOS-FE和EOSE-8FX,可以通过进入相应EOS接口使用show interface命令查看EOS接口的收发包统计。通过业务流向的各点的收发包统计,查看数据增量或者具体数据统计,来判读

13、故障点。图:通过业务流各点数据统计判断故障范围方法的示意图举例说明:在接入侧一直使用电脑或路由设备发包,例如ping。按照业务流向,首先查看EOS接入盘的FX-eth接口的数据统计,如果接收有数据变化,说明接收到数据;再进入EOS接入盘的EOS接口,查看是否有数据发送出去;然后再进入EOS汇聚盘的EOS接口,查看收发有数据接收。上图中,在EOS汇聚盘EOS1接口处无数据变化,说明中间的传输出了问题或EOS汇聚盘接入盘出了问题,判断好范围之后,再进行下一步定位。经验1:通过一些测试软件,例如sniffer,再加上各点的环回,也可以逐段判断故障点。使用sniffer产生一定量的数据包,然后通过线路

14、中各点的环回,然后使用sniffer进行收包统计,如果发出去的包与接收的包数量一致,则说明传输没有问题;如果接收的包少于发送出去的包,则说明线路质量不好;如果干脆没有接收到的包,则说明环回点这段业务不通,再进一步减少环回范围逐段判断故障点。经验2:通过在交换盘汇聚盘上查看MAC地址表也可以初步查看业务通道是否正常MAC地址表可以在一定程度判断业务是否正常。例如,在汇聚交换板卡上查看MAC地址表,可以清楚的看到相应端口和VLAN下面的MAC地址,如果某个业务接入通道有问题或业务接入终端设备有问题,就不能学到相应业务接入终端的MAC地址,可以粗略的判断业务是否正常。2、故障排查常用命令2.1查看槽

15、位运行状态Raisecom# show slot slot 1: working ,opcom3500-8eos-fe , hdlc , none , poll ,slot 2: null ,slot 3: null ,slot 4: null ,slot 5: null ,slot 6: working ,opcom3500e-b-stm1-m , hdlc , none , poll ,slot 7: null ,slot 8: null ,slot 9: working ,subesw2ge , hdlc , none , poll ,slot 10: null ,slot 11: nu

16、ll ,slot 12: null ,3 board(s) in slot(s)通过show slot命令可以初步了解板卡的工作状态。常见的状态有以下几种:Null:未插入板卡;working:板卡处于正常工作状态;powering:板卡处于上电状态;:板卡处于注册状态;?dev:不能正常识别的板卡。当板卡处于上电或注册状态时,常见的故障原因是:1、电源问题:电源电压或功率偏低;2、网管盘通信问题;3、某个业务盘出现故障导致把背板通信总线失效。当处于“?dev”时,通常情况下网管盘的程序版本较低或非MSAP板卡,升级网管盘出现或确认板卡型号后一般可以解决。2.2查看系统当前告警Raisecom

17、# show current-alarm 1 coldStart LOCATION:SLOT-02 rcEntDiscoverTrap LOCATION:SLOT-63 rcDeviceFanLostTrap LOCATION:SLOT-15 ID-14 rcDeviceFanLostTrap LOCATION:SLOT-15 ID-25 rcOptTrapSdhLosTrap LOCATION:SLOT-6 STM1-OPT-2-0-0-0-06 linkDown LOCATION:SLOT-3 FX-ETH-37 rcOptTrapSfpNotExistTrap LOCATION:SLOT

18、-3 FX-ETH-3通过show current-alarm可以查看系统当前的告警信息。快速识别当前告警是非常重要的,下面简单介绍当前告警的识别方法。上面图中的告警介绍如下:5 rcOptTrapSdhLosTrap LOCATION:SLOT-6 STM1-OPT-2-0-0-0-0 说明: 6槽位的第二个光口出现SDH光口los告警; 6 linkDown LOCATION:SLOT-3 FX-ETH-3说明:第三槽位的第三个以太光口没有输入方向的光纤连接。7 rcOptTrapSfpNotExistTrap LOCATION:SLOT-3 FX-ETH-3说明:第三槽位的第三个以太光口

19、SFP模块不存在。2.3查看SDH接口告警Raisecom(config)# slot 6Raisecom(config-slot/6)# interface stm1-opt 1传输层面正常时的状态:Raisecom(config-stm1-opt/6/1)# show sdh-alarm RS Alarm: NOALARMMS Alarm: NOALARMHP-1 Alarm: NOALARMvc12-1-01: NOALARM传输层面异常时的告警:Raisecom(config-stm1-opt/6/1)# show sdh-alarm RS Alarm: RS-LOS RS-LOF R

20、S-OOF RS-SD RS-TIMMS Alarm: MS-AIS MS-EXC MS-SDHP-1 Alarm: AU-LOP AU-AIS HP-TIM HP-PLM HP-RDI HP-LOM HP-UASvc12-1-01: TU-LOP TU-AIS LP-SLM LP-RFI进入SDH接口查看相应的告警,是排除传输层面故障的基础方面。上图中给出了传输层面正常时的状态,再生段、复用段、高阶和低阶均为“NO ALARM”没有告警。传输层面如有告警的时候在相应的段层就会详细的显示告警情况,在排除故障时,按照“先高级、后低级,先高阶、再低级”的原则。例如上图中显示,再生段有RS-LOS告

21、警,说明SDH接口输入的光纤没有接或断了,这时候需要先处理光线路,解决RS-LOS告警后,再处理后面的告警。经验:出现RS-TIM、HP-TIM和LP-TIM时,是由于jx字节的实际接收值与期望接收值不匹配造成的。瑞斯康达的MSAP再出现上述告警时,是否下插AIS可以进行选择,默认情况下为不下插AIS信号,所以,及时出现了TIM告警也不会影响业务。 另外,新的SDH标准中新增定义了,出现TIM告警时认为相应的段层不可用,出现TIM告警的时候,同时也会存在UAS告警,所以,不用紧张,至于处理好jx字节就可以了。但如果TIM和UAS不时同时存在,即只有UAS存在,说明相应段误码严重,需要进一步排除

22、了。2.4查看SDH接口开销设置及状态Raisecom(config-stm1-opt/6/1)# show interface interface:sdh1 status :up description: SLOT-6 SDH-1 line code is: CMI line type is: SDH LongSingeMode Optical Module type is: OTHER-TYPE als: disable loopback: noneRegenerator Section: RS exc-threshold :3 RS sd-threshold :6 RS es-thres

23、hold :900 RS ses-threshold :900 RSTIM Insert msais Enable: DISABLE j0 mode: sixteen-byte j0 transmit: Raisecom-Opcom j0 expected: Raisecom-Opcom j0 received: Raisecom-Opcom Multiplex Section: MS exc-threshold :3 MS sd-threshold :6 MS es-threshold :900 MS ses-threshold :900 MSEXC Insert msais Enable

24、: DISABLE S1 transmit:(0f)h S1 received:(0f)h K1 transmit:(00)h K1 received:(00)h K2 transmit:(00)h K2 received:(00)hHigher Path: VC4-1 exc-threshold :3 VC4-1 sd-threshold :6 VC4-1 es-threshold :900 VC4-1 ses-threshold :900 AU-1 PJEPs-threshold:65535 AU-1 PJENs-threshold:65535 j1-mode: sixteenbyte j

25、1 transmit: Raisecom-Opcom j1 expected: Raisecom-Opcom j1 received: Raisecom-Opcom sdh: stm-1 c2 transmit:(02)h sdh: stm-1 c2 expected:(02)h sdh: stm-1 c2 received:(02)h HPPLM Insert ais Enable : DISABLE HPEXC Insert ais Enable : DISABLE HPTIM Insert ais Enable : DISABLE sdh 1/1 vc12 1 k4(b1(1219) t

26、ransmit: (0d)h sdh 1/1 vc12 1 k4(b1(1219) expected: (0d)h sdh 1/1 vc12 1 k4(b1(1219) received: (0d)hLower Path: lower-path exc-threshold :3 lower-path sd-threshold :6 lower-path es-threshold :900 lower-path ses-threshold :900 TU-PJEPs-threshold :65535 TU-PJENs-threshold :65535PORT-1 VC4-1: sdh 1/1 v

27、c12 1 j2 transmit: Raisecom-Opcom sdh 1/1 vc12 1 j2 expected: Raisecom-Opcom sdh 1/1 vc12 1 j2 received: FF 52 61 69 73 65 63 6F 6D 2D 4F 70 63 6F 6D 20 sdh 1/1 vc12 1 v5(b5b7) transmit: (101)b sdh 1/1 vc12 1 v5(b5b7) expected: (101)b sdh 1/1 vc12 1 v5(b5b7) received: (101)b通过进入相应群路盘的SDH接口使用show int

28、erface命令可以查看相应接口各段的开销设置情况和实际开销接收的情况。在遇到传输层面的故障时,可以通过查看这些开销来排除设备对接问题,另外,结合环回测试法也可以判断传输链路是否正常。2.5交换盘和汇聚盘的MAC地址表信息Raisecom# show slot slot 1: working ,opcom3500-8eos-fe , hdlc , none , poll ,slot 2: null ,slot 3: null ,slot 4: null ,slot 5: null ,slot 6: working ,opcom3500e-b-stm1-m , hdlc , none , pol

29、l ,slot 7: null ,slot 8: null ,slot 9: working ,subesw2ge , hdlc , none , poll ,slot 10: null ,slot 11: null ,slot 12: null ,3 board(s) in slot(s)Raisecom# configConfiguration mode, one conmmand input per time. End with CTRL-Z.Raisecom(config)# slot 9Raisecom(config-slot/9)# mac-polling Raisecom(con

30、fig-slot/9)# show mac-address-table all2 item(s) found 000e.5e03.7e80 : dynamic, vlanid 109, port 1 0015.58c6.0a8d : dynamic, vlanid 109, port 13Raisecom(config-slot/9)# slot 1Raisecom(config-slot/1)# mac-polling Raisecom(config-slot/1)# show mac-address-table al2 item(s) found 000e.5e03.7e80 : dyna

31、mic, vlanid 109, port 1 0015.58c6.0a8d : dynamic, vlanid 109, port 9说明:8EOS-FE/FX和交换盘等业务汇聚板卡中具有交换功能,通过查看MAC地址表的信息,可以分析业务是否正常,或者某段传输是否正常。上图所示中查看交换盘的MAC地址表,端口1学到分支路由器的MAC,一般情况下说明从分支到中心的业务方向是正常的。端口13学到中心路由器的MAC地址,说明中心设备到交换盘的下行是正常的。如果查看8EOS-FE的MAC地址表,显示的信息又可以进一步分析网络情况。注意:在查看MAC地址表的之前要在槽位模式下执行mac-polling命令。 2.6交换盘交换端口的统计信息Raisecom(config-slot/1)# inter switchport 1 Raisecom(config-eswif/1/1)# clear statistic Set Successfully.Raisecom(config

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1