01OptiX光传输设备复用段保护及其常见故障处理.docx
《01OptiX光传输设备复用段保护及其常见故障处理.docx》由会员分享,可在线阅读,更多相关《01OptiX光传输设备复用段保护及其常见故障处理.docx(22页珍藏版)》请在冰豆网上搜索。
01OptiX光传输设备复用段保护及其常见故障处理
OptiX光传输设备复用段保护原理及故障定位
11前言
复用段保护需要APS协议实现,APS协议在复用段开销的K1、K2字节中传送。
复用段保护由于需要APS协议实现相对通道保护复杂一些。
复用段保护一般有以下形式:
●二纤双向复用段共享保护环
●二纤单向复用段保护环(专用环)
●四纤双向复用段共享保护环
●线性复用段1+1和1:
1保护
本文主要介绍二纤双向复用段共享保护环,简单介绍一下二纤单向复用段和线性复用段,四纤双向复用段共享保护环不作介绍。
关键字
复用段,保护倒换,节点参数,K1,K2,APS协议
12
复用段保护原理
12.1二纤双向复用段共享保护环
1.二纤双向复用段共享保护环的原理
二纤双向复用段保护倒换环的保护倒换过程如图1所示。
图11二纤双向复用段保护倒换环
在二纤双向复用段保护环中,将每个传输方向光纤的容量一半分配给业务通道,另外一半分配给保护通道。
正常情况下,如图2(a)所示,从节点A进环以节点C为目的的业务信号沿S1/P2光纤按顺时针方向传输;而从节点C进环以节点A为目的的业务信号则沿S2/P1光纤按逆时针方向传输。
当节点B、C间两根光纤同时被切断,如图2(b)所示,节点B与节点C的倒换开关将S1/P2光纤与S2/P1光纤沟通。
在节点B将从节点A进环沿S1/P2光纤送来的业务信号时隙转移到S2/P1光纤的保护时隙,传送到节点C。
在节点C将从本节点进环沿S2/P1光纤送出的业务信号时隙倒换至S1/P2光纤的保护时隙,传送到节点A。
因为二纤双向环中每个方向的业务时隙和保护时隙在同一条光纤上传输,即在一条光纤上既传输业务信号又传输保护信号。
这时,无论是接收机、发送机、光缆或节点发生故障,总是会同时影响工作通道和保护通道。
2.二纤双向复用段共享保护环的特点
环上最大可保护的业务容量为K×STM-N/2,K为环上节点数。
对于节点之间业务分布均匀的情况可以大大提高传输容量,而对于集中型的业务分布则体现不出它的优越性。
由于K1、K2字节中分别用四个bit表示节点号,所以环上最大节点数为16个。
中继站(REG)不需占用节点号。
不带额外业务的环,在没有先前的桥接请求以及短于1200km光纤的情况下,倒换完成时间应少于50ms。
12.2二纤单向复用段共享保护环
二纤单向复用段倒换环的保护倒换过程如图2所示。
二纤单向复用段保护倒换环中,业务的工作通道和保护通道分别在两根不同的光纤上。
正常情况下,如图2(a)所示,信息在业务光纤S上传送。
例如,节点A发送给节点C的业务信号是从节点A经S光纤穿过节点B到达节点C的;而节点C发送给节点A的信号是从节点C经S光纤穿过节点D到达节点A的。
各个节点仅仅从来自业务光纤S的信号中分插低速支路信号,保护光纤P是空闲的。
当节点B、C间的两根光纤都被切断,节点B和C的保护倒换开关的动作如图2(b)所示。
于是,在节点B从S光纤接收的业务信号,经过保护倒换开关切换到从P光纤返回,沿逆时针穿过节点A和节点D到达节点C,并进过节点C倒换开关回到S光纤下到支路。
故障排除后,保护倒换开关返回到图2(a)的状态。
图11二纤单向复用段保护倒换环
12.3线性复用段
线性复用段保护可以是专用的保护也可以是共享的保护,它保护复用段层并适用于点对点的物理网。
一个保护复用段可用于保护几个(N14)工作复用段,它不能保护节点的故障,它可按单向或双向方式操作,并可在保护复用段上载送额外业务信息。
其又分线性复用段1+1和1:
N保护。
采用1+1保护时,业务同时在两个信道上传输,接收端根据两个信道的信号质量进行优选。
1+1保护一般为单端不恢复式倒换。
采用1:
N保护时,保护信道上可传送额外业务。
1:
N保护是双端恢复式的。
线性复用段1+1保护不需要采用APS协议;1:
N需要采用APS协议。
13
OptiX环形复用段共享保护的实现
13.1复用段倒换的过程介绍
1.复用段倒换算法和网元侧和单板侧的关系
如图3所示,由线路板检测倒换的条件、或网管下发强制/人工倒换命令启动倒换;环上各网元的主控板根据复用段算法判断复用段节点的状态迁移,并根据倒换状态向交叉板下发倒换后的数据。
图11
2.复用段倒换启动的条件
启动复用段倒换的条件有SD(信号劣化)和SF(信号失效)。
SF包括RLOS、RLOF、MS-AIS;SD包括B2SD和B2OVER。
光板有B2OVER和B2SD两个告警监测线路的误码,出现B2OVER的条件为误码率超过10-3,出现B2SD的条件为误码率超过10-6。
主机软件却省状态下,SD启动复用段倒换的功能为关闭状态。
3.APSC协议处理和K字节的穿通、上报
在线路上出现故障时,由线路板检测到SD或SF条件,然后通过中断上报到主控板(SCC板),主控板根据APSC协议产生K字节并通过线路板发送出去,其它节点的光板检查到K1、K2字节发生变化,通过快速邮箱输出到主控板(SCC),SCC板根据复用段倒换协议进行处理。
主控板根据APSC协议确定各节点的最后倒换状态,然后下发命令到交叉板进行业务的切换。
另外,在线路板接收方向检测到MSAIS(RLOS)告警时,线路板将在发送方向将K2(b6-b8)强插110,即MSRDI告警。
4.复用段的倒换和恢复过程
复用段的倒换过程:
如图4所示,由A、B、C、D四个网元组成复用段环,C站发到B站的光纤断,倒换过程为:
图(a)图(b)
图(c)图(d)
图11
●A收到信号失效,向两个方向上发送桥接请求。
●C收到A在短径上发送的桥接请求后,在短径上发响应请求,在长径上发SF环桥接请求。
C收到A在长径上发送的桥接请求后,执行环桥接和倒换,并在短径和长径上发桥接倒换确认。
●B和D收到A或者C在长径上发送给对方的请求K字节,进入穿通状态,收到确认K字节,交叉板选择页面。
●A收到C在长径上发送的倒换确认请求后,执行桥接和倒换,并发送桥接确认,信令达到稳态。
复用段倒换的恢复过程:
●C站和B站光纤恢复后,A收到信道恢复信号,进入等待恢复(WTR)状态,并向两个方向发送等待恢复请求。
●根据在短径上的等待恢复请求,C节点在短径上发送响应请求,在长通道上发送WTR,启动定时器。
●等待恢复定时结束,A,C节点结束桥接和倒换,并向两个方向发送无请求(NR)码。
B和D接收到NR码,进入空闲状态。
倒换恢复完成。
13.2复用段倒换的状态迁移
复用段倒换状态迁移的过程如图5所示:
图11
在APSC协议停止的情况下,复用段是不进行倒换的。
APSC协议正常启动后,环上各复用段节点协议控制器的状态应为正常状态(I)。
检测到线路有SF、SD的网元、或网管下发了强制/人工倒换命令的网元,倒换后光路两侧的网元应处于倒换状态(S)。
如果上图中B网元西向断纤,则B网元处于倒换西向、A网元处于倒换东向。
倒换后环上的中间节点处于穿通态(P)。
如上图中A、B之间网元断纤后,C、D网元处于穿通态。
为了防止由于线路不稳定而引起频繁倒换,有个等待恢复的状态。
在工作信道恢复正常,或强制/人工倒换命令取消后,倒换并不马上恢复,而是要等待一段时间,这段时间称为等待恢复时间(WTR),WTR时间可设,主机软件却省为600秒。
在设定的等待恢复时间内,如果没有其它异常情况,等待恢复时间结束后全环将进入正常状态(I)。
13.3交叉板的保护数据
1.工作通道和保护通道的划分
二纤双向复用段环工作通道和保护通道的划分如图6所示。
622M双向复用段保护环工作路由为第1~2VC4,保护路由为第3~4VC4;对2.5G双向复用段保护环工作路由为第1~8VC4,保护路由为第9~16VC4。
图11双向环工作通道和保护通道划分
二纤单向复用段保护环由两个反向旋转的环构成,一个环用来传送业务,另一个用作保护,也可以传送额外业务。
环上的最大可保护业务容量为STM-N,也需要用K1、K2字节传送APS协议,倒换条件、倒换过程与双向复用段保护环一样,只是交叉板的动作不一样。
单向复用段环工作通道和保护通道的划分如图7所示:
图12单向环工作通道和保护通道划分
2.交叉板保护数据
对处于倒换态的网元,由交叉板实现将业务从故障线路板桥接到另一块正常线路板的相应备用通道。
如图8所示,2.5GSDH网元在倒换西向的状态下,原来经由W1的支路业务,桥接到保护通道E9。
图11
对处于穿通态的网元,由交叉板实现东、西向线路板备用VC4通道的连接。
下图为2.5G设备倒换后处于穿通状态的网元的交叉连接如图9所示(只显示了备用通道的穿通):
图12
13.4复用段组网要求和数据设定
1.线路板要求使用对偶板位/通道
复用段组网对网元的板位有要求,要求光板所用的板位或通道必须对偶。
对偶板位或通道提供的板间通信功能,可以完成K字节的穿通。
进行复用段组网时,应确认所用光口的板位或通道是否对偶。
2.逆时针方向、主环方向
逆时针方向为主环方向。
将网元上相邻光板的左边板位称为西向,右边板位称为东向。
逆时针组环要求环上各节点的东向板位光板与下游站西向板位的光板相连,西向板位的光板与上游站网元东向板位的光板相连。
3.复用段环的数据设定
复用段参数包括:
逻辑系统号、复用段节点号、最大节点号、等待恢复时间。
复用段参数设置必须准确,否则可能导致复用段倒换失败。
●逻辑系统号
OptiX设备为多ADM(MADM)设备,可同时支持多个复用段保护环,逻辑系统号用以区分不同的复用段保护环。
●复用段节点号
环上复用段节点号,可任选一个网元从“0”开始,按主环方向逐站递增,最大节点号为15。
属性为REG的网元不需节点号。
●最大节点号
最大节点号:
为复用段节点总数-1。
●等待恢复时间
一般设置为600秒。
4.复用段环组网数据设定一例
某组网如图所示,为2.5G双向复用段环带链组网。
NE1、NE2、NE4站为2.5GADM设备;NE3站为2.5GREG(中继站);NE5站为622的TM设备。
REG(中继)站点,由于只处理再生段开销,不处理复用段、高阶等其它开销字节,K1、K2字节在REG中一般只是透传,所以REG网元在复用段环中不需占用节点号。
各网元复用段节点参数设置:
网元名称
网元节点号
最大节点号
恢复时间(秒)
NE1
0
2
600
NE2
1
2
600
NE4
2
2
600
以NE2与NE3之间,NE2发到NE3断纤为例,分析倒换后NE1到NE4的业务路由,来理解复用段倒换后的业务流:
由于NE3为REG,在复用段倒换的时候REG网元接收到RLOS,将向NE4方向下插MS-AIS,NE4网元检测到MS-AIS后将启动复用段倒换。
如果NE3为ADM,则NE3检测到RLOS后启动复用段倒换。
在工程期间,应做好复用段保护倒换的测试工作。
测试每一段光纤断开后的倒换情况,查看倒换后各网元的倒换状态和业务是否正常。
对机房设备或线路进行维护时,如果操作会引起复用段保护倒换,可以先做强制/人工倒换或关断激光器,以判断操作后全环倒换是否正常,在确认业务正常后再进行业务割接。
13.5复用段的几种倒换方式
1.强制倒换
指强制业务从工作信道倒换到保护信道,不管保护信道的状态如何。
强制倒换不管主路信号是否正常而在恢复时间后倒换回主路,也就是说强制倒换将导致一直处于倒换状态下,再也不会自动恢复,除非再人为解除这一倒换操作。
2.人工倒换
指命令将业务从工作信道倒换到保护信道,如果保护信道处于正常状态,则倒换将发生,若保护信道处于失效或正在满足一个更高级别的倒换,则倒换不会发生;如果工作信道是好的,那么这次倒换动作将在恢复时间到了之后又自动回到最初的正常状态;这一操作主要是设备维护时用来测试网络目前是否还具有保护能力。
3.锁定倒换
是对相邻两点之间链路的保护倒换状态的设定。
如果原系统都处于正常状态,那么锁定倒换的作用将是,维持两个节点间的保护倒换状态,使得保护状态不再随外部条件的改变而动作;如复用段环两节点间光路不稳定,时通时断,为避免频繁倒换带来业务频繁瞬断,可以将这两端倒换状态设置为锁定倒换。
4.练习倒换
演习请求通路的环倒换而不完成实际的桥接和倒换。
因此只发出指令并核对响应,交叉板不动作,工作业务量不受影响的,可在日常维护中用于判断全环倒换协议的处理是否正常。
14
OptiX线性复用段保护的实现
14.11+1线性复用段保护
1+1链形保护实际上也是采用“并发选收”的机制,对于TM站点,要安装2块线路板;对于ADM站点,要安装4块线路板。
一对光纤作为主用光纤,另一对光纤作为备用光纤,备用光纤与主用光纤传送的是同样的内容。
它的倒换是单端倒换,只需由接收端进行倒换,因此不需要协议。
倒换条件也是SD与SF,且倒换是非恢复式的。
倒换过程如下(如图10所示):
A在主用通道上收到信号失效,如果备用通道正常,交叉板倒换页面,接收备用通道的信号,并在备用通道上发送倒换指示,B点无动作。
倒换完成。
图11
14.21:
N线性复用段保护
1:
N点到点保护倒换过程备用光纤可以用来传送额外业务,在倒换时额外业务将被抛弃。
倒换是双端倒换,需要用K1、K2字节传送APS协议。
倒换条件也SD与SF,倒换是恢复式的。
倒换过程如下(如图11所示):
●A在主用通道上接收到信号失效,在备用通道上向B发送倒换请求。
●B在备用通道上接收到A的倒换请求,在备用通道上向A发送倒换响应。
●A收到B的响应后执行倒换和桥接,并在备用通道上向B发送倒换确认
●B收到A的倒换确认后执行倒换和桥接,信令达到稳态,倒换完成。
图11
恢复过程如下(如图12所示):
●A在主用信道上收到信道恢复信号,在备用通道上向B发送等待恢复请求,并启动等待恢复定时器。
●B接收到A的等待恢复请求后,启动定时器。
●定时结束,A和B分别释放倒换,并向对端发送无桥接请求,倒换恢复完成。
图12
15
复用段保护环故障定位
15.1复用段倒换常用的故障诊断方法
1.复用段参数、状态的检查
复用段保护环,业务异常时应先检查各个节点的复用段状态是否正常;并检查线路质量、确认引起复用段倒换的原因。
对复用段保护环,日常维护时应注意检查环上各个网元的节点参数设置是否正确,节点号是否按主环方向递增,协议是否已启动,各个网元的协议状态是否为正常状态(I)。
2.停止APS协议,按照链型来处理
如果APS协议的状态正常,但业务仍然不通,可以将APS协议停掉,将复用段环当作一条环型的链来进行故障定位。
这种方法定位故障起来比较简单,可以迅速定位出故障点。
3.强制倒换,先恢复业务
比如某段光路有大误码,我们可以通过拔纤或下发强制倒换命令,使业务先恢复正常,然后再处理故障。
4.逐段环回
如果复用段倒换发生后,APS协议状态正常,但某些业务仍然不通,还可以用逐段环回的方法来定位故障。
这里逐段环回时APS协议仍保持启动状态,逐段环回的手段和前面讲述的所有区别:
因为倒换发生后业务可能不但要经过主用通道,还要经过备用通道,因此我们环回的VC4可能既有主用通道的VC4,也有备用通道的VC4,视业务经过的路径而定,具体可以参见下面的案例7。
环回第一个VC4会影响ECC,要注意。
15.2复用段故障处理的基本思路
1.查看APS协议是否正常
对于复用段保护倒换故障,首先要判断APS协议是否正常,判断的依据是APS参数、状态等内容。
若倒换协议异常,如协议不能正常启停、保护倒换不动作或部分站点倒换状态不对等,则首先要排除协议问题,然后再排除设备存在的其它问题。
对于已经开通运行的局,出现协议工作不正常,一般可能的原因是光板或主控板的故障,导致K字节的穿通和上报出现问题。
2.排除协议问题后的处理
如果已经排除了协议异常的问题,则此时的业务中断有两种情况:
一种是全网保护倒换处于正常状态,也就是“I”状态,保护倒换还没有动作;还有一种情况是保护倒换已经正常动作。
对于第一种情况,有两种处理办法:
一种方法是将协议停掉,将复用段环当作一条环型的链来进行故障定位。
另一种方法是启动保护倒换,将中断的业务倒到保护通道,看能否先恢复业务,若业务能恢复,则先恢复业务,然后再来定位故障的原因;若不能恢复业务,则仍按方法一进行处理。
显然,若启动协议恢复业务后再来定位故障,则增加了故障定位的难度。
但此时业务已经恢复,维护人员可以静下心,慢慢对故障进行分析、定位。
对于第二种情况,一般是单板故障等问题,我们可以按一般的业务中断故障来进行处理,即先通过自环法定位出故障的站点,然后再对故障站点进行故障排除。
此时,唯一需注意的就是正确画出中断业务的路径图,因为中断业务走的是保护通道。
16
复用段保护环常见案例
下面通过一些典型案例,学习复用段保护环的特点以及故障处理方法的应用。
16.1案例1:
复用段节点倒换状态不正确的处理
●组网情况
某局组网如下图所示。
5个站组成的一个2.5G复用段保护环,1号站为网管中心站,1号站到其它各个站有业务。
图11
●故障现象
某日,环上2号网元与3号网元之间断纤后,环上业务出现中断。
●故障分析
断纤复用段倒换后业务应能正常保护倒换,出现业务中断的原因可能是复用段倒换失败,各节点的倒换状态不对。
●处理步骤
查询3、4、5、1、2号网元的复用段倒换状态,不是S、P、P、P、S态。
倒换状态不正确。
通过网管“维护”菜单下的“复用段维护”,将复用段协议控制器停止后重新启动,业务出现正常。
●经验教训
在业务中断的情况下,及时恢复业务很重要。
由于复用段协议复杂,受各种因素的影响可能导致倒换失败。
在这种情况下可以重新启停协议,试一下倒换能否恢复正常。
遇到复用段倒换失败,应查明原因。
OptiX提供了复用段倒换事件记录的功能,复用段倒换失败应及时通知华为当地的维护工程师,以便收集数据进行分析。
16.2案例2:
复用段节点参数设置错误导致倒换失败
●组网情况同图13。
●故障现象
2号和3号网元之间断纤后,部分业务中断。
查询3、4、5、1、2号网元的复用段倒换状态,不是S、P、P、P、S态,倒换状态不正确。
重新启动复用段协议,也不能进入正常的复用段倒换状态。
●故障分析
重新启动协议不能恢复正常,可能与复用段节点参数设置有关。
查询环上各个网元的复用段参数,结果为:
站名
1号
2号
3号
4号
5号
查询返回的复用段节点号
0
4
3
2
1
从上表中可以看出,复用段节点参数未按逆时针方向设置,设置的方向与逆时针方向相反。
●处理步骤
在网管上按逆时针方向重新设置复用段节点参数后,重启协议恢复正常。
●故障原因
复用段节点参数设置错误导致了倒换出现异常。
如:
2号网元复用段模块处理时,默认为西向光板对应的网元节点号比本身小1,东向光板对应的网元节点号比本身大1。
如果复用段节点参数设置不正确,必将导致协议处理出现异常。
●经验教训
复用段参数的设置必须按逆时针方向从“0”逐站递增,最大节点数为环上节点数-1。
复用段参数的设置和修改要仔细。
16.3案例3:
网元处于安装态复用段倒换异常
●组网情况同图13。
●故障现象
某日,2号网元与3号网元之间断纤后,网上部分业务中断。
查询全网倒换告警,发现4号网元无保护倒换告警,查询倒换状态4号网元未进入穿通态。
●故障分析
网元未进入倒换状态,可能与配置有关。
●处理步骤
查询各网元的复用段参数,发现4号网元复用段参数丢失。
查询4号网元的网元运行状态,为“安装态”。
●故障原因
由于网元进入安装态,配置和复用段节点参数丢失,导致复用段倒换不正常。
由于复用段倒换协议涉及到主控板、线路板、交叉板,环上此类单板任何一块工作不正常都可能导致复用段倒换失败。
在日常维护中,如果发现网元进入安装态或者有单板不在位,应及时处理。
16.4案例4:
光路误码复用段未倒换
●组网情况同图13。
●故障现象
某日,1号站到4、5号站的部分业务出现了中断。
查询相应支路板的业务没有TU-AIS告警,查询支路板性能有误码。
查询5号支路板有B2SD告警。
●故障分析
可以判断是由于支路板出现误码导致业务出现了异常,由于出现异常的业务都经过了5号网元的东向光板,而该光板有B2SD告警。
可以初步定位该段光路误码导致了业务的异常。
在光路异常的情况下,复用段保护为什么没有倒换呢?
●处理步骤
1、通过网管“维护”菜单下的“线路板维护”,将1号网元西向光板的激光器关断,5号网元上报RLOS告警,全环复用段保护倒换后,业务恢复正常。
2、或者,对5号网元进行东向强制倒换。
●故障原因
线路出现了大误码,导致对电路要求高的业务出现了中断。
线路出现大误码的原因是5号网元收1号网元的尾纤受到挤压,导致收光功率过低。
而网管没有设置SD误码允许倒换使能,使得在线路误码状态下无法启动保护倒换协议,解决方法是在网管“复用段维护菜单”的SD使能选项中设置为允许。
16.5
案例5:
下插了MS-RDI告警导致复用段倒换异常
●组网情况同图13。
●故障现象
某日,网上一处断纤后,网上部分业务中断。
查询全网倒换状态,发现全网保护倒换不正常。
●故障分析
可能是由于某种原因导致复用段倒换失败,但重新启动协议后全环复用段倒换仍然不正常。
进一步分析可能是复用段参数配置不正确或者K字节传递不正常。
●处理步骤
查询各网元的复用段参数,各网元参数正常。
查询网上各网元的告警,发现4号网元西向光板有MS-RDI告警。
而3号网元收4号网元的光路正常,为什么4号网元有MS-RDI告警呢?
可能的原因是人工在3号网元的东向光板插入了MS-RDI告警,或者是单板告警误报。
●故障原因
单板插入了MS-RDI告警,将导致K2字节的后3位bit始终为110(MS-RDI),导致K字节不能正常在3号节点进行穿通,导致复用段倒换异常。
分析原因是,用网管或命令行工具向该网元的一光板下插过MS-RDI,导致K字节在该网元无法正常穿通,影响复用段保护倒换。
16.6案例6:
穿通业务有时分的节点失效后对业务的影响
●组网情况同图13。
●故障现象
5号网元掉电后,其它各网元处于正常的倒换状态中。
但4号网元经由5号网元到1号网元的业务中断。
●故障原因
分析4号网元到1号网元的业务在5号网元的穿通配置,发现5号网元的该穿通配置进行了的VC-12级别时分交叉:
W1,17~32←→E1,1~16。
当5号网元节点失效后,两侧的网元将进入倒换状态,而双向复用段倒换是以VC-4为基础的,将导致穿通点的时分交叉信息丢失。
●处理过程
重新配置业务,将各站点穿通业务的时分取消。
16.7案例7:
复用段保护通道故障的定位方法
●组网情况
某局SDH组网为一2.5Gbit/s复用段保护环,组网图如下图所示,1号站为网管中心站。
2M业务时隙分配表如表5-2所示。
时隙表中不同的行表示不同的VC-4,第一行为第一个VC-4,该局共用到了四个VC-4的业务;t1、t2、t3、t4分别表示第一到第四板位2M支路板。
支路板后面的数字表示通道号,横线上的数字表示所占用的时隙号。
该局业务已割接,各站复用段保护倒换协议均启动为“I”状态,业务运行正常。
某日,维护人员发现,2站、3站相连的光板出现RLOS告警,各站交叉板均有保护倒换告警,查询各节点倒换状态正常。
但3号站与1号站的业务中断,其它站业务正常。
对应中断的业务,1号