1、图10-1 SDH同步网中的时钟跟踪方向 10-1图10-2 时钟保护倒换故障处理流程图 10-7图10-3 系统组网图 10-9图10-4 系统组网图 10-10表格目录表10-1 同步状态信息编码 10-2表10-2 时钟保护倒换故障的常见原因 10-5第10章 时钟保护倒换故障处理10.1 背景知识10.1.1 时钟保护的原理在SDH网中,各个网元通过一定的时钟同步路径一级一级地跟踪到同一个时钟基准源,从而实现整个网的同步;如图10-1所示,所有网元的时钟同步于一个基准源主用BITS。通常,一个网元获得时钟基准源的路径并非只有一条,比如图10-1中,NE4既可以跟踪西向时钟,也可以跟踪东
2、向时钟,这两个时钟源都来源于同一个基准。SDH同步网中的时钟跟踪方向在同步网中,保持各个网元的时钟尽量同步是极其重要的。为避免由于一条时钟同步路径的中断,导致整个同步网的失步,有必要考虑同步时钟的自动保护倒换问题。也就是说,当一个网元所跟踪的某路同步时钟源丢失的时候,要求该网元能自动地倒换到另一路时钟源上。这一路时钟源,可能与网元先前跟踪的时钟源都是源于同一个时钟基准源,也可能是另一个质量稍差的时钟基准源(比如另外一个备用BITS)。这就是时钟的自动保护倒换。10.1.2 时钟保护倒换实现的条件1. 时钟源配置根据当前网元使用的时钟源列表,合理配置网元时钟源的优先级、时钟源的恢复参数、时钟源倒
3、换条件、时钟源倒换状态。2. 时钟子网的配置在进行时钟子网的划分中,目前并没有特别的限制和规则,通常将需要跟踪同一个时钟源的所有网元划分到同一个子网中;但在进行设计时,要遵循“时钟跟踪链不宜太长”的原则,以免时钟精度劣化。需要注意的是,基于SSM时钟保护的网元必须划分到时钟保护子网中,否则没有被划分到时钟保护子网中的网元SSM不会被启动,会引起时钟跟踪倒换不正确。时钟子网配置完成后,需要通过网管启动主控板的时钟保护协议,同时使时钟板进入SSM模式(即检测SSM):当主控板启动时钟保护协议时,自动下发命令给时钟板,使其也进入SSM模式;主控板禁止时钟保护协议的同时下发命令给时钟板退出SSM模式。
4、所以,在网管中“允许”时钟保护,就同时完成了协议启动和S1字节激活。SSMSynchronous Status Message,即同步状态消息,是同步网中用来表示时钟质量等级的一组编码。目前ITU-T建议规定用四个bit来进行编码,这四bit即为同步状态消息字节(SSMB)。如表10-1所示是ITU-T已定义的同步状态信息(SSM)编码,表示16种同步源质量等级信息。SSMB=2对应的时钟质量等级最高,SSMBf对应的时钟质量等级最低。同步状态信息编码Z1(b5-b8S1字节SDH同步质量等级描述00000x00同步质量不可知(现存同步网)00010x01保留00100x02G.811时钟信号
5、(PRC,一般为铯钟)00110x0301000x04G.812 转接局时钟信号(SSU-A,一般为铷钟)01010x0501100x0601110x0710000x08G.812本地局时钟信号(SSU-B,一般为铷钟或晶体钟)10010x0910100x0a10110x0b同步设备定时源(SETS)信号 (SEC,一般为晶体钟)11000x0c11010x0d11100x0e11110x0f不应用作同步需要说明的是,SSMB和S1字节的概念是有不同的:SSMB是一组消息编码,用来表明时钟质量等级,如上表所示;而S1字节是SDH段开销中的一个字节,S1字节的低四位即为SSMB。在SDH传输网中
6、,SSM是通过SDH段开销中的S1字节(STM-N 帧中第一个STM-1帧的第一个Z1字节)的低四位 b5b8来传送的;而在BITS设备中,SSM是通过2Mbit/s 时钟信号的第一时隙(TS0)的某个bit来传送的。可见,2MHz时钟信号不能携带SSM信息。对于OptiX 155/622设备而言,时钟板参数配置过程中的“s1”参数的含义如下:此参数的形式为:s1=sa4&sa5;第一个“sa4”对应第一路外时钟,第二个“sa5”对应第二路外时钟。当外接的时钟源模式为2Mbit/s,且要求实现时钟的自动保护倒换功能时,需要配置此S1参数,即同步状态信息SSM在外时钟输入信号中所占的位置(由外时
7、钟的提供者给出),以便时钟板能从这一时隙位置正确地接收SSM。可见此参数只需要在外时钟接入点设置,而且也只需要在时钟保护时才需要设置。因为如果不需要实现时钟保护,就用不到这个SSMB。10.1.3 参与时钟保护倒换的相关单板时钟保护倒换,和复用段保护倒换类似,也需要启动协议,也需要时钟板、线路板、主控板的参与;而和复用段保护倒换不同的是,时钟保护倒换需要时钟板的参与,而不是交叉板了。在时钟保护倒换中,网管及各单板完成的功能如下。1. 线路板负责S1字节的插入和提取。从主控板送来的S1字节在线路板插入段开销;而从线路板段开销中提取的S1字节则送到主控板进行处理。2. 时钟板完成外时钟SSM的提取
8、、执行跟踪时钟源的倒换等功能。3. 主控板在OptiX 155/622系统中,时钟保护协议的处理,在SCC板进行。SCC板接收到线路板和STG板送来的SSM后,依据协议判决STG该跟踪那一路时钟源,然后下发命令给STG板进行动作,同时把当前时钟源的SSM发送给其他线路板。10.2 常见故障现象及原因时钟保护倒换的常见故障包括: 全网时钟源分配不合理,导致全网出现二个或二个以上主时钟,造成相关网元产生大量的指针调整。 时钟保护倒换协议正常启动,但保护倒换不成功,造成了指针调整、业务中断等故障。 时钟保护倒换协议不正常,导致保护倒换不成功,造成了指针调整、业务中断等故障。时钟保护倒换的常见故障现象
9、和原因主要如表10-2所示,可分为外部原因、数据配置原因以及设备故障原因三大类。时钟保护倒换故障的常见原因故障类别故障原因外部原因光纤连接错误,导致跟踪时钟源错误外接时钟源时钟信号没有提供相关的时钟信息数据配置时钟保护协议没有正常启用网元的时钟跟踪源级别不正确时钟源恢复参数配置不正确设备原因时钟板、线路板、主控板工作异常10.3 故障定位方法与步骤10.3.1 常用定位方法 更改配置法10.3.2 故障定位步骤导致时钟保护倒换故障的原因需要结合全网来分析。故障的定位原则一般是先判断全网的各个网时钟跟踪方式配置是否正确,其次再判断时钟保护倒换协议是否正常启动,然后判断相应网元的外接时钟源的时钟信
10、号是否正确输出。时钟保护倒换故障定位流程如图10-2所示。图10-1 时钟保护倒换故障处理流程图10.4 故障定位与排除10.4.1 检查全网的的光纤连接关系对于时钟保护,各个网元时钟源的方向必须与网元的光纤连接关系相匹配;即光纤的东、西向必须确保正确。当时钟保护失败时,首先应检查全网中各个网元的光纤连接关系是否与时钟源的设置相匹配。10.4.2 分析网元时钟优先级由于时钟保护倒换涉及到全网时钟配置方式,因此在进行故障分析时,应结合时钟倒换协议,分析各个网元的时钟跟踪方式是否正确,是否出现由于配置原因导致网元时钟跟踪混乱。其次再判断时钟保护子网设置是否正确,相关网元的保护状态是否正常;然后再判
11、断外部时钟源所输出的时钟信号是否正常。通过如上分析,可以大致确定导致时钟保护倒换故障的站点。10.4.3 查询时钟子网的设置由于各个网元的时钟参数设置正确,并不能保证时钟保护子网正常工作。需要在网管上,查询各个网元是否已经正确添加到相应的时钟保护子网中,此时网元的时钟保护倒换协议才启动。此外由于只有在时钟保护协议启动后,网元才可依靠接收到的S1字节信息来判断时钟的质量;因此还需要在网管上,进一步查询相关网元的时钟保护倒换协议是否予以正常启动。10.4.4 查询外接时钟源时钟信号是否正常输出首先确认外接时钟源输出的时钟信号质量和SSM信息的时隙位置;其次判断相应的外接时钟是否携带有SSMB信息,
12、因为只有配置有SSMB信息的时钟源,设备才能够提取相应的时钟信息;然后确认相应的sa字节是否设置正确,设备是否能够通过相应的字节提取出相应的时钟。10.4.5 排除故障根据如上分析,按照不同的故障原因,制订相应的故障解决方案,即可排除故障。10.5 常见故障处理案例10.5.1 时钟同步状态字节无效引起时钟保护设置失败1. 系统概述某工程组网如图10-3所示,由6个OptiX 155/622设备组成,1号站时钟设置为“内部时钟”,2、3、4号站西向跟踪1号站的时钟,5、6号站东向跟踪1号站的时钟。系统组网图2. 故障现象某日,维护人员发现3号站有LTI告警,并且设备上有大量的指针调整事件。除了
13、LTI告警,没有查询到有其它的告警。3. 故障分析及排除 (1) 在网管中,查询3号站的当前时钟源,查询结果为“内部时钟源”;(2) 在网管中,查询发现3号站的时钟配置为“西向时钟源1/内部时钟源”,配置正确;(3) 查询3号站是否启动时钟保护功能。查询发现3号站被加到了保护子网中,并且时钟保护已被设置为“允许”;(4) 通过分析全网时钟保护子网,发现该网络其它站点没有启动S1保护;而且发不出可用的S1字节,导致3号站收不到有用的S1字节,从而判断3号站西向时钟源不可用,跟踪“内部时钟源”。(5) 修改配置,将3号站时钟保护功能设置为禁止后,LTI告警和指针调整事件消失,全网正常。4. 结论及
14、建议如果某网元启动了时钟保护功能,而其收到的各个级别的时钟源提供的S1字节都显示时钟不可用,会导致此网元不再跟踪其它时钟,改用内部时钟,造成网络不同步。在接有2Mbit/s的BITS并且提供了可用的S1信息情况下,可以启动全网的时钟保护功能。LTI(Loss of timing input)是指同步源丢失,该告警在除“内部时钟源”外其它各个级别的时钟源丢失或不可用的情况下产生。在本案例中启用了S1字节,但由于收到的“西向时钟”并不包含有用的S1信息,导致西向时钟不可用。另外我们日常维护时可能也会看到SYNC_LOS(Synchronous source level loss)告警,该告警是指同
15、步源级别丢失,在高级别的时钟源丢失或不可用时产生SYNC_LOS告警。如果高级别的时钟源全部丢失或不可用,则上报LTI告警,网元将跟踪时钟板提供的“内部时钟源”。10.5.2 外部BITS时钟不能提供SSMB信息导致的问题某工程组网如图10-4所示,由6台OptiX 155/622设备组成本地传输网,1号网元所在为中心局,跟踪外部BITS的2Mb/s时钟,时钟源级别为“外部/内置”;其他网元的时钟源级别为“西向/东向/内置”。全网要求实现时钟保护倒换。配置了各网元的时钟参数,并在网管启动了时钟保护协议后,发现1号网元始终不能跟踪外部时钟,而工作在自由振荡模式下。(6) 检查BITS输出的时钟信
16、号波形和频率正常;(7) 对于BITS提供其2Mb/s时钟信号中的SSMB的值和位置,询问用户维护人员;答复均不知道BITS时钟信号中的SSMB。(8) 将1号网元的“S1”参数分别设置为sa4sa8进行尝试,再启动协议后发现,1号网元接收的BITS时钟中的SSM都为“0f ”。(9) 如此故障原因可以知确定。按照ITU-T建议,SSM为“0f ”表示“不应用作同步”,即时钟质量等级为不可用。在全网的时钟保护协议启动后,各网元就只根据接收到的SSM(或S1字节)来判断同步源是否可用,应该跟踪哪一路时钟;而BITS时钟的SSM为“0f”,就导致了1号网元依据时钟质量等级不能跟踪该时钟源。(10) 为验证如上的分析,停止全网的时钟保护协议后,此时1号网元就能跟踪外部BITS时钟,但这时全网是无法实现时钟保护倒换的。这是因为1号网元不再依据SSM来判断时钟质量和时钟是否可以使用,从而能跟踪BITS时钟。(11) 经和BITS厂家的人员联系,确认了BITS设备确实没有设置SSM。最后由BITS厂家的人员对其设备进行了设置后,1号网元正常接收到了SSM为“4”,全网时钟保护倒换正常实现。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1