传输专业设备故障处理指导手册13页精选文档.docx
《传输专业设备故障处理指导手册13页精选文档.docx》由会员分享,可在线阅读,更多相关《传输专业设备故障处理指导手册13页精选文档.docx(13页珍藏版)》请在冰豆网上搜索。
传输专业设备故障处理指导手册13页精选文档
传输专业设备故障处理指导手册
1.0编制目的
与当今“教师”一称最接近的“老师”概念,最早也要追溯至宋元时期。
金代元好问《示侄孙伯安》诗云:
“伯安入小学,颖悟非凡貌,属句有夙性,说字惊老师。
”于是看,宋元时期小学教师被称为“老师”有案可稽。
清代称主考官也为“老师”,而一般学堂里的先生则称为“教师”或“教习”。
可见,“教师”一说是比较晚的事了。
如今体会,“教师”的含义比之“老师”一说,具有资历和学识程度上较低一些的差别。
辛亥革命后,教师与其他官员一样依法令任命,故又称“教师”为“教员”。
为了提高辽宁公司传输专业维护人员对传输设备告警处理的能力、快速定位告警原因、缩短故障处理时长、提高故障处理效率,根据集团网运部关于北方NOC标准化建设的总体要求,以及辽宁省公司公司网运部关于告警处理的各项管理规定,结合实际情况,形成本处理手册。
死记硬背是一种传统的教学方式,在我国有悠久的历史。
但随着素质教育的开展,死记硬背被作为一种僵化的、阻碍学生能力发展的教学方式,渐渐为人们所摒弃;而另一方面,老师们又为提高学生的语文素养煞费苦心。
其实,只要应用得当,“死记硬背”与提高学生素质并不矛盾。
相反,它恰是提高学生语文水平的重要前提和基础。
2.0适用范围
语文课本中的文章都是精选的比较优秀的文章,还有不少名家名篇。
如果有选择循序渐进地让学生背诵一些优秀篇目、精彩段落,对提高学生的水平会大有裨益。
现在,不少语文教师在分析课文时,把文章解体的支离破碎,总在文章的技巧方面下功夫。
结果教师费劲,学生头疼。
分析完之后,学生收效甚微,没过几天便忘的一干二净。
造成这种事倍功半的尴尬局面的关键就是对文章读的不熟。
常言道“书读百遍,其义自见”,如果有目的、有计划地引导学生反复阅读课文,或细读、默读、跳读,或听读、范读、轮读、分角色朗读,学生便可以在读中自然领悟文章的思想内容和写作技巧,可以在读中自然加强语感,增强语言的感受力。
久而久之,这种思想内容、写作技巧和语感就会自然渗透到学生的语言意识之中,就会在写作中自觉不自觉地加以运用、创造和发展。
本手册适用于地市所有波分、SDH等传输设备。
3.0传输告警分级分类及派单规则
3.1告警分级分类
3.1.1告警分级
告警级别用于标识一条告警的严重程度和重要性、紧迫性,按严重程度递减的顺序可以将告警分为以下四种:
紧急告警、重要告警、次要告警、提示告警。
告警级别
定义
紧急告警
带有全局性的、会导致主机瘫痪的故障告警和事件告警。
重要告警
局部范围内的单板或线路故障告警和事件告警。
次要告警
一般性的、描述各单板或线路工作是否正常工作的故障告警和事件告警,如单板复位、公用资源申请失败/占用超时等。
提示告警
提示性故障告警和事件告警。
3.1.2告警分类
告警类别
定义
举例
通信告警
有关网元通信、ECC通信、光信号通信等的告警。
网元通信中断、光信号丢失。
处理告警
有关软件处理和异常情况的告警。
数据库错误、网元处于安装态。
设备告警
有关设备硬件的告警。
激光器故障、光口环回。
服务告警
有关业务状态和网络服务质量的告警。
线路层信号劣化。
环境告警
有关电源系统、机房环境的告警。
电源模块温度过高。
安全告警
有关网管、网元安全性的告警。
网元用户未登录。
4.0告警处理基础知识
4.1SDH单板常见告警详解
4.1.1摘要
SDH帧结构中有着丰富的开销字节,借助于这些开销字节传递的告警、性能信息,使得SDH系统具有很强的在线告警和误码监测能力。
本段落从数据流向的角度,与单板相结合,详细阐述了各个单板可能出现的告警信息与原因,对维护人员了解告警信息的产生方式与对故障的快速定位有一定帮助意义。
4.1.2线路告警
指信号流向为SDH接口→交叉板→SDH接口这条路由上的告警信息,也就是在光板上出现的告警。
有再生段、复用段与高阶通道开销告警。
具体为:
(1)LOS信号丢失(截止)
从光路上来的STM-N光信号进入光板的光接收模块后,首先经过光电转换后,被恢复成公司号送往帧同步器和扰码器处理。
在这过程中,光电转换模块会对该信号进行检测,如果发现输入信号无光、光功率过低或光功率过高以及输入信号码型不匹配时会上报LOS(信号丢失)告警。
发生R-LOS告警时,系统会对下一级电路插入全“1”信号。
(2)OOF帧失步报警与LOF帧丢失告警(截止):
A1、A2字节用来定位从光/电转换模块发来的STM-N信号,同时从中提取线路参考同步定时源,发送给时钟板进行时钟锁定,正常情况下,A1值恒为F6,A2值恒为28,但如果检测到A1≠F6或A2≠28,将上报OOF告警(帧失步报警)。
如果R-OOF告警持续超过3ms,则上报帧丢失告警LOF并下插全"1"信号。
在LOF状态下,若连续1ms以上又处于定帧状态,那么设备又回到正常状态。
(3)J0追踪识别符失配告警:
定帧后检查J0字节,如果收发两端的J0字节不匹配,则会上告J0追踪识别符失配告警。
(4)B1误码:
如果从STM-N信号中恢复出的B1字节和接收到的前一个STM-N帧中的BIP-8计算结果不一致,则上报B1误码。
以上部分为再生段告警信息。
下面介绍复用段告警。
这部分主要处理的与告警、性能相关的再生段开销字节有:
自动保护倒换通路字节(K1、K2)、复用段误码监视字节(B2)。
(5)MS-AIS,MS-RDI告警:
如果检测到K2(b6-b8)=111,则上报MS-AIS告警并下插全"1"信号。
如果检测到K2(b6-b8)=110,则上报MS-RDI告警。
(6)B2误码:
如果从STM-N信号中恢复出的B2字节和前一个STM-N帧(除再生段开销外的所有比特)的BIP-24计算结果不一致,则上报B2误码。
并通过M1字节上报MS-REI告警(注意此告警为回传的告警信息)。
下面讲述指针与高阶通道开销告警。
这部分主要处理的是高阶指针调整和高阶通道开销,与指针调整有关的字节是H1、H2、H3,而与告警、误码相关的字节有高阶通道追踪字节(J1)、信号标记字节(C2)、高阶通道误码监视字节(B3)、通道状态字节(G1)、复帧位置指示字节(H4)。
(注:
有的系统高阶通道开销在支路板上处理)
(7)AU-AIS管理单元-告警指示信号
H1和H2字节全为“1”,则上报AU-AIS告警并下插全“1”信号。
(8)AU-LOP(管理单元-指针丢失)
如果H1和H2字节代表的指针值非法(不在正常范围0~782内),连续8帧收到非法指针,则上报告警并下插全“1”信号。
处理了指针后,光板对高阶通道开销进行处理并产生相应的告警信息。
(9)HP-TIM(高阶通道踪迹字节失配):
J1字节和预定值不同,则上报HP-TIM告警并下插全“1”信号。
(10)高阶通道未装载,高阶通道信号标记失配:
如果检测到字节C2=00,则上报HP-UNEQ(高阶通道未装载)告警并下插全"1"信号。
如果检测到C2字节和预定值不同,则上报HP-SLM(高阶通道信号标记失配)告警并下插全"1"信号。
(11)B3误码:
如果从HPOH恢复出的B3字节的计算结果和前一帧VC-4信号的BIP-8计算,结果不一致,则上报B3误码。
(12)HP-RDI与HP-REI:
如果检测到字节G1(bit5)=1,则上报HP-RDI告警,根据字节G1(bit1-bit4)的取值是否为1-8,判断是否上报HP-REI告警,若是,则上报。
(13)LOM(复帧丢失)告警
如果检测到H4字节非法,则上报LOM(复帧丢失)告警,并下插全"1"信号。
4.1.3支路告警
支路告警主要考虑低阶通道开销告警。
业务流向为支路板→交叉板→光板,从交叉板来的VC-4信号送到支路板,然后把VC-4解映射成VC-12。
(1)HP-LOM告警:
如果检测到H4复帧字节序列错,则上报HP-LOM。
(和13相同)
(2)TU-AIS、TU-LOP、LP-RDI告警:
如果检测到低阶指针字节V1、V2值为全“1”,则上报TU-AIS告警;如果检测到V1、V2值为不合法,则上报TU-LOP告警,发生这两个告警都会往下一功能块插入全“1”信号。
此外,如果接收到TU-AIS,除在向下的数据中插入AIS信号以外,同时需要回告LP-RDI,即将V5字节字节的b8比特置为“1”。
(3)低阶通道未装载LP-UNEQ、信号标记失配LP-SLM:
检测V5字节的b5-b7比特,作为信号标记上报。
如果为000,则表示低阶通道未装载LP-UNEQ,并往下一级电路插入AIS信号。
如果信号标记失配,则上报LP-SLM,并往下一级电路插入AIS信号。
在V5字节的b8中通道RDI信息将被终结,并上报“远端告警指示”。
(4)LPBBE、LPFEBBE:
检测V5字节的误码监测比特位b1、b2,对VC-12计算BIP-2。
对现行帧计算出来的BIP-2值将与下一帧中恢复出来的V5的b1、b2进行比较,不一致则上报LPBBE。
同时,V5字节中的b3比特被恢复出来,如果为“1”,表示检测到远端有BIP-2差错,作为LPFEBBE上报。
(5)低阶通道追踪识别符失配告警(LP-TIM):
检测收到的J2字节的值和预期收到的值是否相等,若不等,则上报低阶通道追踪识别符失配告警(LP-TIM)。
与此同时,还会将低阶通道识别符J2字节恢复出来,并检测收到的J2字节的值和预期收到的值是否相等,若不等,则上报低阶通道追踪识别符失配告警(LP-TIM)。
4.2波分系统信号流及常见告警
4.2.1波分系统信号流
波分复用系统设备可分为光终端复用器(OTM)、光线路放大器(OLA)、光分插复用器(OADM)和电中继器(REG)几种类型。
以OTM系统为例,业务信号在系统里的流向如图所示:
图1发送端
图2接收端
4.2.2波分系统常见告警
光波长转换单元(OTU)常见告警
告警描述
各厂家告警描述
产生告警的主要原因
缺省告警级别
信号丢失
烽火:
R_LOS、TRIB_RF;
华为:
R_LOS
中兴:
信号丢失告警
1、线路光纤断;2、线路衰耗过大;3、对端站发送部分故障,线路发送失效
紧急
帧丢失
烽火:
RS_LOF、OTN_SDH_LOF;
华为:
LOF
中兴:
帧丢失告警
1)输入光功率过低或传输过程误码过大2)对端站点发送部分故障
紧急
激光器发送失效
烽火:
OTN_LDOFF、CLIENT_LDOFF;
华为:
TF
中兴:
输出无光告警
本板激光器故障
紧急
发送器劣化
烽火:
EOL
华为:
TF
中兴:
激光器寿命告警
激光器性能变坏
紧急
输入功率过低
烽火:
IOP、;
华为:
IN_PWR_LOW
中兴:
输入弱光告警
输入光功率过低
重要
输入功率过高
烽火:
IOP_HIGH、
华为:
IN_PWR_HIGH
中兴:
输入光功率过强告警
输入光功率过高
重要
单板不在位告警
烽火:
CARD_ABSENT、COMFAIL;
华为:
BD_STATUS
中兴:
接口板不在位、单板脱位
子架板位槽无单板、单板邮箱故障或单板未插好
重要
波分复用器:
分波/合波器(ODU/OMU)常见告警:
告警描述
各厂家告警描述
产生告警的主要原因
缺省告警级别
单波长信号丢失
烽火:
CH_ILOS
华为:
MUT_LOS
中兴:
OPM板某个具体通道上报“输入无光告警”
1)输出光功率检测电路故障
2)线路衰耗过大
紧急
光放大器(BA/LA/PA)常见告警:
告警描述
各厂家告警描述
产生告警的主要原因
缺省告警级别
输入功率过低
烽火:
IOP;
华为:
IN_PWR_LOW
中兴:
输入弱光告警
输入光功率过低
重要
输入功率过高
烽火:
OPM、
华为:
IN_PWR_HIGH
中兴:
输出强光告警
输出光功率大雨上限;本盘故障;或门限设置不当
重要
激光器发送失效
烽火:
LASER_TF、PUMP_TF
华为:
TF
中兴:
输出无光告警
本板激光器故障
紧急
光监控信道/通路(OSC)常见告警:
告警描述
各厂家告警描述
产生告警的主要原因
缺省告警级别
接收线路侧信号丢失
烽火:
OSC_LOS
华为:
R_LOS
中兴:
输入无光告警
1)断纤2)线路衰耗过大3)对端站发送部分故障
紧急
接收远端告警
烽火:
OSC_FERF
华为:
OSC_RDI
中兴:
信号丢失告警
对端站接收到告警信号
次要
5.0告警处理
5.1SDH设备告警处理
华为SDH设备告警操作手册:
序号
网管告警现象
产生原因
处理办法
1
R-LOS
光路断或用户端设备掉电或故障
先确认用户端设备是否掉电,是否为市电断电导致,如均不是,则查询全程光路是否有问题,设备是否存在问题
2
T-ALOS
在哪个机房产生,则故障点即在哪个机房
只需确认相应端局是否有人正在施工或做相关操作,否则由相关人员检查设备至配线架之间的整条路由中是否存在问题。
3
TU-AIS
多数会由于对端站出现故障或配置数据不完全造成此告警
多数情况下为非本端问题,是由对端故障所引起,首先保证整条传输路由中没有其他告警,其次确认是否有相关人员正在进行配置数据等操作。
4
R-LOF、R-OOF
多数会伴随R-LOS产生,如果不是则有可能是光路衰耗过大所引起
以处理R-LOS告警为先,否则检查光路质量是否良好
5
PS
传输环网发生倒换
检查是否存在其他紧急告警,如有光路问题,以处理光路问题为主。
6
BD_STATUS
单板不在位
确认是否有人正在进行拔插单板或配置业务等操作,否则通知相关专业员处理
除上述告警外不常出现的告警,先咨询专业员,在决定是否通知包机责任人。
5.2波分设备告警处理
波分设备告警处理时,大体需要把握以下三点:
1)应严格区分告警来源究竟是客户侧还是波分侧,区别方法总结如下:
烽火
中兴
华为
客户侧(接收线路侧)
线路2IN/OUT
OAC侧
CLIENTRx/Tx
波分侧(群路侧)
线路1Rx/Tx
OCH侧
OCHIN/OUT
2)关于激光器自动关断功能:
激光器自动关断是在没有光输入的时候,自动关断输出,主要作用是延长激光器寿命,起保护作用。
在网运行的设备,只有华为的设备启动了这一功能,即光放站或是OTM站的光放大板如果收不到上游站的光,则该站点不向下游站发光。
3)性能事件分析:
性能事件是反映设备工作性能的重要参数。
性能事件和告警是相关的,当性能事件值超过预先设定的门限时,就会引发相关的告警。
了解和掌握性能事件的产生原理、相关单板和相关告警,有利于在日常维护中及时发现隐患,有利于在发生故障时进行故障分析。
非传输专业人员只要求会打开性能事件窗口,将当前15分钟性能与历史性能对比即可。
5.2.1LOS告警
LOS告警含义为输入光功率低于预定门限值,即输入信号丢失。
1)波长转换板上的LOS告警:
OTU(波长转换板)上的客户侧LOS告警上报因厂家而异,客户侧LOS告警总结如下:
中兴
华为
烽火
LOS告警
输入无光告警;
信号丢失告警
R_LOS
TRIB_RF(支路侧收无光)
OTU很少上报群路侧LOS告警,因为群路侧为设备内部连纤,出现告警的概率很低。
处理方法:
准确定位告警单板,以及告警来源(客户侧还是群路侧),查看告警单板是否故障,光路是否正常,然后根据故障原因进行相应处理。
2)光放盘上的LOS告警:
光放盘上接收上游站的放大盘上报此告警,此时往往伴随光监控信道盘的LOS告警,出现这两个告警的原因多数是光缆故障。
该告警往往会影响数据专业、交换专业的设备,查看传输网管的同时需注意其他专业监控终端的上报情况。
处理方法:
首先查看告警单板是否故障,然后进行线路巡检,确定光缆断点后立即进行熔纤等抢修工作。
5.2.2LOF告警
LOF告警含义为业务信号帧丢失,产生原因较多,例如接收光功率低、传输误码过大、对端发送故障等等。
由于该告警在群路侧和客户侧均会产生,而且整条电路路由上的网元均有可能上报该告警,因此定位该告警的故障点相对困难。
处理方法:
从电路的终端站开始查询,是否有客户侧LOS告警或客户侧LOF告警,如果有,则初步断定故障点在该终端站;如果没有相应告警,只有群路侧LOF告警,需根据电路的路由信息查看相关网元,直至找到故障点。
注意:
烽火设备OTU板的FEC_FDI告警相当于群路侧帧丢失告警。
提示:
背靠背的OTM站中,对应波道一端站的群路侧有帧丢失告警,另一端站则会有客户侧帧丢失告警。
5.2.3输入光功率低、高告警
波分系统单板接收光功率低于门限值的下限或高于门限值的上限即会上报输入光功率低或高告警。
处理方法:
查看故障单板的性能事件,将当前性能与历史性能和预置值相对比。
找到差异原因,对光功率值偏差过大以至于造成网络运行隐患的,需由传输专业员与设备厂家共同制定光功率整改方案。
如果涉及到省干电路,需按相关要求进行割接申报,与省公司配合共同完成光功率隐患整治。