网络应急预案Word文档下载推荐.docx

上传人:b****4 文档编号:17834157 上传时间:2022-12-11 格式:DOCX 页数:20 大小:154.73KB
下载 相关 举报
网络应急预案Word文档下载推荐.docx_第1页
第1页 / 共20页
网络应急预案Word文档下载推荐.docx_第2页
第2页 / 共20页
网络应急预案Word文档下载推荐.docx_第3页
第3页 / 共20页
网络应急预案Word文档下载推荐.docx_第4页
第4页 / 共20页
网络应急预案Word文档下载推荐.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

网络应急预案Word文档下载推荐.docx

《网络应急预案Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《网络应急预案Word文档下载推荐.docx(20页珍藏版)》请在冰豆网上搜索。

网络应急预案Word文档下载推荐.docx

保护需要防静电的部件。

防静电服

十字螺丝刀

用于拆装设备螺丝.

标签纸

用于标示设备或者线缆。

SDH、ETH业务分析仪

用于测量业务信号.

2应急恢复

总体原则:

以业务快速恢复为目标,优先抢通业务,做好分工和解决方案的沟通,争取抢通和抢修并行。

当故障业务条数小于等于2条时,如初步判断不能短期解决,优先将重要业务倒换到保护波道。

2.1事故信息收集(10分钟)

第一时间关键信息收集

操作人员

操作步骤

具体动作

备注

网管人员

故障基本信息收集

1、故障发生时间:

年/月/日时:

分:

2、影响业务信息:

波数,业务级别(2.5G,10G,40G,100G)和承载的业务类型(大客户专线,移动回传)及对接设备类型(可选)。

3、故障前外部操作或环境变化:

如掉电,机房温度变化,光缆割接,网络拓扑调整(增删节点,网络改造),客户侧业务割接调整等;

4、故障后已做操作及结果:

网管侧操作:

业务配置,人工保护倒换,复位单板,环回等;

现场操作:

拔插光纤/电缆,物理环回,拔插单板,更换单板,网元上下电;

处理结果:

中断业务部分恢复,中断业务更多,网元返回失败,单板不开工;

等等

网络基本信息收集

5、网络拓扑:

节点数、保护类型(ODUkSNCP,OLP光线路1+1,客户侧1+1,ODUkSpring,ERPS,板内1+1,无保护)、网络层次(骨干,汇聚,接入)、拓扑类型(链,环,环相切,环相交,环带链)

6、设备信息及运行情况:

设备类型,网元版本、网元状态

查询告警和性能信息

根据承载业务中断的具体时间,查询对应时间段是否存在关键告警或异常状态(如:

光纤中断RLOS、单板复位、网元脱管、保护倒换告警、环回告警、安装态告警)

7、在网管上先同步告警,然后查询当前和历史告警以及当前及历史15m性能.

8、把设备、单板、线路的告警与业务中断的时间进行一致性确认。

9、建议检查告警屏蔽状态和通道非介入监视状态,确保告警正常上报。

10、故障前后主通道光功率值(光放大板/OSC板);

(通过24H历史性能查询历史值)

查询操作日志

11、根据承载业务中断的具体时间,查询该时间段的关键操作日志。

(关键步骤为:

配置业务、复位、环回、优化、倒换等操作)

初步判断

12、根据告警和操作日志是否能初步准确定位到关键设备和保护子网。

采取相应预案。

求助烽火工程师

13、请第一时间电话烽火工程师。

有条件的可以取得客户授权的情况下远程接入;

查询业务中断共同路由

14、如果是多波中断,查询所有中断波长所经过的路径,确认波长经过的共同网元节点.

通过环回功能定位到单站

15、选取一条中断的路径,点击维护-环回,进入环回界面。

采用二分法,从源端到宿端逐步环回。

确认影响业务中断具体设备,再根据该设备的具体异常,采取预案。

避免在情况不明的情况下盲目操作,导致问题扩大化。

处理过程中一定要作好故障记录,保存好故障的原始数据.

2.2分析定界:

(5分钟)

根据上述采集的信息,判断是否波分网络的问题:

信息分析定界

步骤

判断和定位

时间花费

1

中断的业务只在波分系统上有共同的故障路由,则需要先排除波分侧故障;

5分钟

2

波分设备OTU单板的波分侧存在

OTN_LOF/OTN_LOS/OTUk_SM_BIP8_SD/OTUk_SM_BDI/OTUk_SM_BEI

ODUk_PM_AIS/ODUk_PM_BDI等告警,确认为波分侧问题;

3

中断业务经过的共同路由有明确的设备、单板等硬件故障告警(如:

COMMUN_FAIL/TEMP_OVER等),判断为波分设备问题,并马上启动硬件备件响应;

4

波分设备OTU单板客户侧端口存在R_LOS、R_LOF等告警,则需要先排查客户侧光口和对接设备之间的故障。

2.3定位恢复:

(50分钟)

场景一:

单波业务中断

此处指无保护场景

定位恢复步骤

场景介绍

A/B/C/D/E五个站点组成一个96波波分环(左上图),各站信号流图见右图。

每个波道在中间站点均OMU48—-—ODU48尾纤直接穿通.

现发现A<

-——>

D之间的192。

1THZ单波道中断。

有相关告警(OTN_LOS/OTN_LOF/ODUk_SM_BIP8_SD/ODUk_PM_AIS等)上报。

假设告警上报在D站点,A站有对应的BDI回告。

排除故障原因

操作动作

时间

花费

网管&现场人员

快速恢复动作

在资源允许的情况下:

将客户业务调至其它可用的波道或者备用波道;

或者客户对接设备存在保护则可以通过关闭OTU单板激光器触发倒换,或者联系对接设备维护人员手动倒换。

30分钟

故障综述:

单波故障绝大部份可以归为两类,一类为由于光功率异常导致(以下统一描述为光功率子场景),另一类为由于板件、尾纤等异常导致(以下统一描述为非光功率子场景),关键在于定位到具体的故障点,采取相应措施解决。

光功率问题子场景(D站点波分侧直接报R_LOS的情况)处理步骤

排除收端

先扫描收端站点192。

1THZ波长是否丢失,如果没有丢失且光功率正常,则进一步排查站点下波尾纤、光衰,尝试远程硬复位单板,同时安排人现场使用光纤环回OTU单板的波分侧,确定是否单板故障,如故障,则更换单板;

10分钟

排除发端

然后再扫描发端站点192.1THZ波长是否丢失,如果丢失,则排查上波尾纤和光衰、尝试远程硬复位单板,同时安排人现场使用光纤环回确定是否单板故障,如故障,则更换单板;

定位中间站点

如果发端192。

1THZ波长没有丢失,从发端A站点开始,按信号流方向逐站扫描192.1THZ波长是否丢失,确认波长丢失站点,(通过光功率计测试方法:

发端站点:

OTU---〉OMU48,收端站点:

ODU48—-—>

OTU,中间穿通站点:

ODU48--->

OMU48)查找故障点,并通过清洁光口、更换尾纤、更换单板的方式解决。

15分钟

备注:

如果现场没有配置OPM单板,又无法调波,业务恢复时长很难控制,同时网管中心通过总光功率变化来粗略判断故障点(波数很少的情况比较有效,波数多则无法判断),需要维护人员带上光功率计、光谱分析仪、备件、尾纤等物料逐站排查.

光功率问题子场景(非报R_LOS)处理步骤

检查光功率是否下降、是否有误码

分别查询A、D两站OTU单板的收发光功率,并对比历史24H性能值,确认是否是光功率问题导致的故障(可通过与故障前的光功率数据(如历史光功率性能数据或定期刷新过的文档)进行比较,以确定当前光功率值是否异常。

)此场景通常会伴随存在误码、FEC纠错等异常性能事件。

3分钟

排除硬件故障

分别对A、D站OTU单板使用光纤进行环回,确认是否单板故障,若单板故障直接更换;

(单光口板可以直接尝试硬复位单板)

排除波长漂移问题

对发端OTU单板(本例中为A站点)扫描波长,确认是否波长漂移,若漂移则硬复位单板临时恢复;

尝试提高该单波的收光功率(不能超过过载点)并观察性能变化。

方法:

从发端开始减少各站OMU48对应通道的衰减值。

5

尝试调整发端线路总光功率:

注意观察其他波长性能变化,在不影响其他波长性能的前提下小量多次,调整幅度不超过3dB。

6

从发端A站点开始,按信号流方向逐站扫描192。

1THZ波长,确认波长突变量较大的点,(通过光功率计测试方法:

OTU-—-〉OMU48,收端站点:

ODU48---〉OTU,中间穿通站点:

ODU48——-〉OMU48)查找故障点,并通过清洁光口、更换尾纤、减小M40V衰减、更换单板的方式解决。

非光功率问题子场景处理步骤

确认为非光功率问题

分别查询A、D两站OTU单板的收发光功率,并对比历史24H性能值,确认是非光功率问题导致的故障(可通过与故障前的光功率数据(如历史光功率性能数据或定期刷新过的文档)进行比较,以确定当前光功率值是否异常。

1、先硬复位发端单板,再硬复位收端单板;

2、如果硬复位完成后,业务未恢复,分别对A、D站OTU单板进行软件内环回、外环回,确认是否单板故障;

现场人员

1、对收发端单板进行硬环回,确认故障单板。

2、对故障单板进行更换.

场景二:

多波业务中断

A/B/C/D/E五个站点组成一个80波波分环(左上图),每个站点均为背靠背的OTM站,各站信号流图见左下图。

每个波道在中间站点均为M40—--D40尾纤直接穿通。

现发现环上大量波道出现异常告警。

多波中断。

环路多波故障绝大部份都是由于主光路异常或者合分波板、光放板故障导致,在没有光纤中断的情况下,关键在于定位出故障出现的站点.

排除光缆故障

查询环路上所有站点OSC单板的输入、输出光功率(对比单板当前和历史性能值),对比历史记录值,确认主光路是否存在光功率跌落,如果有跌落:

1、减少链路上可调衰减器件的衰减值(比如VOA等);

2、适当增大光放板增益;

通知客户修复主光路;

网管&

排除光放板故障

查询环路上所有段落光放板的输入、输出光功率,对比历史记录值(对比单板当前和历史性能值),确认是否存在异常的光放板,如果异常:

1、首先确认增益设置是否正确,不正确则修复并确认故障是否恢复;

2、通过光功率确认光放板(如果是OA系列单板)内部口衰耗是否正常,不正常则更换尾纤(DCM模块不动);

3、尝试修改光放增益,无效则硬复位光放,

4、上述三步无法解决则更换光放大板;

排除OMU48/ODU48故障

查询环路上所有站点OMU48/ODU48的输入、输出光功率,对比历史记录值(对比单板当前和历史性能值),如果有异常,则通过清洁光口、更换相关尾纤,调整光衰的方法排除故障,如无法排除,则更换单板.

20分钟

排除操作异常

上述主光功率问题均排除的情况下,应重点了解现场人员故障前的操作情况,是否存在DCM和光缆变化的情况,同时核查各站DCM配置,分析路由,尝试性增减、替换DCM来解决。

25分钟

场景三:

常见保护业务中断

此处常见保护包括:

光线路保护、客户侧1+1保护、板内1+1保护、ODUkSNCP保护、SWSNCP保护

快速恢复步骤

检查保护组状态,确认是否存在保护组被强制/锁定在非NORMAL的通道上。

如果是,解除强制/锁定倒换查看业务是否恢复,如业务未恢复,将保护组强制倒换到另一通道上,查看业务是否恢复.

强制倒换恢复

针对SNCP保护,可以尝试去激活、激活保护组,业务无法恢复则再尝试进行强制倒换,看业务是否恢复。

去激活/激活恢复

删除保护组重新配置,查看业务是否恢复;

如果不恢复,再进行强制倒换,看业务是否恢复.

重新配置保护组恢复

如果采取以上操作后都不恢复,将保护组两端强制到主通道,参照波分侧单波故障、多波故障的方式恢复主用通道业务。

场景四:

单站单板上报告警

此处告警指COMFAIL等硬件类告警,业务中断。

告警名称

故障现象

COMFAIL

单盘通信中断告警,表示单盘与其他盘之间的通信中断。

拔插单板,更换单板。

COMMUN_FAIL

通信错误告警.表示机盘内部各模块间通信不正常.

拔插单板,更换单板。

LASER_TF

激光器发送失效。

表示告警机盘激光器发送端无法正常工作。

FAIL

机盘工作失效。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 社交礼仪

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1