ImageVerifierCode 换一换
格式:DOCX , 页数:12 ,大小:154.30KB ,
资源ID:14686628      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/14686628.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(网络应急预案Word格式.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

网络应急预案Word格式.docx

1、十字螺丝刀 用于拆装设备螺丝。标签纸 用于标示设备或者线缆。SDH、ETH业务分析仪 用于测量业务信号。2 应急恢复应急恢复 总体原则:以业务快速恢复为目标,优先抢通业务,做好分工和解决方案的沟通,争取抢通和抢修并行。当故障业务条数小于等于 2条时,如初步判断不能短期解决,优先将重要业务倒换到保护波道。2.1 事故信息收集(事故信息收集(10 分钟)分钟)第一时间关键信息收集 操作人员 操作步骤 具体动作 备注 网管人员 故障基本信息收集 1、故障发生时间:年/月/日 时:分:秒 2、影响业务信息:波数,业务级别(2.5G,10G,40G,100G)和承载的业务类型(大客户专线,移动回传)及对

2、接设备类型(可选)。3、故障前外部操作或环境变化:如掉电,机房温度变化,光缆割接,网络拓扑调整(增删节点,网络改造),客户侧业务割接调整等;4、故障后已做操作及结果:网管侧操作:业务配置,人工保护倒换,复位单板,环回等;现场操作:拔插光纤/电缆,物理环回,拔插单板,更换单板,网元上下电;处理结果:中断业务部分恢复,中断业务更多,网元返回失败,单板不开工;等等 网管人员 网络基本信息收集 5、网络拓扑:节点数、保护类型(ODUk SNCP,OLP 光线路 1+1,客户侧 1+1,ODUk Spring,ERPS,板内 1+1,无保护)、网络层次(骨 干,汇聚,接入)、拓扑类型(链,环,环相切,环

3、相交,环带链)6、设备信息及运行情况:设备类型,网元版本、网元状态 网管人员 查询告警和性能信息 根据承载业务中断的具体时间,查询对应时间段是否存在关键告警或异常状态(如:光纤中断RLOS、单板复位、网元脱管、保护倒换告警、环回告警、安装态告警)7、在网管上先同步告警,然后查询当前和历史告警以及当前及历史 15m 性能。8、把设备、单板、线路的告警与业务中断的时间进行一致性确认。9、建议检查告警屏蔽状态和通道非介入监视状态,确保告警正常上报。10、故障前后主通道光功率值(光放大板/OSC板);(通过 24H历史性能查询历史值)网管人员 查询操作日志 11、根据承载业务中断的具体时间,查询该时间

4、段的关键操作日志。(关键步骤为:配置业务、复位、环回、优化、倒换等操作)网管人员 初步判断 12、根据告警和操作日志是否能初步准确定位到关键设备和保护子网。采取相应预案。网管人员 求助烽火工程师 13、请第一时间电话烽火工程师。有条件的可以取得客户授权的情况下远程接入;网管人员 查询业务中断共同路由 14、如果是多波中断,查询所有中断波长所经过的路径,确认波长经过的共同网元节点。网管人员 通过环回功能定位到单站 15、选取一条中断的路径,点击维护-环回,进入环回界面。采用二分法,从源端到宿端逐步环回。确认影响业务中断具体设备,再根据该设备的具体异常,采取预案。避免在情况不明的情况下盲目操作,导

5、致问题扩大化。处理过程中一定要作好故障记录,保存好故障的原始数据。2.2 分析定界:(分析定界:(5 分钟)分钟)根据上述采集的信息,判断是否波分网络的问题:信息分析定界 步骤 操作人员 判断和定位 时间花费 1 网管人员 中断的业务只在波分系统上有共同的故障路由,则需要先排除波分侧故障;5分钟 2 网管人员 波分设备 OTU单板的波分侧存在 OTN_LOF/OTN_LOS/OTUk_SM_BIP8_SD/OTUk_SM_BDI/OTUk_SM_BEI ODUk_PM_AIS/ODUk_PM_BDI等告警,确认为波分侧问题;3 网管人员 中断业务经过的共同路由有明确的设备、单板等硬件故障告警(

6、如:COMMUN_FAIL/TEMP_OVER 等),判断为波分设备问题,并马上启动硬件备件响应;4 网管人员 波分设备 OTU单板客户侧端口存在 R_LOS、R_LOF等告警,则需要先排查客户侧光口和对接设备之间的故障。2.3 定位恢复:(定位恢复:(50 分钟)分钟)场景一:单波业务中断场景一:单波业务中断 此处指无保护场景 定位恢复步骤 场景介绍 A/B/C/D/E 五个站点组成一个 96波波分环(左上图),各站信号流图见右图。每个波道在中间站点均OMU48-ODU48尾纤直接穿通。现发现 AD之间的192.1THZ单波道中断。有相关告警(OTN_LOS/OTN_LOF/ODUk_SM_

7、BIP8_SD/ODUk_PM_AIS 等)上报。假设告警上报在 D站点,A站有对应的 BDI回告。步骤 操作人员 排除故障原因 操作动作 时间 花费 1 网管&现场人员 快速恢复动作 在资源允许的情况下:将客户业务调至其它可用的波道或者备用波道;或者客户对接设备存在保护则可以通过关闭OTU单板激光器触发倒换,或者联系对接设备维护人员手动倒换。30分钟 故障综述:单波故障绝大部份可以归为两类,一类为由于光功率异常导致(以下统一描述为光功率子场景),另一类为由于板件、尾纤等异常导致(以下统一描述为非光功率子场景),关键在于定位到具体的故障点,采取相应措施解决。光功率问题子场景(D站点波分侧直接报

8、 R_LOS 的情况)处理步骤 1 网管&现场人员 排除收端 先扫描收端站点 192.1THZ波长是否丢失,如果没有丢失且光功率正常,则进一步排查站点下波尾纤、光衰,尝试远程硬复位单板,同时安排人现场使用光纤环回 OTU 单板的波分侧,确定是否单板故障,如故障,则更换单板;10分钟 2 网管&现场人员 排除发端 然后再扫描发端站点192.1THZ波长是否丢失,如果丢失,则排查上波尾纤和光衰、尝试远程硬复位单板,同时安排人现场使用光纤环回确定是否单板故障,如故障,则更换单板;5分钟 3 网管&现场人员 定位中间站点 如果发端 192.1THZ 波长没有丢失,从发端 A站点开始,按信号流方向逐站扫

9、描192.1THZ波长是否丢失,确认波长丢失站点,(通过光功率计测试方法:发端站点:OTU-OMU48,收端站点:ODU48-OTU,中间穿通站点:ODU48-OMU48)查找故障点,并通过清洁光口、更换尾纤、更换单板的方式解决。15分钟 备注:如果现场没有配置 OPM 单板,又无法调波,业务恢复时长很难控制,同时网管中心通过总光功率变化来粗略判断故障点(波数很少的情况比较有效,波数多则无法判断),需要维护人员带上光功率计、光谱分析仪、备件、尾纤等物料逐站排查。光功率问题子场景(非报 R_LOS)处理步骤 1 网管人员 检查光功率是否下降、是否有误码 分别查询 A、D两站 OTU单板的收发光功

10、率,并对比历史 24H性能值,确认是否是光功率问题导致的故障(可通过与故障前的光功率数据(如历史光功率性能数据或定期刷新过的文档)进行比较,以确定当前光功率值是否异常。)此场景通常会伴随存在误码、FEC 纠错等异常性能事件。3分钟 2 网管&现场人员 排除硬件故障 分别对 A、D站 OTU 单板使用光纤进行环回,确认是否单板故障,若单板故障直接更换;(单光口板可以直接尝试硬复位单板)10分钟 3 网管人员 排除波长漂移问题 对发端 OTU单板(本例中为 A站点)扫描波长,确认是否波长漂移,若漂移则硬复位单板临时恢复;5分钟 4 网管人员 快速恢复动作 尝试提高该单波的收光功率(不能超过过载点)

11、并观察性能变化。方法:从发端开始减少各站 OMU48对应通道的衰减值。3分钟 5 网管人员 快速恢复动作 尝试调整发端线路总光功率:注意观察其他波长性能变化,在不影响其他波长性能的前提下小量多次,调整幅度不超过 3dB。5分钟 6 网管人员 从发端 A站点开始,按信号流方向逐站扫描 192.1THZ波长,确认波长突变量较大的点,(通过光功率计测试方法:ODU48-OMU48)查找故障点,并通过清洁光口、更换尾纤、减小 M40V衰减、更换单板的方式解决。15分钟 非光功率问题子场景处理步骤 1 网管人员 确认为非光功率问题 分别查询 A、D两站 OTU单板的收发光功率,并对比历史 24H性能值,

12、确认是非光功率问题导致的故障(可通过与故障前的光功率数据(如历史光功率性能数据或定期刷新过的文档)进行比较,以确定当前光功率值是否异常。)3分钟 2 网管人员 排除硬件故障 1、先硬复位发端单板,再硬复位收端单板;2、如果硬复位完成后,业务未恢复,分别对 A、D 站5分钟 OTU单板进行软件内环回、外环回,确认是否单板故障;3 现场人员 排除硬件故障 1、对收发端单板进行硬环回,确认故障单板。2、对故障单板进行更换。10分钟 场景二:多波业务中断场景二:多波业务中断 此处指无保护场景 定位恢复步骤 场景介绍 A/B/C/D/E 五个站点组成一个 80 波波分环(左上图),每个站点均为背靠背的

13、OTM站,各站信号流图见左下图。每个波道在中间站点均为 M40-D40尾纤直接穿通。现发现环上大量波道出现异常告警。多波中断。步骤 操作人员 操作动作 排除故障原因 时间 花费 故障综述:环路多波故障绝大部份都是由于主光路异常或者合分波板、光放板故障导致,在没有光纤中断的情况下,关键在于定位出故障出现的站点。1 网管人员 排除光缆故障 查询环路上所有站点 OSC 单板的输入、输出光功率(对比单板当前和历史性能值),对比历史记录值,确认主光路是否存在光功率跌落,如果有跌落:5分钟 1、减少链路上可调衰减器件的衰减值(比如 VOA等);2、适当增大光放板增益;通知客户修复主光路;2 网管&现场人员

14、 排除光放板故障 查询环路上所有段落光放板的输入、输出光功率,对比历史记录值(对比单板当前和历史性能值),确认是否存在异常的光放板,如果异常:1、首先确认增益设置是否正确,不正确则修复并确认故障是否恢复;2、通过光功率确认光放板(如果是OA系列单板)内部口衰耗是否正常,不正常则更换尾纤(DCM 模块不动);3、尝试修改光放增益,无效则硬复位光放,4、上述三步无法解决则更换光放大板;现场人员 排除OMU48/OD U48 故障 查询环路上所有站点 OMU48/ODU48的输入、输出光功率,对比历史记录值(对比单板当前和历史性能值),如果有异常,则通过清洁光口、更换相关尾纤,调整光衰的方法排除故障

15、,如无法排除,则更换单板。20分钟 4 网管&现场人员 排除操作异常 上述主光功率问题均排除的情况下,应重点了解现场人员故障前的操作情况,是否存在 DCM 和光缆变化的情况,同时核查各站 DCM 配置,分析路由,尝试性增减、替换 DCM 来解决。25分钟 场景三:常见保护业务中断场景三:常见保护业务中断 此处常见保护包括:光线路保护、客户侧 1+1 保护、板内 1+1保护、ODUk SNCP保护、SW SNCP 保护 定位恢复步骤 步骤 操作人员 操作动作 快速恢复步骤 时间 花费 1 网管人员 检查保护组状态,确认是否存在保护组被强制/锁定在非 NORMAL的通道上。如果是,解除强制/锁定倒换查看业务是否恢复,如业务未恢复,将保护组强制倒换到另一通道上,查看业务是否恢复。强制倒换恢复 3 2 网管人员 针对 SNCP 保护,可以尝试去激活、激活保护组,业务无法恢复则再尝试进行强制倒换,看业务是否恢复。去激活/激活恢复 3 3 网管人员 删除保护组重新配置,查看业务是否恢复;如果不恢复,再进行强制倒换,看业务是否恢复。重新配置保护组恢复 5 4 网管人员 如果采取以上操作后都不恢复,将保护组两端强制

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1