中国联通运行维护规程移动通信网络分册-核心网设备篇-数通设备.doc
《中国联通运行维护规程移动通信网络分册-核心网设备篇-数通设备.doc》由会员分享,可在线阅读,更多相关《中国联通运行维护规程移动通信网络分册-核心网设备篇-数通设备.doc(18页珍藏版)》请在冰豆网上搜索。
运行维护规程
移动通信网络分册
核心网设备篇——数通设备
(试行)
中国联通集团移动网络有限公司
二零一零年六月
目录
第一章通则
第二章运行维护组织体系及职责界面 3
第一节维护组织机构及职责 3
第二节维护界面划分 4
第三章维护作业计划 5
第四章故障管理 5
第五章质量管理 8
第六章仪器仪表和备品备件管理 9
附录1:
故障处理流程图 11
附录2:
故障上报简要书面报告 12
附录3:
故障上报表 13
附表1:
故障统计月报表 14
附表2:
数通设备作业计划大纲及执行记录表 16
第一章通则
第1条.中国联通移动网数通设备是中国联通移动网网元接入设备,由路由器、交换机、防火墙等设备组成,完成移动网元的IP组网,保证网络安全性。
第2条.本篇适用于移动网中的所有相关数通设备。
第二章运行维护组织体系及职责界面
第一节维护组织机构及职责
第3条.中国联通移动网络数通设备的维护管理按照统一领导、分级管理、分级负责的原则,在总部统一领导下,各省分公司负责各自管辖范围内移动网络数通设备的维护管理工作。
第4条.总部运行维护部职责:
1.负责组织制定数通设备的维护管理规程,监督各省落实维护规定的情况,对各省的维护工作给予指导。
2.协调解决数通设备维护、故障管理中存在的共性问题。
3.负责组织数通设备的网络优化工作。
4.负责制定数通设备网络组织、路由原则和全网业务的网络实施方案。
5.负责数通设备的软件、硬件、资源管理等工作。
6.组织制定全网数通设备的应急通信保障方案及应急演练,指导各省级分公司制定省内数通设备的应急方案。
7.牵头组织各级维护人员的技术、业务交流与培训。
第5条.各省级分公司运行维护部门主要职责为:
1.贯彻总部数通设备维护管理规程,根据本省情况制定切实可行的维护管理实施细则,监督各地市分公司落实维护管理实施细则的的情况,对各地市的工作给予指导。
2.负责省内数通设备的安全工作。
3.组织制定省内数通设备应急预案。
4.负责制定本省数通设备结构、路由原则和省内业务的网络实施方案。
5.在总部的指导下,负责做好本省数通设备的软件、硬件、资源管理等工作。
6.负责定期分析省内数通设备的网络运行状况,做好网络预警工作,制定并实施相应的改造、优化措施。
7.负责7×24小时实时监控省内数通设备的运行状况,指导地市分公司进行数通设备的日常维护、故障处理、资源调度、软件装载等工作。
重大故障需向总部报告,并组织解决省内数通设备运行维护中的问题。
8.参与省内数通设备工程的验收测试工作。
9.组织本省维护技术人员的交流和培训工作。
第6条.各地市分公司运行维护部门主要职责:
1.贯彻落实省网络分公司运行维护部数通设备维护管理实施细则。
2.在省分公司的指导下完成数通设备的设备、软件、资源管理等工作。
3.承担属地数通设备的现场维护职责。
4.完成省分公司运行维护部委派的其它各项任务。
第二节与其他网络/系统间的界面划分
第7条.数通设备维护归属于所服务网元相关专业负责。
第8条.数通设备与动力、环境系统的界面:
以数通设备侧配电设备出线端子为界,数通设备至动力设备侧配电设备出线端子部分(不含出线端子)属数通设备维护范畴,设备侧配电设备出线端子以外部分(含出线端子)属动力、环境维护范畴。
第9条.数通设备与传输设备的界面:
以移动通信网局房设备的DDF/ODF为界,DDF/ODF外侧属传输系统维护范畴,DDF/ODF(含)内侧属数通设备维护范畴。
第10条.数通设备在增加节点、进行重大数据修改或实施软件版本升级计划前,必须根据界面划分,按要求通报相关部门。
第11条.各省根据维护界面划分制定具体的划分细则,对于本分册没有涉及的设备,各省网络分公司运行维护部门根据本省实际情况与相关专业协商确定,严禁出现无维护责任设备。
第三章维护作业计划
第12条.各省应按照总部要求进行数通设备的作业计划的编制和实施,并可在本作业计划大纲的基础上根据自身情况增加相应的维护作业项目,测试周期可以根据实际情况进行调整,但频度不得低于下表所列,以确保能够对所维护管理的设备进行定期的预防性巡视检查,及时发现和处理设备存在的问题。
第13条.维护测试项目及周期。
维护项目
项目编号
维护子项目
作业内容
周期
设备巡视
101
日常检测
告警信息检查及处理
实时
102
硬件运行状况巡视
日
CPU占用率检查
内存占用率检查
103
日常检测
各接口状态检查
日
监测各主要端口的流量是否异常
主控板卡状态检查
连通性测试
网络数据管理
201
数据备份
配置数据的备份
月
202
路由表归档
路由器路由表归档
月
203
防火墙策略检查
防火墙安全策略检查
月
安全检查
301
网络安全检测
各网元设备远程登陆用户名密码更新
月
302
主备倒换
主、备用设备(或主备用板卡)倒换测试
按需
第14条.作业计划大纲详细内容及执行记录表详见附表。
第15条.备份介质和备份文件管理:
1.必须准备一定数量的备份介质,作为存贮数据备份文件、系统备份文件及计费文件使用。
光盘应放在专用光盘盒内,保持表面清洁,防止挤压和划伤。
磁带或移动硬盘等备份介质保存应放置在防静电、防电磁干扰的专柜中,以保证安全和方便使用。
2.最新备份数据内容应与交换系统所存贮的程序和数据保持一致。
3.按要求定期或按需进行备份工作,新的系统文件复制后,应有详细记录,光盘、磁带应贴上标记,并档妥善保管,按规定时间进行保存。
4.加强对备份介质的管理,应设兼职人员专门负责,交接手续要完备。
5.原则上重要系统数据应进行双备份,并异地存放,确保数据安全。
6.各类备份介质和数据应安全可靠存放,保证应急情况下方便使用。
第16条.保留交换机所有操作维护(包括本地和远程操作终端)的输出报告(即电子版LOG文件),统一管理、备份存档,保存时间至少半年。
第四章故障管理
第17条.数通设备的故障处理由其所服务网元相关专业负责。
第18条.故障处理中各级单位职责:
1.总部运行维护部负责移动通信网全网故障管理工作。
故障发生时,负责指挥调度和协调处理工作,随时与省级分公司及有关各方进行沟通,掌握事态发展,及时有效的进行处理,恢复通信。
2.各省级分公司运行维护部门应为地市分公司制定故障管理办法。
故障发生时,负责指挥调度及现场处理,组织地市级分公司对故障进行抢修并负责及时向总部报告故障的原因和处理情况。
每月应对移动通信网故障情况进行分析、统计和汇总,并随月报上报至网络分公司。
3.各地市级分公司运行维护部门直接负责通信故障的现场处理,必须严格执行相关故障管理办法,服从省级运行维护部门的指挥和调度。
每月应对移动通信网故障情况进行分析、统计和汇总,并上报至省级运行维护部门。
第19条.数通设备故障是指由于数通设备/系统发生故障而导致对业务正常使用的影响或网络安全稳定运行的危害。
第20条.故障级别分为特别重大故障、重大故障、严重故障、一般故障、其他故障五级。
具体故障等级划分按照影响业务的范围和程度,参照所服务网元相关专业分册确定
第21条.故障上报要求:
1.树立全程全网的故障处理观念,建立故障逐级上报制度。
各级维护单位应当按照本规程要求及时、真实、准确地报告特别重大故障,重大故障状况,严禁弄虚作假。
2.发生特别重大故障时,各级运行维护部门应按规定立即逐级口头上报,15分钟内报至集团公司,3小时内做出简要书面报告;故障处理结束后24小时内提交包括故障现象、原因、处理过程、经验教训、整改措施等内容的书面故障专题报告。
特别重大故障发生后,各省级分公司在按规定向集团公司报告的同时,应按照政府主管部门的行业规定的要求,向当地政府通信主管部门报告故障情况。
3.发生重大故障时,各级运行维护部门应按规定立即逐级口头上报,15分钟内报至集团公司,24小时内做出简要书面报告;故障处理结束后4日内内提交包括故障现象、原因、处理过程、经验教训、整改措施等内容的书面故障专题报告。
重大故障发生后,各省级分公司在按规定向集团公司报告的同时,应按照政府主管部门的行业规定的要求,向当地政府通信主管部门报告故障情况。
4.发生较大故障时,各省级分公司应按规定在4小时内向当地政府通信主管部门做出口头报告,24小时内做出简要书面报告;故障处理结束后的5日内提交包括故障现象、原因、处理过程、经验教训、整改措施等内容的书面故障专题报告;每月汇总较大故障发生情况上报集团公司。
5.各省级分公司应每月汇总一般故障发生情况,上报集团公司和当地政府通信主管部门。
6.各省级分公司每月应将所有故障统计汇总,填入故障统计月报表中。
第22条.为保证发生特别重大故障/重大故障或业务中断时,业务能够迅速恢复,各级移动网络运行维护部门应制订应急预案。
预案内容应具备可操作性,并应根据网络情况不定期进行修改完善。
第23条.故障处理流程见附录1。
第24条.故障处理原则及要求:
1.故障处理的的总原则是“先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外,分故障等级进行处理”。
当两个以上的故障同时发生时,对特别重大故障/重大故障、影响重要大客户的故障等予以优先处理。
2.发生故障时,各级移动网络运行维护人员应遵循发现故障、确认故障、派单、处理、回单、确认修复和销障等流程,形成闭环管理,确保及时处理。
对于严重故障,应安排技术骨干前往处理;对于特别重大故障/重大故障,相关单位领导应到现场指挥抢修。
3.移动网络运行维护人员在处理故障时,未经上级运行维护部门同意,不得擅自对交换机、基站控制器等关键设备进行重启,以免造成更大范围的影响。
4.移动网络运行维护人员在处理故障时,必须对现场各种告警信息、故障显示、故障记录报告等进行认真分析处理,应不影响正在通话的用户或任意扩大影响范围,并严格按照各设备厂商提供的故障诊断手册、设备操作手册等规定的命令和操作方法进行处理。
5.运维管理部门应根据所维护的设备,制定紧急情况下的应急措施或预案,每个维护人员均应熟悉其操作步骤和方法,根据故障的不同等级作相应的处理,尽快消除故障、恢复业务。
第25条.故障历时管理:
1.故障历时是指从故障发生时起,到恢复通信时止的总时长(以分钟为单位),各分公司应根据具体情况,分解故障处理段落的时限。
2.故障处理历时指从接到派修单时起,到恢复通信时止的总时长(以分钟为单位)。
3.采用集中监控、无人值守的机房发生硬件设备故障时,对其故障处理历时的考核,可另加赴途时间,并且应对途中时间段进行跟踪考核。
4.网络监控部门发现告警信息,应监督各级设备维护部门及时处理故障。
第26条.运行维护人员在处理故障时,未经上级运行维护部门同意,不得擅自对交换机、路由器等关键设备进行重启,以免造成更大范围的影响。
第五章质量管理
第27条.为完善对移动软交换网各个环节的质量控制,应建立各级检查体系。
做到统一领导,分级管理,分工负责,层层到位,把好质量关
1.总部移动网络公司运行维护部负责组织建立中国联通数通设备质量分析制度。
2.各省网络分公司运行维护部负责定期汇总全省数通设备运行质量、网络性能等指标,进行数据网运行质量分析,排除质量隐患,不断提高网络运行质量和服务质量。
第28条.数通设备主要性能指标:
1.CPU利用率和内存利用率。
2.到主要接口的网络延时,丢包率等网络连通性指标。
3.各接