网络设备巡检服务工作规范方案.doc

上传人:wj 文档编号:85264 上传时间:2022-10-02 格式:DOC 页数:35 大小:150.96KB
下载 相关 举报
网络设备巡检服务工作规范方案.doc_第1页
第1页 / 共35页
网络设备巡检服务工作规范方案.doc_第2页
第2页 / 共35页
网络设备巡检服务工作规范方案.doc_第3页
第3页 / 共35页
网络设备巡检服务工作规范方案.doc_第4页
第4页 / 共35页
网络设备巡检服务工作规范方案.doc_第5页
第5页 / 共35页
点击查看更多>>
下载资源
资源描述

网络设备巡检服务工作规范方案.doc

《网络设备巡检服务工作规范方案.doc》由会员分享,可在线阅读,更多相关《网络设备巡检服务工作规范方案.doc(35页珍藏版)》请在冰豆网上搜索。

网络设备巡检服务工作规范方案.doc

实用标准文案

XX信息中心

网络设备巡检服务工作规范

(H3C设备网络)

V1.0

信息中心

目录

1概述 5

2巡检工作流程 5

2.1巡检前期准备 6

2.2数据采集阶段 7

2.3数据分析和报告生成阶段 7

2.4汇报和满意度调查阶段 7

3网络巡检数据采集方法 7

3.1手工数据采集方法 8

3.2网络管理平台数据收集方法 8

3.3巡检工具数据采集方法 8

4网络巡检服务基准数据库的建立 8

5网络巡检工作内容 9

5.1巡检工作的主要内容 9

5.2网络巡检工作技术涵盖 10

6网络系统巡检基本判断标准 10

7设备相关信息收集 12

7.1软件版本及硬件信息分析 12

7.1.1当前设备硬件信息 13

7.1.2当前设备运行软件信息 14

7.2设备板卡硬件配置信息分析 14

7.3设备运行状况检查 15

7.3.1设备CPU工作状态检查 16

7.3.2设备CPU利用率分析 16

7.3.3设备MEMORY使用状态检查 17

7.3.4设备MEMORY利用率分析表 18

7.4设备运行状态检查 18

7.4.1电源的工作状态 18

7.4.2风扇的工作状态 19

7.4.3设备工作温度 19

8端口的可用性、准确性检查 19

8.1端口状态检查 19

8.1.1基本网络接口状态分析 22

8.1.2接口半/全双工模式和链路类型 23

8.1.3接口稳定性统计信息 23

8.2端口状态检查表 23

9设备端口负载及流量检查 24

9.1设备缓存信息检查 24

10网络架构、配置信息分析 24

10.1网络结构检查 24

10.1.1检查内容 24

10.1.2检查方式 24

10.2网络配置信息检查 27

10.2.1检查内容 27

10.2.2检查方式 27

11LOG信息检查 30

11.1标准的LOG格式 30

11.2LOG日志等级 30

11.3日志信息分析表 30

关于文档

为保障XX信息中心网络的平稳运行,将在每月进行网络巡检,并根据巡检结果给出相应的网络系统改进和优化建议。

本文档面向XX的技术人员和外部支持公司网络工程师,通过参考本文档,共同完成对XX信息中心网络运行状况的检查与分析。

通过本文档使XX技术人员和外部支持公司网络工程师充公了解XX信息中心对网络巡检的基本要求,以该规范为参考,使得网络系统巡检工作更加标准化、规范化。

由于网络技术的不断发展和设备的更新换代,本规范需要逐步地更新、完善,增加网络设备硬件、软件、固件的新版本和新硬件的内容。

同时,随着网络健康服务的不断深入,对网络系统检查的深度和范围也将发生变化,本规范也会逐步地完善。

文档适用对象

本文档仅适用参与XX网络项目相关技术人员和外部支持公司的网络工程师。

1概述

为确保XX信息中心网络安全生产,提升网络服务质量,确保设备的正常运行,将每月对XX信息中心网络设备进行巡检,巡检范围根据巡检工作需要而确定,通过对网络设备的数据采集和分析,能够对XX信息中心网络设备的状态具有更加深入地了解。

网络巡检是指通过标准的方法和流程定期地对客户一定范围内的网络进行网元级的系统检查,内容包括现场数据采集、分析、客户报告生成等。

通过对关键网元设备的关键检查点参数进行数据采集、并将采集到的数据与有关标准进行比较,从而确定关键网元设备所处的运行状态。

通过定期网络巡检,可以及时发现网络中可能存在的隐患,并消灭在萌芽状态。

2巡检工作流程

网络巡检工作分为前期准备、现场数据采集、数据分析、报告生成和汇报、满意度调查和问题整改追踪等五个阶段。

服务流程如下:

2.1巡检前期准备

在网络巡检的前期准备阶段,工程师需要在与客户进行充分沟通的情况下,确定要巡检的设备范围及巡检重点,形成《网络巡检方案书》。

网络巡检书至少包括:

l巡检设备范围和巡检工作重点

l巡检各个工作环节的方式

l数据采集的命令集

l协商具体的巡检时间安排

l巡检报告输出样表和图形

在得到客户认可的情况下,进入下一阶段的工作。

2.2数据采集阶段

在网络巡检的数据采集阶段,对于网络数据采集的手段和工具需要得到用户的授权,遵守用户运行管理的相关规定,在指定时间和网络设备范围内进行数据采集工作。

在用户的协助下收集相关网元的技术数据,并记录输出结果。

2.3数据分析和报告生成阶段

巡检工程师对现场采集到的数据进行分析,形成《XX信息中心XX中心网络巡检报告》。

经过南天公司的网络专家审核通过后,由工程师负责以纸质文档或电子文档的方式提交给客户。

2.4汇报和满意度调查阶段

通过定期交流的方式,讨论巡检工作中发现的问题及隐患,给出网络运行状况的检查、评估及建议,并进行问题跟踪。

同时进行客户满意度调查,以便发现和纠正工作中的问题,改进网络系统巡检工作。

3网络巡检数据采集方法

网络巡检服务的数据采集方法有两种,一是手工命令采集,并配合网管平台进行辅助性数据采集的方法;一是巡检工具数据采集的方法。

3.1手工数据采集方法

手工采集就是登录到网络设备上,通过手工输入命令并记录输出结果的方式进行数据采集。

为加强手工数据采集的准确性和合理性,需要对数据进行多次,重复性数据收集。

如考量CPU的利用率和MEM的利用率等信息,可以采用日起、日中、日结等三个阶段,分时段收集并进行汇总比。

对于网络设备运行状态、数据流量等信息的趋势性数据采集需要结合一定时间段数据的采集工作,需要利用网络管理系统进行相关数据的采集工作。

3.2网络管理平台数据收集方法

通过网络管理系统收集相关的数据,可以进行一个阶段的趋势分析,以便更加准确地了解网络系统的整体运行情况,并可以与手工数据采集的结果进行对比,确保数据采集和分析的合理性和可靠性。

3.3巡检工具数据采集方法

通过H3C提供的专用巡检工具进行数据采集。

该工具集合了常用的设备状态检查的命令,可以自动化收集输出结果,并在后期导出巡检报告。

但是需要H3C提供软件及其授权。

在没巡检工具软件的情况下,可以由第一巡检方法来替代。

4网络巡检服务基准数据库的建立

由于网络系统的巡检服务是一个长期的、持续性的工作,首先需要对网络系统具有一定的了解,建立一个基本信息库。

主要包括:

Ø设备清单:

设备名称、IP地址、位置、功用、序列号等

Ø设备模块硬件配置:

模块种类、型号等

Ø设备软件版本

Ø设备使用、维修记录

Ø设备性能基准,包括CPU、Memory利用率、设备端口流量的初始数据等

Ø设备端口信息:

相关计数器初始状态

通过第一次巡检完成基本信息库的建立,作为以后巡检工作的数据对比性分析的基础和依据,并保持数据更新,动态调整基本信息库的参考点。

5网络巡检工作内容

5.1巡检工作的主要内容

本项目中,网络巡检工作中涉及的相关内容如下:

1)设备基本信息收集

采集设备的基本信息,包括用户定义的设备名称、设备序列号、设备型号、运行的软件版本、内存大小、CF卡的大小等

2)设备运行状态检查

主要采集和分析网络设备的CPU、Memory利用率,并在可能是的情况下,观察其变化趋势。

3)设备管理运行环境检查

主要通过设备的相关命令收集网络设备的运行环境,主要包括机框内部各个检测点的温度及其变化,电源工作状态和工作输出电压等相关信息。

4)场地环境检查

检查设备的运行环境,如机房温度、湿度、设备供电、网络线缆走线等

5)网络设备硬件检查

检查设备状态、设备连线状态等

6)网络设备日志检查

使用display命令,收集设备运行日志,并做分析

7)核心设备的端口可用性、准确性检查

使用display命令查看设备各端口的工作情况,包括端口的输出、输入错误丢包信息等,buffer占用情况和缓冲器溢出现象等

8)核心设备端口负载及流量检查

通过网管及其他手段,对设备端口的带宽占用、负载和流量进行统计分析,便于掌握网络设备及其连接线路的情况。

9)网络系统总体性能评估

针对巡检的内容及分析结果,对网络运行的整体情况做评估。

5.2网络巡检工作技术涵盖

网络系统巡检工作主要涵盖以下技术内容:

项目

分类

参数

数据来源

设备基本信息

软件

ComwareVersion

命令采集

BootstrapVersion

命令采集

启动与运行

Boot-loader

命令采集

uptime

命令采集

硬件

Device

命令采集

Flash

命令采集

NVRAM

命令采集

TotalMemory

命令采集

SDRAM

命令采集

设备运行环境

环境

温度

命令采集

电源

命令采集

风扇

命令采集

性能

CPU利用率

PeakUtil

命令采集

AvgUtil

命令采集

内在利用率

PeakUsedMemory

命令采集

AvgUsedMemory

命令采集

线路稳定性

网络端口

InDrops

OutDrops

命令采集

网络事件

LOG

6网络系统巡检基本判断标准

我们将依照依据华三公司的技术指标和业界遵循的阈值、惯例和相关技术标准,将采集的数据结果与其对照分析,以判断当前网络运转情况是否良好,根据具体发现的问题提出合理改进意见。

1)设备运行记录

设备运行时间

少于7天的(即运行时间过短的设备)需要关注,有可能发生意外重启,同样对于设备启动时间过长的设备建议维护性重启。

2)设备报警温度

3)电源风扇状态

电源

正常标准

Normal(指示灯为绿色)

非正常标准

Fail(指示灯为红色)

风扇

正常标准

Normal(指示灯为绿色)

非正常标准

Fail(指示灯为红色)

4)CPU内存状态

电源(重点关注后两列)

H3C建议值

巡检建议值

变化值

关注

65%

>35%

差值大于10%

告警

>75%

>50%

差值大于20%

风扇(重点关注后两列)

H3C建议值

巡检建议值

变化值

关注

75%

>40%

差值大于5%

告警

>90%

>50%

差值大于10%

5)接口丢包错包率(增量)

Inputdrop

Outputdrop

Inputerror

Outputerror

关注

>0.5%

>0.5%

>1%

>1%

告警

>5%

>5%

>5%

>5%

6)接口负载率

7)防火墙状态

检查项目

正常值

运行时间

>7Days

CPU使用率

<35%

内存使用率

<40%

Failover状态

Active、Standby

会话连接

<+30%

地址转换

<+30%

7设备相关信息收集

7.1软件版本及硬件信息分析

使用命令displayversion,查看路由器信息,在巡检过程中用此命令收集来的数据主要作用是:

Ø查看当前设备型号,及当前启动软件版本

Ø查看当前设备已运行时间

Ø查看当前设备引擎内存大小

Ø查看当前设备Flash大小

具体关注方法如下:

7.1.1当前设备硬件信息

设备硬件信息主要包括如下参数:

H3CS7500with1MPC8245Processor

256MbytesSDRAM

32768KbytesFlashMemory

512KbytesNVRAMMemory(如图第7-10行)

当前设备引擎号、内在与Flash大小

H

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1