华为常用维护手册.docx
《华为常用维护手册.docx》由会员分享,可在线阅读,更多相关《华为常用维护手册.docx(45页珍藏版)》请在冰豆网上搜索。
华为常用维护手册
第1章例行维护项
介绍每个维护周期需要的维护项目、操作指导以及参考标准。
1.1 例行维护项目简介
按照维护周期,介绍例行维护中所涉及的维护项目.
注意:
NE20E-X6不附带安装工具、仪表及相关设备。
仪表必须经过计量校验,证明合格后方能使用。
NE20E—X6的稳定运行一方面依赖于完备的网络规划,另一方面平时的维护、监测、发现设备运行隐患也是非常必要的。
例行维护项目提供了对NE20E-X6运行环境和设备本身软、硬件进行日常维护、周、月和年度维护工作的基本参考和建议,其中包括机房环境、机柜内部环境、设备单板运行状态、端口状态、路由协议等。
用户在设备的日常运行中,可以结合维护项目的操作指导完成设备的维护管理。
同时,也可以根据实际的组网情况和机房环境要求,对本章提供的维护项目和指导进行增加或者删除,以满足实际维护的需要.
本手册例行维护过程中涉及的所有的项目如表所示。
表例行维护项目列表
维护周期
维护项目
日
机房温度,湿度状况
日志、告警
设备温度、电压状态
设备风扇、电源状态
CPU占用状态、内存占用状态
月
系统时间
接口流量
单板运行状态
OSPF/ISIS/BGP邻居状态
路由信息
管理级用户控制
Telnet登录控制
防攻击检测
FTP口令控制
更改用户登录口令
备份、恢复配置文件
1.2日常维护项目及操作
表:
日常维护项目操作
维护项目
建议维护周期
操作指导
参考标准
结果描述
机房状况
机房温度状况
日
观测机房内温度计指示。
长期工作环境温度:
0°C~40°C。
短期工作环境温度:
—5°C~50°C.
若机房的环境温度长期不能满足要求,运营商应考虑检修或更换机房的空调系统。
检查空调制冷度、开关情况等,空调制冷应完好无损,开关接触良好。
机房湿度状况
日
观测机房内湿度计指示。
在正常情况下,机房的长期工作环境相对湿度应在5%~85%之间,短期工作环境相对湿度应在5%~95%之间。
若机房的相对湿度过大,运营商应考虑为机房安装除湿设备;若机房的相对湿度过小,运营商应考虑为机房安装加湿设备。
基本信息项
告警
日
执行displaytrapbuffer命令。
无告警信息。
如果有告警,需要记录,对于3级以上告警需并立即分析并处理.
如下显示信息的加粗部分为告警级别:
displaytrapbuffer
TrappingBufferConfigurationandcontents:
enabled
allowedmaxbuffersize:
1024
actualbuffersize:
256
channelnumber:
3,channelname:
trapbuffer
droppedmessages:
0
overwrittenmessages:
131
currentmessages:
1
#Nov16200915:
33:
06PE-1SRM_BASE/1/ENTITYRESUME:
OID1.3。
6.1.4。
1。
2011.5.25
。
129。
2.1。
10Physicalentityisdetectedresumedfromfailure.(EntityPhysicalInd
ex=16908289,BaseTrapSeverity=2,BaseTrapProbableCause=67719,BaseTrapEventType=
5,EntPhysicalContainedIn=16908288,EntPhysicalName="LPU2",RelativeResource="S
FP",ReasonDescription=”LPU2isfailed,EAGFSFP0ofPIC0isabnormal,Resume
")
日志
日
执行displaylogbuffer命令。
没有大量重复的日志信息.
如果有这种情况出现,需要立即分析并处理。
如下显示信息中的加粗部分所示,该日志重复出现多次。
〈HUAWEI〉displaylogbuffer
Loggingbufferconfigurationandcontents:
enabled
Allowedmaxbuffersize:
1024
Actualbuffersize:
512
Channelnumber:
4,Channelname:
logbuffer
Droppedmessages:
0
Overwrittenmessages:
3
Currentmessages:
3
Nov13200918:
12:
18HUAWEI%%01SRM/3/LPURESET(l):
LPU3reset,thereasonisLPU
boardLOAMNETinitfailedandresetlpu。
Nov13200918:
10:
22HUAWEI%%01SRM/3/LPURESET(l):
LPU3reset,thereasonisLPU
boardLOAMNETinitfailedandresetlpu。
Nov13200918:
08:
26HUAWEI%%01SRM/3/LPURESET(l):
LPU3reset,thereasonisLPU
boardLOAMNETinitfailedandresetlpu。
配置文件
月
执行displaycurrent-configuration、displaysaved—configuration命令查看当前配置和保存配置。
执行compareconfiguration来比较当前运行配置和保存配置是否一致.
运行配置需要与保存过的配置相同。
配置必须与用户的要求保持一致.
CF卡剩余容量
月
执行dir命令。
cfcard里的文件都必须是有用的,否则请执行delete/unreserved命令删除。
设备运行状况
设备温度
日
执行displaytemperature命令。
各模块当前的温度应该小于Minor(轻微告警门限)。
如下所示,Temp(c)表示设备当前温度,正常情况下应该小于Minor(轻微告警门限)。
〈HUAWEI〉displaytemperature
SlotID9:
Base—Board,Unit:
C,Slot9
PCBI2CAddrChlStatusMinorMajorFatalAdj_speedTemp
TMinTmax(C)
—-----———---—-——--—-—--—--—---——————-—-——--—---—--——-—-—--—--—-——
SRUA110NORMAL667890566740
SRUA120NORMAL576980465732
SRUA130NORMAL556778445531
SRUA140NORMAL647280465733
设备电压
日
执行displayvoltage命令。
单板当前的电压应该在上下限之间.
如下所示,Vol表示当前电压值,LowAlmThresholdMajor表示低电压轻微告警值,HighAlmThresholdMajor表示高电压轻微告警值。
正常情况下LowAlmThresholdMajor〈HUAWEI〉displayvoltage
SlotID6:
SlotID:
6
Base—Board,Unit:
Volt,Slot6
PCBI2CAddrChlStatusRequiredLowAlmThresholdHighAlmThresholdVolRatio
MajorFatalMajorFatal
—-—-—-——--————-—--—---—--————--——-—-—-—---—-——-—------—-———----—-—-—---—--——---
FADB100NORMAL1。
501.201。
051.801.951。
491.00
FADB101NORMAL1.801.441.262。
162.341.841。
00
FADB102NORMAL2.502。
001.753。
003.252。
790。
68
FADB106NORMAL5。
004。
053.556.076.574。
970。
38
风扇状态
日
执行displayfan命令。
FAN的“present”为“YES"
FAN的“Status”为“AUTO”.
如下面显示信息的加粗部分所示。
displayfan
Slotid:
19
Present:
YES
Registered:
YES
Status:
AUTO
FanSpeed:
[No.]Speed
[1]100%[2]100%
Slotid:
20
Present:
YES
Registered:
YES
Status:
AUTO
FanSpeed:
[No。
]Speed
[1]100%[2]100%
电源状态
日
执行displaypower命令。
PWR的“Present”为“Yes”
PWR的“State”为“Normal"。
如下面显示信息的加粗部分所示.
NoPresentmodeStateNum
-—----------——-—————————---———-—--—--——---——-------——--—--—-————--—--—-—----———
17YesDCNormal1
18YesDCNormal1
系统时间
月
执行displayclock命令。
通过该命令查询系统日期和时间。
时间应与当地实际时间一致(时间差不大于5分钟)。
如果不合格,请执行clock命令修改系统时间或者NTP。
请重点关注下面信息的加粗部分.
2010-11-1617:
59:
27
Monday
TimeZone(DefaultZoneName):
UTC
CPU占用状态
日
执行displaycpu-usage命令。
CPU的占用率应低于80%.
如果长时间过高,应检查设备,查询原因。
下面显示信息的加粗部分为CPU当前占用率,应该低于80%。
displaycpu-usage
CPUUsageStat。
Cycle:
60(Second)
CPUUsage:
8%Max:
92%
CPUUsageStat.Time:
2009—11—1618:
31:
48
CPUutilizationforfiveseconds:
8%:
oneminute:
8%:
fiveminutes:
8%.
TaskNameCPURuntime(CPUTickHigh/TickLow)TaskExplanation
BOX0%0/2ad2abBOXOutput
_TIL0%0/0Infiniteloopeventtask
_EXC0%0/0ExceptionAgentTask
TICK0%0/8a559c
—-——More-———
内存占有率
日
执行displaymemory-usage命令。
内存的占用率应低于80%。
如果长时间过高,应检查设备,查询原因.
下面显示信息的加粗部分为当前内存占用率,应该小于80%。
〈HUAWEI>displaymemory-usage
Memoryutilizationstatisticsat2010—11—1618:
36:
45150ms
SystemTotalMemoryIs:
1073741824bytes
TotalMemoryUsedIs:
506644196bytes
MemoryUsingPercentageIs:
47%
接口流量
月
执行displayinterfacebrief命令。
把当前流量和接口带宽比较,如果使用率超过端口带宽的80%,需要记录并确认。
并检查接口下的入方向和出方向是否有错误统计,重点关注错误统计的增长情况,并且参考出现错误包的时间间隔。
如下面显示信息的加粗部分所示,InUti表示接口接收方向最近300秒内的平均带宽利用率,正常情况下应该小于80%。
OutUti表示接口发送方向最近300秒内的平均带宽利用率,正常情况下应该小于80%.inErrors表示接口接收的错误报文数,正常情况下应该为0.outErrors表示接口发送的错误报文数,正常情况下应该为0。
PHY:
Physical
*down:
administrativelydown
^down:
standby
(l):
loopback
(s):
spoofing
(b):
BFDdown
(e):
EFMdown
(d):
DampeningSuppressed
InUti/OutUti:
inpututility/outpututility
InterfacePHYProtocolInUtiOutUtiinErrorsoutErrors
Aux0/0/1*downdown0%0%00
GigabitEthernet0/0/0upup0%0%00
GigabitEthernet2/0/0upup0%0%00
GigabitEthernet2/0/0.100updown0%0%00
GigabitEthernet2/0/1downdown0%0%00
GigabitEthernet2/0/2*downdown0%0%00
GigabitEthernet2/0/3*downdown0%0%00
GigabitEthernet2/0/4*downdown0%0%00
GigabitEthernet2/0/5*downdown0%0%00
GigabitEthernet2/0/6*downdown0%0%00
GigabitEthernet2/0/7*downdown0%0%00
GigabitEthernet2/0/8downdown0%0%00
GigabitEthernet2/0/9*downdown0%0%00
LoopBack0upup(s)0%0%00
NULL0upup(s)0%0%00
———-More-—-—
单板运行状态
月
执行displaydevice命令.
单板“Online”为“Present”
单板“Status”为“Normal”.
如下面显示信息加粗部分所示。
〈HUAWEI〉displaydevice
NE20E-X6'sDevicestatus:
Slot#TypeOnlineRegisterStatusPrimary
—-----————-——---—-—————----—————-—---—
1LPUPresentRegisteredNormalNA
2LPUPresentRegisteredNormalNA
3LPUPresentRegisteredNormalNA
6LPUPresentRegisteredNormalNA
9MPUPresentNANormalMaster
10MPUPresentRegisteredNormalSlave
11SFUPresentRegisteredNormalNA
12SFUPresentRegisteredNormalNA
13SFUPresentRegisteredNormalNA
14SFUPresentRegisteredNormalNA
15CLKPresentRegisteredNormalMaster
16CLKPresentRegisteredNormalSlave
17PWRPresentNANormalNA
18PWRPresentNANormalNA
19FANPresentRegisteredNormalNA
20FANPresentRegisteredNormalNA
21LCDPresentRegisteredNormalNA
业务运行项
OSPF邻居状态
月
执行displayospfpeer命令。
正常情况下,邻居状态State为“2—Way”或“FULL”。
正常情况下,要求该邻居建立时间不应该小于一天。
如下面显示信息加粗部分所示。
displayospfpeer
OSPFProcess1withRouterID10。
1。
1.2
Neighbors
Area0.0。
0。
0interface10。
1.1。
2(GigabitEthernet1/0/0)'sneighbors
RouterID:
10。
1。
1.1Address:
10.1。
1.1GRState:
Normal
State:
FullMode:
NbrisSlavePriority:
1
DR:
10.1.1.1BDR:
NoneMTU:
0
Deadtimerduein35sec
Retranstimerinterval:
5
Neighborisupfor72:
00:
05
AuthenticationSequence:
[0]
IS—IS邻居状态
月
执行displayisispeer命令.
邻居状态State为“UP”。
如下面显示信息加粗部分所示。
〈HUAWEI>displayisispeer
PeerinformationforISIS
(1)
——--—--—--——--——--—-—-——-—-—
SystemIdInterfaceCircuitIdStateHoldTimeTypePRI
0000。
0000.0001GE1/0/00000.0000.0001.01Up9sL2100
0000.0000。
0002GE1/0/00000.0000。
0001。
01Up28sL264
BGP邻居状态
月
执行displaybgppeer命令.
邻居状态State为“Established”。
如下面显示信息加粗部分所示.
〈HUAWEI>displaybgppeer
BGPlocalrouterID:
2.2。
2.2
LocalASnumber:
65009
Totalnumberofpeers:
3Peersinestablishedstate:
3
PeerVASMsgRcvdMsgSentOutQUp/DownStatePrefRcv
9。
1。
1.24650094962000:
44:
58Established0
9。
1.3。
24650095656000:
40:
54Established0
200。
1.1.24650084965000:
44:
03Established1
路由信息
月
执行displayiprouting—table命令。
与前一次记录的路由信息比较,检查是否由明显变化。
并可抽样对其中的路由项进行ping或者 tracert操作。
正常情况下,路由表中有默认路由。
对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。
用户及安全管理
管理级用户控制
月
执行displaycurrent—configuration|includesuperpasswordlevel3 命令.
请使用superpassword 命令为系统配置超级用户密码,并且要求是密文方式,密码长度大于6位。
Telnet登录控制
月
执行 displaycurrent—configuration |includesuperpasswordlevel3命令。
Telnet口令和super口令的设置要不同。
密码使用密文格式。
FTP口令控制
月
执行displaycurrent-configuration |includesuperpasswordlevel3 命令。
FTP口令和super口令的设置要不同.
密码使用密文格式。
更改用户登录口令
月
在local—aaa—server视图下执行user username passwordcipher命令。
对于用本地password认证的登录用户,执行setauthenticationpassword命令修改用户口令。
口令采用密文方式,密码长度大于6位。
最少每季度更改一次口令。
备份、恢复配置文件
月
参见数据备份和恢复
-
清洁除尘
防尘网除尘、风扇除尘、单板除尘,光接口和尾纤接头除尘
年
参见设备除尘维护
-
1.3设备除尘维护
介绍如何对设备进行除尘。
警告:
所有的操作过程都必须严格执行防静电措施,如在防静电工作台上操作,维护人员穿防静电服装、戴防静电腕套等。
为了保证系统散热和通风状况良好,避免防尘网被灰尘堵住,必须定期清洗防尘网。
建议至少一季度清洗一次,机房防尘环境较差的清洗频率应更高。
1.3.1风扇框除尘
1.3.1.1背景信息
风扇框是设备的一部分,风扇框的主要作用是为业务机框的散热进风提供动力。
在设备的运行过程中,风扇框中的风扇叶片、控制电路板等部位会吸附其周围空气中的尘埃而形成积累,当这种尘埃积累达到一定的程度时,它不仅影响风扇框的稳定运行,其积累的尘埃还会成为业务机框的污染源,从而对设备的稳定运行产生潜在的威胁。
为确保设备能够长期稳定运行,维护