日常维护项目及操作.docx
《日常维护项目及操作.docx》由会员分享,可在线阅读,更多相关《日常维护项目及操作.docx(7页珍藏版)》请在冰豆网上搜索。
日常维护项目及操作
维护项目
建议维护周期
操作指导
参考标准
结果描述
机房状况
机房温度状况
日
观测机房内温度计指示。
长期工作环境温度:
0°C~45°C(32°F~113°F)。
短期工作环境温度:
-5°C~55°C(23°F~131°F)。
对于NE80E/40E系列中的X1和X2设备,长期工作环境温度为:
-5°C~50°C(23°F~122°F)。
短期工作环境为:
-20°C~60°C(-4°F~140°F)。
若机房的环境温度长期不能满足要求,运营商应考虑检修或更换机房的空调系统。
检查空调制冷度、开关情况等,空调制冷应完好无损,开关接触良好。
机房湿度状况
日
观测机房内湿度计指示。
在正常情况下,机房的长期工作环境相对湿度应在5%~85%之间,短期工作环境相对湿度应在5%~95%之间。
若机房的相对湿度过大,运营商应考虑为机房安装除湿设备;若机房的相对湿度过小,运营商应考虑为机房安装加湿设备。
基本信息项
告警
日
执行displaytrapbuffer命令。
无告警信息。
如果有告警,需要记录,对于3级以上告警需并立即分析并处理。
如下显示信息的加粗部分为告警级别:
displaytrapbuffer
TrappingBufferConfigurationandcontents:
enabled
allowedmaxbuffersize:
1024
actualbuffersize:
256
channelnumber:
3,channelname:
trapbuffer
droppedmessages:
0
overwrittenmessages:
131
currentmessages:
1
#Nov16200915:
33:
06PE-1SRM_BASE/1/ENTITYRESUME:
OID1.3.6.1.4.1.2011.5.25
.129.2.1.10Physicalentityisdetectedresumedfromfailure.(EntityPhysicalInd
ex=16908289,BaseTrapSeverity=2,BaseTrapProbableCause=67719,BaseTrapEventType=
5,EntPhysicalContainedIn=16908288,EntPhysicalName="LPU2",RelativeResource="S
FP",ReasonDescription="LPU2isfailed,EAGFSFP0ofPIC0isabnormal,Resume
")
日志
日
执行displaylogbuffer命令。
没有大量重复的日志信息。
如果有这种情况出现,需要立即分析并处理。
如下显示信息中的加粗部分所示,该日志重复出现多次。
displaylogbuffer
Loggingbufferconfigurationandcontents:
enabled
Allowedmaxbuffersize:
1024
Actualbuffersize:
512
Channelnumber:
4,Channelname:
logbuffer
Droppedmessages:
0
Overwrittenmessages:
3
Currentmessages:
3
Nov13200918:
12:
18HUAWEI%%01SRM/3/LPURESET(l):
LPU3reset,thereasonisLPU
boardLOAMNETinitfailedandresetlpu.
Nov13200918:
10:
22HUAWEI%%01SRM/3/LPURESET(l):
LPU3reset,thereasonisLPU
boardLOAMNETinitfailedandresetlpu.
Nov13200918:
08:
26HUAWEI%%01SRM/3/LPURESET(l):
LPU3reset,thereasonisLPU
boardLOAMNETinitfailedandresetlpu.
配置文件
月
执行displaycurrent-configuration、displaysaved-configuration命令查看当前配置和保存配置。
运行配置需要与保存过的配置相同。
执行compareconfiguration来比较当前运行配置和保存配置是否一致。
配置必须与用户的要求保持一致。
CF卡剩余容量
月
执行dir命令。
cfcard里的文件都必须是有用的,否则请执行delete/unreserved命令删除。
设备运行状况
设备温度
日
执行displaytemperature命令。
各模块当前的温度应该小于Minor(轻微告警门限)。
如下所示,Temp(c)表示设备当前温度,正常情况下应该小于Minor(轻微告警门限)。
displaytemperature
SlotID9:
Base-Board,Unit:
C,Slot9
PCBI2CAddrChlStatusMinorMajorFatalAdj_speedTemp
TMinTmax(C)
-----------------------------------------------------------------
SRUA110NORMAL667890566740
SRUA120NORMAL576980465732
SRUA130NORMAL556778445531
SRUA140NORMAL647280465733
设备电压
日
执行displayvoltage命令。
单板当前的电压应该在上下限之间。
如下所示,Vol表示当前电压值,LowAlmThresholdMajor表示低电压轻微告警值,HighAlmThresholdMajor表示高电压轻微告警值。
正常情况下LowAlmThresholdMajordisplayvoltage
SlotID6:
SlotID:
6
Base-Board,Unit:
Volt,Slot6
PCBI2CAddrChlStatusRequiredLowAlmThresholdHighAlmThresholdVolRatio
MajorFatalMajorFatal
-------------------------------------------------------------------------------
FADB100NORMAL1.501.201.051.801.951.491.00
FADB101NORMAL1.801.441.262.162.341.841.00
FADB102NORMAL2.502.001.753.003.252.790.68
FADB106NORMAL5.004.053.556.076.574.970.38
风扇状态
日
执行displayfan命令。
FAN的“present”为“YES”
FAN的“Status”为“AUTO”。
如下面显示信息的加粗部分所示。
displayfan
Slotid:
19
Present:
YES
Registered:
YES
Status:
AUTO
FanSpeed:
[No.]Speed
[1]100%[2]100%
Slotid:
20
Present:
YES
Registered:
YES
Status:
AUTO
FanSpeed:
[No.]Speed
[1]100%[2]100%
电源状态
日
执行displaypower命令。
PWR的“Present”为“Yes”
PWR的“State”为“Normal”。
如下面显示信息的加粗部分所示。
displaypower
NoPresentmodeStateNum
-------------------------------------------------------------------------------
17YesDCNormal1
18YesDCNormal1
系统时间
月
执行displayclock命令。
通过该命令查询系统日期和时间。
时间应与当地实际时间一致(时间差不大于5分钟)。
如果不合格,请执行clock命令修改系统时间或者NTP。
请重点关注下面信息的加粗部分。
displayclock
2010/11/1617:
59
Monday
TimeZone(DefaultZoneName):
UTC
CPU占用状态
日
执行displaycpu-usage命令。
CPU的占用率应低于80%。
如果长时间过高,应检查设备,查询原因。
下面显示信息的加粗部分为CPU当前占用率,应该低于80%。
displaycpu-usage
CPUUsageStat.Cycle:
60(Second)
CPUUsage:
8%Max:
92%
CPUUsageStat.Time:
2009-11-1618:
31:
48
CPUutilizationforfiveseconds:
8%:
oneminute:
8%:
fiveminutes:
8%.
TaskNameCPURuntime(CPUTickHigh/TickLow)TaskExplanation
BOX