服务器存储网络设备巡检报告.docx
《服务器存储网络设备巡检报告.docx》由会员分享,可在线阅读,更多相关《服务器存储网络设备巡检报告.docx(21页珍藏版)》请在冰豆网上搜索。
服务器存储网络设备巡检报告
服务器/存储/网络设备
预防性维护服务记录
用户单位
XX市XX局
联系人
XX
电话
Xx
巡检日期
2018年07月02日
巡检时间
巡检次数
第3次巡检
场地环境检查
火线-零线电压(198~232V)
实测:
备注:
零线-地线电压(应<1V,最高不超过3V)
实测:
备注:
温度(20~25℃)
实测:
备注:
湿度(20~60%)
实测:
备注:
机房环境(电源,空调…)近期有没有较大变动
□没有
□有简要说明:
1.网络设备状态检查
1.1网络交换机
序号
巡检步骤
预期结果
实际结果
结论
华为QuidwayS7706(10.145.0.254)
1
观测下列模板的工作状态
#displaydevice
各模板正常识别状态为Normal
Normal
□正常
□不正常
2
检测系统配置
#dir
#displaysaved-configuration
路由交换机NVRAM,RAM正常存储数据
正常
□正常
□不正常
3
检测CPU、存的利用率
displaycpu
displaymemory
CPU<50%,RAM<60%
Cpu=4%
RAM=33%
□正常
□不正常
4
检测当前所运行的系统中路由交换机的安全及配置文件
#displaycu|includeaaa
Password已设置并已加密
已加密
□正常
□不正常
5
检测syslog中的告警事件
#displayalarm-urgent
日志中无alarmurgent
Info=7
□正常
□不正常
6
检测设备温度
disenvironment
Temperature低于55
29
□正常
□不正常
7
检测路由是否正常,邻居建立个数
Displayiprouting-table
邻居:
路由协议:
ospf,static
□正常
□不正常
8
检测上下互联端口,链路是否存在errors
Displayinterface
CRC
ERRORS
CRC:
0
ERRORS:
0
□正常
□不正常
HUAWEIS5700(10.145.0.252)
1
观测下列模板的工作状态
#displaydevice
各模板正常识别状态为Normal
Normal
□正常
□不正常
2
检测系统配置
#dir
#displaysaved-configuration
路由交换机NVRAM,RAM正常存储数据
正常
□正常
□不正常
3
检测CPU、存的利用率
displaycpu
displaymemory
CPU<50%,RAM<60%
CPU=8%
RAM=65%
□正常
□不正常
4
检测当前所运行的系统中路由交换机的安全及配置文件
#displaycu|includeaaa
Password已设置并已加密
已加密
□正常
□不正常
5
检测syslog中的告警事件
#displayalarm-urgent
日志中无alarmurgent
无alarm
□正常
□不正常
6
检测设备温度
disenvironment
Temperature低于55
29
□正常
□不正常
7
检测路由是否正常,邻居建立个数
Displayiprouting-table
邻居:
0
路由协议:
static
13
□正常
□不正常
8
检测上下互联端口,链路是否存在errors
Displayinterface
CRC
ERRORS
CRC:
0
ERRORS:
0
□正常
□不正常
HUAWEIS5700-28C-EI(10.145.0.100)
1
观测下列模板的工作状态
#displaydevice
各模板正常识别状态为Normal
Normal
□正常
□不正常
2
检测系统配置
#dir
#displaysaved-configuration
路由交换机NVRAM,RAM正常存储数据
正常
□正常
□不正常
3
检测CPU、存的利用率
displaycpu
displaymemory
CPU<50%,RAM<60%
CPU=8%
RAM=51%
□正常
□不正常
4
检测当前所运行的系统中路由交换机的安全及配置文件
#displaycu|includeaaa
Password已设置并已加密
已加密
□正常
□不正常
5
检测syslog中的告警事件
#displayalarm-urgent
日志中无alarmurgent
无alarm
□正常
□不正常
6
检测设备温度
disenvironment
Temperature低于55
34
□正常
□不正常
7
检测路由是否正常,邻居建立个数
Displayiprouting-table
邻居:
0
路由协议:
static
13
□正常
□不正常
8
检测上下互联端口,链路是否存在errors
Displayinterface
CRC
ERRORS
CRC:
0
ERRORS:
0
□正常
□不正常
华为QuidwayS7706
1
观测下列模板的工作状态
#displaydevice
各模板正常识别状态为Normal
Normal
□正常
□不正常
2
检测系统配置
#dir
#displaysaved-configuration
路由交换机NVRAM,RAM正常存储数据
正常
□正常
□不正常
3
检测CPU、存的利用率
displaycpu
displaymemory
CPU<50%,RAM<60%
Cpu=7%
RAM=32%
□正常
□不正常
4
检测当前所运行的系统中路由交换机的安全及配置文件
#displaycu|includeaaa
Password已设置并已加密
已加密
□正常
□不正常
5
检测syslog中的告警事件
#displayalarm-urgent
日志中无alarmurgent
无alarm
□正常
□不正常
6
检测设备温度
disenvironment
Temperature低于55
32
□正常
□不正常
7
检测路由是否正常,邻居建立个数
Displayiprouting-table
邻居:
路由协议:
ospf,static
□正常
□不正常
8
检测上下互联端口,链路是否存在errors
Displayinterface
CRC
ERRORS
CRC:
0
ERRORS:
0
□正常
□不正常
HUAWEIS5700(10.145.0.251)
1
观测下列模板的工作状态
#displaydevice
各模板正常识别状态为Normal
Normal
□正常
□不正常
2
检测系统配置
#dir
#displaysaved-configuration
路由交换机NVRAM,RAM正常存储数据
正常
□正常
□不正常
3
检测CPU、存的利用率
displaycpu
displaymemory
CPU<50%,RAM<60%
CPU=5%
RAM=49%
□正常
□不正常
4
检测当前所运行的系统中路由交换机的安全及配置文件
#displaycu|includeaaa
Password已设置并已加密
已加密
□正常
□不正常
5
检测syslog中的告警事件
#displayalarm-urgent
日志中无alarmurgent
无alarm
□正常
□不正常
6
检测设备温度
disenvironment
Temperature低于55
28
□正常
□不正常
7
检测路由是否正常,邻居建立个数
Displayiprouting-table
邻居:
0
路由协议:
static
13
□正常
□不正常
8
检测上下互联端口,链路是否存在errors
Displayinterface
CRC
ERRORS
CRC:
0
ERRORS:
0
□正常
□不正常
1.2网络安全设备
主机信息
设备型号(TYPE)
FWS-S3300-T
序列号(S/N)
操作系统版本
v3.0buildversion2306
IP
10.144.0.2/10
120.10.96.254
主机硬件检查
检查容
参考命令
检查结果
指示灯状态
□正常
□异常说明:
风扇
□正常
□异常说明:
存
要求:
可用>20%
□正常
□异常说明:
free:
5694774KB
CPU使用情况
要求:
<25%
□正常
□异常说明:
20%
TCP连接数
□正常
☐异常说明:
282
电源指示灯
□正常
☐异常说明:
系统分析检查
检查容
参考命令
检查结果
日志分析
SystemLog确定有无异常事件记录
□正常
□异常
说明:
端口分析
确定各端口工作模式、错误记录等参数是否正常
□正常
□异常
说明:
路由模式
路由及连通性检查
使用ping及tracerouter等命令,检查路由可达性,测试路由是否正常
□正常
☐异常
说明:
策略Policies
要求:
<10000
□正常
□异常
说明:
2
系统备份检查
Ios操作系统备份
□是
□否建议:
配置文件备份
□是
□否建议:
主机信息
设备型号(TYPE)
深信服VPN网关
序列号(S/N)
操作系统版本
HDB4GEYALEDDZLQG
IP
10.144.0.6:
4430
主机硬件检查
检查容
参考命令
检查结果
指示灯状态
□正常
□异常说明:
风扇
□正常
□异常说明:
存
要求:
可用>20%
□正常
□异常说明:
CPU使用情况
要求:
<25%
□正常
□异常说明:
3%
TCP连接数
□正常
☐异常说明:
162
电源指示灯
□正常
☐异常说明:
系统分析检查
检查容
参考命令
检查结果
日志分析
SystemLog确定有无异常事件记录
□正常
□异常
说明:
端口分析
确定各端口工作模式、错误记录等参数是否正常
□正常
□异常
说明:
路由及连通性检查
使用ping及tracerouter等命令,检查路由可达性,测试路由是否正常
□正常
☐异常
说明:
VPN
VPN模块是否正常,建立连通性
□正常
☐异常
说明:
策略Policies
要求:
<10000
□正常
□异常
说明:
14
系统备份检查
Ios操作系统备份
□是
□否建议:
配置文件备份
□是
□否建议:
2、服务器和存储设备状态检查
存储子系统信息主柜L02-02(6-9)U从柜L02-02(22-25)U
设备型号(TYPE)
OceanstorS5500
序列号(S/N)
控制器微码版本
V100R005C02
管理地址:
10.145.4.250
硬盘个数
450G*10(FC/15K/3.5)
2T*18(SATA/7.2K/3.5)
HotSpare个数
3(450*1/2T*2)
RAID级别
RAID5*2/RAID6*1
Partitions
/
阵列个数
3
LUN个数
16
硬件检查
检查容
参考容
检查结果
存储指示灯
指示灯无告警
正常
异常说明:
磁盘故障
面板指示灯无告警灯亮
■正常
☐异常说明:
控制器状态
状态灯无黄色告警
■正常
☐异常说明:
控制器电池状态
无黄色告警,可使用寿命正常
正常
异常说明:
BBU需更换
磁盘柜电源状态
电源错误灯无告警
■正常
☐异常说明:
光纤线连接状态
光纤接口有无异常
■正常
☐异常说明:
网线连接状态
网口能正常发光,通讯正常
■正常
☐异常说明:
存储连接冗余
控制器分别接到两个SAN
■正常
☐异常说明:
当前配置检查
检查容
参考容
检查结果
Mapping设置
每个LUN应当都有对应的mapping
■正常
☐异常说明:
检查Hotspace硬盘分布是否合理。
建议每一个array配有一个热备盘
■正常
☐异常说明:
LUN是否都在最佳路径
如果这个值没有enable,一旦发生故障,有可能会造成数据丢失
■正常
☐异常说明:
服务器设备巡检表
序号
设备名称型号
配置
序列号
位置
设备运行状态
1
曙光天阔服务器
I840r-GP
CNA_07
CPU:
E7-4830*4
MEM:
16G*32
HDD:
600G*2(SAS/10K/2.5)
PS:
3个
OS:
fusioncompute
APP:
DB:
IP:
10.145.0.7(系统)
10.145.1.7(mgmt)
其他:
L01-01(26-29)U
■正常□异常
描述:
2
曙光天阔服务器
I840r-GP
CNA_06
CPU:
E7-4830*4
MEM:
16G*32
HDD:
600G*2(SAS/10K/2.5)
PS:
3个
OS:
fusioncompute
APP:
DB:
IP:
10.145.0.6(系统)
10.145.1.6(mgmt)
其他
L01-01(20-23)U
■正常□异常
描述:
3
曙光天阔服务器
I840r-GP
CNA_05
CPU:
E7-4830*4
MEM:
16G*32
HDD:
600G*2(SAS/10K/2.5)
PS:
3个
OS:
fusioncompute
APP:
DB:
IP:
10.145.0.5(系统)
10.145.1.5(mgmt)
其他
L01-01(14-17)U
■正常□异常
描述:
4
曙光天阔服务器
I840r-GP
CNA_04
CPU:
E7-4830*4
MEM:
16G*32
HDD:
600G*2(SAS/10K/2.5)
PS:
3个
OS:
fusioncompute
APP:
DB:
IP:
10.145.0.4(系统)
10.145.1.4(mgmt)
其他
L01-01(08-11)U
■正常□异常
描述:
5
曙光天阔服务器
I840r-GP
CNA_03
CPU:
E7-4830*4
MEM:
16G*32
HDD:
600G*2(SAS/10K/2.5)
PS:
3个
OS:
fusioncompute
APP:
DB:
IP:
10.145.0.3(系统)
10.145.1.3(mgmt)
其他
L01-01(0205)U
■正常□异常
描述:
6
曙光天阔服务器
I840r-GP
CNA_01
CPU:
E7-4830*4
MEM:
16G*32
HDD:
600G*2(SAS/10K/2.5)
PS:
3个
OS:
fusioncompute
APP:
DB:
IP:
10.145.0.1(系统)
10.145.1.1(mgmt)
其他
L02-01(32-35)U
■正常□异常
描述:
7
曙光天阔服务器
I840r-GP
CNA_02
CPU:
E7-4830*4
MEM:
16G*32
HDD:
600G*2(SAS/10K/2.5)
PS:
3个
OS:
fusioncompute
APP:
DB:
IP:
10.145.0.2(系统)
10.145.1.2(mgmt)
其他
L02-01(13-16)U
■正常□异常
描述:
8
戴尔R910服务器
CPU:
MEM:
HDD:
300G*3(SAS/10K/2.5)
PS:
4
OS:
APP:
DB:
IP:
(APP)
10.145.0.221(mgt)
其他
L02-03(07-10)U
■正常□异常
描述:
9
戴尔R910服务器
CPU:
E7-8837*4
MEM:
4G*16
HDD:
300G*3(SAS/10K/2.5)
PS:
4
OS:
APP:
DB:
IP:
(APP)
10.145.0.222(mgt)
其他
L02-03(12-15)U
■正常□异常
描述:
10
戴尔R710服务器
CPU:
X5670*2
MEM:
8G*8
HDD:
300G*3(SAS/15K/3.5)
PS:
2
OS:
APP:
DB:
IP:
(APP)
10.145.0.227(mgt)
其他
L02-03(21-22)U
■正常□异常
描述:
11
戴尔R710服务器
CPU:
X5670*2
MEM:
8G*8
HDD:
300G*3(SAS/15K/3.5)
PS:
2
OS:
APP:
DB:
IP:
(APP)
10.145.0.228(mgt)
其他
L02-03(24-25)U
正常□异常
描述:
12
戴尔R710服务器
CPU:
X5670*2
MEM:
8G*8
HDD:
300G*3(SAS/15K/3.5)
PS:
2
OS:
APP:
DB:
IP:
(APP)
10.145.0.229(mgt)
其他
L02-03(27-28)U
■正常□异常
描述:
13
戴尔R710服务器
CPU:
X5670*2
MEM:
8G*8
HDD:
300G*3(SAS/15K/3.5)
PS:
2
OS:
APP:
DB:
IP:
10.145.0.231(mgt)
其他
L02-02(19-20)U
■正常□异常
描述:
14
戴尔R710服务器
CPU:
X5670*2
MEM:
8G*8
HDD:
300G*3(SAS/15K/3.5)
PS:
2
OS:
APP:
DB:
IP:
10.145.0.230(mgt)
其他
L02-02(16-17)U
■正常□异常
描述:
15
浪潮5220服务器
NF5220
CPU:
E5606*2
MEM:
8G
HDD:
300G*2(SAS/3.5/15K)
PS:
2个
OS:
APP:
DB:
IP:
其他:
千兆网口*2
L02-01(07-08)U
■正常□异常
描述:
关机状态
16
浪潮5220服务器
NF5220
CPU:
E5606*2
MEM:
8G
HDD:
300G*2(SAS/3.5/15K)
PS:
2个
OS:
APP:
DB:
IP:
其他
L02-01(04-05)U
■正常□异常
描述:
17
浪潮5220服务器
NF5220
CPU:
E5620*2
MEM:
8G
HDD:
300G*2(SAS/3.5/15K)
PS:
OS:
APP:
DB:
IP:
10.145.4.32(IP)
10.145.4.34(VIP)
其他
L01-03(20-21)U
■正常□异常
描述:
18
浪潮5220服务器
CPU:
E5620*2
MEM:
8G
HDD:
300G*2(SAS/3.5/15K)
PS:
OS:
APP:
DB:
IP:
10.145.4.33(IP)
10.145.4.35(VIP)
其他
L01-03(23-24)U
■正常□异常
描述:
19
浪潮5220服务器
CPU:
MEM:
HDD:
PS:
OS:
APP:
DB:
IP:
其他
□正常□异常
描述:
不在
20
光纤交换机
PORTINFO:
VERSION:
v7.1.0c
ZONEINFO:
其他:
10.145.0.11
L02-02(36)U
■正常□异常
描述:
21
EMC虚拟带库
DD2200
HDD:
2T*7(SAS/7.2K/3.5)(100-554-336-01)
L01-03(03-04)U
■正常□异常
描述:
此次预防性维护的总结及建议
2018年7月02日通过对XX市XX局机房维保设备的外观状态,存储运行状态,网络设备的整体健康状态进行巡检。
目前:
1.服务器设备物理状态运行正常,没有硬件告警信息。
2.存储目前运行正常,但是有一个BBU电池有故障。
3.网络设备运行正常,无告警信息
□非常满意□满意□不满意□非常不满意
尊敬的客户:
您好!
预防性维护服务的主要目的是对您所购买的设备进行全面检查,及早发现潜在问题,提交详细检查报告及问题的针对性建议,提高用户业务的可用性。
服务工程师有责任将检查的结果向您汇报。
如果您已了解此次预防性维护服务的容,请在此签字:
服务工程师:
客户代表:
日期:
2018年07月02日
日期:
年月日