radwaread巡检手册v10.docx
《radwaread巡检手册v10.docx》由会员分享,可在线阅读,更多相关《radwaread巡检手册v10.docx(10页珍藏版)》请在冰豆网上搜索。
radwaread巡检手册v10
Radware负载均衡设备
巡检文档
一.1
负载均衡检查(RadwareAD)
一.1.1数据备份
检查项目:
RadwareAD数据备份
检查目的:
及时备份数据,确保设备故障时能及时恢复
检查步骤:
登陆,即AD的物理接口ip登录到AD,执行以下操作:
File→Configuration→ReceivefromDevice;
点Set,保存;将配置文件进行存档。
如下图所示:
检查标准:
数据正常备份。
异常处理:
如果无法备份,需要尽快定位问题。
一.1.2软件版本检查
检查项目:
软件版本检查
检查目的:
确保RadwareAD版本合乎要求,并且主备AD版本一致
检查方法:
登陆,即AD的物理接口ip登录到AD,执行以下操作:
Device→DeviceInformation;(也可以输入命令systemdev-info)
检查标准:
在现网的设备只允许使用ADbuild89或者ADBuild106版本,且主备两台AD的版本必须一致
一.1.3运行服务器状态检查
检查项目:
服务器的运行状态
检查目的:
确保服务器各节点状态正常
检查步骤:
登陆,即AD的ip登录到AD,点击Device→DeviceInformation观察各VirtualServer的状态。
如下图所示:
检查标准:
各VirtualServer的状态均正常(绿色打钩图标)。
异常处理:
如果有节点down掉了(红色叉图标),先确认是不是AD把它给shutdown掉了,如果不是在去查节点的问题,然后进行处理。
一.1.4主备状态检查
检查项目:
AD的主备状态
检查目的:
确保两台AD处于正常主备状态
检查步骤:
登陆,即AD的ip登录到AD,点击AppDirector→Redundancy→VRRP→Virtualrouter观察各接口VRRP的状态。
,观察AD显示的状态为一个master,一个standby(也可以在命令行输入redundancyvrrpvirtual-routers)。
如下图所示:
检查标准:
从图形界面登录到AD,观察两台AD的主备状态一个为master,一个为backup
异常处理:
如果是双active,需要检查各接口Priority,主设备为priority为200,备设备为100。
如下图所示:
一.1.5Fatallog日志检查
检查项目:
AD的Log
检查目的:
确保系统正常运行。
检查步骤:
从图形界面分别登录到两台AD,观察两台的Service->Eventlog如下图所示。
其中System记录了一些重要的日志:
检查标准:
没有异常的异常的资源告警日志或者Crash日子等。
异常处理:
根据异常的记录,分析异常发生的原因,相应处理。
一.1.6Sysloglog日志检查
检查项目:
AD的Log
检查目的:
确保系统正常运行。
检查步骤:
查看syslog服务器上的系统日志,(在build106的版本上可以记录系统日志在本地,使用managetrap-loggingview-log命令进行查看)
检查标准:
没有异常的操作记录、健康检查记录等。
异常处理:
根据异常的记录,分析异常发生的原因,相应处理。
备注:
如果没有使用日志服务器的,在RadwareAD服务器上设置日志服务器地址。
如果没有syslog服务器,可以配置本地日志。
建议本地日志仅在分析故障时使用。
这个功能仅在1.07.11DLbuild102版本后可以使用。
进入Services->TrapLogging
TrapLogging:
本地日志状态
MinimumSeverityforTrapLogging:
本地日志的保存级别,info表示info级别以上的信息全部记录,包括端口up/down,服务器up/down等信息。
TrapsLogFileSize:
本地日志保存的条目数,默认为1000条,满了自动删除以前日志
命令行配置如下:
AD-Master#managetrap-loggingstatusset1//开启日志记录
AD-Master#managetrap-loggingfile-sizesetset1000
AD-Master#managetrap-loggingview-log//用来查看日志
AD-Master#managetrap-loggingclear-log//没出现问题时,经常清空一下,方便查看
一.1.7CPU利用率检查
检查项目:
cpu利用率
检查目的:
确保系统的cpu使用情况
检查步骤:
登陆,即AD的ip登录到AD,点击Performance→Elementstatistics→Resource观察ResourceUtilization:
值。
(或者使用命令systemoscpu命令)
检查标准:
看cpu的利用率是否超过80%。
异常处理:
如果cpu的利用率出现过高的情况,就要根据情况进行相应的处理
一.1.8链路端口传输质量检查
检查项目:
传输质量检查
检查目的:
确认所有物理端口是否有丢包和错包
检查步骤:
登陆到AD的命令行界面,使用命令sysnf-stats,查看有没有丢包和错包的记录。
检查标准:
没有异常的丢包和错包的记录
处理:
如果端口有丢包或者错误,观察数据是否增长,一旦发现增长,需要检查交换机端口和radware设备端口的双工、速率是否正常判断该互联链路是否正常
一.1.9NHR质量检查
检查项目:
默认路由下一跳可达检测
检查目的:
确认路由下一跳正常
检查步骤:
登陆,即AD的ip登录到AD,点击Router→NHRTable观察Operstatus:
值。
检查标准:
OperStatus正常情况下Active的,如果是其它状态,检查下一跳设备是否正常。
一.1.10硬件状态灯检查
检查项目:
硬件状态灯检查
检查目的:
确保硬件没有显示异常现象
检查标准:
查看电源指示灯、风扇指示等、系统指示灯。
硬件
平台
ODS1/ODS2/ODS3
AS2/AS3
AS4/AS5
PWR
1)指示灯绿色:
表示正常
2)指示灯红色:
表示一个电源有故障(双电源的情况)
1)指示灯亮,表示设备加电
1)指示灯亮,表示设备加电
FAN
1)指示灯绿色:
表示正常
2)指示灯红色:
表示一个或者多个风扇有问题
1)指示灯灭:
正常;
2)指示灯亮:
表示风扇有问题,不工作;
1)指示灯灭:
正常;
2)指示灯亮:
表示风扇有问题,不工作;
SYS
1)指示灯:
绿色表示正常
2)指示灯:
红色表示正在启动或者有告警(如温度过高)
1)指示灯亮:
设备运行正常;
2)指示灯灭:
表示设备有问题
1)指示灯亮:
设备运行正常;
2)指示灯灭:
表示设备有问题或者有问题;双电源时,其中一个电源有故障,led灯闪烁
异常处理:
如果发现有指示灯闪烁或者异常,对现场电源进行检查,如果处理不了,及时和厂家联系。
精心搜集整理,只为你的需要