1、radwaread巡检手册Radware负载均衡设备巡检文档一.1 负载均衡检查(Radware AD)一.1.1 数据备份检查项目:Radware AD数据备份检查目的:及时备份数据,确保设备故障时能及时恢复检查步骤:登陆,即AD的 物理接口ip登录到AD,执行以下操作:FileConfigurationReceive from Device;点Set,保存;将配置文件进行存档。如下图所示:检查标准:数据正常备份。异常处理:如果无法备份,需要尽快定位问题。一.1.2 软件版本检查检查项目:软件版本检查检查目的:确保Radware AD版本合乎要求,并且主备AD版本一致检查方法:登陆,即AD的
2、 物理接口ip登录到AD,执行以下操作:DeviceDevice Information;(也可以输入命令system dev-info)检查标准:在现网的设备只允许使用AD build89 或者AD Build106版本,且主备两台AD的版本必须一致一.1.3 运行服务器状态检查检查项目:服务器的运行状态检查目的:确保服务器各节点状态正常检查步骤:登陆,即AD的ip登录到AD ,点击DeviceDevice Information观察各Virtual Server的状态。如下图所示:检查标准:各Virtual Server的状态均正常(绿色打钩图标)。异常处理:如果有节点down掉了(红色叉
3、图标),先确认是不是AD把它 给shutdown掉了,如果不是在去查节点的问题,然后进行处理。一.1.4 主备状态检查检查项目:AD的主备状态检查目的:确保两台AD处于正常主备状态检查步骤:登陆,即AD的ip登录到AD ,点击AppDirectorRedundancyVRRPVirtual router观察各接口VRRP的状态。,观察AD显示的状态为一个master,一个standby(也可以在命令行输入redundancy vrrp virtual-routers)。如下图所示: 检查标准:从图形界面登录到AD,观察两台AD的主备状态一个为master,一个为backup异常处理:如果是双a
4、ctive,需要检查各接口Priority,主设备为priority为200,备设备为100。如下图所示:一.1.5 Fatal log日志检查检查项目:AD的Log检查目的:确保系统正常运行。检查步骤:从图形界面分别登录到两台AD,观察两台的Service-Event log如下图所示。其中System记录了一些重要的日志:检查标准:没有异常的异常的资源告警日志或者Crash日子等。异常处理:根据异常的记录,分析异常发生的原因,相应处理。一.1.6 Syslog log日志检查检查项目:AD的Log检查目的:确保系统正常运行。检查步骤:查看syslog 服务器上的系统日志,(在 build
5、106的版本上可以记录系统日志在本地,使用manage trap-logging view-log命令进行查看)检查标准:没有异常的操作记录、健康检查记录等。异常处理:根据异常的记录,分析异常发生的原因,相应处理。备注:如果没有使用日志服务器的,在Radware AD服务器上设置日志服务器地址。如果没有syslog服务器,可以配置本地日志。建议本地日志仅在分析故障时使用。这个功能仅在1.07.11DL build 102版本后可以使用。进入Services - Trap LoggingTrap Logging: 本地日志状态Minimum Severity for Trap Logging:
6、本地日志的保存级别,info表示info级别以上的信息全部记录,包括端口up/down,服务器up/down等信息。Traps Log File Size :本地日志保存的条目数,默认为1000条,满了自动删除以前日志命令行配置如下:AD-Master# manage trap-logging status set 1 / 开启日志记录AD-Master# manage trap-logging file-size set set 1000 AD-Master# manage trap-logging view-log / 用来查看日志AD-Master# manage trap-loggin
7、g clear-log / 没出现问题时,经常清空一下,方便查看一.1.7 CPU利用率检查检查项目:cpu利用率检查目的:确保系统的cpu使用情况检查步骤:登陆,即AD的ip登录到AD ,点击PerformanceElement statisticsResource观察Resource Utilization:值。(或者使用命令system os cpu命令)检查标准:看cpu的利用率是否超过80。异常处理:如果cpu的利用率出现过高的情况,就要根据情况进行相应的处理一.1.8 链路端口传输质量检查检查项目:传输质量检查检查目的:确认所有物理端口是否有丢包和错包检查步骤:登陆到AD的命令行界
8、面,使用命令sys nf-stats,查看有没有丢包和错包的记录。检查标准:没有异常的丢包和错包的记录处理:如果端口有丢包或者错误,观察数据是否增长,一旦发现增长,需要检查交换机端口和radware设备端口的双工、速率是否正常判断该互联链路是否正常一.1.9 NHR质量检查检查项目:默认路由下一跳可达检测检查目的:确认路由下一跳正常检查步骤:登陆,即AD的ip登录到AD ,点击RouterNHR Table观察Oper status:值。 检查标准:Oper Status 正常情况下Active的,如果是其它状态,检查下一跳设备是否正常。一.1.10 硬件状态灯检查检查项目:硬件状态灯检查检查
9、目的:确保硬件没有显示异常现象检查标准:查看电源指示灯、风扇指示等、系统指示灯。硬件平台ODS1/ODS2/ODS3AS2/AS3AS4/AS5PWR1)指示灯绿色:表示正常2)指示灯红色:表示一个电源有故障(双电源的情况)1)指示灯亮,表示设备加电1)指示灯亮,表示设备加电FAN1)指示灯绿色:表示正常2)指示灯红色:表示一个或者多个风扇有问题1)指示灯灭:正常;2)指示灯亮:表示风扇有问题,不工作;1)指示灯灭:正常;2)指示灯亮:表示风扇有问题,不工作;SYS1)指示灯:绿色表示正常2)指示灯:红色表示正在启动或者有告警(如温度过高)1)指示灯亮:设备运行正常;2)指示灯灭:表示设备有问题1)指示灯亮:设备运行正常;2)指示灯灭:表示设备有问题或者有问题;双电源时,其中一个电源有故障,led灯闪烁异常处理:如果发现有指示灯闪烁或者异常,对现场电源进行检查,如果处理不了,及时和厂家联系。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1