数据库一体机(Exadata)日常运维手册.docx
《数据库一体机(Exadata)日常运维手册.docx》由会员分享,可在线阅读,更多相关《数据库一体机(Exadata)日常运维手册.docx(72页珍藏版)》请在冰豆网上搜索。
![数据库一体机(Exadata)日常运维手册.docx](https://file1.bdocx.com/fileroot1/2022-10/1/be9812f7-ae0b-4d7d-85f8-38b426c92a35/be9812f7-ae0b-4d7d-85f8-38b426c92a351.gif)
Exadata日常运维
Exadata日常运维
Page24of
71
目录
一、 日常操作 4.
配置查看 4.
详细查看硬件配置和状态 5
检查当前电源功耗 6.
检查功耗的历史记录 7
告警设置 9.
二、 健康检查 11
系统状态查看 11
各传感器工作状态 11
设置组件的指示灯亮和快闪 13
检查系统硬件日志 4
三、 Infiniband交换机 16
查看IB硬件信息 6
查看IB硬件配置和状态 18
查看ILOM的网络会话超时的设置 19
查看ILOM的网络设置 20
查看系统SNMP管理的设置 21
检查IB链路状态 2
查看IB网络拓扑状态 23
诊断IB链路没有错误 26
查看IB网络连线 4
查看IB健康状态 5
四、 PDU 35
监控PDU状态 5
使用MeteringUnit’sLCDScreen监控PDU 35
使用Web界面监控PDU. 36
PDU故障处理 8
五、 Cisco交换机 8
监控Cisco交换机状态 38
Cisco故障处理 8
六、 日常运维及故障处理 39
PoweringOffOracleExadataRack 39
启停ExadataDatabaseServer 39
启停ExadataStorageServer 40
监控服务器周边温度 41
DB节点磁盘状态检查 42
CELL节点磁盘故障 43
CELL节点Flash卡故障 55
七、 常用诊断工具 8
ExachkorHealthCheck 5.8
DiagnosticsCollectionTool:
sundiag.sh 59
RDA(RemoteDiagnosticAgent) 60
ADRCI 6.1
八、 Exadata最佳实践 61
OptimizeASMDiskgroupBalance 61
OptimizeScanRates 62
Ensureautoextendsizewillallocatespaceonalldisksinthediskgrou6p3
备份(Tape-Based) 3
备份(Disk-Based) 6
恢复 6.8
VerifyDW/BIInstanceDatabaseInitializationParameters 69
CheckforASMnotificationofcorruption 70
ChoosetheASMredundancytypebasedonyourdesiredprotectionlevelandcapacity
demands 1
一、日常操作
由于DatabaseServer与StorageCell为同平台产品,ILOM版本相同,所以ILOM管理操作基本相同,下述内容及图例将以StorageCell为例。
ILOM可远程查看DBserver/StorageCell硬件信息和开关机状态,采用Web方式,通过Web浏览器访问监控,例如:
https:
//10.182.28.146。
配置查看
用IE访问ILOM.
输入用户名(root)和口令(welcome1),完成登录。
选择和,可查看DBServer/StorageCell系统硬件概览信息:
概览信息包括产品名称、序列号、BIOS版本、SP主机名称和IP地址、和ILOM
版本等,特别的还显示有加电状态(例如On),系统运行时间等。
详细查看硬件配置和状态
采用Web方式,选择标签和,可查看DBServer/StorageCell系统各个硬件组件和状态:
部件类型说明:
部件号
/SYS
名称
全系统
注释
存储节点或数据库服务器节点
/SYS/CONNBD
连接板组件
ConnectorBoard
Assembly
/SYS/DBP
硬盘背板
/SYS/DBP/HDD0
硬盘
0号插槽
/SYS/FB
前风扇板
/SYS/FB/F0
风扇模块
0号插槽
/SYS/MB
主板
存储节点
/SYS/MB/BIOS
BIOS模块
/SYS/MB/CPLD
NVRAM模块
/SYS/MB/NET0
千兆网口
0号端口
/SYS/MB/P0
CPU
0号插槽
/SYS/MB/P0/D2
内存条
2号插槽
/SYS/MB/RISER0
PCIE插槽组件
用于插PCIE板
/SYS/MB/RISER0/PCIE0
PCIE插槽模块
/SYS/MB/RISER2/PCIE2/F20CARD
/SYS/PD
F20闪存卡分电板
/SYS/SAS_EXP
SAS硬盘扩展板
插SAS硬盘的背板
/SYS/SP
/SYS/SP/NET0
SP控制器
SP控制器网口
管理服务器的控制器
选定部件,可观察更为详细的信息,例如选择CPU部件,会看到CPU的详细信息,包括型号和状态等:
注:
标明为FRU(FieldReplaceUnit)的组件,为现场可更换组件。
检查当前电源功耗
采用Web方式,选择标签和,可监控电源功耗状态:
实际功耗(ActualPower)显示当前系统的实际功耗。
检查功耗的历史记录
采用Web方式,可选择标签和:
可显示最近一小时内的每分钟内平均电源功耗:
即可查看实时功耗和历史功耗,若有单价,有利于帮助数据中心电费的统计。
告警设置
可定义报警规则,总共可定义15条。
Web方式,选择:
选中任意一个规则,点击。
可选择三种报警方式:
IPMIPET、Email或SNMPTrap,可选择5种报警级别:
Down、Critical(临界值)、Major(重要)、Minor(次要)和Disable:
点击保存定义的规则,点击可测试所定义的报警规则。
二、健康检查
系统状态查看
登录ILOM后,可显示DBServer/StorageCell全系统运行状态:
采用Web方式查看SystemOverview:
显示系统状态SystemStatus(Normal)。
各传感器工作状态
采用Web方式查看,选择标签和:
类型
说明
注释
Temperature
温度
会显示温度,如主板
Voltage
电压
电压
Power
Supply
电源
正常
Fan
风扇
转速
其中,其中,传感器类型EntityPresence会说明对应组件(如硬盘)是否在插槽中(presend)。
注:
传感器类型
电源传感器检查举例(状态正常,为cleared):
风扇组件检查举例(显示有转速等参数,状态正常,为cleared):
设置组件的指示灯亮和快闪
设置组件的指示灯亮和快闪,用以定位组件在存储节点硬件上的位置。
采用Web方式,选择标签和,状态Status显示组件指示灯是否亮(On)或灭(Off):
检查系统硬件日志
采用Web方式,选择标签和,查看有关每个特定事件的各种详细信息,包括事件ID、类、类型、严重性、日期和时间以及事件的说明,要清除日志,选择:
可按事件过滤器客户化查询日志:
三、Infiniband交换机
查看IB硬件信息
采用Web方式,通过Web浏览器访问SP控制器,例如:
https:
//xxx.xxx.xxx.xxx
输入用户名(root)和口令(welcome1),完成登录。
选择和:
选择和:
可观察InfiniBandSwitch交换机SP控制器固件版本等信息。
查看IB硬件配置和状态
采用Web方式,选择标签和,可查看InfiniBandSwitch
系统各个硬件组件和状态:
选择,可查看InfiniBandSwitch产品名称、零件号和序列号等信息:
选择或,可查看InfiniBandSwitch冗余电源的零件号和序列号等信息:
查看ILOM的网络会话超时的设置
采用Web方式,选择标签和