VMware vSAN售后运维检查清单文档格式.docx
《VMware vSAN售后运维检查清单文档格式.docx》由会员分享,可在线阅读,更多相关《VMware vSAN售后运维检查清单文档格式.docx(15页珍藏版)》请在冰豆网上搜索。
topic=%2Fcom.vmware.vcli.getstart.doc%2FGUID-
C3A44A30-EEA5-4359-A248-D13927A94CCE.html
4
SSH登录到RVC
vCenter命令行下执行:
rvc,输入用户
名密码
re/en/pdf/products/vsan/vmware-ruby-vsphere-console-
command-reference-for-virtual-san.pdf
5
SSH登录到每台vSAN节点
UsingESXiShellinESXi5.xand6.x(2004746)
6
登录主机管理界面
例如HPiLO或者DelliDrac
类
别
UI界面
命令行
结果
第
步基础检查
检查vCenter版本
登录vCenter-Summary-版本9v
VC:
vpxd-v
检查ESXi主机版本
登录vCenter-主机-Summary
ESXi:
esxclisystemversionget
确认所有的主机版本一致
检查ESXi和vCenter是否满足vSAN的要求
确认ESXi和vCenter版本符NvSAN兼容要求,见截图1
erop_matrix.php
检查vCenter运行状态
登录vCenter管理界面-健康状态
见U图2
检查vCenter服务状态
登录vCenter-系统9v-节点-相关
对象
service-control--status
见U图3
检查vSAN集群成员数量是否正常
登录vCenter-集群-配置-磁盘管理
-确认所有主机都在列表里
esxclivsancluster
get|grep"
Sub-ClusterMemberCount"
确认节点数量正确。
7
检查集群告警信v
登录vCenter-集群-监控-告警
记录集群告警信v。
8
检查集群主机负载(CPU)
登录vCenter-集群-主机
确认所有主机负载均衡。
9
检查集群主机负载(内I)
10
检查vSANDatastore容量状
态
登录vCenter-集群-监控-vSAN-容量
df-h
确认所有使用率没有超过70%。
VMware建议保留30%
的使用空间,参考VirtualSAN运行状况服务-物理磁盘
运行状况-磁盘容量(2141542)
11
检查vSAN集群所有磁盘的
使用率
登录vCenter-集群-监控-vSAN-物
理磁盘
RVC:
vsan.disks_stats
确认没有单块磁盘使用率过高,见截图4。
12
检查vSAN集群健康状态
登录vCenter-集群-监控-vSAN-运
行状况
esxclivsanhealthclusterlist
确认没有黄色或者红色的告警。
13
检查vSAN网络分区状态
-网络分区
确认所有的主机在同一个分区下,见截图5。
14
检查vSAN集群默认的存1
策略
登录vCenter-PoliciesandProfiles--
VM存1策略
esxclivsanpolicygetdefault
确认默认存1策略符N预期。
15
检查vSAN集群的磁盘添加
方式
登录vCenter-集群-配置-vSAN
esxclivsanstorageautomodeget
确认为手动方式,VMware建议使用手动模式,见截图6
16
检查vSAN集群磁盘格式
esxclivsanstoragelist|grepversion
确认符N兼容性要求。
UnderstandingvSANon-diskformatversionsandcompatibility(2145267)
17
检查集群满足“一台主机故
障”场、
行状况-限制
vsan.whatif_host_failures
确认没有告警,见截图7。
18
检查所有主机都安全退出维
护模式
esxclivsanclusterget|grepMaintenance
确认为OFF。
19
检查vSANHCL数据库版本
登录vCenter-集群-配置-健康和性
甘
确认巳经更新到最新的版本,见截图8。
步主机
检查主机告警信v
登录vCenter-主机-监控-告警
记录主机告警信v。
检查主机名
uname-a
确认主机名正确,避免使用Localhost。
检查主机运行时间
uptime
确认主机运行时间正确。
检查主机硬件状态
登录vCenter-主机-监控-硬件状态
确认没有硬件告警9v,见截图9。
检查主机启动盘分区使用率
确认没有过高的使用率,见截图10。
检查ramdisk状态
vdf-h
确认没有过高的使用率,见截图11。
检查主机syslog配置
登录vCenter-主机-配置-高级系统
配置-“Syslog.global.logDir”
esxclisystemsyslogconfigget
确认syslog没有存1在vSANDatastore上。
不支持日志
文件存1在vSANDatastore。
检查主机vSANtrace文件的配置
esxclivsantraceget
确认vSANTrace没有存1在vSANDatastore上。
不支持
vSANTrace存储在vSANDatastore。
第四步存1
检查主机vSAN磁盘数量
esxclivsanstorage
list|grepDevice
确认符N实际数量。
检查主机vSAN磁盘挂载状
esxclivsanstoragelist|grepCMMDS
确认所有磁盘都是健康和挂载状态,见截图12。
检查主机vSAN磁盘映射状
vdq-iH
确认符N实际分配情况。
检查Raid控制器型号
登录vCenter-主机-配置-StorageAdapters-Properties
esxcfg-scsidevs-a
确认符NvSANHCL要求,见截图13php?
deviceCategory=vsan
检查Raid控制器驱动固件
/usr/lib/vmware/vmkmgmt_k
eyval/vmkmgmt_keyval-a
确认符NvSANHCL要求,见截图13
php?
检查Raid控制器下的磁盘
登录vCenter-主机-配置-StorageAdapters-Devices
esxcfg-scsidevs-A
检查Raid控制器/SSD9v
例如HPiLO或者DelliDrac,确认相关版本符NvSANHCL
要求,例如SSD固件。
U界面
第五
检查网卡型号
登录vCenter-主机-配置-PhysicalAdapters
esxcfg-nics-l
确认符NESXiHCL要求。
deviceCategory=io
步网络
检查网卡驱动固件
ethtool-SvmnicX
确认符NESXiHCL要求。
检查网卡UP/Down记录
grepvmnic
/var/log/vobd.log|egrep-e"
up|down"
如果段时间A有过多的Up/Down记录需要进一步调查。
检查网卡报错
esxclinetworknicstatsget-nvmnicX或者ethtool-S
vmnicX
确认errors和dropped的数值没有短时间A持续增加。
检查主机所有vmk配置
登录vCenter-主机-配置-VMKerneladapters
esxclinetworkipinterfacelist/esxclinetworkipinterfaceipv4get
确认ip地址和子网掩码配置正确。
检查主机虚拟交换机状态
登录vCenter-主机-配置-Virtualswitches
esxcfg-vswitch-l
确认虚拟交换机配置符N预期。
检查主机上vSAN使用的单
播状态
esxclivsanclusterunicastagentlist
确认包S除本身以外的其他所有节点。
检查标准虚拟交换机的MTU
登录vCenter-主机-配置-Virtual
switches-编辑
esxcfg-vswitch-l|grepMTU-A1
记录MTU数值,结N第(11)项
检查分布式虚拟交换机的
MTU
登录vCenter-网络-分布式交换机-
配置-属性
检查vmk的MTU
esxcfg-vswitch-l和esxclinetworkipinterfacelist
检查物理交换机配置的
MTU,确认于第(8)(9)(10)项
查到的MTU相同
确认vswitch和vmkinterfaceMTU是一致的,并且和物理交换机配置的MTU一致。
步骤
A容
第六步后续工作
拨打服务热线或者通过MyVMware网站创建ServiceRequest(China)4008160688/8009151919
见U图14
请按照下方的表格1收集需要的日志
HowtocollectvSANsupportlogsanduploadtoVMware
(2072796)
把日志上传VMwareFTP服务器
UploadingdiagnosticinformationforVMware(1008525)
准备Webex网络环境(推荐)
保持手机畅通
关于服务响应时间,请参考VMware网站
表格1-根据不同的故障场景收集对应的日志信息
第二章部分配套截图和KB
截图1-基础检查-检查ESXi和vCenterH否满足vSAN的要N(vSAN-ESXi)
截图1-基础检查-检查ESXi和vCenter是否满足vSAN的要求(vSAN-vCenter)
截图1-基础检查-检查ESXi和vCenterH否满足vSAN的要N(vCenter-ESXi)
截图2-基础检查-检查vCenter运行状态
截图3-基础检查-检查vCenter服务状态-图形界面
截图3-基础检查-检查vCenter服务状态-命令行
截图4—基础检查-检查vSAN集群A有磁盘的3S率
截图5—基础检查-检查vSAN网络47状态
截图6—基础检查-检查vSAN集群的磁盘添6方式
截图7—基础检查-检查集群满足“182机故障”1景
截图8—基础检查—检查0SANHC-数C库版L
截图9—2机—检查主机硬件状态
截图10—2机—检查主机-动盘分区使用率
截图11—2机—检查ramdisk状态
截图12—存储-检查主机vSAN磁盘挂载状态
截图13—存储-检查Raid控5器型9(步骤1和步骤2)
截图13—存储-检查Raid控5器型9(步骤3)
截图4—后续工作-VMware售后服务热线