VMware vSAN售后运维检查清单.docx
《VMware vSAN售后运维检查清单.docx》由会员分享,可在线阅读,更多相关《VMware vSAN售后运维检查清单.docx(15页珍藏版)》请在冰豆网上搜索。
VMwarevSAN售后运维检查清单
VMWarevSAN售后最佳实践第二部:
运维检查清单
第—章运维检查清单
运维检查清单按照下面的结构进行划分
VMwareGSS-ChinavSANTeamv1.1
类别
序
号
项目
登录方式
参考文档/备注
第一步准备工作
1
使用WebClient登录vCenter
https:
//vcenteripaddressorfqdn
vSphere/6.0/com.vmware.vsphere.vcenterhost.doc/GUID-
CE128B59-E236-45FF-9976-D134DADC8178.html
2
使用WebClient登录vCenter管理界面
https:
//vcenteripaddressorfqdn:
5480
vSphere/6.5/com.vmware.vsphere.vcsa.doc/GUID-9831B635-DFFA-40FA-9DA9-CEF8A1729E54.html
3
SSH登录到vCenter
5/index.jsp?
topic=%2Fcom.vmware.vcli.getstart.doc%2FGUID-
C3A44A30-EEA5-4359-A248-D13927A94CCE.html
4
SSH登录到RVC
vCenter命令行下执行:
rvc,输入用户
名密码
re/en/pdf/products/vsan/vmware-ruby-vsphere-console-
command-reference-for-virtual-san.pdf
5
SSH登录到每台vSAN节点
UsingESXiShellinESXi5.xand6.x(2004746)
6
登录主机管理界面
例如HPiLO或者DelliDrac
VMwareGSS-ChinavSANTeamv1.1
VMwareGSS-ChinavSANTeamv1.1
类
别
序
号
项目
UI界面
命令行
结果
第
步基础检查
1
检查vCenter版本
登录vCenter-Summary-版本9v
VC:
vpxd-v
2
检查ESXi主机版本
登录vCenter-主机-Summary
ESXi:
esxclisystemversionget
确认所有的主机版本一致
3
检查ESXi和vCenter是否满足vSAN的要求
确认ESXi和vCenter版本符NvSAN兼容要求,见截图1
erop_matrix.php
4
检查vCenter运行状态
登录vCenter管理界面-健康状态
见U图2
5
检查vCenter服务状态
登录vCenter-系统9v-节点-相关
对象
VC:
service-control--status
见U图3
6
检查vSAN集群成员数量是否正常
登录vCenter-集群-配置-磁盘管理
-确认所有主机都在列表里
ESXi:
esxclivsancluster
get|grep"Sub-ClusterMemberCount"
确认节点数量正确。
7
检查集群告警信v
登录vCenter-集群-监控-告警
记录集群告警信v。
8
检查集群主机负载(CPU)
登录vCenter-集群-主机
确认所有主机负载均衡。
9
检查集群主机负载(内I)
登录vCenter-集群-主机
确认所有主机负载均衡。
10
检查vSANDatastore容量状
态
登录vCenter-集群-监控-vSAN-容量
ESXi:
df-h
确认所有使用率没有超过70%。
VMware建议保留30%
的使用空间,参考VirtualSAN运行状况服务-物理磁盘
运行状况-磁盘容量(2141542)
11
检查vSAN集群所有磁盘的
使用率
登录vCenter-集群-监控-vSAN-物
理磁盘
RVC:
vsan.disks_stats
确认没有单块磁盘使用率过高,见截图4。
12
检查vSAN集群健康状态
登录vCenter-集群-监控-vSAN-运
行状况
ESXi:
esxclivsanhealthclusterlist
确认没有黄色或者红色的告警。
13
检查vSAN网络分区状态
登录vCenter-集群-配置-磁盘管理
-网络分区
确认所有的主机在同一个分区下,见截图5。
14
检查vSAN集群默认的存1
策略
登录vCenter-PoliciesandProfiles--
VM存1策略
ESXi:
esxclivsanpolicygetdefault
确认默认存1策略符N预期。
15
检查vSAN集群的磁盘添加
方式
登录vCenter-集群-配置-vSAN
ESXi:
esxclivsanstorageautomodeget
确认为手动方式,VMware建议使用手动模式,见截图6
16
检查vSAN集群磁盘格式
登录vCenter-集群-配置-磁盘管理
ESXi:
esxclivsanstoragelist|grepversion
确认符N兼容性要求。
UnderstandingvSANon-diskformatversionsandcompatibility(2145267)
17
检查集群满足“一台主机故
障”场、
登录vCenter-集群-监控-vSAN-运
行状况-限制
RVC:
vsan.whatif_host_failures
确认没有告警,见截图7。
18
检查所有主机都安全退出维
护模式
ESXi:
esxclivsanclusterget|grepMaintenance
确认为OFF。
19
检查vSANHCL数据库版本
登录vCenter-集群-配置-健康和性
甘
确认巳经更新到最新的版本,见截图8。
类
别
序
号
项目
UI界面
命令行
结果
第
步主机
1
检查主机告警信v
登录vCenter-主机-监控-告警
记录主机告警信v。
2
检查主机名
ESXi:
uname-a
确认主机名正确,避免使用Localhost。
3
检查主机运行时间
登录vCenter-主机-Summary
ESXi:
uptime
确认主机运行时间正确。
4
检查主机硬件状态
登录vCenter-主机-监控-硬件状态
确认没有硬件告警9v,见截图9。
5
检查主机启动盘分区使用率
ESXi:
df-h
确认没有过高的使用率,见截图10。
6
检查ramdisk状态
ESXi:
vdf-h
确认没有过高的使用率,见截图11。
7
检查主机syslog配置
登录vCenter-主机-配置-高级系统
配置-“Syslog.global.logDir”
ESXi:
esxclisystemsyslogconfigget
确认syslog没有存1在vSANDatastore上。
不支持日志
文件存1在vSANDatastore。
8
检查主机vSANtrace文件的配置
ESXi:
esxclivsantraceget
确认vSANTrace没有存1在vSANDatastore上。
不支持
vSANTrace存储在vSANDatastore。
类
别
序
号
项目
UI界面
命令行
结果
第四步存1
1
检查主机vSAN磁盘数量
登录vCenter-集群-配置-磁盘管理
ESXi:
esxclivsanstorage
list|grepDevice
确认符N实际数量。
2
检查主机vSAN磁盘挂载状
态
登录vCenter-集群-配置-磁盘管理
ESXi:
esxclivsanstoragelist|grepCMMDS
确认所有磁盘都是健康和挂载状态,见截图12。
3
检查主机vSAN磁盘映射状
态
登录vCenter-集群-配置-磁盘管理
ESXi:
vdq-iH
确认符N实际分配情况。
4
检查Raid控制器型号
登录vCenter-主机-配置-StorageAdapters-Properties
ESXi:
esxcfg-scsidevs-a
确认符NvSANHCL要求,见截图13php?
deviceCategory=vsan
5
检查Raid控制器驱动固件
登录vCenter-主机-配置-StorageAdapters-Properties
ESXi:
/usr/lib/vmware/vmkmgmt_k
eyval/vmkmgmt_keyval-a
确认符NvSANHCL要求,见截图13
php?
deviceCategory=vsan
6
检查Raid控制器下的磁盘
登录vCenter-主机-配置-StorageAdapters-Devices
ESXi:
esxcfg-scsidevs-A
确认符NvSANHCL要求,见截图13
php?
deviceCategory=vsan
7
检查Raid控制器/SSD9v
登录主机管理界面
例如HPiLO或者DelliDrac,确认相关版本符NvSANHCL
要求,例如SSD固件。
类
别
序
号
项目
U界面
命令行
结果
第五
1
检查网卡型号
登录vCenter-主机-配置-PhysicalAdapters
ESXi:
esxcfg-nics-l
确认符NESXiHCL要求。
php?
deviceCategory=io
步网络
2
检查网卡驱动固件
ESXi:
ethtool-SvmnicX
确认符NESXiHCL要求。
php?
deviceCategory=io
3
检查网卡UP/Down记录
ESXi:
grepvmnic
/var/log/vobd.log|egrep-e"up|down"
如果段时间A有过多的Up/Down记录需要进一步调查。
4
检查网卡报错
ESXi:
esxclinetworknicstatsget-nvmnicX或者ethtool-S
vmnicX
确认errors和dropped的数值没有短时间A持续增加。
5
检查主机所有vmk配置
登录vCenter-主机-配置-VMKerneladapters
ESXi:
esxclinetworkipinterfacelist/esxclinetworkipinterfaceipv4get
确认ip地址和子网掩码配置正确。
6
检查主机虚拟交换机状态
登录vCenter-主机-配置-Virtualswitches
ESXi:
esxcfg-vswitch-l
确认虚拟交换机配置符N预期。
7
检查主机上vSAN使用的单
播状态
ESXi:
esxclivsanclusterunicastagentlist
确认包S除本身以外的其他所有节点。
8
检查标准虚拟交换机的MTU
登录vCenter-主机-配置-Virtual
switches-编辑
ESXi:
esxcfg-vswitch-l|grepMTU-A1
记录MTU数值,结N第(11)项
9
检查分布式虚拟交换机的
MTU
登录vCenter-网络-分布式交换机-
配置-属性
ESXi:
esxcfg-vswitch-l|grepMTU-A1
记录MTU数值,结N第(11)项
10
检查vmk的MTU
登录vCenter-网络-分布式交换机-
配置-属性
ESXi:
esxcfg-vswitch-l和esxclinetworkipinterfacelist
记录MTU数值,结N第(11)项
11
检查物理交换机配置的
MTU,确认于第(8)(9)(10)项
查到的MTU相同
确认vswitch和vmkinterfaceMTU是一致的,并且和物理交换机配置的MTU一致。
VMwareGSS-ChinavSANTeamv1.1
VMwareGSS-ChinavSANTeamv1.1
类别
步骤
A容
参考文档/备注
第六步后续工作
1
拨打服务热线或者通过MyVMware网站创建ServiceRequest(China)4008160688/8009151919
见U图14
2
请按照下方的表格1收集需要的日志
HowtocollectvSANsupportlogsanduploadtoVMware
(2072796)
3
把日志上传VMwareFTP服务器
UploadingdiagnosticinformationforVMware(1008525)
4
准备Webex网络环境(推荐)
5
保持手机畅通
6
关于服务响应时间,请参考VMware网站
VMwareGSS-ChinavSANTeamv1.1
表格1-根据不同的故障场景收集对应的日志信息
第二章部分配套截图和KB
截图1-基础检查-检查ESXi和vCenterH否满足vSAN的要N(vSAN-ESXi)
截图1-基础检查-检查ESXi和vCenter是否满足vSAN的要求(vSAN-vCenter)
截图1-基础检查-检查ESXi和vCenterH否满足vSAN的要N(vCenter-ESXi)
截图2-基础检查-检查vCenter运行状态
截图3-基础检查-检查vCenter服务状态-图形界面
截图3-基础检查-检查vCenter服务状态-命令行
截图4—基础检查-检查vSAN集群A有磁盘的3S率
截图5—基础检查-检查vSAN网络47状态
截图6—基础检查-检查vSAN集群的磁盘添6方式
截图7—基础检查-检查集群满足“182机故障”1景
截图8—基础检查—检查0SANHC-数C库版L
截图9—2机—检查主机硬件状态
截图10—2机—检查主机-动盘分区使用率
截图11—2机—检查ramdisk状态
截图12—存储-检查主机vSAN磁盘挂载状态
截图13—存储-检查Raid控5器型9(步骤1和步骤2)
截图13—存储-检查Raid控5器型9(步骤3)
截图4—后续工作-VMware售后服务热线