FusionCompute日常维护与故障处理介绍.pptx

上传人:b****9 文档编号:171788 上传时间:2022-10-05 格式:PPTX 页数:51 大小:1.75MB
下载 相关 举报
FusionCompute日常维护与故障处理介绍.pptx_第1页
第1页 / 共51页
FusionCompute日常维护与故障处理介绍.pptx_第2页
第2页 / 共51页
FusionCompute日常维护与故障处理介绍.pptx_第3页
第3页 / 共51页
FusionCompute日常维护与故障处理介绍.pptx_第4页
第4页 / 共51页
FusionCompute日常维护与故障处理介绍.pptx_第5页
第5页 / 共51页
点击查看更多>>
下载资源
资源描述

FusionCompute日常维护与故障处理介绍.pptx

《FusionCompute日常维护与故障处理介绍.pptx》由会员分享,可在线阅读,更多相关《FusionCompute日常维护与故障处理介绍.pptx(51页珍藏版)》请在冰豆网上搜索。

FusionCompute日常维护与故障处理介绍.pptx

,FusionCompute日常维护与故障处理介绍,技术创新,变革未来,前言FusionCompute是华为云计算解决方案的基石,了解和掌握FusionCompute的日常维护和故障处理方法,可以更好的部署和维护企业云计算环境。

通过本章学习,您将能够掌握FusionCompute系统的日常运维能力。

第页,目标学完本课程后,您将能够:

描述日常维护操作区分FusionCompute告警分析常见故障处理步骤描述FusionCompute常见故障处理方法,第页,目录维护管理日常监控配置管理用户管理FusionCompute备份与恢复2.故障管理,第页,日常维护操作,为了保证系统长期正常、稳定的运行,维护工程师需要定期对系统进行检查,并根据检查出的异常结果排除故障。

维护项目,第页,检查项,正常状态,维护周期,FusionCompute上的告警健康检查报告,无新增告警无“不合格”检查项,每天每天,查看系统告警检查FusionCompute健康状态检查设备运行状态,服务器、交换机和存储设备的指示灯状态,每天,检查设备运行环境,指示灯显示正常符合运行环境对温度和湿度的要求。

每周符合运行环境对空气质量的要求每周无明显尘土附着每周,查看预警整改公告,温湿度空气质量防尘情况“http:

/se”,选择“公告产品公告预警公告IT云计算数据中心FusionSphereFusionSphere”,查看预警整改公告。

满足预警通知的要求,每月,查看告警,第页,实时监控,管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运行状态,第页,目录1.维护管理日常监控配置管理用户管理FusionCompute备份与恢复2.故障管理,第页,系统配置

(1),第页,管理员可以根据业务需求对FusionCompute系统配置参数作出调整。

配置域认证信息更新License修改系统Logo配置登录超时时间配置资源调度周期配置SNMP管理站VRM单节点扩展为主备部署,系统配置

(2),第页,任务管理,管理员可以通过FusionCompute查看操作任务的进度,第页,目录维护管理日常监控配置管理用户管理FusionCompute备份与恢复2.故障管理,第页,FusionCompute账户,第页,FusionCompute账户分为:

本地用户、域用户、接口对接用户。

本地用户用于登录、管理系统;在配置域后可用域用户登录系统;接口对接用户用于其他用户对接。

FusionCompute登录账户如下表:

目录维护管理日常监控配置管理用户管理FusionCompute备份与恢复2.故障管理,第页,备份与恢复策略,第页,维护工程师在对系统进行重大操作(如升级、重大数据调整等)前,为了保证FusionCompute在出现异常或未达到预期结果时可以及时进行数据恢复,将对业务的影响降到最低,需要提前对VRM节点的数据进行备份。

FusionCompute同时支持对关键数据进行自动备份和手工备份。

在对系统部件进行重大操作(如升级、重大数据调整等)后,系统有可能出现异常或未达到预期结果。

此时,需要对其进行回退,回退过程中需要进行数据恢复操作。

本节小结,本节介绍了FusionCompute系统的日常管理内容,包括监控管理、配置管理、用户管理和管理数据备份等内容。

第页,目录维护管理故障处理主机和集群故障处理存储故障处理网络故障处理虚拟机和模板故障处理,第页,主机和集群创建流程,FusionCompute主机和集群的故障处理,可以参考该流程顺序进行检查。

主机和集群的故障可能会涉及到如下关键故障点:

站点故障集群故障主机故障系统接口故障,创建集群,向集群添加主机,设置主机时钟同步,添加主机存储接口,存储设备厂商,其他修改主机存储多路径,否,华为,存储类型为SAN?

是,第页,主机和集群故障点,不能使用Fus站ion点C故om障pute,不能配置级联,不能创建、修改、集移群除故集群障,集群配置故障,不能添加、修改、主移机除故主机障,主机配置故障,网口绑定异常系统接口故障业务管理接口异常,存储接口异常,第页,站点、集群故障点分析,不能使用FusionCompute不能配置级联不能创建、修改、移除集群集群配置故障,故障点,网络异常,VRM节点异常站点配置异常集群配置异常,可能的故障原因,排除网络故障排除VRM节点故障修复站点配置修复集群配置,排除故障,第页,FusionCompute使用VRM节点对资源统一调度管理,站点、集群故障和VRM节点强相关。

站点、集群故障案例-VRM虚拟机无法启动,收集信息,FusionCompute服务异常,无法启动VRM虚拟机,定位故障,可能在FusionCompute中对VRM虚拟机执行过关机操作可能在VRM虚拟机上执行过关机命令可能VRM操作系统异常而引发VRM自动关机,排除故障,使用“PuTTY”,登录VRM节点所在主机切换至“root”用户:

su-root查找VRM虚拟机id启动虚拟机:

virshstart虚拟机ID,检查确认,告警消失业务正常,第页,主机故障点分析,不能添加、修改、移除主机主机配置故障,故障点,可能的故障原因网络异常代理服务异常系统异常,排除网络故障修复代理服务重装系统,排除故障,第页,主机上的计算资源经过虚拟化后,形成计算资源池,并分配给虚拟机使用。

如果主机出现故障,将影响上层的虚拟机和业务。

主机故障案例-添加主机失败,收集信息,在FusionCompute界面上添加主机失败,定位故障,VRM与CNA节点网络链路不通添加主机失败后,主机上可能残留网络配置数据,导致再次添加主机失败,排除故障,检查VRM与故障CNA节点网络连接删除故障CNA节点残留网络数据,检查确认,告警消失业务正常,第页,系统接口管理,第页,FusionCompute管理如下几类系统接口:

绑定网口绑定主机的网口,以提高网络的可靠性。

存储接口在主机中添加存储接口,实现主机与存储设备对接。

添加多个存储接口,可以实现存储的多路径传输。

业务管理接口承载一些特殊业务流量的系统接口,这些特殊业务包括热迁移虚拟机、虚拟机主机容灾、虚拟化SAN存储心跳检测等。

系统接口故障点分析,网口绑定异常业务管理接口异常存储接口异常,故障点,可能的故障原因网络异常主机异常VRM异常,排除网络故障修复主机修复VRM,排除故障,第页,系统接口涉及到底层网络硬件,主机和VRM节点,排除故障时可自顶向下快速定位故障层次,然后再自底向上逐步排除故障点。

系统接口故障案例-删除存储接口路由导致异常,收集信息,删除存储接口路由后,提示存储链路中断,关联虚拟机不能使用,定位故障,主机与存储设备通过三层网络连接,主机的存储接口和存储设备的存储IP地址不在同一网段,需要设置静态路由,使存储平面能够互通,排除故障,登录主机为主机存储接口配置静态路由,检查确认,告警消失业务正常,第页,目录维护管理故障处理主机和集群故障处理存储故障处理网络故障处理虚拟机和模板故障处理,第页,存储资源池配置流程,FusionCompute存储池的故障处理,可以参考该流程顺序进行检查。

存储池可能会涉及到如下关键故障点:

存储资源故障存储设备故障数据存储故障虚拟磁盘故障,添加站点的存储资源,判断存储设备类型,AdvancedSANFusionstorage,向主机关联存储资源,扫描存储设备添加数据存储创建磁盘,NASFC/IPSAN,第页,本地存储,存储资源池故障点,不能添加、修改、,删存除储存资储资源源故障,不能关联存储资源,存储设备故障扫描不到存储设备,添加、修改、移除数据存储异常数据存储故障关联、解关联主机异常,数据存储异常,创建、绑定、解,绑定、删除虚拟,虚磁拟盘磁异常盘故障,调整容量异常,快照异常,迁移异常,第页,存储资源、存储设备故障点分析,不能添加、修改、删除存储资源不能关联存储资源扫描不到存储设备,故障点,可能的故障原因存储网络链路异常对端存储设备异常主机存储接口异常,排除存储网络链路故障排除对端存储设备故障修复主机存储接口配置,排除故障,第页,FusionCompute存储资源、存储设备故障涉及到对端存储设备配置,存储链路,存储接口等,需要逐步排错。

存储资源故障案例-存储资源管理链路中断,收集信息,FusionCompute上报告警信息:

存储资源管理链路中断,定位故障,网络异常存储资源网口故障,排除故障,查看故障的存储资源的名称及出现故障的存储资源管理IP登录VRM节点查看VRM与故障的管理链路的IP能否正常通信网络排查、修复,检查确认,告警消失业务正常,第页,数据存储故障点分析,不能添加、修改、移除数据存储关联、解关联主机异常数据存储异常,故障点,可能的故障原因存储网络故障虚拟化的本地存储文件系统损坏对应存储设备损坏,排除存储网络故障修复文件系统损坏修复磁盘损坏,排除故障,第页,FusionCompute数据存储涉及到虚拟化和非虚拟化数据存储,也就是文件系统和块存储,需要重点关注这两类故障。

数据存储故障案例-VIMS文件系统损坏,收集信息,共享存储的VIMS文件系统损坏,定位故障,系统文件元数据损坏或用户文件元数据损坏超级块损坏或文件系统根目录损坏,排除故障,停止故障存储设备上的业务运行fsck修复只读卷恢复故障存储设备上的业务运行,检查确认,告警消失业务正常,第页,虚拟磁盘故障点分析,不能创建、绑定、解绑定、删除虚拟磁盘调整容量异常快照异常磁盘迁移异常,故障点,可能的故障原因数据存储异常磁盘类型限制磁盘配置模式限制虚拟机状态限制,修复数据存储更改磁盘类型更改磁盘配置模式更改虚拟机状态,排除故障,第页,FusionCompute上的虚拟机,如果绑定的虚拟磁盘出现故障,会影响到业务和数据,故障排除时需提前备份数据。

虚拟磁盘故障案例-磁盘无法在线扩容,收集信息,虚拟机磁盘不能在线扩容,定位故障,磁盘所属的数据存储类型不支持扩容磁盘配置模式不支持在线扩容虚拟机操作系统不支持在线扩容,排除故障,迁移磁盘到支持扩容的数据存储上更改磁盘配置模式重启虚拟机,检查确认,磁盘扩容成功,业务正常,第页,目录维护管理故障处理主机和集群故障处理存储故障处理网络故障处理虚拟机和模板故障处理,第页,网络池创建流程,FusionCompute网络池的故障处理,可以参考该流程顺序进行检查。

网络池可能会涉及到如下关键故障点:

分布式交换机故障上行链路故障VLAN池故障子网故障端口组故障因网络池的各个组件关联紧密,可以统一概括成如下故障:

虚拟机之间通讯故障虚拟机和外部网络通讯故障,创建分布式交换机,已有可用的分布式交换机?

否,添加上行链路,添加VLAN池(可选),添加子网(可选),配置VTEP(可选),是,创建端口组,第页,虚拟机之间通讯故障,同一主机上,虚拟机之间通讯故障不同主机上,虚拟机之间通讯故障,故障点,端口组可配能置异的常故障原因分布式交换机配置异常VLAN池配置异常子网配置异常,修复端口组配置修复分布式交换机配置修复VLAN池配置修复子网配置,排除故障,第页,虚拟机可能分别属于不同分布式交换机,归属于不同端口组,使用不同上行链路,需要逐一进行故障排除。

虚拟机之间通讯故障案例-两台虚拟机无法通讯,收集信息,同一主机上的两台虚拟机无法通讯,定位故障,虚拟机自身网络异常虚拟机所属的端口组不同虚拟机所属的分布式交换机不同,排除故障,修复故障虚拟机自身网络配置更改故障虚拟机所属端口组检查所属的分布式交换机,检查确认,网络正常,业务正常,第页,虚拟机和外部网络通讯故障,虚拟机不能访问外部网络虚拟机访问外部网络慢,故障点,可能的故障原因上行链路异常主机网络服务异常外部交换机配置异常硬件故障,修复上行链路修复主机网络服务修复外部交换机配置排除硬件故障,排除故障,第页,虚拟机和外部网络通讯涉及到底层主机、网卡、外部交换机等,需要逐一进行故障排除。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1