华为 eSight 服务器设备管理软件 技术白皮书文档格式.docx
《华为 eSight 服务器设备管理软件 技术白皮书文档格式.docx》由会员分享,可在线阅读,更多相关《华为 eSight 服务器设备管理软件 技术白皮书文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
固件版本管理提供对服务器固件批量升级的能力,提升服务器固件版本升级的效率。
多厂商设备集成,实现全网设备统一管理
全面支持第三方服务器设备的集成和管理,支持用户在界面上对第三方设备的基本信息,告警,性能,进行定制。
支持分级网管部署
eSight服务器管理组件支持分级网管部署方式,通过建立分级的层次化网管系统,分散了大规模网络的管理压力,突破了单网管站点的资源管理能力和性能限制。
3产品功能
3.1服务器资源管理
3.1.1服务器接入
eSightServer提供以下几种设备接入方式:
●单个添加,配置设备基本信息,将单个设备手工添加到管理系统。
●自动发现,搜索某一IP网段内的设备,自动批量增加到管理系统。
●批量导入,将设备的关键信息编辑到模板中,实现批量导入到管理系统。
●自动检测,当被管理设备进入管理网络中,会主动寻找管理系统,并请求被管理。
服务器类型
设备接入方式
接入协议
单个添加
自动发现
批量导入
自动检测
刀片服务器
支持
E9000
SNMP
机架服务器
RH1288V3/RH2288V3/RH2288HV3/5288V3/RH5885V3C10/RH5585HV3/RH8100V3
存储型服务器
不支持
IPMI
高密度服务器
X6800
SNMP+IPMI
第三方服务器
3.1.2服务器状态
eSight服务器管理组件提供对服务器的运行状态、部件状态进行监控。
●静态信息监控
对华为服务器静态信息进行监控,具体信息包括:
1.基本信息:
名称、IP地址、在线状态、健康状态、类型、型号、描述、信息刷新时间等2.服务器部件信息:
电源、风扇、CPU、内存、硬盘、主板、交换板等
●状态监控
对华为服务器动态信息进行监控,界面上的部件状态支持自动刷新,具体信息如下表:
表3-1状态监控
是否支持
设备类型
整机
CPU
内存
磁盘
风扇
电源
交换设备
√
/
刀片服务器
--
●设备面板图展示
支持华为全系服务器面板状态监控,可动态实时显示设备健康状态。
图3-2刀片服务器前视图
图3-3刀片服务器后视图
3.1.3服务器资产信息导出
eSight支持对服务器、CPU、内存、硬盘、网卡等信息的资产导出功能,方便用户及时查询了解硬件资产信息;
为了提供导出效率,目前服务器的信息保存在内存中,导出的时候直接从内存进行读取,导出字段如下标所示:
表3-1资产导出内容
RH1288V3-188.10.5.170
设备名称
设备状态
--
正常
IP地址
序列号
资产标签
188.10.5.170
RH1288V3CCCCC
主板信息
部件号
生产厂商
201411061550
HuaweiTechnologiesCo.,Ltd.
CPU信息
个数
型号
频率
2
Intel(R)Xeon(R)CPUE5-2620v3@2.40GHz
Intel(R)Corporation
2400MHz
内存信息
容量
15
1
Micron
8192MB
2133MHz
3.2服务器监控管理
3.2.1性能管理
eSight服务器管理组件通过性能数据采集、实时资源监控、历史性能分析、可视化展示等功能,帮助IT人员分析和预测业务资源瓶颈,有效评估资源利用率、业务运行效率等,优化设备性能、配置等,提高IT系统的生产资料价值,提升商业竞争力。
●化繁为简的性能监控,协助运维人员提前有序的规避系统故障,使其无需花费大量的时间和精力在设备故障的排查上,提供统计分析能力,提升维护效率。
●可视化曲线图方式的实时性能、历史性能展示、直观的性能数据文件(csv)导出,满足用户不同数据查看和统计需求。
●用户定制化的采集周期,用户可以根据不同设备的配置需求,设置不同的采集周期,以满足对性能数据的分析需求。
性能管理通过以下几个模块,提供性能管理的整体方案,通过收集和展示设备上的各种性能指标可直观的了解设备的运行健康情况,对设备部署及业务的调整提供可信的决策依据:
●预置性能采集模板:
创建性能采集任务时直接加载,可以快速设置指定设备的采集指标。
●基于任务管理:
以任务方式自由,灵活的采集性能数据。
设备的指标被采集后,就能查看到该设备的此项历史性能数据。
●性能指标监控:
及时发现并上报业务资源性能阈值告警。
●查看历史性能数据:
可视化图表方式展示历史性能趋势,提供上层决策依据
表3-1服务器设备性能指标支持列表
对象
性能指标
功率
占用率、可用物理内存容量
占用率
硬盘
使用容量、占用率
网口
发送包速、接收包速、流入流速、流出流速、接收包出错率、发送包出错率
3.2.2告警管理
概述
eSight服务器管理组件提供了统一快速的告警管理机制,帮助用户快速定位故障、解决和恢复故障,降低设备异常概率,提高设备的可靠性。
eSight服务器管理组件实现告警集中监控,支持以界面实时刷新、短信、邮件、声音等远程通知方式,及时通知到设备维护人员,恢复网络正常运行。
图3-1告警定位分析处理流程
eSight服务器管理组件能够监控服务器全面的、精细的硬件告警信息以及管理系统自身的告警信息。
这些告警信息包括但不限于:
CPU硬件故障、超温故障、主板电压故障、散热风扇故障、系统电源故障、总线故障、内存故障、硬盘故障、系统运行故障、设备管理板故障、交换板部分故障、设备离线告警、性能阈值告警、网管性能告警等。
同时eSight服务器管理组件还能够集中监控硬盘SMART告警信息,硬盘作为主要的数据存储单元,一旦出现硬件故障,对用户数据安全造成的影响非常大,硬盘SMART信息是重要的硬盘预警手段。
eSight服务器管理组件为了方便用户统一的、集中的管理告警,提供了丰富的告警管理功能:
●便捷的告警信息查看与检索:
用户自定义告警过滤、告警刷新、告警按照属性排序、级别重定义等功能,满足不同场景下的个性化需求;
●告警归并:
自动实现重复告警归并,从而简化重复告警处理流程;
●多种远程通知方式:
支持邮件、短信、声光(告警箱)等,满足用户不同的告警通知需求,保证故障处理的实时有效性;
●告警经验库:
告警管理提供告警屏蔽、维护经验库等功能,提高告警处理的准确性和效率;
●其他特性:
告警统计、告警导出、告警删除、告警转储;
3.2.3拓扑管理
拓扑图展示网元、子网和链路的布局以及状态,便于IT人员了解网络拓扑结构,实时监控网络运行状态,拓扑图会根据接入的设备进行自动更新。
图3-1拓扑图
3.3服务器业务管理
3.3.1配置部署
eSight提供了批量配置部署功能,用于协助管理人员解决重复,且繁琐的服务器配置工作,提高管理效率,简化管理工作。
主要从以下几个方面来进行优化配置部署工作:
1.提供可视化的配置管理操作。
2.批量的配置操作。
3.可复制的高效的模板配置。
4.基于任务的配置管理。
表3-1支持配置部署类型
类型
描述
上下电配置
提供服务器设备批量上电、下电、重启操作。
BIOS配置
提供服务器设备系统启动选项的配置功能,满足用户对系统从不同介质启动的需求。
网口配置
提供服务器设备管理网口的批量配置,可方便管理人员进行网络的规划和修改调整。
RAID配置
提供服务器设备批量的RAID配置操作,方便管理人员根据实际的需求进行RAID配置规划和修改,简化了RAID配置过程,提高了配置效率。
OS批量安装
基于ServiceCD工具,提供批量安装OS和硬盘分区功能,简化OS安装流程,提供统一的、无人值守的OS安装功能,极大简化了OS安装过程,提高了OS安装效率,降低了维护成本,该流程较复杂,在下面详细描述。
应用程序安装
该任务用于分发或安装应用软件。
HBA配置
该任务在服务器和存储设备间提供I/O处理和物理连接。
CNA配置
该任务使用网口在服务器和存储设备间提供I/O处理和物理连接。
iBMC配置
该任务用于定义网元的BMC配置。
交换板配置
交换板配置主要负责对交换板批量配置,并支持多种配置的组合,它主要实现以下能力:
●堆叠配置
支持两个交换板间创建堆叠,接口加入堆叠,删除堆叠,支持批量配置。
●VLAN配置
支持创建单个、批量VLAN,删除单个、批量VLAN。
●自定义配置
可以创建自定义模板进行配置,用户输入要配置的命令,直接对设备下发配置,支持批量配置。
●支持不同种配置同时下发。
支持多种模板组合进行同时下发到多个设备,支持批量配置。
3.3.2批量固件升级
支持批量升级服务器固件版本包括:
iBMC、BIOS、RAID、CNA、MM、CPLD、LCD、PCIeSSD、NVDIMM、IB网卡等;
从而大幅节约人力和差旅费用、提升维护工作效率、降低服务成本,同时缩短升级周期,快速给客户带来新业务体验,提升竞争力。
图3-1批量升级和传统升级对比
固件升级特性仅仅支持华为服务器,对于第三方服务器和存储型服务器都不支持。
3.3.3无状态计算
eSight无状态计算技术基于华为无状态计算技术,从数据中心的运维场景出发,具备多框/跨框使用功能,提供配置保持、配置迁移、离线配置、配置复制、配置导入/导出、配置自动生成模板的功能,解决用户设备更换、设备迁移、快速配置等运维场景中常见的复杂的计算属性的配置管理问题,提高操作的便捷性,简易、快速、高效的完成数据中心计算的设备维护,实现设备维护时设备的“无状态”,做到即插即用,简化管理和降低运维成本。
配置属性
图3-1配置属性
Profile配置属性包含:
计算资源属性配置(UUID)、HBA(WWN等配置属性)、CNA(MAC地址/WWN,网卡PF数,PF带宽,PFVLAN、SANboot等配置属性)、RAID(RAID组配置)、BIOS(系统启动顺序、IPMI属性、串口等相关配置属性)。
用户价值
无状态计算功能通过,抽取服务器、网络设备、存储设备的硬件属性信息统一管理、自动配置,屏蔽硬件差异对系统的影响。
在硬件出现故障或者业务迁移需要时,快速恢复系统的运行,节省传统硬件更换所需的时间,极大减少了系统的宕机时间。
2.配置保持:
用户不需为更换硬件而进行重新的硬件配置。
当一个计算节点故障,无法正常运行业务时,eSight提供计算节点的直接更换,原配置自动下发到更换后的计算节点上,无需手动重新配置功能。
3.配置迁移:
用户业务部署的位置迁移不需重新配置硬件。
因业务迁移需要,eSight提供计算节点的配置快速迁移功能,以支撑业务的迁移需求,而无需重新手动配置迁移后的计算节点。
4.离线配置:
用户配置需要,提供预分配profile给离线的计算节点功能。
因配置场景需要,eSight提供计算节点基于槽位号的离线配置功能,预分配配置属性profile给一个未插入计算节点的槽位号,一旦槽位号中插入物理计算节点,则该物理计算节点会自动拥有该profile的配置属性,无需手动配置。
5.配置复制:
用户因多种不同的业务配置需求,需要快速配置。
用户因不同的业务配置需求,需要相似的配置时,可通过配置复制和修
改的方式快速的配置。
6.跨框配置迁移:
eSight提供跨框的计算节点可以进行配置迁移、配置复制的功能,方便用户进行多框设备的无状态计算功能。
7.配置自动迁移(Failover):
实现了将服务器的硬件与配置信息分离,当设备出现故障时,自动迁移其配置信息至与之相配的服务器上,主动激活继续运行业务。
应用场景举例
图3-1典型应用-服务器更换
eSightServer支持无状态计算特性,无状态计算将服务器的硬件配置抽象为文件的形式,并支持这些配置文件的灵活调度。
设备更换时,eSight服务器管理组件会将故障设备的配置完全保留下来,当新设备替换后,配置将加载到新的服务器设备中,快速完成设备更换
A缩略语
B
BIOS
BasicInputOutputSystem
基本输入输出系统
C
CPLD
ComplexProgrammableLogicalDevice
复杂可编程逻辑器件
D
DHCP
DynamicHostConfigurationProtocol
动态主机配置协议
I
iBMC
BaseboardManagementController
基板管理控制器
K
KVM
Key,video,mouse
远程视频键盘鼠标
M
MM
ManagementModule
管理模块
N
NVDIMM
Non-volatileDualIn-lineMemoryModule
非易失性双列直插内存模块
P
PCIe
PCIExpress
PCIexpress标准
R
RAID
RedundantArrayofIndependentDisks
独立磁盘冗余阵列
S
SSD
SolidStateDisk
固态硬盘