华为 eSight 服务器设备管理软件 技术白皮书.docx

上传人:b****5 文档编号:7025162 上传时间:2023-01-16 格式:DOCX 页数:16 大小:763.84KB
下载 相关 举报
华为 eSight 服务器设备管理软件 技术白皮书.docx_第1页
第1页 / 共16页
华为 eSight 服务器设备管理软件 技术白皮书.docx_第2页
第2页 / 共16页
华为 eSight 服务器设备管理软件 技术白皮书.docx_第3页
第3页 / 共16页
华为 eSight 服务器设备管理软件 技术白皮书.docx_第4页
第4页 / 共16页
华为 eSight 服务器设备管理软件 技术白皮书.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

华为 eSight 服务器设备管理软件 技术白皮书.docx

《华为 eSight 服务器设备管理软件 技术白皮书.docx》由会员分享,可在线阅读,更多相关《华为 eSight 服务器设备管理软件 技术白皮书.docx(16页珍藏版)》请在冰豆网上搜索。

华为 eSight 服务器设备管理软件 技术白皮书.docx

华为eSight服务器设备管理软件技术白皮书

华为eSight

服务器管理技术白皮书

文档版本

01

发布日期

2016-03-30

华为技术有限公司

1执行摘要

服务器设备作为IT基础设施,企业用户都会涉及到服务器设备的维护。

随着企业对计算需求的逐渐扩大,服务器需求量的增加,为保证整个系统的可靠性运行,对服务器的管理越来越复杂,服务器管理面临的挑战:

●服务器数量大、种类多

●服务器故障后恢复时间长

●服务器配置部署复杂耗时

●服务器升级耗时耗力

单纯凭某个工具或某个人,已经不能胜任如此大的工作量和满足业务紧迫性的要求,必须有一套完整的服务器管理解决方案。

eSight系统是华为公司全新推出的一套企业ICT设备管理解决方案,eSightServer作为eSight解决方案的一个组件,实现服务器生命周期管理,提高运维效率,降低运维成本。

2产品简介

2.1概述

针对企业客户的诉求,eSight引入组件化、WEB化等关键技术,统一的告警和性能管理等全网状态监控和恢复手段,以及丰富的可选业务组件,帮助用户搭建最适合企业特点的、简单易用的运维环境,只需要一套管理软件,实现全网ICT设备的轻松管理。

图2-1eSight服务器管理方案

2.2关键技术特性

全面监控设备状态,把控业务全局

服务器基础组件包含了服务器设备基本的管理监控能力,实现服务器硬件状态、性能的全面监控,及时快速发现故障设备。

批量化配置部署,缩短上线周期

批量配置部署功能提供了批量配置、批量部署业务系统的能力,提升服务器初始化安装部署的效率。

实现设备即插即用,提升运维效率

无状态计算通过硬件属性、配置抽象的手段,实现硬件配置灵活的变更,提升了故障设备更换,服务器扩容的效率。

固件版本管理提供对服务器固件批量升级的能力,提升服务器固件版本升级的效率。

多厂商设备集成,实现全网设备统一管理

全面支持第三方服务器设备的集成和管理,支持用户在界面上对第三方设备的基本信息,告警,性能,进行定制。

支持分级网管部署

eSight服务器管理组件支持分级网管部署方式,通过建立分级的层次化网管系统,分散了大规模网络的管理压力,突破了单网管站点的资源管理能力和性能限制。

3产品功能

3.1服务器资源管理

3.1.1服务器接入

eSightServer提供以下几种设备接入方式:

●单个添加,配置设备基本信息,将单个设备手工添加到管理系统。

●自动发现,搜索某一IP网段内的设备,自动批量增加到管理系统。

●批量导入,将设备的关键信息编辑到模板中,实现批量导入到管理系统。

●自动检测,当被管理设备进入管理网络中,会主动寻找管理系统,并请求被管理。

服务器类型

设备接入方式

接入协议

单个添加

自动发现

批量导入

自动检测

刀片服务器 

支持

支持

支持

E9000

SNMP

机架服务器

支持

支持

支持

RH1288V3/RH2288V3/RH2288HV3/5288V3/RH5885V3C10/RH5585HV3/RH8100V3

SNMP

存储型服务器

支持

支持

支持

不支持

IPMI

高密度服务器

支持

支持

支持

X6800

SNMP+IPMI

第三方服务器

支持

支持

支持

不支持

SNMP+IPMI

3.1.2服务器状态

eSight服务器管理组件提供对服务器的运行状态、部件状态进行监控。

●静态信息监控

对华为服务器静态信息进行监控,具体信息包括:

1.基本信息:

名称、IP地址、在线状态、健康状态、类型、型号、描述、信息刷新时间等2.服务器部件信息:

电源、风扇、CPU、内存、硬盘、主板、交换板等

●状态监控

对华为服务器动态信息进行监控,界面上的部件状态支持自动刷新,具体信息如下表:

表3-1状态监控

是否支持

设备类型

整机

CPU

内存

磁盘

风扇

电源

交换设备

机架服务器

/

刀片服务器

高密度服务器

/

存储型服务器

--

--

--

--

--

/

●设备面板图展示

支持华为全系服务器面板状态监控,可动态实时显示设备健康状态。

图3-2刀片服务器前视图

图3-3刀片服务器后视图

3.1.3服务器资产信息导出

eSight支持对服务器、CPU、内存、硬盘、网卡等信息的资产导出功能,方便用户及时查询了解硬件资产信息;

为了提供导出效率,目前服务器的信息保存在内存中,导出的时候直接从内存进行读取,导出字段如下标所示:

表3-1资产导出内容

RH1288V3-188.10.5.170

设备名称

设备状态

设备类型

 --

RH1288V3-188.10.5.170

正常

机架服务器

 --

IP地址

序列号

资产标签

 --

188.10.5.170

RH1288V3CCCCC

 --

 --

主板信息

序列号

部件号

生产厂商

 --

201411061550

 --

HuaweiTechnologiesCo.,Ltd.

 --

CPU信息

个数

型号

生产厂商

频率

2

Intel(R)Xeon(R)CPUE5-2620v3@2.40GHz

Intel(R)Corporation

2400MHz

内存信息

个数

生产厂商

容量

频率

15

 --

 --

 --

1

Micron

8192MB

2133MHz

3.2服务器监控管理

3.2.1性能管理

eSight服务器管理组件通过性能数据采集、实时资源监控、历史性能分析、可视化展示等功能,帮助IT人员分析和预测业务资源瓶颈,有效评估资源利用率、业务运行效率等,优化设备性能、配置等,提高IT系统的生产资料价值,提升商业竞争力。

●化繁为简的性能监控,协助运维人员提前有序的规避系统故障,使其无需花费大量的时间和精力在设备故障的排查上,提供统计分析能力,提升维护效率。

●可视化曲线图方式的实时性能、历史性能展示、直观的性能数据文件(csv)导出,满足用户不同数据查看和统计需求。

●用户定制化的采集周期,用户可以根据不同设备的配置需求,设置不同的采集周期,以满足对性能数据的分析需求。

性能管理通过以下几个模块,提供性能管理的整体方案,通过收集和展示设备上的各种性能指标可直观的了解设备的运行健康情况,对设备部署及业务的调整提供可信的决策依据:

●预置性能采集模板:

创建性能采集任务时直接加载,可以快速设置指定设备的采集指标。

●基于任务管理:

以任务方式自由,灵活的采集性能数据。

设备的指标被采集后,就能查看到该设备的此项历史性能数据。

●性能指标监控:

及时发现并上报业务资源性能阈值告警。

●查看历史性能数据:

可视化图表方式展示历史性能趋势,提供上层决策依据

表3-1服务器设备性能指标支持列表

对象

性能指标

电源

功率

内存

占用率、可用物理内存容量

CPU

占用率

硬盘

使用容量、占用率

网口

发送包速、接收包速、流入流速、流出流速、接收包出错率、发送包出错率

3.2.2告警管理

概述

eSight服务器管理组件提供了统一快速的告警管理机制,帮助用户快速定位故障、解决和恢复故障,降低设备异常概率,提高设备的可靠性。

eSight服务器管理组件实现告警集中监控,支持以界面实时刷新、短信、邮件、声音等远程通知方式,及时通知到设备维护人员,恢复网络正常运行。

图3-1告警定位分析处理流程

eSight服务器管理组件能够监控服务器全面的、精细的硬件告警信息以及管理系统自身的告警信息。

这些告警信息包括但不限于:

CPU硬件故障、超温故障、主板电压故障、散热风扇故障、系统电源故障、总线故障、内存故障、硬盘故障、系统运行故障、设备管理板故障、交换板部分故障、设备离线告警、性能阈值告警、网管性能告警等。

同时eSight服务器管理组件还能够集中监控硬盘SMART告警信息,硬盘作为主要的数据存储单元,一旦出现硬件故障,对用户数据安全造成的影响非常大,硬盘SMART信息是重要的硬盘预警手段。

eSight服务器管理组件为了方便用户统一的、集中的管理告警,提供了丰富的告警管理功能:

●便捷的告警信息查看与检索:

用户自定义告警过滤、告警刷新、告警按照属性排序、级别重定义等功能,满足不同场景下的个性化需求;

●告警归并:

自动实现重复告警归并,从而简化重复告警处理流程;

●多种远程通知方式:

支持邮件、短信、声光(告警箱)等,满足用户不同的告警通知需求,保证故障处理的实时有效性;

●告警经验库:

告警管理提供告警屏蔽、维护经验库等功能,提高告警处理的准确性和效率;

●其他特性:

告警统计、告警导出、告警删除、告警转储;

3.2.3拓扑管理

拓扑图展示网元、子网和链路的布局以及状态,便于IT人员了解网络拓扑结构,实时监控网络运行状态,拓扑图会根据接入的设备进行自动更新。

图3-1拓扑图

3.3服务器业务管理

3.3.1配置部署

eSight提供了批量配置部署功能,用于协助管理人员解决重复,且繁琐的服务器配置工作,提高管理效率,简化管理工作。

主要从以下几个方面来进行优化配置部署工作:

1.提供可视化的配置管理操作。

2.批量的配置操作。

3.可复制的高效的模板配置。

4.基于任务的配置管理。

表3-1支持配置部署类型

类型

描述

上下电配置

提供服务器设备批量上电、下电、重启操作。

BIOS配置

提供服务器设备系统启动选项的配置功能,满足用户对系统从不同介质启动的需求。

网口配置

提供服务器设备管理网口的批量配置,可方便管理人员进行网络的规划和修改调整。

RAID配置

提供服务器设备批量的RAID配置操作,方便管理人员根据实际的需求进行RAID配置规划和修改,简化了RAID配置过程,提高了配置效率。

OS批量安装

基于ServiceCD工具,提供批量安装OS和硬盘分区功能,简化OS安装流程,提供统一的、无人值守的OS安装功能,极大简化了OS安装过程,提高了OS安装效率,降低了维护成本,该流程较复杂,在下面详细描述。

应用程序安装

该任务用于分发或安装应用软件。

HBA配置

该任务在服务器和存储设备间提供I/O处理和物理连接。

CNA配置

该任务使用网口在服务器和存储设备间提供I/O处理和物理连接。

iBMC配置

该任务用于定义网元的BMC配置。

交换板配置

交换板配置主要负责对交换板批量配置,并支持多种配置的组合,它主要实现以下能力:

●堆叠配置

支持两个交换板间创建堆叠,接口加入堆叠,删除堆叠,支持批量配置。

●VLAN配置

支持创建单个、批量VLAN,删除单个、批量VLAN。

●自定义配置

可以创建自定义模板进行配置,用户输入要配置的命令,直接对设备下发配置,支持批量配置。

●支持不同种配置同时下发。

支持多种模板组合进行同时下发到多个设备,支持批量配置。

3.3.2批量固件升级

支持批量升级服务器固件版本包括:

iBMC、BIOS、RAID、CNA、MM、CPLD、LCD、PCIeSSD、NVDIMM、IB网卡等;从而大幅节约人力和差旅费用、提升维护工作效率、降低服务成本,同时缩短升级周期,快速给客户带来新业务体验,提升竞争力。

图3-1批量升级和传统升级对比

固件升级特性仅仅支持华为服务器,对于第三方服务器和存储型服务器都不支持。

3.3.3无状态计算

eSight无状态计算技术基于华为无状态计算技术,从数据中心的运维场景出发,具备多框/跨框使用功能,提供配置保持、配置迁移、离线配置、配置复制、配置导入/导出、配置自动生成模板的功能,解决用户设备更换、设备迁移、快速配置等运维场景中常见的复杂的计算属性的配置管理问题,提高操作的便捷性,简易、快速、高效的完成数据中心计算的设备维护,实现设备维护时设备的“无状态”,做到即插即用,简化管理和降低运维成本。

配置属性

图3-1配置属性

Profile配置属性包含:

计算资源属性配置(UUID)、HBA(WWN等配置属性)、CNA(MAC地址/WWN,网卡PF数,PF带宽,PFVLAN、SANboot等配置属性)、RAID(RAID组配置)、BIOS(系统启动顺序、IPMI属性、串口等相关配置属性)。

用户价值

无状态计算功能通过,抽取服务器、网络设备、存储设备的硬件属性信息统一管理、自动配置,屏蔽硬件差异对系统的影响。

在硬件出现故障或者业务迁移需要时,快速恢复系统的运行,节省传统硬件更换所需的时间,极大减少了系统的宕机时间。

2.配置保持:

用户不需为更换硬件而进行重新的硬件配置。

当一个计算节点故障,无法正常运行业务时,eSight提供计算节点的直接更换,原配置自动下发到更换后的计算节点上,无需手动重新配置功能。

3.配置迁移:

用户业务部署的位置迁移不需重新配置硬件。

因业务迁移需要,eSight提供计算节点的配置快速迁移功能,以支撑业务的迁移需求,而无需重新手动配置迁移后的计算节点。

4.离线配置:

用户配置需要,提供预分配profile给离线的计算节点功能。

因配置场景需要,eSight提供计算节点基于槽位号的离线配置功能,预分配配置属性profile给一个未插入计算节点的槽位号,一旦槽位号中插入物理计算节点,则该物理计算节点会自动拥有该profile的配置属性,无需手动配置。

5.配置复制:

用户因多种不同的业务配置需求,需要快速配置。

用户因不同的业务配置需求,需要相似的配置时,可通过配置复制和修

改的方式快速的配置。

6.跨框配置迁移:

eSight提供跨框的计算节点可以进行配置迁移、配置复制的功能,方便用户进行多框设备的无状态计算功能。

7.配置自动迁移(Failover):

实现了将服务器的硬件与配置信息分离,当设备出现故障时,自动迁移其配置信息至与之相配的服务器上,主动激活继续运行业务。

应用场景举例

图3-1典型应用-服务器更换

eSightServer支持无状态计算特性,无状态计算将服务器的硬件配置抽象为文件的形式,并支持这些配置文件的灵活调度。

设备更换时,eSight服务器管理组件会将故障设备的配置完全保留下来,当新设备替换后,配置将加载到新的服务器设备中,快速完成设备更换

A缩略语

B

BIOS

BasicInputOutputSystem

基本输入输出系统

C

CPLD

ComplexProgrammableLogicalDevice

复杂可编程逻辑器件

D

DHCP

DynamicHostConfigurationProtocol

动态主机配置协议

I

iBMC

BaseboardManagementController

基板管理控制器

K

KVM

Key,video,mouse

远程视频键盘鼠标

M

MM

ManagementModule

管理模块

N

NVDIMM

Non-volatileDualIn-lineMemoryModule

非易失性双列直插内存模块

P

PCIe

PCIExpress

PCIexpress标准

R

RAID

RedundantArrayofIndependentDisks

独立磁盘冗余阵列

S

SSD

SolidStateDisk

固态硬盘

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1