HACMP教材.docx - 冰豆网

资源描述

HACMP教材.docx

《HACMP教材.docx》由会员分享，可在线阅读，更多相关《HACMP教材.docx（56页珍藏版）》请在冰豆网上搜索。

HACMP教材.docx

HACMP教材

HACMPforAIX

原理、设计及实现

联想集成系统有限公司

前言3

第一章HACMP的概念和原理4

§1.1HACMP简介5

§1.2HACMP中术语的定义6

§1.3HACMP群集的硬件组成7

§1.4AIX与HACMP10

§1.5HACMP群集的软件结构11

§1.6HACMP群集资源12

§1.7建立高可用系统――避免单点故障15

第二章HACMP群集的设计21

§2.1高可用性设计要点21

§2.2存储系统设计21

§2.3LVM组件设计30

§2.4HACMPforAIX的网络设计31

§2.5群集结构的设计36

§2.6应用的设计42

第三章HACMP群集的实现43

§3.1准备AIX44

§3.2安装HACMP51

§3.3配置HACMP52

第四章HACMP群集的管理57

§4.1群集的启动57

§4.2群集的停止58

§4.3群集的监视59

§4.4群集的测试60

附录AHACMP和数据库61

附录BHACMP与同类产品的比较64

前言

传统概念里，关键性任务的计算一直是大型主机的专有领域。

主机能够提供关键性任务所必须的很高的交易速度、非常好的系统可用性和鲁棒的系统管理功能。

随着UNIX系统的发展和普及，关键性任务对主机的依赖程度也在逐渐减弱，越来越多的企业将他们的关键性任务应用从专有的主机系统迁移至基于UNIX平台上来。

这种转变主要基于以下一些因素：

Client/Server模式的高效率和扩展性、开放标准的出现、UNIX平台上交易处理能力的增强和基于RISC技术的处理器的性能/价格比的提高。

IBM公司的HACMPforAIX软件是业界领先的，建立UNIX平台上关键性任务计算环境的工具软件。

HACMPforAIX软件能够保证关键性资源的高可用性。

本文主要讨论HACMPforAIX的原理、规划、配置、管理和其它一些相关内容，并根据自己的实践提出了在规划和配置HACMP时的一些经验和建议，希望能够对大家有所帮助。

本文的第一章主要介绍HACMP的基本概念和工作原理，第二章主要介绍HACMP高可用群集的设计，第三章介绍HACMP群集的配置和实现，第四章主要介绍HACMP群集的管理。

本文的附录A介绍了HACMP和主要数据库产品配合时的各种配置。

附录B介绍UNIX平台主流高可用产品的比较。

文中用到的命令用加黑的斜体字表示，如：

fsck

文中用到的SMIT路径用黑体字表示，如：

smitdevices

带下划线的正文文字代表应引起注意的事项。

因本人水平所限，文中难免会有错误或介绍不详之处，希望大家批评指正，并多提宝贵意见。

第一章

HACMP的概念和原理

在今天竞争激烈的全球市场中，从金融、电信、医疗到零售、运输、制造的各个企业都必须保证关键性业务的信息和数据的可用性，而且通常是一天24小时，一年365天。

各个企业必须始终如一地、正确地根据用户的要求提供银行往来金额、投资资金、医疗记录、测试结果和其它许多关键服务，而成功提供这些服务的关键是依靠信息技术的可用性。

由ContingencyPlanningResearch提供的最新研究结果表明，平均每小时的宕机时间会导致上百万美元的损失。

更重要的是，当因为意料之外的系统故障而丢失他们的数据之后，50%的公司没有再重新开门，90%的公司则歇业两年。

因此，要保证业务的连续性，就必须尽可能减少会导致信息和应用不可用的系统宕机时间，从而减小对用户服务的影响。

关键业务的连续性可以通过以下三个层次的方法实现：

磁带备份

磁带备份是实现基本的业务连续的通用方法。

信息先备份到磁带上，然后送到另外的地点保存。

这种方法的问题在于磁带备份往往需要较长的时间来记录数据。

另外，在数据备份过程中或者做数据备份前的系统或环境故障很可能造成数据丢失。

而且，从备份磁带上恢复数据也需要很长的时间，数据存储得越多，恢复的时间越长。

高可用系统

高可用系统一般是在一个地点，通过高可用软件将一组服务器连接在一起，组成一个群集。

IBM的HACMPforAIX和HP的MC/ServiceGuard就是这样的群集产品，通过快速地将用户、应用和数据从发生硬件或软件故障的机器切换至其它机器来提供高可用计算环境。

容错系统

容错系统依赖于冗余的硬件设备和软件来实现关键业务的连续性。

虽然容错系统是避免宕机和数据丢失的有效方法，但是购买、操作和维护容错系统都是非常昂贵的。

另外，系统的升级也需要很大的代价。

用户可以根据自己的应用情况选择适合自己的方法实现关键业务的连续性。

§1.1HACMP简介

IBM公司的HACMPforAIX软件是基于AIX平台的，在高可用系统层次实现关键性任务计算环境的工具软件。

HACMP应用于RS/6000系列的单处理器机型、对称多处理器机型或SP的节点，可以检测系统故障并快速恢复服务，使最终用户只感受到很小的中断时间。

HACMP（HighAvailabilityClusterMulti-Processing）有两个主要的组成部分：

高可用技术（HA）和群集多处理技术（CMP）。

高可用技术

在HA产品出现之前，在UNIX领域实现高可用性的最有效途径是通过容错技术。

容错技术依靠专门的硬件设备检测到硬件的故障，然后立即切换至冗余的硬件设备上，不管故障设备是处理器、内存板、电源、I/O子系统还是存储子系统。

尽管这种切换能够无缝地提供不间断的服务，但却在硬件费用和性能上付出了很高的代价，因为冗余的设备不能处理事务。

更重要的是，容错系统不能处理软件故障，而这却是宕机的最常见的原因。

高可用技术并不是通过将可用性当作一系列重复的物理设备来实现高可用性，它将高可用性看作是一个全系统范围的、共享的资源的集合，这些资源相互协作来保证关键的服务。

高可用技术将软件和工业标准的硬件结合起来，在系统、设备或应用发生故障时通过快速恢复关键服务来使宕机时间减至最小。

尽管不能立即切换，恢复服务也是很快的，通常在1分钟之内。

容错技术和高可用技术的区别在于服务中断的时间。

当硬件发生故障时，容错环境没有宕机时间，而高可用环境有很小的宕机时间。

但是，在容错环境中，由于软件故障无法被检测，有可能造成系统的严重破坏。

而在高可用环境中，软件故障只会造成很小的宕机时间。

现在，大多数的公司都愿意忍受一小段的宕机时间，采用高可用技术，而不愿意花费高得多的代价采用只能检测硬件故障的容错技术。

另外，在高可用配置中，备份机还可承担其他应用。

群集多处理技术

群集多处理技术是指一组松散耦合的机器，通过网络连接在一起，共享磁盘资源。

在群集中，多个服务器协同工作，为用户提供一组服务或资源。

将两个或多个服务器组成群集来备份关键应用是一个划算的高可用性解决方案。

用户可以使用更多的技术能力，同时确保关键应用在硬件或软件故障后能够快速恢复正常工作。

群集多处理技术还为客户提供了灵活的扩展途径。

客户可以很容易地在群集中增加处理器以分担不断增加的工作量，还可以对群集中的处理器进行升级。

而在容错环境中，则必须同时增加两个处理器，其中一个作为冗余备份，在正常工作时不进行任何处理。

§1.2HACMP中术语的定义

群集（Cluster）：

多个服务器节点一起工作，使用TCP/IP进行通讯，每个节点上运行ClusterManager进程。

节点（Node）：

群集中的每个运行ClusterManager进程的独立的机器。

节点是HACMP的核心部分，节点上运行AIX操作系统和HACMPforAIX软件。

在HACMP群集中，每个节点有一个唯一的节点名。

一个节点可能拥有一组资源――磁盘、卷组、文件系统、网络、网络地址和应用。

节点上一般运行着访问共享磁盘上数据的“后台”应用。

资源（Resources）：

由一个节点控制的实体，当节点发生故障时能够被其它节点接管。

可以被当作资源的实体有：

★磁盘、卷组、文件系统

★NFS输出的文件系统

★IP地址

★应用程序

关键应用（CriticalApplication）：

由HACMP控制其启动和停止的应用程序，例如数据库的后台进程。

事件（Event）：

群集中发生的一些事情，即群集状态的改变，包括节点up/down，网络up/down，网卡故障等等。

行为（Behavior）：

事件发生时群集的响应动作。

事件是由shell脚本控制的。

重聚（Reintegration）：

将故障节点、网络、网卡重新带回群集的过程。

下图是HACMP群集的一个例子。

在实际的群集中，由于节点数目、网络拓扑、磁盘类型等具体配置的区别，群集的形状可能会不同。

图1：

HACMP群集

§1.3HACMP群集的硬件组成

从上图中可以看出，HACMP群集的硬件由以下硬件组成：

★节点

★共享磁盘设备

★网络和网卡

★客户机

1.3.1节点机型

HACMPforAIX软件支持RS/6000单处理器和SMP机型作为群集的节点。

在HACMP中，SMP系统和单处理器机型一样，都被当作单一节点。

采用SMP系统是提高整个群集吞吐量的有效途径。

群集中的每个节点都可以是一个大的SMP系统，使得群集系统远远超过单个系统的处理能力，可以支持成千上万个客户机连接到单一的数据库系统。

1.3.2共享磁盘设备

群集中的每个节点都需要配置内置硬盘来存储AIX操作系统、HACMP软件和应用程序。

另外，每个节点都应连接到一个或多个外置的共享磁盘上。

共享磁盘是指物理上连接到多个节点的磁盘设备，共享磁盘上存放着关键任务的数据，通常采用镜像或RAID技术来提供数据的冗余保护。

HACMP的共享磁盘设备支持SCSI-2Differential磁盘、SCSI-2Differential磁盘阵列和串行磁盘。

HACMP支持两种对共享磁盘的访问方式：

非并发访问和并发访问。

在非并发访问环境中，每个时间点上只能有一条活动的连接，保持活动连接的节点拥有磁盘，当此节点离开群集时，它拥有的磁盘被其他节点接管。

在并发访问环境中，共享磁盘同时与多个节点保持活动连接，因此当节点故障时，不需要接管磁盘。

并发访问要求SSA或RAID作为外置共享磁盘。

共享硬盘应该单独放在一个机柜中，不应和机器混放。

1.3.3网卡

一个节点至少应有两块网卡连接每个网络：

一块服务网卡（serviceadapter）和一块备份网卡（standbyadapter）。

如果配置IP地址接管，还应配置启动网卡（bootadapter）。

启动网卡并不需要单独的物理网卡，而是配置在服务网卡上的不同的IP地址。

HACMPforAIX采用网卡标识（adapterlabel）来识别网卡。

对于TCP/IP网络，网卡标识是在文件/etc/hosts中关联某一IP地址的名字。

一个节点可以定义多个网卡标识和IP地址。

1.3.4网络

HACMP使用LAN来监视网络，网卡和其它节点的状态，HACMP支持AIX支持的大多数基于TCP/IP的网络，如Ethernet、Token-Ring、FDDI、ATM等等。

HACMP中定义了三种类型的网络：

公用网络（publicnetwork）、私用网络（privatenetwork）和串行网络（serialnetwork）。

公用网络

在HACMP环境中，公用网络连接多个节点并允许客户机服务群集节点。

Ethernet、Token-Ring、FDDI、ATM等网络可以被定义为公用网络。

私用网络

HACMP群集中的节点必须相互通讯以实现对数据的连续访问。

私用网络提供两个节点之间的点到点通讯，但不允许客户机访问。

HACMP使用私用网络来传输锁的信息，只有在没有定义私用网络时才使用公用网络来传输锁的信息。

私用网络一般用于并发访问磁盘的情况。

Ethernet、Token-Ring、FDDI、ATM等网络可以被定义为私用网络。

串行网络

串行网络是两个节点之间的点到点连接。

HACMP在TCP/IP子系统发生故障时，使用串行网络来传输控制信息和心跳信息。

串行网络可以是一条SCSI-2Differential总线或一条RS232串行线。

网络名称

网络名称用于标识HACMP群集中的网络，群集进程使用网络名称信息来确定哪些网卡连接在同一物理网络上。

网络的命名是任意的，但必须保持一致。

如果多个网卡连接在同一物理网络上，定义这些网卡时必须使用相同的网络名称。

1.3.5客户机

客户机是指能够访问群集中节点的机器。

客户机通过公用局域网络与节点通讯，其上运行“前端”程序或客户机应用来访问群集节点上的服务器应用。

HACMPforAIX为群集节点上的关键性的数据和应用提供高可用性环境，但不负责客户机的高可用性。

§1.4AIX与HACMP

AIX是第一个，也是最为成熟的第二代UNIX操作系统，具有很多先进的特征，保证UNIX系统的可靠性和高性能，IBM公司引入到UNIX中的LVM逻辑卷管理和JFS日志文件系统，使AIX更容易使用和管理。

AIX满足几乎所有的工业标准和事实标准，是真正的开放系统。

AIX包含许多承袭IBM大主机等级的优异特性，诸如系统集成性、系统管理及系统可用性。

除了具有当系统损毁时可以快速修复的文件系统外，IBM运用自身在计算机领域45年的经验，增加了逻辑卷管理和日志文件系统等功能，支持三份能够同步写入及错误区块重新配置的系统镜像功能，用以确保您高价值的数据。

IBM在设计RISC/6000的AIX操作系统时，针对UNIX系统的弱点，重新改写了UNIX的内核，清除200个编程缺陷。

在系统功能稳定性、可靠性和可管理性方面做了极大的改进，使UNIX从一个主要面向科技市场的操作系统，发展成为能够承担关键任务的成熟的操作系统。

AIX具有动态可扩展内核，用户装卸设备时可联机动态配置，无须关机和重新启动，具有实时的扩展功能。

所有硬件设备均可随时动态增加、更换而不影响文件系统及其数据。

AIX中的许多功能和HACMP紧密配合，为用户提供更高的可用性。

以下介绍AIX中与HACMP相关的几项功能：

LVM、JFS、ODM、SMIT和SRC。

逻辑卷管理器LVM（LogicalVolumeManager）

LVM逻辑上将多个硬盘当作单一实体进行管理。

使用LVM可将存储空间分区为“逻辑卷”，可以指定其存放位置，以获得优化的性能和可用性。

逻辑卷（文件系统）可以动态扩展而不需重新配置整个逻辑硬盘子系统。

逻辑卷可以镜像，避免磁盘的单点故障。

LVM使磁盘资源很容易被其他节点接管。

日志文件系统JFS（JournaledFileSystem）

在传统Unix中，文件系统恢复需要很长时间且文件系统的完整性不能得到保证。

AIX使用日志文件系统，所有对文件系统的更新在写到文件系统之前先记入一个日志之中，当系统故障后JFS日志可以被重新执行，文件系统的更新可以根据日志前滚或回滚（rollforward/back）。

AIX很少用到fsck命令进行整个文件系统的恢复，所以故障后恢复文件系统的时间大大减少，也就大大减少了文件系统接管的时间。

ODM（ObjectDataManager）

ODM是一个面向对象的数据库，其中存放着系统的配置信息。

采用ODM管理使配置信息更加安全，可以免受偶然的或故意的损坏。

ODM库一般通过SMIT、高级命令或应用程序进行访问。

所有的HACMP配置信息都存放于ODM库中。

HACMPforAIX使用“GlobalODM”，可以在一个节点上做配置，然后传到群集内的所有节点。

这样可以减少配置的工作量，并保证各个节点上配置信息的一致性。

SMIT（SystemManagementInterfaceTool）

AIX中绝大部分系统管理功能都可以通过SMIT完成（95%以上）。

使用SMIT减少了偶然使用错误命令或错误选项的可能性，增加了系统的可用性。

HACMP全部用SMIT管理，快捷路径是smithacmp

SRC（SystemResourceController）

SRC是一个AIX进程，用来管理其它的进程。

使用startsrc和stopsrc命令来启动、停止由SRC控制的一组进程。

如果SRC控制的一个进程非正常终止，SRC会自动执行一个特定的程序来响应。

HACMP的进程都是由SRC控制和监视的。

§1.5HACMP群集的软件结构

HACMPforAIX软件由以下部分组成：

★ClusterManager

★EventScripts

★ClusterLockManager

★Clinfo

★Clsmuxpd

ClusterManager

ClusterManager运行在群集中的所有节点上。

它的主要任务是监视和响应群集状态的变化，包括：

节点故障和恢复、网络故障和恢复、网卡故障和恢复。

它负责同步和协调群集内部的动作，发现错误征兆，诊断问题，并做出适当的反应。

它还负责执行EventScripts（事件脚本）来影响群集状态的变化。

EventScripts

EventScripts定义了为响应群集事件所需执行的动作。

HACMP包括了大多数情况下的EventScripts，这些EventScripts是用标准shell编写的，使用标准AIX命令和HACMP功能，且可以客户化。

ClusterLockManager

用于并发访问环境，使多个节点可以同时访问相同的数据。

应用程序必须用ClusterLockManagerAPI来登记、申请、释放锁。

LockManager协调和排序对共享数据的访问，防止数据的不一致和错误。

Clinfo&Clsmuxpd

Clinfo是ClusterInformation进程。

ClinfoAPI允许应用程序来确定群集现在的状态和释放动作响应变化，每当群集内有事件发生时Clinfo发布信息。

Clinfo的通讯基于SNMP依靠SNMP的代理（clsmuxpd）接收群集状态的改变。

Clinfo是可选的。

§1.6HACMP群集资源

1.6.1资源

HACMPforAIX软件通过以下途径提供高可用性环境：

★定义一组必须的群集资源，资源可以是硬件，也可以是软件。

★定义群集节点访问这些资源的关系。

这些关系确定哪个节点控制资源以及当该节点放弃资源的控制权后哪个节点接管资源。

当一个节点离开群集时，ClusterManager能够将这个节点的资源转移到群集中的其它节点上。

资源的类型

高可用资源可以是以下几种实体：

★应用

★磁盘

★卷组

★文件系统

★NFS文件系统

★IP地址

资源怎样做到高可用

应用：

由HACMP启动，如果节点发生故障，则在另一节点重新启动。

磁盘、卷组、文件系统：

磁盘物理上与多个节点相连。

在非并发环境中，一个节点控制磁盘资源，如果该节点发生故障，它控制的磁盘资源由其它节点接管。

在并发环境中，多个节点同时控制磁盘资源，一个节点发生故障并不影响其它节点。

IP地址：

如果服务网卡发生故障，由本机的备份网卡接管其地址，称为“网卡切换”。

如果整个节点故障，由另一个群集节点的备份网卡接管其地址，称为“IP地址接管”。

1.6.2资源组

每个HACMP的高可用资源都必须被分配在某个资源组中。

资源组允许您将相关的资源结合成一个单一的实体，便于配置和管理。

HACMP共有三种类型的资源组，分别是Cascading资源组、Rotating资源组和Concurrent资源组。

在一个群集中可以有多个不同类型的资源组。

定义资源组的类型实际上就是定义了群集的故障恢复策略。

Cascading资源组

Cascading资源组可以被一个或多个节点接管。

所有被指定参与接管一个资源组的节点都是该资源组的资源链的一部分，每个参与的节点都被指定了接管优先级，优先级代表了接管可用资源的顺序。

当接管发生时，具有最高优先级的活动节点将获得资源组。

如果该节点不可用，则由具有次高优先级的节点获得资源组，依此类推。

当对该资源组具有更高优先级的节点重新回到群集后，它将取回它的资源组。

Rotating资源组

一个Rotating资源组和一组节点相关联。

资源组在所有被定义的节点之间轮转。

每个节点可以拥有一个资源组。

开始时，第一个加入群集的节点获得第一个资源组，第二个加入群集的节点获得第二个资源组，依此类推，直到所有的资源组都被节点获得。

剩余的节点作为备份节点。

当一个控制资源的节点故障时，可用节点中对资源组具有最高优先级的节点将接管资源组。

当故障节点重新加入群集后，成为备份节点，不再取回资源组。

Concurrent资源组

Concurrent资源组由多个节点共享。

所有并发访问资源组的节点在加入群集后都获得该资源组。

节点之间没有优先级的区别。

由于AIXJFS不支持并发访问，应用就必须用生设备（逻辑卷）。

因此Concurrent资源组的资源只能有应用、磁盘和卷组。

Concurrent资源组的共享磁盘必须是SSA盘或RAID盘。

资源链

每个能访问资源组的节点都必须被列为参与节点，参与节点的列表就建立了资源组的资源链。

这样，这几个节点都可以参与维护资源组的可用性。

对于Cascading资源组或Rotating资源组来说，这也就建立了资源链中各节点的优先级。

对于Cascading资源组，当前在资源链中具有最高优先级的活动节点将从故障节点处获得资源组。

对于Rotating资源组，当前在资源链中具有最高优先级且具有可用连接（网络、网卡、IP地址）的节点将从故障节点处获得资源组。

接管节点可能是已经拥有资源的节点，也可能是备份节点。

HACMP对资源组的位置有如下假定：

Cascading―具有最高优先级的活动节点控制资源组。

Rotating―具有与Rotating资源组相关的服务地址的节点控制资源组。

Concurrent―所有活动节点都拥有资源组。

§1.7建立高可用系统――避免单点故障

高可用系统的主要特点是具有检测和响应可能影响到关键服务的事件的能力。

HACMPforAIX软件使群集在遇到系统的关键组件（例如网卡）发生故障的情况下仍能继续对外提供服务。

HACMPforAIX软件通过避免单点故障的方式建立高可用的和可扩展的群集。

单点故障点是指一个关键的群集功能只由单一的组件提供，当这个组件故障时，群集没有其它的途径提供关键的服务。

在群集中，有可能出现单点故障的群集组件是：

★节点

★网络和网卡

★磁盘和磁盘控制卡

★应用

HACMP可以检测和响应三种类型的故障：

节点故障、网卡故障和网络故障。

1.7.1节点故障

节点故障指处理器硬件或操作系统故障。

当发生节点故障上，其它节点可以配置为：

★接管共享磁盘

★Vary-on卷组

★Mount文件系统

★ExportNFS文件系统

★接管IP地址

★重启应用

磁盘接管

图2：

节点故障时的磁盘接管

磁盘物理上与多个节点相连。

在非并发环境中，一个节点控制磁盘资源，如果该节点发生故障，它控制的磁盘资源（包括卷组、文件系统等）由其它节点接管。

在并发环境中，多个节点同时控制磁盘资源，因此不需要磁盘接管。

图2表示了非并发环境磁盘接管的过程。

IP地址接管

图3：

节点故障时的IP地址接管

IP地址接管使另一节点可以获得故障节点的网络地址。

当提供给客户机的服务绑定到一个特定的IP地址时，必须配置IP地址接管。

如果只接管磁盘，客户机将无法访问服务器的IP地址。

展开阅读全文