HACMP 认证学习系列第 2 部分计划与设计.docx
《HACMP 认证学习系列第 2 部分计划与设计.docx》由会员分享,可在线阅读,更多相关《HACMP 认证学习系列第 2 部分计划与设计.docx(41页珍藏版)》请在冰豆网上搜索。
HACMP认证学习系列第2部分计划与设计
了解应用程序在故障情况下的行为,对于控制集群在此类情况下应当如何反应是非常重要的。
规划和实现集群所必需的信息应该涵盖应用程序、环境、硬件、网络、存储,同时还要涵盖支持和变更过程。
本章将介绍以下HACMP集群主题:
∙节点规模调整注意事项
∙集群硬件规划
∙软件规划
∙存储规划
∙灾难恢复规划
注意:
规划是成功的实现的一半,但是就HACMP而言,如何强调正确规划的重要性都不为过。
如果规划不当,您可能会在以后某个时候发现自己陷入种种限制之中,而要摆脱这些限制可能是非常痛苦的经历。
因此,请保持镇定从容,并使用产品附带的规划工作表;这些工作表对于任何迁移或问题确定情形或者对于规划的文档记录都是非常有价值的。
规划注意事项
在规划高可用性集群时,您应该考虑节点、存储、网络等方面的规模调整,以便即使是在接管情况下,也能够提供应用程序正确运行所必需的资源。
规模调整:
选择集群中的节点
在开始集群的实现之前,您应该了解需要多少个节点,以及应该使用什么节点类型。
就应用程序所需要的资源而言,将要使用的节点类型是非常重要的。
节点的规模调整应该涵盖以下方面:
∙CPU(CPU的数量和速度)
∙每个节点中的随机访问存储器(RAM)容量
∙磁盘存储(内部)
∙每个节点中的通信和磁盘适配器数量
∙节点可靠性
集群中的节点数量取决于要实现高可用性的应用程序的数量,同时还取决于所需的可用性程度。
在集群中为每个应用程序准备多个备用节点可以提高应用程序的总体可用性。
注意:
HACMPV5.1集群中的最大节点数量是32。
HACMPV5.1支持各种各样的节点,涵盖从桌面系统到高端服务器的范围。
SP节点和逻辑分区(LogicalPartition,LPAR)也受支持。
有关进一步的信息,请参阅红皮书《HACMPforAIX5LV5.1PlanningandInstallationGuide》(SC23-4861-02)。
集群资源的共享基于应用程序的需求。
有些节点执行的任务与要实现高可用性的应用程序并不直接相关,并且不需要与应用程序节点共享资源,应该将此类节点配置在单独的集群中以简化实现和管理。
所有的节点都应该提供足够的资源(CPU、内存和适配器),以维持所有指定的应用程序在故障转移(接管故障节点中的资源)情况下的执行。
如果可能,应该在集群中包括附加的节点,以提高集群的可用性;这还可以在执行节点故障转移、重新集成和维护操作时提供更大的灵活性。
建议使用具有相似硬件配置的集群节点,
在实现具有相互接管(mutualtakeover)或并发配置的应用程序的集群时尤其是如此。
这样使得分发资源和执行管理操作(软件维护等等)变得更加容易。
规模调整:
存储注意事项
在最常用的配置中,要实现高可用性的应用程序需要一个共享存储空间来存储应用程序数据。
该共享存储空间或者用于并发访问,或者用于使数据对接管节点上的应用程序可用(在fail-over情况下)。
要在集群中使用的存储应该允许每个应用程序从所有的指定节点进行共享访问。
当前支持的HACMP共享存储技术包括SCSI、SSA和光纤通道(FibreChannel.)。
根据应用程序的需求,应该将存储配置定义为非共享(“私有”)或共享存储。
私有存储可以保留在内部磁盘上,并且不参与任何接管活动。
考虑到以下原因,共享存储应该提供访问控制机制:
∙放在共享存储中的数据必须能够从可能在某个时间点运行应用程序的任何一个节点进行访问。
在某些情况下,应用程序一次仅在一个节点上运行(非并发),但是在另一些情况下,必须提供对数据的并发访问。
∙在非并发环境中,如果共享数据被错误的节点更新,这可能会导致数据破坏。
∙在并发环境中,应用程序应该提供自己的数据访问机制,因为平台并发软件(AIX/HACMP)会绕过由存储控制的访问机制。
网络注意事项
在规划HACMP集群时,应该考虑以下方面:
∙IP网络拓扑(路由、交换机等等)
∙IP网络性能(速度/带宽、延迟和冗余)
∙ATM和/或X.25网络配置
IP网络用于使客户端访问运行在集群中的节点上的应用程序,以及用于在集群节点之间交换心跳信号消息。
在HACMP集群中,心跳信号消息是通过IP网络和点对点(非IP)网络进行交换的。
HACMP旨在通过基于TCP/IP的网络、X.25和ATM网络提供客户端的访问。
回页首
HACMP集群规划
集群规划也许是实现成功的配置过程中最重要的步骤。
HACMP规划应该包括以下方面:
∙硬件规划
o节点
o网络
o存储
∙软件规划
o操作系统版本
oHACMP版本
o应用程序兼容性
∙测试和维护规划
o测试过程
o变更管理
o管理操作
硬件规划
实现高可用性配置的目标是通过消除单点故障(硬件、软件和网络),以及通过屏蔽服务中断(无论是计划内还是计划外的中断),从而提供高度可用的服务。
节点规划的决策因素包括:
∙支持的节点:
计算机类型、功能、支持的适配器、电源(AC、DC、双电源与单电源等等)。
∙连接和电缆:
电缆类型、长度、接头、型号、导线管布线、电缆槽容量需求,以及可用性。
节点配置
HACMPV5.1支持在一个集群中使用IBMEserverpSeries(独立和LPAR模式)、IBMSP节点以及现有的RS/6000服务器的任何节点组合。
节点必须满足内部内存、内部磁盘、可用I/O插槽数量和操作系统兼容性(AIX版本)的最低要求。
要考虑的项包括:
∙内部磁盘(磁盘数量、容量以及是否使用LVM镜像)
∙共享磁盘容量和存储数据保护方法(RAID和LVM镜像)
∙I/O插槽限制及其对导致单点故障(SPOF)的影响
∙对集群的客户端访问(网络适配器)
∙其他LAN设备(交换机、路由器和网桥)
∙I/O适配器和子系统冗余
∙电源冗余
网络配置
规划群集网络时的主要目标是评估所需的冗余程度,以消除网络组件成为单点故障的可能性。
应该考虑以下方面:
∙网络:
连接到多个物理网络的节点
∙对于TCP/IP子系统故障:
使用非IP网络以帮助决策过程
∙网络接口:
每个网络上的冗余网络适配器(以防止在单个网络接口发生故障情况下的资源组故障转移)
在规划集群网络配置时,必须为节点连接选择正确的组合:
∙集群网络拓扑(交换机、路由器等等)。
∙连接集群节点的IP和非IP(点到点)网络组合和每个节点到所有网络的连接数量。
用于提供高可用性服务IP地址的方法:
∙通过IP别名的IP地址接管(IPaddresstakeover,IPAT)
∙通过IP替换的IPAT。
有关HACMP配置中支持的节点和适配器的完整列表,请参阅红皮书《HACMPforAIX5LV5.1PlanningandInstallationGuide》(SC23-4861-02);另请访问位于以下地址的IBM支持网站:
HACMP网络术语
从HACMPV5.1开始,用于描述HACMP配置和操作的术语已发生了很大的变化。
做出此更改是为了简化HACMP的总体使用和维护,同时也是为了使术语与IBM产品系列保持一致。
例如,在早期的HACMP版本中,取决于上下文,术语“适配器”可以具有不同的含义,从而使配置变得非常令人混淆和困难。
IP标签(IPlabel)
术语“IP标签”表示与特定IP地址相关联的名称,此名称是在集群节点上使用的名称解析方法(DNS或静态-/etc/hosts)中定义的。
此术语取代“主机名称”(hostname),后者可能与hostname命令的输出产生混淆,并且可能没有与任何IP地址相关联。
在HACMPV5.1中,术语“适配器”(Adapter)已替换如下:
∙服务IP标签/地址(ServiceIPLabel/Address):
通过其提供服务的IP标签/地址。
此IP标签/地址可能与单个节点绑定,也可能由多个节点共享,并且HACMP保持其高度可用。
∙通信接口(CommunicationInterface):
支持TCP/IP协议并由其基本IP地址表示的物理接口。
∙通信设备(CommunicationDevice):
表示点到点非IP网络连接的一端的物理设备,例如/dev/tty1、/dev/tmssa1、/dev/tmscsi1和/dev/hdisk1。
∙通信适配器(CommunicationAdapter):
用于提供高度可用的通信链路的X.25适配器。
服务IP地址/标签(ServiceIPaddress/label)
服务IP地址是用于客户端访问的IP地址。
此IP地址(及其关联的标签)由HACMP监视,并且是资源组的一部分。
存在两种类型的服务IP地址(标签):
∙共享服务IP地址(标签):
可以配置在多个节点上的IP地址,并且是一次只能在一个节点上处于活动状态的资源组的一部分。
∙与节点绑定的服务IP地址(标签):
只能配置在一个节点上(不由多个节点共享)的IP地址。
通常,此类服务IP地址与并发资源组相关联。
服务IP地址在HACMP已启动并且关联的资源组处于在线状态时变得可用。
HACMP通信接口(HACMPcommunicationinterface)
HACMP中的通信接口定义是以下内容的逻辑分组:
∙逻辑网络接口一个名称,AIX将某个物理网络适配器端口(例如,en0)解析为此名称。
∙服务IP地址是一个IP地址,将通过该IP地址提供诸如应用程序等服务,并且客户端节点将通过该IP地址进行通信。
∙服务IP标签是映射到服务IP地址的标签。
通信接口指的是基于IP的网络和网络适配器。
连接到公共物理网络的网络适配器组合为HACMP所使用的逻辑网络。
每个网络适配器能够承载多个TCP/IP地址。
在配置集群时,您要定义HACMP将监视的IP地址(基本或启动IP地址)和HACMP将保持其对HACMP高度可用的IP地址(服务IP地址)。
HACMP中的心跳信号通过通信接口进行传递。
HACMP使用RSCT子系统的心跳检测功能(通过UDP)来监视其网络接口和IP地址。
每当HACMP服务在该节点上启动,HACMP就将ODM中定义和存储的网络拓扑传递给RSCT,并且RSCT将向HACMP提供故障通知。
HACMP通信设备(HACMPcommunicationdevice)
HACMP还提供点对点非IP网络的监视。
点对点网络的两端都是AIX设备(在/dev目录中定义)。
这些设备是通信设备,并包括串行RS232连接、目标模式SCSI、目标模式SSA和磁盘检测信号连接。
点对点网络也由RSCT监视,并且HACMP使用它们的状态来区分节点故障和IP网络故障。
例如,通过磁盘的心跳检测使用磁盘设备名称(例如,/dev/hdisk2)作为在连接的每一端配置到HACMP的设备。
建议此类网络至少要在集群中的任何两个节点之间配置一个非IP网络。
在磁盘心跳检测的情况下,建议使用一个点对点网络,此网络由每个物理机箱的每个节点对的一个磁盘组成。
不能将一个物理磁盘用于两个点对点网络。
通信适配器和链路(Communicationadapterandlink)
可以将以下通信链路定义为HACMP中的资源:
∙LAN网络适配器(ent*)上配置的SNA
∙X.25适配器上配置的SNA
∙本机X.25链路
HACMP将这些链路作为资源组的一部分进行管理,从而确保高可用性通信链路。
在物理网络接口故障、X.25链路故障或节点故障的情况下,高度可用的通信链路(连同相同资源组中的所有资源一起)将被迁移到同一个节点或接管节点上的另一个可用的适配器。
IP别名
IP别名是通信(网络)接口上配置的除基本IP地址以外的IP地址。
IP别名是受HACMP支持的一个AIX功能。
AIX支持在每个通信接口上使用多个IP别名。
适配器上的每个IP别名可以在单独的子网上。
AIX还允许为接口配置具有不同子网掩码的IP别名;HACMP尚不支持此功能。
IP别名在HACMP中同时用作用于IP地址接管的服务和非服务地址,以及用于心跳配置。
网络接口功能(Networkinterfacefunction)
对于IP网络,建议您在每个节点上为每个网络配置多个通信接口。
那些通信接口将分别具有特定的作用,具体取决于HACMP集群的状态。
∙服务接口(ServiceInterface)
服务接口是配置了一个或多个服务IP地址(标签)的通信接口。
取决于为每个网络定义的IP地址接管(IPAT)方法,将在基本IP地址之外添加服务IP地址(通过别名的IPAT),或者服务IP地址将取代通信接口的基本(启动)IP地址。
此接口用于提供对运行在该节点上的应用程序的访问。
服务IP地址由HACMP通过RSCT心跳信号进行监视。
∙启动接口(BootInterface)
这是由在AIX配置中定义的基本(启动)IP地址表示的通信接口。
如果使用了通过IP别名进行的心跳检测,则HACMP将不监视此IP地址,而是通过HACMP在启动时分配的IP别名来监视通信接口。
启动接口不传输任何客户端流量;然而,如果服务接口失败,HACMP将把服务IP地址转移到非服务接口上。
如果某个节点发生故障,接管节点上的另一个接口将在执行资源组故障转移时配置服务IP地址。
注意:
对于每个网络,一个节点可以具有零到七个非服务接口。
在同一个网络上使用多个非服务接口可以消除通信接口的单点故障。
∙持久节点IP标签(PersistentNodeIPLabel)
持久节点IP标签是一个IP别名,可以将其分配给集群网络上的某个特定节点。
持久节点IP标签:
o与节点绑定(始终保持在同一个节点上)。
o能够在已经定义了某个服务或非服务IP标签的网络适配器上共存。
o具有不需要在该节点上安装附加物理网络适配器的优点。
o不属于任何资源组。
分配持久节点IP标签可以提供一个与节点绑定的IP地址,并且对于管理目的来说非常有用,因为到持久节点IP标签的连接始终会确定该特定的集群节点,即使HACMP服务没有在该节点上启动时也是如此。
注意:
可以在每个节点上为每个网络配置一个持久节点IP标签(地址)。
例如,如果有一个连接到HACMP中定义的两个网络的节点,可以通过两个分别用于每个网络的持久IP标签(地址)来确定该节点。
持久IP标签是在HACMP配置中定义的,并在HACMP第一次在每个节点上启动时变得可用。
一经配置,持久IP标签(地址)将在配置它们的适配器上保持可用,即使HACMP已在节点上停止或节点已重新启动时也是如此。
可以在以下类型的基于IP的网络上创建持久节点IP标签:
o以太网
o令牌环网
oFDDI网
oATM局域网模拟器
限制:
不能在SP交换机、ATM传统IP或非IP网络上配置持久节点IP标签。
持久IP标签的行为如下:
o如果某个配置了服务IP标签的网络适配器发生故障,并且该网络适配器上还定义了一个持久标签,则会将持久IP标签(地址)连同服务IP标签(地址)一起转移到同一个非服务接口上。
o如果指定节点上用于集群网络的所有网络适配器均发生故障,则持久节点IP标签将变得不可用。
持久节点IP标签始终保持在同一个网络上,并保持在同一个节点上;它不会在集群中的节点之间移动。
用于心跳检测的IP别名(IPaliasesusedforheartbeat)
这些IP地址是从专用的不可路由地址池中分配的,并用于监视通信接口,而不需要更改通信接口的基本(启动)IP地址。
这在某些情况下是非常有用的,例如,当更改每个节点上的网络适配器的基本IP地址不适宜(因为它们是在AIX中定义的),并且那些地址不符合HACMP要求(它们在同一个子网中,因此不能监视网络适配器)的时候。
为此目的,HACMP提供了通过IP别名的进行心跳检测的方法。
网络类型
在HACMP中,“网络”这个术语用于定义一个逻辑实体,此逻辑实体将用于集群中的节点间通信和用于客户端访问的通信接口和设备分组在一起。
可以将HACMP中的网络定义为IP网络和非IP网络。
IP网络和非IP网络均用于在节点之间交换心跳信号(“KeepAlive”)消息。
通过这种方式,HACMP维护有关集群节点及其各自的通信接口和设备状态的信息。
HACMPV5.1中支持的IP网络类型包括:
∙以太网(ether)
∙令牌环网(token)
∙FDDI网(fddi)
∙SPSwitch和SPSwitch2网(hps)
∙ATM网(atm)
下列IP网络类型不受支持:
∙串行光纤通道转换器网(SOCC)
∙串行线路IP网(SLIP)
∙光纤通道交换网(FCS)
∙802.3
∙IBM高性能交换网(HPS)
非IP网络是两个集群节点之间的点对点连接,HACMP将其用于控制消息和心跳信号。
在IP网络(或节点上的TCP/IP子系统)发生故障的情况下,这些网络可以为HACMP提供附加级别的保护。
HACMP中的非IP(基于设备)网络支持下列设备:
∙目标模式SCSI(tmscsi)
∙目标模式SSA(tmssa)
∙磁盘心跳信号(diskhb)
∙串行RS232
注意:
在AIX5LV5.1和AIX5LV5.2中,HACMP现在还支持将以太网聚合(Etherchannel)通信接口用于IP地址接管。
不支持将Etherchannel用于:
∙硬件地址接管
∙PCI热插拔
此外,在当前版本中,HACMP不支持AIX虚拟IP功能(VIPA)和IPV6。
选择IP地址接管(IPAT)方法
在实现集群时要做出的关键决策之一是资源组和与之关联的服务IP地址的行为。
由于HACMP在大多数时间都用于保护独立的非并发应用程序,因此必须选择将要用于提供高度可用的服务IP地址的方法。
在启动应用程序或将其连同关联的资源组一起移动到另一个节点时,可以通过两种方式配置服务IP地址:
∙通过替换通信接口的基本(启动时)IP地址;
此方法称为“通过IP替换的IP地址接管(IPAT)”。
∙通过为通信接口配置一个除现有IP地址之外的附加IP地址;此方法称为“通过IP别名的IP地址接管”。
HACMPV5.1中的缺省IPAT方法是通过别名(通过别名的IPAT)。
要更改此缺省行为,必须使用HACMP扩展配置菜单来更改网络属性。
IP地址接管
IP地址接管是一种恢复IP地址标签的机制,其方法是在初始物理网络适配器发生故障时,将服务IP标签转移到另一个节点上的另一个物理网络适配器。
IPAT确保用于向客户端节点提供服务的IP地址(标签)保持可用。
IPAT和服务IP标签
可以将两种IPAT方法和这些方法控制服务IP标签的方式作如下解释:
∙通过IP别名的IP地址接管
将服务IP地址/标签用作某个现有通信接口的别名,而不更改(替换)该接口的基本地址。
HACMP使用ifconfig命令来执行此操作。
注意:
在此配置中,节点上定义的所有基本(启动)IP地址/标签必须配置在不同的子网上,并且还要与服务IP地址(标签)不同。
此方法还可以节省硬件,但是需要额外的子网。
图1。
图1通过IP别名的IPAT
HACMP使用AIX的IP别名网络功能来支持不同类型的网络上的IP地址接管。
通过IP别名的IPAT可以在某些类型的网络上使用无故ARP(gratuitousARP)功能。
通过IP别名的IPAT使单个网络适配器可以支持多个服务IP地址(标签)。
因此,同一个节点可以同时承载多个资源组,而不会将资源组的数量限制为可用的通信接口的数量。
相对于通过IP替换的IPAT,通过别名的IPAT提供了以下优点:
o通过IP别名的IP地址接管比通过IP替换的IPAT速度更快,因为与在同一个接口上添加一个IP别名相比,替换IP地址要花显著更长的时间。
oIP别名允许多个服务标签在同一个网络接口上共存,因此可以在集群中使用更少的物理网络接口卡。
注意:
在HACMPV5.1中,通过IP别名的IPAT是用于保持服务IP标签高度可用的缺省机制。
∙通过IP替换的IP地址接管
服务IP地址替换网络接口上的现有(启动/基本)IP地址。
使用此方法,同一网络接口上一次仅配置有一个IP地址/标签。
注意:
在此配置中,服务IP地址必须与其中一个节点的通信接口启动地址在同一个子网上,而备用通信接口的基本IP地址必须在一个不同的子网上。
此方法还可以节省子网,但是需要额外的硬件。
图2通过IP替换的IPAT
如果包含服务IP地址的通信接口发生故障,在使用通过IP替换的IPAT时,HACMP将把服务IP地址转移到在同一个节点并在同一网络上的另一个可用接口;在此情况下,关联的资源组不受影响。
如果同一个节点上没有可用的接口,则将资源组连同服务IP标签一起转移到另一个具有可用通信接口的节点上。
在使用通过IP替换的IPAT(也称为“传统IPAT”)时,还可以配置硬件地址接管(HWAT)。
硬件地址接管的实现方式是使用本地管理地址(locallyadministeredaddress,LAA)来屏蔽通信接口的本机MAC地址,从而确保客户端上的ARP缓存中的映射保持不变。
网络安全规划
规划网络安全性对于避免集群节点上XX的访问也是非常重要的。
从HACMPV5.1开始,通过为节点之间所有与HACMP配置相关的通信提供公共通信基础设施(守护进程),从而引入了一种新的安全机制。
新的集群通信守护进程(clcomdES)的引入在HACMP集群中提供了增强的安全性,同时还加快了与配置相关的操作速度。
存在三个级别的通信安全性:
∙标准级别
o缺省安全级别。
o直接由集群通信守护进程(clcomdES)实现。
o使用HACMPODM类别和/usr/es/sbin/clus