Hacmp for AIX原理设计及实现Word文档下载推荐.docx

上传人:b****6 文档编号:15832660 上传时间:2022-11-16 格式:DOCX 页数:55 大小:783.57KB
下载 相关 举报
Hacmp for AIX原理设计及实现Word文档下载推荐.docx_第1页
第1页 / 共55页
Hacmp for AIX原理设计及实现Word文档下载推荐.docx_第2页
第2页 / 共55页
Hacmp for AIX原理设计及实现Word文档下载推荐.docx_第3页
第3页 / 共55页
Hacmp for AIX原理设计及实现Word文档下载推荐.docx_第4页
第4页 / 共55页
Hacmp for AIX原理设计及实现Word文档下载推荐.docx_第5页
第5页 / 共55页
点击查看更多>>
下载资源
资源描述

Hacmp for AIX原理设计及实现Word文档下载推荐.docx

《Hacmp for AIX原理设计及实现Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《Hacmp for AIX原理设计及实现Word文档下载推荐.docx(55页珍藏版)》请在冰豆网上搜索。

Hacmp for AIX原理设计及实现Word文档下载推荐.docx

本文的附录A介绍了HACMP和主要数据库产品配合时的各种配置。

附录B介绍UNIX平台主流高可用产品的比较。

文中用到的命令用加黑的斜体字表示,如:

fsck

文中用到的SMIT路径用黑体字表示,如:

smitdevices

带下划线的正文文字代表应引起注意的事项。

因本人水平所限,文中难免会有错误或介绍不详之处,希望大家批评指正,并多提宝贵意见。

第一章

HACMP的概念和原理

在今天竞争激烈的全球市场中,从金融、电信、医疗到零售、运输、制造的各个企业都必须保证关键性业务的信息和数据的可用性,而且通常是一天24小时,一年365天。

各个企业必须始终如一地、正确地根据用户的要求提供银行往来金额、投资资金、医疗记录、测试结果和其它许多关键服务,而成功提供这些服务的关键是依靠信息技术的可用性。

由ContingencyPlanningResearch提供的最新研究结果表明,平均每小时的宕机时间会导致上百万美元的损失。

更重要的是,当因为意料之外的系统故障而丢失他们的数据之后,50%的公司没有再重新开门,90%的公司则歇业两年。

因此,要保证业务的连续性,就必须尽可能减少会导致信息和应用不可用的系统宕机时间,从而减小对用户服务的影响。

关键业务的连续性可以通过以下三个层次的方法实现:

磁带备份

磁带备份是实现基本的业务连续的通用方法。

信息先备份到磁带上,然后送到另外的地点保存。

这种方法的问题在于磁带备份往往需要较长的时间来记录数据。

另外,在数据备份过程中或者做数据备份前的系统或环境故障很可能造成数据丢失。

而且,从备份磁带上恢复数据也需要很长的时间,数据存储得越多,恢复的时间越长。

高可用系统

高可用系统一般是在一个地点,通过高可用软件将一组服务器连接在一起,组成一个群集。

IBM的HACMPforAIX和HP的MC/ServiceGuard就是这样的群集产品,通过快速地将用户、应用和数据从发生硬件或软件故障的机器切换至其它机器来提供高可用计算环境。

容错系统

容错系统依赖于冗余的硬件设备和软件来实现关键业务的连续性。

虽然容错系统是避免宕机和数据丢失的有效方法,但是购买、操作和维护容错系统都是非常昂贵的。

另外,系统的升级也需要很大的代价。

用户可以根据自己的应用情况选择适合自己的方法实现关键业务的连续性。

§

1.1HACMP简介

IBM公司的HACMPforAIX软件是基于AIX平台的,在高可用系统层次实现关键性任务计算环境的工具软件。

HACMP应用于RS/6000系列的单处理器机型、对称多处理器机型或SP的节点,可以检测系统故障并快速恢复服务,使最终用户只感受到很小的中断时间。

HACMP(HighAvailabilityClusterMulti-Processing)有两个主要的组成部分:

高可用技术(HA)和群集多处理技术(CMP)。

高可用技术

在HA产品出现之前,在UNIX领域实现高可用性的最有效途径是通过容错技术。

容错技术依靠专门的硬件设备检测到硬件的故障,然后立即切换至冗余的硬件设备上,不管故障设备是处理器、内存板、电源、I/O子系统还是存储子系统。

尽管这种切换能够无缝地提供不间断的服务,但却在硬件费用和性能上付出了很高的代价,因为冗余的设备不能处理事务。

更重要的是,容错系统不能处理软件故障,而这却是宕机的最常见的原因。

高可用技术并不是通过将可用性当作一系列重复的物理设备来实现高可用性,它将高可用性看作是一个全系统范围的、共享的资源的集合,这些资源相互协作来保证关键的服务。

高可用技术将软件和工业标准的硬件结合起来,在系统、设备或应用发生故障时通过快速恢复关键服务来使宕机时间减至最小。

尽管不能立即切换,恢复服务也是很快的,通常在1分钟之内。

容错技术和高可用技术的区别在于服务中断的时间。

当硬件发生故障时,容错环境没有宕机时间,而高可用环境有很小的宕机时间。

但是,在容错环境中,由于软件故障无法被检测,有可能造成系统的严重破坏。

而在高可用环境中,软件故障只会造成很小的宕机时间。

现在,大多数的公司都愿意忍受一小段的宕机时间,采用高可用技术,而不愿意花费高得多的代价采用只能检测硬件故障的容错技术。

另外,在高可用配置中,备份机还可承担其他应用。

群集多处理技术

群集多处理技术是指一组松散耦合的机器,通过网络连接在一起,共享磁盘资源。

在群集中,多个服务器协同工作,为用户提供一组服务或资源。

将两个或多个服务器组成群集来备份关键应用是一个划算的高可用性解决方案。

用户可以使用更多的技术能力,同时确保关键应用在硬件或软件故障后能够快速恢复正常工作。

群集多处理技术还为客户提供了灵活的扩展途径。

客户可以很容易地在群集中增加处理器以分担不断增加的工作量,还可以对群集中的处理器进行升级。

而在容错环境中,则必须同时增加两个处理器,其中一个作为冗余备份,在正常工作时不进行任何处理。

1.2HACMP中术语的定义

群集(Cluster):

多个服务器节点一起工作,使用TCP/IP进行通讯,每个节点上运行ClusterManager进程。

节点(Node):

群集中的每个运行ClusterManager进程的独立的机器。

节点是HACMP的核心部分,节点上运行AIX操作系统和HACMPforAIX软件。

在HACMP群集中,每个节点有一个唯一的节点名。

一个节点可能拥有一组资源――磁盘、卷组、文件系统、网络、网络地址和应用。

节点上一般运行着访问共享磁盘上数据的“后台”应用。

资源(Resources):

由一个节点控制的实体,当节点发生故障时能够被其它节点接管。

可以被当作资源的实体有:

★磁盘、卷组、文件系统

★NFS输出的文件系统

★IP地址

★应用程序

关键应用(CriticalApplication):

由HACMP控制其启动和停止的应用程序,例如数据库的后台进程。

事件(Event):

群集中发生的一些事情,即群集状态的改变,包括节点up/down,网络up/down,网卡故障等等。

行为(Behavior):

事件发生时群集的响应动作。

事件是由shell脚本控制的。

重聚(Reintegration):

将故障节点、网络、网卡重新带回群集的过程。

下图是HACMP群集的一个例子。

在实际的群集中,由于节点数目、网络拓扑、磁盘类型等具体配置的区别,群集的形状可能会不同。

图1:

HACMP群集

1.3HACMP群集的硬件组成

从上图中可以看出,HACMP群集的硬件由以下硬件组成:

★节点

★共享磁盘设备

★网络和网卡

★客户机

1.3.1节点机型

HACMPforAIX软件支持RS/6000单处理器和SMP机型作为群集的节点。

在HACMP中,SMP系统和单处理器机型一样,都被当作单一节点。

采用SMP系统是提高整个群集吞吐量的有效途径。

群集中的每个节点都可以是一个大的SMP系统,使得群集系统远远超过单个系统的处理能力,可以支持成千上万个客户机连接到单一的数据库系统。

1.3.2共享磁盘设备

群集中的每个节点都需要配置内置硬盘来存储AIX操作系统、HACMP软件和应用程序。

另外,每个节点都应连接到一个或多个外置的共享磁盘上。

共享磁盘是指物理上连接到多个节点的磁盘设备,共享磁盘上存放着关键任务的数据,通常采用镜像或RAID技术来提供数据的冗余保护。

HACMP的共享磁盘设备支持SCSI-2Differential磁盘、SCSI-2Differential磁盘阵列和串行磁盘。

HACMP支持两种对共享磁盘的访问方式:

非并发访问和并发访问。

在非并发访问环境中,每个时间点上只能有一条活动的连接,保持活动连接的节点拥有磁盘,当此节点离开群集时,它拥有的磁盘被其他节点接管。

在并发访问环境中,共享磁盘同时与多个节点保持活动连接,因此当节点故障时,不需要接管磁盘。

并发访问要求SSA或RAID作为外置共享磁盘。

共享硬盘应该单独放在一个机柜中,不应和机器混放。

1.3.3网卡

一个节点至少应有两块网卡连接每个网络:

一块服务网卡(serviceadapter)和一块备份网卡(standbyadapter)。

如果配置IP地址接管,还应配置启动网卡(bootadapter)。

启动网卡并不需要单独的物理网卡,而是配置在服务网卡上的不同的IP地址。

HACMPforAIX采用网卡标识(adapterlabel)来识别网卡。

对于TCP/IP网络,网卡标识是在文件/etc/hosts中关联某一IP地址的名字。

一个节点可以定义多个网卡标识和IP地址。

1.3.4网络

HACMP使用LAN来监视网络,网卡和其它节点的状态,HACMP支持AIX支持的大多数基于TCP/IP的网络,如Ethernet、Token-Ring、FDDI、ATM等等。

HACMP中定义了三种类型的网络:

公用网络(publicnetwork)、私用网络(privatenetwork)和串行网络(serialnetwork)。

公用网络

在HACMP环境中,公用网络连接多个节点并允许客户机服务群集节点。

Ethernet、Token-Ring、FDDI、ATM等网络可以被定义为公用网络。

私用网络

HACMP群集中的节点必须相互通讯以实现对数据的连续访问。

私用网络提供两个节点之间的点到点通讯,但不允许客户机访问。

HACMP使用私用网络来传输锁的信息,只有在没有定义私用网络时才使用公用网络来传输锁的信息。

私用网络一般用于并发访问磁盘的情况。

Ethernet、Token-Ring、FDDI、ATM等网络可以被定义为私用网络。

串行网络

串行网络是两个节点之间的点到点连接。

HACMP在TCP/IP子系统发生故障时,使用串行网络来传输控制信息和心跳信息。

串行网络可以是一条SCSI-2Differential总线或一条RS232串行线。

网络名称

网络名称用于标识HACMP群集中的网络,群集进程使用网络名称信息来确定哪些网卡连接在同一物理网络上。

网络的命名是任意的,但必须保持一致。

如果多个网卡连接在同一物理网络上,定义这些网卡时必须使用相同的网络名称。

1.3.5客户机

客户机是指能够访问群集中节点的机器。

客户机通过公用局域网络与节点通讯,其上运行“前端”程序或客户机应用来访问群集节点上的服务器应用。

HACMPforAIX为群集节点上的关键性的数据和应用提供高可用性环境,但不负责客户机的高可用性。

1.4AIX与HACMP

AIX是第一个,也是最为成熟的第二代UNIX操作系统,具

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 冶金矿山地质

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1