1、AIX61 HACMP安装配置切换过程AIX6.1 HACMP双机安装切换过程1引言1.1HACMP 工作原理 HACMP 是 High Availability Cluster Multi-Processing 的缩写。HACMP 是 IBM 公司在 P 系列 AIX 操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP 是利用网络来侦测主机及网卡的状况,搭配 AIX 所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作 ; 若是主机故障切换至备份机上继续应用系统的运行。 作为双机系统的两台服
2、务器同时运行 HACMP 软件。两台服务器的备份方式有二种 : 一台服务器运行应用,另外一台服务器做为备份 两台服务器除正常运行本机的应用外,同时又作为对方的备份; 两台主机系统在整个运行过程中,通过 心跳线 相互监测对方的运行情况 ( 包括系统的软硬件运行、网络通讯和应用运行情况等 ); 一旦发现对方主机的运行不正常 ( 出故障 ) 时,故障机上的应用就会立即停止运行,本机 ( 故障机的备份机 ) 就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源 ( 包括用到的 IP 地址和磁盘空间等 ) 接管过来,使故障机上的应用在本机继续运行 ; 应用和资源的接管过程由 HACMP 软件
3、自动完成,无需人工干预 ; 当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机 ( 备份机 ) 上运行。1.2心跳设计 配置 HACMP 的过程中,除了 TCP/IP 网络之外,您也可以在其它形式的网络上,如串行网络和磁盘总线上配置心跳网络。TCP/IP 网络 优点:要求低,不需要任何额外硬件或软件,即可实现。缺点:占用 IP 地址,不能避免由于 TCP/IP 的软件问题导致 HACMP 崩溃,系统不可用。串口网络 优点:真正实现高可用性,不占用 IP 地址。缺点:需要硬件支持,对于 p5 机器,需要新增异步卡,而中低端的机器的插槽有限。磁盘心跳 优点 : 不占用插槽,
4、磁盘总线上的心跳网络能够在 TCP/IP 网络资源有限的情况下提供额外的 HACMP 节点间的通信手段,并且能够防止 HACMP 节点之间由于 TCP/IP 软件出现问题而无法相互通信。缺点:需要操作系统和存储支持,如使用增强型卷组,此外对于 I/O 读写负荷高的应用,也需要慎用。1.3磁盘及 VG 设计 虽然实际上 HACMP 是靠 PVID 来认磁盘的,但集群的机器上磁盘顺序不一,磁盘对应不一致会造成某种混乱。以致于安装配置和维护时很容易产生各种人为错误,所以强烈建议机器上看到的磁盘和 VG 名称都一一对应,此外 VG 的 MajorNumber 也需要预先设计规划,以免不一致。1.4实施
5、环境操作系统:AIX6.1-06-05HACMP版本:HACMP V6.1查看HACMP对aix操作系统的要求:查看aix系统版本: # oslevel -s注:本文采用的是IP心跳方式实现的双机1.4.1机器一览表节点名称操作系统HA版本test1AIX6.1-06-05HA6.1test2AIX6.1-06-05HA6.11.4.2IP规划表网络名功能网络类型属性节点名IP地址test1_boot1bootetherpublictest1192.168.1.1test1_boot2heartbeatetherpublictest1192.168.2.1test2_boot1bootethe
6、rpublictest2192.168.1.2test2_boot2heartbeatetherpublictest2192.168.2.2test1_peradministratoretherpublictest1172.29.2.211test2_per administratoretherpublictest2172.29.2.212serviceserviceetherpublic172.29.2.2101.4.3磁盘和VG规划表节点名磁盘VGVG Major Numbertest1Hdisk2datavg54test2Hdisk2datavg482升级系统2.1安装系统bundle和
7、基本包 1.1安装系统bundle #smitty easy_installinstall software bundle,安装Server和App-Dev 1.2 安装基本包bos.*和rsct.* #smit install install software 这里选择所有的bos的包; 3前期配置工作3.1设置ip地址#Smit tcpip更改en1 ip地址同上3.2更改hosts 文件(node1&node2)# vi /etc/hosts 编辑文件192.168.1.1 test1_boot1 test1192.168.2.1 test2_boot1 test2192.168.1.2
8、 test1_boot2192.168.2.2 test2_boot2172.29.2.211 test1_per172.29.2.212 test2_per172.29.2.210 ser# chmod 755 hostsSer 为service ip Node1_per Node2_per 为永久ip(又称管理ip)3.3设置系统各参数 设置异步io(aio) #Smit chaio(重启生效) 3.4设置每用户最大进程数 #smit system-change/show characteristics of operation system 3.5修改/etc/security/limi
9、ts,取消各种限制 default: fsize = -1 core = -1 cpu = -1 data = -1 rss = -1 stack = -1 nofiles = 2000 3.6扩充Paging space 查看页空间大小#lsps -a #smit chps选择hd6,这里扩充为4G PP大小为128M,32为PP个数,共扩充4G3.7扩充/usr和/tmp 查看文件分区大小# df -m#smit chfs 选择/usr,扩充为4G; #smit chfs 选择/tmp,扩充为500M; 4安装hacmp安装 HACMP#smit install_latest 在选择文件集
10、的时候,除了cluster.h*的不选,其余的都选; 因为这里hacmp的需求包已经安装(前面的rsct.*),所以这里不会有什么错误; 确认安装和补丁包 : lslpp l cluster.*另外节点同上,安装HACMP5共享磁盘管理5.1创建共享盘AIX主机通过SAN环境连接HDS存储AMS2100,HDS存储划出200GB的共享磁盘同时映射给2台小机上的HBA卡,并通过命令:cfgmgr v识别识别到共享存储后,通过:chdev l hdiskX a pv=yes赋予pvid 再使用lspv命令在2台小机上面确认pvid的一致性。5.2建共享卷组创建步骤在node1上创建datavg,然
11、后再在node2上importvg;#smit mkvg确认vg: #lsvg#lsvg o#lspv#varyoffvg datavg在备机上面导入vg的信息Importvg y datavg hdiskX#lsvg#lsvg o #lspv#varyoffvg datavg6配置HACMP6.1创建Cluster# smit hacmp Extended Configuration Extended Topology Configuration Configure an HACMP Cluster Add/Change/Show an HACMP Cluster6.2添加节点# smit
12、hacmp Extended Configuration Extended Topology Configuration Configure HACMP Sites Add a Node to the HACMP Cluster同样方法添加节点2从相关节点发现一下; # smit hacmp Extended Configuration Discover HACMP-related Information from Configured Nodes6.3创建网络# smit hacmp Extended Configuration Configure HACMP Networks Add a
13、Network to the HACMP Cluster6.4添加ip地址到新网络中# smit hacmp Extended Configuration Extended Topology Configuration Configure HACMP Communication Interfaces/Devices Add Communication Interfaces/Devices Add Pre-defined Communication Interfaces and Devices Communication Interfaces同样方法添加node26.5配置永久IP(管理IP)#
14、 smit hacmp Extended Configuration Extended Topology Configuration Configure HACMP Persistent Node IP Label/Addresses Add a Persistent Node IP Label/Address ha_node1同样方法添加node26.6配置资源组6.6.1编写start和stop脚本(两节点)#mkdir /usr/hascript#vi start-app banner startting appexit 0#vi stop-appbanner stoping appba
15、nner app is stopedexit 06.6.2添加app server# smit hacmp Extended Configuration Extended Resource Configuration HACMP Extended Resources Configuration Configure HACMP Application Servers Add an Application Server6.6.3添加server ip# smit hacmp Extended Configuration Extended Resource Configuration HACMP E
16、xtended Resources Configuration Configure HACMP Service IP Labels/Addresses Add a Service IP Label/Address Configurable on Multiple Nodes6.6.4添加资源组# smit hacmp Extended Configuration Extended Resource Configuration 6.6.5配置资源组# smit hacmp Extended Configuration Extended Resource Configuration HACMP E
17、xtended Resource Group Configuration Change/Show Resources and Attributes for a Resource Group data_rg 6.7同步# smit hacmp Extended Configuration 同步成功!6.8启动HACMP#smit clstart确认HACMP启动后的网络和卷组的状况6.9测试#/usr/es/sbin/cluster/clinfo a打开另一个窗口#/usr/es/sbin/cluster/clstat可以看出当前资源组在node1(本文中的test1)上查看服务ip地址在en1网卡上10.10.10.10相当于之前提到的 172.29.2.2106.9.1手动正常切换资源组#smit clstop查看资源:资源正常切到node2上#/usr/es/sbin/cluster/clstat
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1