AIX61 HACMP安装配置切换过程.docx
《AIX61 HACMP安装配置切换过程.docx》由会员分享,可在线阅读,更多相关《AIX61 HACMP安装配置切换过程.docx(23页珍藏版)》请在冰豆网上搜索。
AIX61HACMP安装配置切换过程
AIX6.1HACMP双机安装切换过程
1引言
1.1HACMP工作原理
HACMP是HighAvailabilityClusterMulti-Processing的缩写。
HACMP是IBM公司在P系列AIX操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。
HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作;若是主机故障切换至备份机上继续应用系统的运行。
作为双机系统的两台服务器同时运行HACMP软件。
两台服务器的备份方式有二种:
●一台服务器运行应用,另外一台服务器做为备份
●两台服务器除正常运行本机的应用外,同时又作为对方的备份;
●两台主机系统在整个运行过程中,通过"心跳线"相互监测对方的运行情况(包括系统的软硬件运行、网络通讯和应用运行情况等);
●一旦发现对方主机的运行不正常(出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行;
●应用和资源的接管过程由HACMP软件自动完成,无需人工干预;
●当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机(备份机)上运行。
1.2心跳设计
配置HACMP的过程中,除了TCP/IP网络之外,您也可以在其它形式的网络上,如串行网络和磁盘总线上配置心跳网络。
●TCP/IP网络
优点:
要求低,不需要任何额外硬件或软件,即可实现。
缺点:
占用IP地址,不能避免由于TCP/IP的软件问题导致HACMP崩溃,系统不可用。
●串口网络
优点:
真正实现高可用性,不占用IP地址。
缺点:
需要硬件支持,对于p5机器,需要新增异步卡,而中低端的机器的插槽有限。
●磁盘心跳
优点:
不占用插槽,磁盘总线上的心跳网络能够在TCP/IP网络资源有限的情况下提供额外的HACMP节点间的通信手段,并且能够防止HACMP节点之间由于TCP/IP软件出现问题而无法相互通信。
缺点:
需要操作系统和存储支持,如使用增强型卷组,此外对于I/O读写负荷高的应用,也需要慎用。
1.3磁盘及VG设计
虽然实际上HACMP是靠PVID来认磁盘的,但集群的机器上磁盘顺序不一,磁盘对应不一致会造成某种混乱。
以致于安装配置和维护时很容易产生各种人为错误,所以强烈建议机器上看到的磁盘和VG名称都一一对应,此外VG的MajorNumber也需要预先设计规划,以免不一致。
1.4实施环境
操作系统:
AIX6.1-06-05
HACMP版本:
HACMPV6.1
查看HACMP对aix操作系统的要求:
查看aix系统版本:
#oslevel-s
注:
本文采用的是IP心跳方式实现的双机
1.4.1机器一览表
节点名称
操作系统
HA版本
test1
AIX6.1-06-05
HA6.1
test2
AIX6.1-06-05
HA6.1
1.4.2IP规划表
网络名
功能
网络类型
属性
节点名
IP地址
test1_boot1
boot
ether
public
test1
192.168.1.1
test1_boot2
heartbeat
ether
public
test1
192.168.2.1
test2_boot1
boot
ether
public
test2
192.168.1.2
test2_boot2
heartbeat
ether
public
test2
192.168.2.2
test1_per
administrator
ether
public
test1
172.29.2.211
test2_per
administrator
ether
public
test2
172.29.2.212
service
service
ether
public
172.29.2.210
1.4.3磁盘和VG规划表
节点名
磁盘
VG
VGMajorNumber
test1
Hdisk2
datavg
54
test2
Hdisk2
datavg
48
2升级系统
2.1安装系统bundle和基本包
1.1安装系统bundle
#smittyeasy_install—>installsoftwarebundle,安装Server和App-Dev
1.2安装基本包bos.*和rsct.*
#smitinstall–>installsoftware这里选择所有的bos的包;
3前期配置工作
3.1设置ip地址
#Smittcpip
更改en1ip地址~同上
3.2更改hosts文件(node1&node2)
#vi/etc/hosts编辑文件
192.168.1.1test1_boot1test1
192.168.2.1test2_boot1test2
192.168.1.2test1_boot2
192.168.2.2test2_boot2
172.29.2.211test1_per
172.29.2.212test2_per
172.29.2.210ser
#chmod755hosts
Ser为serviceip
Node1_perNode2_per为永久ip(又称管理ip)
3.3设置系统各参数
设置异步io(aio)
#Smitchaio(重启生效)
3.4设置每用户最大进程数
#smitsystem->change/showcharacteristicsofoperationsystem
3.5修改/etc/security/limits,取消各种限制
default:
fsize=-1
core=-1
cpu=-1
data=-1
rss=-1
stack=-1
nofiles=2000
3.6扩充Pagingspace
查看页空间大小
#lsps-a
#smitchps—>选择hd6,这里扩充为4G
PP大小为128M,32为PP个数,共扩充4G
3.7扩充/usr和/tmp
查看文件分区大小
#df-m
#smitchfs→选择/usr,扩充为4G;
#smitchfs–>选择/tmp,扩充为500M;
4安装hacmp
安装HACMP
#smitinstall_latest
在选择文件集的时候,除了cluster.h*的不选,其余的都选;
因为这里hacmp的需求包已经安装(前面的rsct.*),所以这里不会有什么错误;
确认安装和补丁包:
lslpp–lcluster.*
另外节点同上,安装HACMP
5共享磁盘管理
5.1创建共享盘
AIX主机通过SAN环境连接HDS存储AMS2100,HDS存储划出200GB的共享磁盘同时映射给2台小机上的HBA卡,并通过命令:
cfgmgr–v识别
识别到共享存储后,通过:
chdev–lhdiskX–apv=yes赋予pvid
再使用lspv命令在2台小机上面确认pvid的一致性。
5.2建共享卷组
创建步骤在node1上创建datavg,然后再在node2上importvg;
#smitmkvg
确认vg:
#lsvg
#lsvg–o
#lspv
#varyoffvgdatavg
在备机上面导入vg的信息
Importvg–ydatavghdiskX
#lsvg
#lsvg–o
#lspv
#varyoffvgdatavg
6配置HACMP
6.1创建Cluster
#smithacmpàExtendedConfigurationàExtendedTopologyConfigurationàConfigureanHACMPClusteràAdd/Change/ShowanHACMPCluster
6.2添加节点
#smithacmpàExtendedConfigurationàExtendedTopologyConfigurationà
ConfigureHACMPSitesàAddaNodetotheHACMPCluster
同样方法添加节点2
从相关节点发现一下;
#smithacmpàExtendedConfigurationàDiscoverHACMP-relatedInformationfromConfiguredNodes
6.3创建网络
#smithacmpàExtendedConfigurationàConfigureHACMPNetworksAddaNetworktotheHACMPCluster
6.4添加ip地址到新网络中
#smithacmpàExtendedConfigurationàExtendedTopologyConfigurationàConfigureHACMPCommunicationInterfaces/DevicesàAddCommunicationInterfaces/DevicesàAddPre-definedCommunicationInterfacesandDevicesàCommunicationInterfaces
同样方法添加node2
6.5配置永久IP(管理IP)
#smithacmpàExtendedConfigurationàExtendedTopologyConfigurationàConfigureHACMPPersistentNodeIPLabel/AddressesàAddaPersistentNodeIPLabel/Addressàha_node1
同样方法添加node2
6.6配置资源组
6.6.1编写start和stop脚本(两节点)
#mkdir/usr/hascript
#vistart-app
bannerstarttingapp
exit0
#vistop-app
bannerstopingapp
bannerappisstoped
exit0
6.6.2添加appserver
#smithacmpàExtendedConfigurationàExtendedResourceConfigurationàHACMPExtendedResourcesConfigurationàConfigureHACMPApplicationServersàAddanApplicationServer
6.6.3添加serverip
#smithacmpàExtendedConfigurationàExtendedResourceConfigurationàHACMPExtendedResourcesConfigurationàConfigureHACMPServiceIPLabels/AddressesàAddaServiceIPLabel/AddressàConfigurableonMultipleNodes
6.6.4添加资源组
#smithacmpàExtendedConfigurationàExtendedResourceConfigurationà
6.6.5配置资源组
#smithacmpàExtendedConfigurationàExtendedResourceConfigurationàHACMPExtendedResourceGroupConfigurationàChange/ShowResourcesandAttributesforaResourceGroupàdata_rg
6.7同步
#smithacmpàExtendedConfigurationà
同步成功!
!
6.8启动HACMP
#smitclstart
确认HACMP启动后的网络和卷组的状况
6.9测试
#/usr/es/sbin/cluster/clinfo–a
打开另一个窗口
#/usr/es/sbin/cluster/clstat
可以看出当前资源组在node1(本文中的test1)上
查看服务ip地址在en1网卡上
10.10.10.10相当于之前提到的172.29.2.210
6.9.1手动正常切换资源组
#smitclstop
查看资源:
资源正常切到node2上
#/usr/es/sbin/cluster/clstat