双机热备安装说明doc.docx
《双机热备安装说明doc.docx》由会员分享,可在线阅读,更多相关《双机热备安装说明doc.docx(20页珍藏版)》请在冰豆网上搜索。
双机热备安装说明doc
浪潮服务器高可用软件LCH简介理论篇
仁浪潮LCHA双机软件
LCHA是一套提供防止业务主机因不可避免的意外性或计划性宕机问题的高可用性软件。
LCHA软件同时安装在两台主机上,用于监视系统的状态,协调两台主机的工作,维护系统的可用性。
它能侦测应用级系统软件、硬件发生的故障,及时地进行错误隔绝、恢复,以最低成本提供用户几乎不停顿的计算机作业环境。
1.1工作模式
主从方式(Active/Standby)主机工作,从机处于监控准备状态。
当主机宕机时,从
机接管从机的工作,待主机恢复正常后,按使用者的预定以自动或手动的方式将服务切换到主机上运行。
双工方式(Active/Active)两台主机同时运行各自的服务工作,且相互监测对方的
情况。
当一台主机宕机时,另外一台主机立即接管它的工作,保证工作不间断。
1.2特点
当一台活动服务器宕机时,其IP地址、服务器名称及运行的作业会自动
的IP地
转移至另一台服务器,客户端软件不需要重新设定,只要重新连结至原来址及服务器名称即可继续作业;
两台服务器的信息交换可通过:
RS232、TCP/IP;
LCHA采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时间并防范错误,提
供故障警告;
LCHA可设定故障排除后自动或手动回复(switchback);
LCHA^装时不需要修改操作系统的核心、更改应用软件,也无需特殊的硬件;LCHA与
MSC实际上都启动了Windows下的clusterservice服务。
ROSEH提供基于GUI的监控中心,管理员能查看LCHA勺状态、检查错误信息和警告、
修改系统参数及从远程工作站管理LCHA系统;
与数据库无关,可以支持各种数据库,包括ORACLESybase、Informix
等。
1.3PrivateNet私用网络
两台服务器通过私用网络心跳(HeartBeat)信号,使两台服务器能够相互了解对方
的运行情况。
为了避免不必要的失效切换,最好建立两条独立的物理路径作为通讯
路径。
RS-232SocketPrivateNet:
配置服务器空闲的串口作为一条通讯路径。
TCP/IPSocketPrivateNet:
两台服务器的网卡用反线(backtoback)直接
或通过LAN建立一条通讯路径。
如果所有的私用网均失效,服务器仍然可以用公用侦测对方服务器的可用性。
如果对
方服务器仍然可用,不触发接管动作;如果对方服务器不可用,立即接管动作。
1.4
PublicNet公用网络
客户端通过此网络与服务器通信,当两台服务器互为备份。
对于不同的服务,可以用不同的公用网连接到两台服务器。
LCHA支持TCP/IP协议,可以在thernetFastEthernet
FDDI和ATM网上运行。
1.5管理工具
友好、直观、易于操作的GUI界面
有关LCHA勺配置都可以在GUI中完成,支持动态配置和实时同步
网卡的状态,磁盘的状态都可在GUI中显示出来
用户可通过第三方Web浏览器进行远程管理
1.6监控的对象资源
Volume
IP地址
计算机别名
共享文件
NT服务
用户自定义
系统启动后,LCHA首先启动HAManager管理程序,根据高可靠性系统的配置结构初始化,然后启动必要的服务和代理程序来监控和管理系统服务。
HA弋理程序用来监控、监测、诊断
和管理硬件软件服务。
HAManager就会认为该服务处于活动状态,
HAManager,其每项服务处于正常。
当代理程序检测到某个服务发生故障时,它就通知HAManager管理程序。
HA软件首先会重
新启动该服务多次(可由用户设定)。
如果启动不能成功,该服务会由HA转移到后备服务器
上。
HA周期性地检测系统硬件的状态,如果硬件发生故障,HA会把与该硬件相关的服务转移到
后备服务器上。
当某项服务发生转移时,HA首先在运行服务器上停止该服务,之后,由备
份服务器上的HA在备份服务器上启动该服务。
由于停止和启动该服务需要一定的时间,所
以,当服务被切换(转移)时,该服务会有短暂的中断,转移完成后,服务自动恢复正常运行。
考虑到一些数据库系统(如ORACLESYBASEINFORMIX等)以及其它一些应用软件(如
DominoServer、WWWServer等),LCHA在HA管理模块(HAManager)的基础上,提供了一系列的Agent软件模块。
Agent为一个软件监视模块,监控数据库服务或其它应用服务的运行。
当运行服务器发生故障时,由Agent向HA主控软件请求,进行相应的处理动作。
总之丄CHA软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的
运行。
在正常的运作情形之下,主机之间透过冗余侦测线路互相侦测,当任一主机有错误产生时,
LCHA提供严谨的判断与分析,确认主机出错之后,才完全启动备援接管动作。
支持各种操作系统平台
支持众多的UNIX平台(如:
IBM、DECHPNCRSUNSGI、NECSIEMENS等)支持众多的PC平台的Unix系统(如:
SCO/Unix、SolrarisX86等)
支持各种数据库:
MS-SQLOracle、Informix、Sysbase、Excheng、Lotus/Nose、DB2等接管动作包括
接近零系统资源的占用
快速反映,错误检测时间小于10秒,故障切换及恢复时间一般在10-20秒
GUI与Server分离,可随时中断GUI而不影响Server的运行
支持JOB和BRINGIN/BRINGOUT、在一台SERVER上停止JOB不会导致FAILOVER
在同一块网卡上建立多个活动的IP地址,支持多个JOB的运行
主服务器网络连接故障时会自动FAILOVER,而备用援服务器失败时不会进行误切换
采用C++面向对象的方法设计,程序的稳健性、可维护性、扩充性得到提高
在双机热备的架构中,除了要考虑切换时间外,要根据每个系统的作业环境,包括网路系
统是单网或是双网,数据库的安装和作业内容及用户端的设备是经由广域网路、区域网路
接入不同用户有不同的需求,而要求有不同的切换模式,所以选择不同的切换模式,可以
使用户端的改变达到最少的程度。
LCHA根据不同的行业及各行业不同的需求设计多种备援模式以弹性的调适用户的最佳组合
及选择。
1.7LCHA系统运作方式
文件系统(FileSystem)
数据库(Database)
网络地址(IPAddress)
应用程序(AP)
系统环境(OS)
1.8容错备援运作过程
自动侦测(Auto-Detect)阶段由主机上的软件通过冗余侦测线,经由复杂的监听程序。
逻辑判断,来相互侦测对方运行的情况,所检查的项目有:
主机硬件(CPU和周边)、主机网络、主机操作系统
数据库引擎及其它应用程序主机与磁盘阵列连线
为确保侦测的正确性,而防止错误的判断,可设定安全侦测时间,包括侦测时间间隔,
侦测次数以调整安全系数,并且由主机的冗余通信连线,将所汇集的讯息记录下来,以供
维护参考。
自动切换(Auto-Switch)阶段某一主机如果确认对方故障,则正常主机除继续进行原
来的任务,还将依据各种容错备援模式接管预先设定的备援作业程序,并进行后续的程序
及服务。
自动恢复(Auto-Recovery)阶段在正常主机代替故障主机工作后,故障主机可离线进
行修复工作。
在故障主机修复后,透过冗余通讯线与原正常主机连线,自动切换回修复完
成的主机上。
整个回复过程完成由EDI-HA自动完成,亦可依据预先配置,选择回复动作
为半自动或不回复。
1.9多种容错备援模式模式1:
双机相互备援模式2:
主从式备援模式3:
HotStandby模式4:
双网卡,单网段类型5:
双网卡、双网段模式6:
多主机备援系统用户定制模式
在双机热备的架构中,除了要考虑切换时间外,要根据每个系统的作业环境,包括网路系
统是单网或是双网,数据库的安装和作业内容及用户端的设备是经由广域网路、区域网路
接入不同用户有不同的需求,而要求有不同的切换模式,所以选择不同的切换模式,可以
使用户端的改变达到最少的程度。
LCHA根据不同的行业及各行业不同的需求设计多种备援模式以弹性的调适用户的最佳组
合及选择。
樓式1■-跟机双工热备份(Mutu&lBackup^
双主机通过一条TCP/IP网络线以及一条RS-232电缆线相联双主机各自通过一条SCSI电缆线与RAID磁盘阵列相联
双主机各自运行不同的作业,彼此独立,并相互备援主机A故障后,主机B自动接管主机A运行
主机A的作业将在主机B上自动运行
主机A的客户(client)要在主机B上重新登录主机A修复后,主机B将把A的作业自动交还主机A已经连到主机B上的A的客户需要在主机A上重新登录
主机B故障时,主机A接管主机B的作业和数据主机B修复时,主机A再将原来接管的作业和数据交还主机B
双主机各自通过一条SCSI电缆线与RAID相联
主机A为Master,主机B为Slave
主机A处理作业和数据,主机B作为热备份机
主机A故障后,主机B自动接管主机A的作业和数据
主机B同时接管A的主机名(Host)及网络地址(IP)
主机A的作业将在主机B上自动运行
主机A的客户(client)可继续运行,无需重新登录
主机B现为Master,主机A修复后作为Slave,作为热备份机
2个主机建议使用规格相同的主机
模式3---双机热备份(HotStandby)
双主机通过一条TCP/IP网络线以及一条RS-232电缆线相联
双主机各自通过一条SCSI电缆线与RAID相联
主机A为Master,主机B为Slave
主机A处理作业和数据,主机B作为热备份机
主机A故障后,主机B自动接管主机A的作业和数据
主机B同时接管A的主机名(Host)及网络地址(IP)
主机A的作业将在主机B上自动运行
主机A的客户(client)可继续运行,无需重新登录
主机A修复后,自动接管原来的作业和数据,主机B继续作备份机
模式4---双机双网络适配器(DualEthernetAdapter)
双主机各自通过一条SCSI电缆线与RAID相联
双主机各自运行不同的作业
每一主机定义第一网口和第二网口
主机A上第一网口在故障时由第二网口接管
主机B上第一网口在故障时由第二网口接管
主机A故障后,主机B自动接管主机A的作业和数据
主机B同时接管A的主机名(Host)及网络地址(IP)
主机A的作业将在主机B上自动运行
主机A的客户(client)可继续运行,无需重新登录
主机A同样可作B的备份机
进行数机双工备份和网卡的备份
应用篇
硬件环境:
设备
配置
备注
NP200服务器
IntelPentium
NL100T服务器
IntelPentium
NS3500存储
4块73GSCSI硬盘
SCSI线
HDC-VHDC线缆2根
网卡
IntelPRO/100+SAdapter*2
网线
3(其中一根为交叉网线)
方案软件环境
软件名称
L备注
Windows2000AdvaneedServer
SP1
SQLServer2000
EnterPrise
Exchange2000Enterprise
集群的设计:
名称
内容
节点名
主机名:
NT1(节点一)
Publicnet
168.200.21.96
Private
192.100.0.1
OS
Windows2000AdvaneedServer
主机名:
NT2(节点二)
Publicnet
168.200.21.97
Private
192.100.0.2
OS
Windows2000AdvaneedServer
注:
节点名、publicnetip和privatenetip,为举例使用的名称、数字。
2集群服务安装
2.1在安装前首先明确您需要做什么?
NS3500的使用:
做Array、分区。
硬件的连接:
网线、SCSI线、电源线。
操作系统的安装:
包括各种驱动程序的安装。
LCHA的安装。
数据库的安装。
最终的测试。
清楚了这些细节我们就可以开始安装了。
2.2
NS3500的使用
请参考NS3500的使用手册做好Array,并且分好slice,为每个Slice指定LUN号。
如
下:
Slice2:
用户自定义对应LUNO。
Slice3:
用户自定义对应LUN1。
这样在操作系统下就可以看到新的2个逻辑磁盘。
请根据具体的应用情况分区。
请注意在
手动映射Hostchannel时将Array分别映射到Hostchannel1和Hostchannel2。
word文档可编辑
2.3硬件的连接
将SCSI线缆分别连接到服务器端与NS3500的hostchannel端。
将网线分别连接到两
台服务器的网卡端口中,另一端接到交换机或者集线器上作为公共网publicnet;用交叉
网线将剩余的两块网卡相连作为心跳线,即privatenet。
注意:
每个集群节点都至少需要
两个网卡-一个连接公众网,一个连接内部网(它只包含了集群节点)。
内部网卡建立点
对点的通信、集群状态信号和集群管理。
每个节点的公众网卡连接该集群到公众网上,并再响应客户请求。
2.4操作系统的安装
1.在NT1上安装windowsserver操作系统,安装两块网卡的驱动程序,安装SCSI控
制器的驱动程序。
2.NT1上指定net0为公共网,设IP为:
168.200.21.96(IP地址由用户定义),并将第
个本地连接改名为publicnet。
NT1上指定net1为专用网,设IP为:
192.100.0.1(IP地址由用户定义),并将第二个本地连接改名为privatenet。
3.在NT2上重复1-2步;将NT2的publicnetIP设为:
168.200.21.97(IP地址由
用户定义),privatenetIP设为192.100.0.2(IP地址由用户定义)。
4.测试网络连接状况。
NT1和NT2开机,在任何一台服务器上使用ping命令测试网络连接状况。
例如,在NT1上,运行ping192.100.0.2-t,连通说明privatenet设置正确。
运行ping所在的网关来测试publicnet设置。
如果两项网络都连通继续下
<步0
5.测试磁盘阵列连接情况。
NT2关机的情况下,NS3500加电开机。
自检完毕后显示RAID
READY,NT1开机。
选择计算机管理磁盘管理选择重新扫描磁盘。
发现新的逻辑磁盘,
即在NS3500上划分的Slice1Slice2。
如果没有找到请检查线缆连接情况、SCSI卡驱动
程序安装是否正确。
6.更改磁盘路径。
按照您需要的顺序更改C、DE、F、GH等。
7.同样对于NT2重复5-6步。
在NT1关机的情况下,NS3500加电自检完毕后显示RAID
READYNT2开机。
择计算机管理磁盘管理一〉选择重新扫描磁盘。
发现新的逻辑磁盘,
按照第6步设置相同的磁盘顺序,对于公共磁盘一定要与NT1设置为相同的盘符。
2.5
LCHA的安装
在两台服务器上分别执行下列过程:
启动服务器,登录管理员账号。
在CD-ROM上运行安
装程序,按照提示的步骤一步一步的进行。
点击“Next”继续,点击“Cancel”放弃安装。
Wclcoms
在"Name项键入您的名字称,在"Company键入您公司的名称。
点击"Next”继续,点击"Cancel”放弃安装,点击"Back”回至U"Welcome"对话框。
UserInform-ation
T>jpeyomrtametjelow.Youmustalso创口亡thenameolthecompany5JOUkworklor.
Cancel
在“Local”项键入当前服务器的计算机名,例如NT1。
在“Remote”项键入对等的另一
台服务器的计算机名,例如NT2。
点击“Next”继续,点击“Cancel”放弃安装,点击“Back”回到“UserInformation”对话框。
C^rwel
点击"Browse”给LCHA指定安装目录,或者接收提供的缺省目录。
点击"Next”继续.
Choo$eDestinationLocati口口
安装完成后,点击“OK'退出安装程序。
Informalion
;1)Setupitcomplets.Youmaviuntheinstalledprogrambydouble-clickingorheprogrsmXricon.
LCHA安装后在开始菜单会显示“EnterpriseNTCluster”,包括Cluster
AdministrationTool,Clusteron-IineHelp下拉菜单。
在控制面板的服务一项中,把ClusterService和ClusterMonitorService
启动,并把属性设为自动。
2.6
获取LCHA许可代码
LCHA需要正确的许可信息来启动操作。
在两台服务器上执行下列操作来获取许可信息。
1.在开始菜单点击"ClusterAdministrationTool”进入LCHAf理工具GUI。
2.在下拉菜单"Tools”选择"License”条目。
一个"LicenseInformation”窗口会
弹出,把HostID传给浪潮客户服务中心以获取合法的序列号、日期、和许可号。
3.把获取得序列号、(到期)日期和许可号键入"LicenseInformation”窗口。
点击
“OK',LCHA就可以投入工作了。
2.7
LCHA的配置
2.7.1
配置socket心跳线
PrivateNet
ICF/IFSocket
RS-222Eeti对Part
PublicDrivw
点击工具栏的一按钮或者在“PrivateNet”下拉菜单选择“TCP/IPSocket
条目访问“TCP/IPSocketPrivateNet”项目栏。
在IPAddress中对应着选择privatenet的IP地址作为专用网络,其它默认即可。
(可以参考手册了解详细的菜单说明)点击Add按钮就可以创建sock心跳线了。
同样在第二台服务器上进行相同的操作,只是
2.7.2
IP地址与ComputerName对应要注意。
配置RS-232心跳线
点击工具栏的按钮或者在
PrivateNet
Port"条目访问“RS232SerialPortPrivate跳线类似。
Net”
下拉菜单选择“RS232Serial
项目栏。
操作方法与配置Sokcet心
2.7.3
配置IP资源
选择ResourcecreatIPAddress,如下图
2.7.4
配置Volume卷资源
选择ResourcecreatVolume,女口下图
ActiveServer下拉菜单可以选择活动服务器为NT1还是NT2;
选中磁盘阵列所代表的共享磁盘,如G:
点击Add;
点击Create,创建完毕共享磁盘。
2.7.5
配置计算机别名资源
选择ResourcecreatComputerAliasName,女口下图
ActiveServer下拉菜单可以选择活动服务器为NT1还是NT2;
ComputerObjectName中可以输入想创建的虚拟别名,这样可以通过这个别名来访问集群;点击Create,创建完毕计算机别名。
配置NTservice资源
这一步应该是在安装完毕所需要的程序后进行。
例如,您必须先分别在两台服务器上安装好
SQLServer以后才能在LCHA下配置NTservice.
选择ResourcecreatNTservices,女口下图
NTServiceResourceConfiguration
ActiveServer下拉菜单可以选择活动服务器为NT1还是NT2;
ObjectName中可以输入想创建的NT服务的名称,例如输入SQLserver;
从服务中选择服务,点击Select;
点击Create,创建完NT服务。
2.7.7
测试集群服务
1.带入带出服务测试
选中想要带入的服务,点击bringin按钮
绿色说明作为备用。
点击Bringout可以将服务带出。
2.手动接管测试
点击所要切换的服务,选择Failover,可以发现服务切换过去。
3.主机宕机测试将主机关闭,可以发现服务自动的切换到备用机上;主机打开后,作为备用机来监视服务。
4.访问测试终端在以上的切换过程中几乎不受影响。
只有在切换发生的时候会中断几十秒钟,说明正常。
最终的测试集群管理器中显示各项服务处于联机状态,选中NT1或者NT2的组例如sqlservice组,右键移动组,在短暂的暂停后NT1的sqlserver会中止,NT2的sqlserver会启动,说明安装成功。
测试1:
将NT1的公共网线拔掉,NT2会接管;将NT1的公共网线重新插上,NT1处于备用状态,选择移动组,NT1重新接管服务。
测试2:
将NT1关机或者突然断电模仿故障,NT2会接管服务;将NT1重新启动,NT1处于备用状态,选择移动组,NT1重新接管服务。
集群安装成功!