XXXX单位双机热备环境安装步骤.docx
《XXXX单位双机热备环境安装步骤.docx》由会员分享,可在线阅读,更多相关《XXXX单位双机热备环境安装步骤.docx(10页珍藏版)》请在冰豆网上搜索。
XXXX单位双机热备环境安装步骤
XXXX双机热备环境安装步骤
一、服务器配置
主服务器(Dell2950)
1.配置:
Dell2950/xeon*2双核cpu/2GRAM/73G*2(带本机raid卡,做了镜像raid1);本机SCSI卡、PERC5/i,外扩PERC4e/DC
2.机身码:
9F----X
3.机器名:
zzzzzserver1
IP:
192.168.1.3/255.255.255.0
心跳IP:
10.0.0.1/255.0.0.0
备服务器(Dell4600)
a)配置:
Dell4600/2cpu/1GRAM/36G*2(不带本机raid卡,没有镜像);带一外扩SCSI卡PRRC4/DC
b)机身码:
8Y----X
c)机器名:
qqqqqserver3
IP:
192.168.1.4/255.255.255.0
心跳IP:
10.0.0.2/255.0.0.0
双机环境
a)虚拟IP:
192.168.1.2/255.255.255.0
b)服务别名:
zxxxxserver
磁盘阵列
磁盘阵列柜:
dell220s73G*10做raid5
容量545G=73G*10+73G*1(热备盘)
Pluswell注册码:
主:
xxxxxxx注册码:
xxxxxxxxxxxxxxxxx
备:
xxxxxxx注册码:
xxxxxxxxxxxxxxxxx
二、硬件环境检查
1.查看整个局域网内是否有与双机环境提供的虚拟IP和服务名存在冲突
2.磁盘阵列柜的电源是否打开
3.RAID是否完成
4.SCSI(控制)卡是否安装且工作正常
5.磁盘阵列柜连接主、备服务器的SCSI线缆是否牢固
6.主、备用服务器的系统磁盘管理中是否找到磁盘阵列柜
7.磁盘阵列柜在主服务器和备用服务器中的驱动器号要求一致(注意:
不可将磁盘分区标记为活动的)
8.主、备服务器上正确安装Pluswellcluster,并创建磁盘阵列柜的卷保护
9.主、备服务器TCP/IP心跳线是否连接正常且测试通过(可以互ping)
10.主、备服务器COM口心跳线是否连接正常,且测试通过。
11.检查磁盘阵列的配置,如查看各逻辑盘,确定好安装数据库DATA的盘符。
三、双机服务器操作系统及磁盘阵列安装及配置
1.先安装双机中的第一台服务器的操作系统(windowsserver2003+sp1),此时第二台服务器处在关机状态。
1)注意安装服务器操作系统时,该服务器的引导盘信息需与所安装的操作系统相匹配,即在引导盘中能够找到该操作系统。
如:
使用dell4600自带的引导盘去安装win2003+Sp1时就不支持,到复制完程序后就会重启时就会提示admide.sys文件找不到,无法进行下去。
但是使用dell2950的引导盘在dell4600上安装时却是可以找到win2003+sp1的,安装下去也没有上述问题存在。
2)使用引导盘安装时,如果本地磁盘(指服务器自带的SCSI磁盘,而不是阵列柜上的磁盘阵列)配有RAID卡,则会提示使用何种RAID进行配置(建议使用RAID1完全镜像模式,检查默认设置是否是RAID1,若是只需跳过此步继续往下安装操作系统即可)
2.关闭双机中的第一台服务器,再安装第二台服务器的操作系统(windowsserver2003+sp1)
1)安装时需注意先检查本机的磁盘号与第一台安装好的磁盘号是否一致(必须一致,否则在后面的双机配置时磁盘号不一致,会导致双机切换不成功),如:
第一台安装时磁盘0给了本机磁盘,磁盘1给了磁盘阵列柜,那么此时在开机自检时需注意观察本机有多少个磁盘号,是否与第一台机器相匹配,如果不匹配的情况一般有两种:
a)本机磁盘未做RAID1,所以有多个磁盘号,其中每一个磁盘号即代表一块SCSI盘,此时如果本机是配有RAID卡的(一般看开机时有提示如REP5i/dc等),则需要在BIOS或者在后面的安装操作系统配置成RAID1的模式,这样才能与第一台机器的配置一致。
b)本机磁盘未做RAID1,而且又没配有RAID卡的情况下,因为做不了RAID,所以只能先拔下多余的SCSI盘,在本机上只留下一块SCSI磁盘,这样才会自动占用了磁盘0通道,与第一台机器也相匹配了。
3.两台服务器操作系统安装完毕后,主、备服务器上都可以操作磁盘阵列(注:
主、备服务器不能同时去读写阵列柜上的文件、数据等)
4.两台服务器不能同时启动或关闭,必须等待另一台机器完全启动完毕或关闭后才允许对另一台机器进行操作。
5.安装完操作系统后需要做如下测试:
单台机器是否能与外部网络的机器相通,如果不通则需要检查该网卡的IP是否真正设置在了与实际连到外部的网卡上,因为在安装时会提示要输入心跳线和外部IP地址,有可能会有张冠李戴的现象。
四、数据库软件安装配置
1.关闭备服务器,只保持主服务器在开机的状态下进行数据库的安装
2.数据库安装及注意事项
数据库安装过程与普通的数据库安装过程是基本相同的,即两台服务器需分别安装数据库系统,但有一些事项需要特别注意的
双机中安装数据的注意事项
1)数据文件的路径必须在阵列柜上的同一个目录下;
2)程序文件必须安装在本地磁盘上;
3)服务(server、agent)启动模式必须设置成手工启动,用户帐号必须为本地系统帐户;
4)身份验证模式使用混合模式;
5)安装完第一台服务器的数据库系统后要保证:
a)SQLSERVER和SQLSERVERAGENT服务处于停止状态
b)用双机软件将卷资源切换到第二台服务器上
c)把磁盘阵列柜(卷锁)上第一次建立的数据文件夹改名
6)安装第二台数据库的方法、路径必须与第一台保持一致
7)安装完数据库后,还要在每台服务器上安装相关的数据库补丁,如安装补丁SP3。
五、双机软件(pluswellcluster)安装配置
1.以administrator用户逐台安装两台服务器的pluswellcluster软件。
2.保证双机的Administrator用户的密码一致。
3.进行pluswellcluster软件的配置
1)进行心跳线的配置
a)TCP/IP心跳线
注:
主机IP选择时需选择内部心跳线的IP地址
b)RS232心跳线(略)
2)资源配置
a)虚拟IP的配置,如下图:
附:
各项配置值说明
i.可切换IP:
192.168.1.2即双机虚拟IP;
ii.IP占位符:
192.168.1.3与192.168.1.4分别是主、备机服务器与外网的实际IP;
iii.网络适配器与IP地址的选择必须要一致(因为每台机器还有一个心跳线的IP);
iv.自动切回:
打勾即表示,当主机down掉时备机接,如果主机重新恢复后,程序自动的又切换回主机接管,为了考虑有时候正当业务运作很繁忙时如果程序在没人知道情况下又自动切回主机状态,则有可能会影响业务运行,所以此选项不需要打勾保持默认值,真正需要时请手工切换
v.其它各项也保持默认值即可
b)虚拟计算机名的配置
可选项,因为该虚拟机器名是靠NETBUIT协议支持,其速度比起TCP/IP协议要慢;二是因为目前在安装网络协议中,常规的只安装TCP/IP协议即可)
c)卷锁配置
附:
各项配置值说明
i.文件卷:
两台双机服务器共用的磁盘阵列柜的盘符,为了突出该盘符
ii.与本地磁盘所不同,最好在设置逻辑盘符(之前在管理工具的计算机管理的磁盘管理下设置的)时越往后越好,如可以设置成“Y、Z”等。
iii.磁盘号:
磁盘阵列柜在操作系统磁盘管理下的磁盘号,如:
磁盘0、
iv.磁盘1
v.分区号:
磁盘阵列柜的磁盘分区起始号
vi.其它选项保持默认即可
d)文件共享配置
目前暂时没有做此项设置,现在的做法是:
在公共的磁盘阵列柜上新建一个需要对外共享的文件夹
然后轮流在每台单机服务器上对该文件夹进行设置共享,注意设置该共享之前需要加入客户端能够访问到的用户名(如etone),并且需要在计算机管理的用户管理中,把guest用户设置可用状态。
e)NT服务配置(等SQLSERVER安装完毕后再进行配置)
i.配置SQLSERVER服务
附:
各项配置值说明
1)欲保护的Services:
即需要做成主、备服务器公用的服务,如SQLSERVER服务。
2)本机所有Services:
即从当前本机所有的服务中进行选择
3)其它选项保持默认即可
ii.配置SQLSERVERATGENT服务
附:
各项设置值与SQLSERVER的一致
3)建立资源层
附:
配置说明
1)用鼠标左键拖动各个服务的图标进行关系信赖图的建立。
2)依赖图说明如下:
SQLSERVERAGENT依赖MSSQLSERVER
MSSQLSERVER依赖磁盘阵列(Y盘)
磁盘阵列(Y盘)依赖虚拟公共IP或虚拟公共别名
4)系统设置
附:
各项值配置说明:
a)需要把系统设置下面的两个选项打上勾,以监测双方的资源情况
b)如果当双机出现异常时需要声音报警,请在报警选项中进行打勾,消除报警声时需要每次手工去点击一下“停止报警声”选项。
4.双机系统操作注意事项
Pluswellcluster建立好各项配置关系之后,菜单下的“停止服务”选项千万不能使用,因为如果停止了服务有可能会导致磁盘阵列柜的磁盘(Y盘)丢失,从而有可能会破坏卷锁和数据;如果纯粹是为了维护而停止服务的话建议通过修改后台服务为手动,然后重启该服务器的方式,以达到双机服务的停止。
如下图:
5.维护各项服务
a)双机完成安装后,SQLSERVER、SQLSERVERAGENT要把自动启动的勾去掉。
b)一般情况下,SQLSERVER、SQLSERVERAGENT的启动和停止都是通过在Pluswellcluster软件中的资源依赖关系图进行“启动资源”或者“停止资源”来完成(具体操作方法是在关系图中用左键点击服务的名称,然后用右键点击服务的名称,在弹出的选项中选择“启动资源、停止资源”等)。
c)特殊情况下,需要维护SQLSERVER、SQLSERVERAGENT的,则先通过在Pluswellcluster软件中的资源依赖关系图进行“维护资源”(具体操作方法是在关系图中用左键点击服务的名称,然后用右键点击服务的名称,在弹出的选项中选择“维护资源”,此时,该资源变为红色),然后单独选择SQLSERVER/SERSERVERAGENT进行启动或者停止服务。
六、测试双机环境
主备机之间是否可以正常切换,客户端是否可以正常访问
七、切换过程
第一次停机切换步骤(主要是为了启用备用服务器进行门诊单价的查)
1)停止当前服务器,启用备用服务器
a)通知门诊收费停止办理业务转入手工操作阶段,除门诊收费外其他业务部门暂停业务
b)断开当前服务器与所有业务部门的连接
c)启用之前恢复好的备用服务器,此时仅允许门诊收费用于药品、卫生材料、医疗服务单价的查询,不能保存数据
2)备份生产业务数据
a)先用备份工具按正常方式备一份数据,拷贝到双机环境上
b)再停止SQLSERVER,进行冷拷贝,到双机环境上,以防万一
3)恢复生产业务数据
a)先建立好双机环境上的登录用户,以及在model库建好用户
b)使用准备好的挂载语句在双机环境上恢复数据库数据,注意数据路径
4)业务数据环境验证
a)检查JOB是否恢复成功,若不成功,则用之前生成的job脚本重新建立