高可用多机集群数据备份双机热备方案.docx
《高可用多机集群数据备份双机热备方案.docx》由会员分享,可在线阅读,更多相关《高可用多机集群数据备份双机热备方案.docx(31页珍藏版)》请在冰豆网上搜索。
高可用多机集群数据备份双机热备方案
PLUSWELL多机集群、数据备份
解决方案
北京蓝科泰达科技有限公司
2008年7月
一:
概述
企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。
而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。
而用户寻求底成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。
有时因护理不当造成数据损坏,发生更大的事故。
蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。
蓝科泰达容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。
蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux平台,SCOUNIX平台上的多种双机热备软件。
二、需求分析
企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。
所以我们要求双机软件能够实现以下几点:
1、异常终端检测
2、网络故障,系统故障,应用程序故障等全系统检测
3、当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行
4、速度快(快速恢复)
贵单位业务平台,是以Windwos2003Server系统平台为基础,以SQLServer核心的数据库应用系统,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。
因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell软件可以保障该系统中的某一节点故障都可被PlusWell软件所监控,如主服务器应用程序、网卡、操作系统,均纳入公共的安全体系,确保7*24的不停机。
比较典型的危及系统安全应用和系统错误主要有:
(1)进程错误,比如用户应用与文件数据库的连接异常中断或用户进程发生错误。
(2)文件系统故障,由于异常操作或其它原因造成文件系统内部部分信息丢失或不一致。
(3)操作系统故障,操作系统本身的系统调用问题及底层的应用驱动在安装或更新出现冲突;
(4)网络线缆故障。
(5)介质问题,网络连接或物理硬盘也可能会出现问题。
方案拓扑:
三、解决方案
根据用户的具体需求,结合贵单位用户实际应用中高可用性的重要性,方案描述如下:
1、基于内存镜像的方式做主备机的数据实时同步,当主机处理数据信息时,数据信息通过TCP/IP同步到备机,当主机发出写入指令后,备机执行同等操作;用户端提示保存成功,这时候主备机数据都已写入,时刻保障主备机的数据一致性
2、主备机意外关机,管理人员操作启动顺序失误等意外发生后,软件会智能检测,数据新的一方启动数据服务,保障用户数据不丢失(详细测试见附件一)
3、pluswell双机热备份软件能深层检测软硬件信息,在主机软硬件故障后,能迅速的切换到备机,保证应用的不间断性。
(pluswell为奥运集群选用产品)
4、由于考虑到阵列的单点故障,建议采用pluswellmirror企业版做数据的实时备份(支持恢复之前到任何时期),做到本地数据冗余。
5、数据归档文件由PLUSWELL专业加密保存,可以指定网络服务器为保存路径,也可以保存在本机磁盘内,基于底层的数据复制归档技术,保障随时更新您的历史数据,而不影响系统性能;当遭遇病毒攻击、意外删除、磁盘格式化、硬盘损坏等,均可以实时的恢复数据。
双机软件PlusWell四、.
(1)本双机热备方案适用系统如下:
Windows2000/2003,RedHatLinux
(2)适用的数据库系统:
MSSQL2000,Oracle8i/9i/10G,Sybase,MySQL,PostSQL,DB2等数据库
(3)适用第三方应用程序:
为第三方应用程序提供监控程序,同时可为用户特有程序提供编程结口。
(4)双机热备形式:
Active/Standby,Active/Active
Active/Standby方式是传统的双机热备份解决方案,主机运行时,备机处于备用状态,当主机故障时,备机马上启动将服务接替。
因备机平台没有其它的访问量,所以故障切换后用户访问速度不会有大的影响,此种容错方式主要适用于用户只有一种应用,主备机设备配置不太一样,并且用户访问量大的情况。
Active/Active这种方式的主备机平时各自有一种应用运行,当系统中的任何一台主机出现故障,应用都会集中到一台服务器上运行,此时这台备用服务器不仅要承担以前的程序运行而且还要运行宕机服务器上的应用程序,所以此时备机的负担会加重。
这种方式的故障切换往往会造成备机访问量增大,系统运行变慢。
此方式主要适合用户有不只一种应用,用户主备机配置一样且数据访问量不大的情况。
(5)适用服务器:
此双机方案适用的服务器:
IBM,HP,DELL,以及所有Intel架构的服务器。
(6)双机热备拓扑图:
Server1是主“激活”节点,Server2是次“备用”节点。
如果Server1发生故障了,它的被保护资源由Server2节点来恢复。
当节点Server1恢复后,资源可以被Server1重新获得
APPA处于Volumew中,并且在Server1上激活。
APPB存储在VolumeM上,并且在Server2上激活。
在这一配置中,Server1应该是VolumeW:
资源的主节点,Server2应该是VolumeM:
资源的主节点。
当Server2失败时,PlusWellCluster容错软件应该将VolumeM:
转换到Server1上去。
如果系统资源是足够的,这一转换不会影响到已经在Server1上运行的APPA,转换只是简单地将Server2上的被保护应用程序(APPB)加到Server1的运行负载上
五、PlusWell技术原理
(1)心跳工作过程
通过IP做心跳检测时,主备机会通过此心跳路径,周期性的发出相互检测的测试包,如果此时主机出现故障,备机在连续丢失设定数目的检测包后,会认为主机出现故障,这时备会自动检测设置中是否有第二种心跳,如果没有第二种心跳的话,备机则根据已设定的规则,启动备机的相关服务,完成双机热备的切换。
(2)IP工作过程
IP地址使用虚拟IP地址的方法来实现,主要原理如图
主机正常的情况下虚拟IP地址(即访问IP:
192.168.1.33)指向主机的实IP(192.168.1.11)地址,用户通过虚拟IP地址访问主机,这时,HA软件将虚拟IP地址解析到主机实IP地址。
当进行服务器切换时:
虚拟IP(即访问IP192.168.1.33)地址通过PlusWell热备份软件自动将虚拟IP地址解析到备机的实IP(192.168.1.22)地址上,这时,虚拟IP地址指向备机的实IP地址。
但对用户来说,用户访问的仍然是虚拟IP地址。
所以用户只会在切换的过程中发现有短暂的通信中断,经过一个短暂的时间,就可以恢复通信。
.
(3)应用及网络故障切换过程
(i)可以检测到操作系统的故障并及时将服务切到备用服务器
(ii)当操作系统正常的情况下,数据库系统出现意外故障,这时双机容错软件可以及时发现并将其切到备用服务器,使服务不致于停止。
(iii)当操作系统和数据库系统全都正常的情况下,服务器网络出现故障,这时双机热备软件,可以将系统切到正常的备用服务器上。
.
六、pluswellmirror功能描述1、硬盘镜像功能的功能,可将RAID卡中RAID1PlusWell可以有效的完成硬盘镜像功能,此功类似于不同的两块硬盘数据进行镜像,但其不同点在于:
本机硬盘间镜像网络间硬盘镜像功能
则可以在硬盘的Mirror)1RAID卡所支持的对象是两块相同的物理硬盘,而PlusWell(不同分区进行同步,当然为了数据更安全,本软件也见意用户将数据备份到不同硬盘中去。
可以进行网络实时备份,数据不仅可以备份到同一台服务器的一个PlusWellMirror)(2硬盘的不同分区或不同硬盘,也可对不同服务器之间的硬盘或分区进行网络镜像。
硬盘数据实时归档及实时回滚功能2、
)数据的实时备份及回滚:
1(可以有效将用户对数据硬盘的操作进行归档,对这些归档数据MirrorPlusWell
时行管理,记录用户对指定硬盘的所有操作,针对这些操作,用户可以在硬盘或系统损坏后及时的恢复,并可根据用户当时操作的时间,恢复到指定时刻将数据回滚恢复。
.
(2)网络数据恢复功能:
PlusWellMirror不仅可以将数据恢复到本机硬盘,还可以将本机数据恢复到网络中指定硬盘中去,也可以将远端数据恢复到本机指定硬盘,恢复模式灵活方便。
数据实时归档与数据实时回滚技术在硬盘镜像领域一直罕有人涉及,北京蓝科泰达科技有限公司突破技术屏障在国内率先研发生产出数据时实归档与数据实时回滚技术,其技术能力达到世界领先水平,也代表着国内硬盘同步技术的最高技术水准。
3、智能数据实别技术:
PlusWellMirror独有的智能数据实别技术可识别硬盘扇区的数据,只将有用的数据进行镜像,一般镜像创建时,会对硬盘所有扇区进行初始化,其实初始化的目标就是在同步之前首先要保证两块硬盘此时的数据一致性,PlusWellMirror软件并不是将每个扇区进行同步,而是将有数据扇区进行同步,大大减少了初始化时间。
比如硬盘中没有数据的情况下,将300GB的硬盘通过网络镜像到另一台服务器,初始化时间几分钟即可完成。
4、增量数据同步功能:
增量数据同步也是本软件独有的一大功能,多年来,数据同步系统在开关机后,往往都要重新初始化或每个扇区的对数据进行校验,而通过PlusWellMirror软件,完全可以做到增量数据的增量同步,这种增量同步,不仅仅指的是不同服务器开机时的增量,而在网络中相关的服务器关机、服务器故障后再开机,仍可以通过增量方式完成数据的同步,减少同步时间,防止用户误操作。
增量数据同步已经成为PlusWellMirror显著优势,撤底改变以往镜像软件因每次开关机都要对系统进行初始化,从而影响系统性能及稳定性。
成为硬盘镜像划时代的变革,也代表国产镜像软件已经达到世界先进水平,超过国外同类软件,处于领先地位。
5、网络数据的实时备份功能与定时数据收集备份功能。
可以在网络中通过同步镜像或异步镜像的功能对数PlusWellMirror网络备份功能:
*
据进行实时备份,通过同步镜像可以将数据完整的由主机镜像到备用机,此时数据流通过先写备机,后写主机的方式将数据实时写到两台服务器上,这种镜像方式可以保证任何时刻备机的数据总比主机新。
异步镜像方式发挥的服务器的最佳效能,使服务器以最快的速度进行存储,异步方式的写模式为先写主机再写备机,从而保证主机服务效率,PlusWellMirror通过提供用户两种可选模块的镜像方式,灵活的设置,从而更贴近用户的需求。
*定时备份系统:
主要功能是定时将数据传到数据备份中心,适合多个节点备份,每个节点可根据时间,定时将本机所产生的增量数据备份到数据备份中心进行保存。
定时将数据备份到数据备份中心应用切换实时镜像主机镜像+归档方式归档归档
备机
源盘
6、同PlusWellHA相互组合的双机热备
PlusWellMirror同PlusWellHA组合起来可以在没有磁盘阵列存储系统的情况下,完成纯软件方式双机热备份。
节省用户在硬件上的开支,同时又对用户数据起到了备份和数据回滚的功能,可谓一举三得。
大家知道,普通的双机热备离不开共享的磁盘阵列系统,而就是这个外置的磁盘阵列系统,却产生了存储问题—单点故障。
当磁盘阵列故障或意外断电的情况往往会造成双机热备的崩溃或数据库的永久损坏。
而采用PlusWellMirror与PlusWellHA的纯软件双机热备系统,却可以有效的保证数据安全,将数据存放在不同的服务器硬盘中,可有效保证数据安全,再加上数据归档及回滚功能,可确保数据万无一失。
.
应用切换实时镜像主机备机
7、口令保护功能:
PlusWellMirror的操作口令保护功能,主要为区分不同级别的管理人员来设定的,同不级别的服务器管理人拥有对该软件不同的操作权限,其中
管理员:
拥有对该软件的所有权限,包括创建,删除,同步,设置计划及任务。
用户权限:
则可能对软件进行基本操作,而不可以对软件进行创建与删除及数据恢复工作。
来宾权限:
来宾只有对软件的浏览权限,此权限只能看到该软件进行了什么工作,而不能对该软件进行任何操作。
PlusWellMirror通过对软件操作权限的控制方便了服务器管理,机房管理人员可根据此权限方便设定管理流程及策略。
8、设置备份恢复功能:
PlusWellMirror提供了对已设置的配置的备份及恢复功能,用户可事先将设置好的系统设置备出,如果有一天系统重装操作系统,可通过本软件的恢复功能,瞬间将系统配置恢复。
方便用户的维护,节省了你的程序维护成本。
.
9、报警系统:
报警系统是PlusWellMirror的一个重要组成部,也是人性化设计的一部分,PlusWell
Mirror的报警提供了声音报警,邮件通知,短信报警,这几种报警机制可以以最快的方式通知管理人员当前服务器的状态。
而其中的短信报警是具有中国特的便捷、迅速、有效的报警手段,在各类应用中被广范使用。
PlusWellMirror的报警系统可由用户设定报警级别,并可定置化的设计报警内容,在服务器进行初时化,切换,开关机,增量同步时,均可以发出报警通知当前服务器的状态。
10、在线升级与问题反馈系统:
当前互联网络发展非常迅猛,利用相联网可以方便的对PlusWellMirror进行在线升级,及用户问题的反馈,及时对软件进行升级可有效保护用户投资,提高软件的稳定性,并可以及时与我公司取得联系,加快软件的升级。
七:
pluswellmirror应用方案设计
(一)单机备份
此方案主要针对单机数据安全保护,用户在不增加硬盘的情况下,使用PlusWellMirror对硬盘不同分区进行数据同步或归档。
本机硬盘间镜像源本机数据归档镜像源目标目标归档
上图中的左图,为盘对盘镜像,此时两个硬盘或分区的数据是一致的,此种镜像主1()要是为了保护当前数据。
同时再将硬盘的此进源盘与目标盘的数据一样,+数据归档,)(2上图中的右图,为镜像增量数据归档,以利于必要时侯对数据的回滚。
将源如果用户不想只想做归档,那么用户只需要指定一个归档盘即可,此时Mirror(3)
盘的数据归档到指定硬盘中。
纯软件双机热备
(二)
不但可以省去外置磁盘阵列系统,PlusWellHA两个软件的配合,使用PlusWellMirror与而且可以完成数据数据的备份,消除系统的单点故障。
标准版软件,如下图中上面一个图,组Mirror+PlusWell标准版HAPlusWell:
组合搭配一.
成纯软件双机方案,此方案中,将服务器本身的一块硬盘,或某一个分区与备用服务器中的某一块硬盘或分区进行同步,利用PlusWellHA达到热备切换的目的。
工作原理:
当数据正常写到主服务器时,通过Mirror软件将数据包先行送达备份机,当备机写入成功后,将数据包写回主机。
当主机故障时,由HA软件切到备份服务器,此时备份服务器工作,主机故障停机,HA完成了一次有效切换。
当主服务器将故障排除后,主服务器启动,此时备份服务器将备机增量数据反镜像到主机,当主备机数据一致时,完成增量同步,此时可将服务器主从交换,回复到原来状态,服务器等待下一次切换。
目标
组合搭配二:
PlusWellMirror企业版软件+PlusWellHA标准版软件,如上图下面一副图,此方案可以完成数据归档及热备切换,当硬盘损坏或系统崩溃后,可由归档盘将数据回滚。
工作原理:
当数据到达主机时,Mirror将数据同时提交到备机的目标盘和归档盘,当备机写完后,再将数据同时提交给主机的源盘和主机的归档盘,完成一次数据的写入。
当主机故障时,由HA将备机启动,并工作,当主机排除故障,并重新启动计算机后,备机向主机进行数据增量同步或初始化,当同步结束后,用户可将主机重切回主机状态。
当发生数据损坏或磁盘无法读取时,可由主备机任一归档盘,通过软件的恢复功能,将数据恢复。
当然用户也可以将主备机任一归档盘的数据恢复到网络中任意第三台主机,也可以将主机归档数据恢复到备机指定硬盘,同样备机的归档数据也可以通过网络恢复到主机指定硬盘中。
(三)集中的数据备份中心
利用pluswellmirror数据同步与归档原理可以组建整合的集中数据备份中心。
八、配置列表:
产品号产品描述
类别硬件Windows2003操作系统标准版PluswellHA软件Pluswellmirror企业版(或单机版)
数量
2
2
(附件一)
测试报告1
测试环境:
Windows2003server+sp2,服务器名:
servr1server2,同步盘为f盘,容量为60G,
测试软件:
pluswellmirror,辅助软件pluswellcluster,sqlserver2000
测试人员:
测试时间:
测试要求:
同步设置不带日志。
测试序号
测试项目
测试结果
备注
预定结果
实际结果
测试初始化项目,主要指标:
初始化时间。
使两服务器同步盘初始数据相同。
初始化:
就是把主机同步盘的数据全部同步到备机同步盘里面,
1
创建同步
切换成功,数据同步测试同步数据的变化,测试项目包括创建文件,删除文件,修改文件。
测试指标:
2
在主机创建一个写字本文件,然后进行手动切换
文件传到备机
在主机创建一个写字本文件,然后主机关机,进行切换
到件传文备机
3
在主机删除一个文件,然后进行手动切换
文机在备件已删除
在主机删除一个文件,然后主机关机,进行切换
文在备机件已删除
4
然后进行手动切在主机修改一个文本文件,换
文机在备件已修改
然后关闭主机进在主机修改一个文本文件,行切换
文在备机件已修改
测试数据增量的变化,测试指标:
增量同步,软件坚强性
5
首先备机关机,在主机拷贝入200m大小的文件,然后关闭主机,再同时开机
大小的首先备机关机,在主机拷贝入200m文件,然后打开备机
在主机拷贝入多个小文件,拷贝过程中,备机关机,拷贝完以后再启动备机
在主机拷贝入多个小文件,拷贝过程中,备机重起
测试实际环境异常情况,测试指标:
数据完整性,软件坚强性
6
往主机拷贝数据,在拷贝过程中,同时关机,然后再同时开机
往主机拷贝数据,在拷贝过程中同时关机先启动备机,后启动主机
自动识别
然后主机关机,主机写数据,首先备机关机,先启动备机,后启动主机
自动识别
大小文件,然备机关机,主机拷贝约300m后备机开机在进行增量同步时,手动切换。
数据保护
备机关机,主机拷贝,2G文件,然后备机开机在进行数据初始化时,手动切换。
数据保护
和pluswellcluster配合使用做纯软双机,数据库为sqlserver2000。
测试指标:
软件的坚强性,软件的兼容性。
7
关机切换
手动切换
拔掉主机外网网线
在主机杀死数据库进程
sqlserver修改数据在主机然后关机关闭
sqlserver修改数据主机进行手动切换
测试报告2
测试环境:
Windows2003server+sp2,服务器名:
servr1server2,同步盘为f盘,容量为60G,
测试软件:
pluswellmirror,辅助软件pluswellcluster,sqlserver2000
测试人员:
测试时间:
测试要求:
同步设置带日志。
日志文件存在g盘(容量大小为60g)。
测试序号
测试项目
测试结果
备注
预定结果
实际结果
测试初始化项目,主要指标:
初始化时间。
使两服务器同步盘初始数据相同。
初始化:
就是把主机同步盘的数据全部同步到备机同步盘里面
1
创建同步
切换成功,数据同步测试同步数据的变化,测试项目包括创建文件,删除文件,修改文件。
测试指标:
2
在主机创建一个写字本文件,然后进行手动切换
文件传到备机
在主机创建一个写字本文件,然后主机关机,进行切换
到件传文备机
3
在主机删除一个文件,然后进行手动切换
文在备机件已删除
在主机删除一个文件,然后主机关机,进行切换
文机在备件已删除
4
在主机修改一个文本文件,然后进行手动切换
文机在备件已修改
然后关闭主机进在主机修改一个文本文件,行切换
文备机在件已修改
测试数据增量的变化,测试指标:
增量同步,软件坚强性
5
首先备机关机,在主机拷贝入200m大小的文件,然后关闭主机,再同时开机
大小的首先备机关机,在主机拷贝入200m文件,然后打开备机
在主机拷贝入多个小文件,拷贝过程中,备机关机,拷贝完以后再启动备机
在主机拷贝入多个小文件,拷贝过程中,备机重起.