双机热备容灾解决方案0716.docx

上传人:b****5 文档编号:7557474 上传时间:2023-01-25 格式:DOCX 页数:22 大小:786.68KB
下载 相关 举报
双机热备容灾解决方案0716.docx_第1页
第1页 / 共22页
双机热备容灾解决方案0716.docx_第2页
第2页 / 共22页
双机热备容灾解决方案0716.docx_第3页
第3页 / 共22页
双机热备容灾解决方案0716.docx_第4页
第4页 / 共22页
双机热备容灾解决方案0716.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

双机热备容灾解决方案0716.docx

《双机热备容灾解决方案0716.docx》由会员分享,可在线阅读,更多相关《双机热备容灾解决方案0716.docx(22页珍藏版)》请在冰豆网上搜索。

双机热备容灾解决方案0716.docx

双机热备容灾解决方案0716

 

双机热备容灾解决方案

 

编制单位:

北京睿芸翰林信息技术发展有限公司

编制日期:

2014年7月

第一章背景

大家都知道,双机热备有两种典型的方式,一种方式是通过纯软件的方式,一般称为纯软件方式或镜像方式(Mirror)。

一种是比较标准的,两台服务器通过一个共享的存储设备(一般是共享的磁盘阵列或存储区域网SAN),并且安装双机软件,实现双机热备,称为共享方式。

 随着信息化建设的不断推进,企业的信息化已经非常普遍,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用。

如果一些关键应用一旦发生宕机故障或应用停机,将给企业带来巨大的经济损失,并且由于业务的不可用而影响了企业的信誉,致使客户对企业失去信任,所造成的危害是致命的。

可见,对那些需要保障信息安全和提供不间断的信息服务的企业而言,业务系统的容错性和不间断性显得尤为重要。

如何保障各种关键应用持续运营,达到永续经营的良性循环,已成为当今企事业单位和IT领域急需解决的关键问题。

睿芸翰林信息技术发展有限公司自主研发的双机热备软件—REYUNHA。

其主要解决的是服务器的单点故障问题,当服务器的系统或服务器上的应用出现故障,不需人工干预,双机热备中另外一台服务器通过心跳线路,可以自动检测出该故障主机,准确、快速地将原主机的应用系统切换到另一台主机上继续运行,实现整个系统的不间断运行,从而保证整个系统对外服务的正常,为企业24小时×365天的关键业务应用提供了强大的保障。

 

第二章用户现状与需求分析

二.1用户现状

用户现有8台服务器,2台视频监控服务器,2台数据库服务器,2台流媒体服务器,2台管理服务器。

其中管理服务器共享一个阵列存储。

用户目前拓扑结构如下:

二.2需求分析

用户系统由于其自身结构的复杂性,在运行过程中常会出现各种各样的故障,这些故障都会不同程度地造成数据的丢失或者不完整。

一旦服务器由于断电导致宕机而又无法快速恢复使用,将会使用户的日常工作受到影响,甚至带来经济损失,如果出现硬盘损坏的情况,数据将全部丢失,对用来说将会是致命的经济损失。

✓用户希望能够解决当主服务器出现宕机或无法正常启动应用程序时,能够将所有的应用全部由备机接管。

✓用户希望可以在业务接管后能够保证存放在服务器中的数据库数据以及其他应用所产生的数据不丢失,保证关键数据的安全。

第三章推荐的解决方案

三.1推荐方案

用户现有8台服务器,2台视频监控服务器,2台数据库服务器,2台流媒体服务器,2台管理服务器。

其中管理服务器共享一个阵列存储。

将连接了共享阵列存储的2台管理服务器均安装上ReYunHA双机热备软件,其余的6台服务器,两两一组,均部署ReYunHA-MIRROR双机镜像热备软件。

八台服务器两两之间做双机热备,通过心跳线的方式进行连接,当服务器出现宕机情况是能够迅速将主营服务器上的应用和业务切换到备机上,解决服务器单点故障问题,保证企业业务不间断运行,实现了业务的连续性。

ReYunHA解决方案,当服务器出现宕机情况是能够迅速将主营服务器上的应用和业务切换到备机上,解决服务器单点故障问题,保证企业业务不间断运行,实现了业务的性。

ReYun镜像HA解决方案使用纯软件的方式实现双机容错。

它将用户数据存储于各自服务器内的镜像盘(MirrorDisk)上,通过镜像引擎将数据进行实时复制备份。

镜像盘可以是服务器本机上的硬盘,也可以是外部存储设备。

在Active/Standby的工作模式下,ServerA作为活动服务器运行数据库,ServerB作为备份服务器,处于待机状态。

当ServerA发生故障时(包括各种软硬件故障),ServerB通过心跳路径侦测到ServerA的故障并自动接管所有ServerA上的资源(如IP地址、数据库服务或其他应用程序、用户数据、计算机名等等),在本机上将继续读取镜像盘上的数据并继续运行数据库服务或其他应用程序。

用户感觉不到这种故障切换就可以继续使用服务器提供的服务。

待ServerA修复后,可选择通过手工或自动方式将所有已切换到ServerB的资源切换回到ServerA,并且ServerB的镜像盘上的所有数据自动恢复至ServerA的镜像盘上,由于使用了镜像产品,能实现快速差分备份,只需要恢复最新的差分数据即可,可大大加快这种数据恢复的过程,比普通的全盘复制方法在性能上有了明显的提高。

另外,镜像HA解决方案已经实现了对数据实时热备份,并且数据存储于不同服务器内的镜像盘上也避免了单点崩溃的可能性,增加了数据的安全性及系统的可用性。

而且,使用镜像方式构筑集群系统,两台服务器之间的距离不受外部存储设备连接线的限制,可以将两台服务器放置在不同的位置。

我们建议您使用尽量多的心跳方式,以确保系统的可靠性。

三.2心跳线设置问题

在一般的windows服务器上这条线可以是一条RJ45跳线;IBM小机或是大机里这条线可能是专用的串口线也可能是SCSI线,这两种方式对于心跳信息的传输会更有保障。

最好是把应用网段和心跳网段划分为两个不同的网络,这样更可靠一些.所以一般做双机的服务器是至少两块网卡,一块接应用,一块专门是心跳.目前客户的两台服务器在一个局域网中,距离较近,可以用直连的方式做心跳线的设置;距离较远,则请将其与交换机连接做心跳线的相关配置设置。

 

三.3方案优势

✓业务切换速度快,软件提供秒级切换功能,能保证在2秒内进行IP的切换。

✓支持多条心跳路径,配置多条心跳路径可以避免系统的单点故障,进一步提高了系统的可靠性。

✓本地修复功能,即使软件本身发生故障,核心进程Core和Montor,他们也会互相监控,修复软件故障,保证业务切换的可靠性。

✓利用数据镜像技术,实现无需共享存储的高可用软件解决方案

✓基于块的数据镜像技术,只传输变化量,减小数据镜像对带宽的占用

✓生产数据实时同步,能够把远程盘和本地盘构成远程虚拟磁盘,实现数据冗余,缩减业务切换时间

✓支持Active/Standby和Active/Active两种工作模式

✓丰富的应用支持能力

✓采用层次结构图,清晰的表示出资源之间复杂的依赖关系,以确保用户比较容易地配置出正确的资源启/停顺序

✓通过集群管理平台可以对各操作系统平台集群进行集中统一的管理、图形化远程的管理、监控

✓块级实时镜像模式,能够把远程盘和本地盘构成远程虚拟磁盘,具有RAID1功能

✓独有的识别码和BitMap技术,重启服务器后,不用全盘校验便能保证数据一致

✓真正实现实时同步镜像机制策略,保证数据零丢失

✓任务的备援规则可以灵活配置,资源利用更加合理

✓支持快速切换,能够3秒内切换任何无需共享存储的资源组

✓基于系统级的集群实现应用级的集群,保证了足够的集群系统综合处理性能

✓完善的日志记录和错误报警,便于错误跟踪

✓应用的无关性,支持几乎所有的数据库环境

✓支持双节点到多节点的平滑扩展,方便整合现有资源

✓支持多种特殊的集群环境,MPIO(多路径冗余)环境,升级至REYUNCDT-Cluster可支持双机双柜,多机双柜

✓提供数据库应用的专业级保护,如ORACLE模块、SQL模块

✓支持全中文操作界面

第四章推荐方案产品简介

四.1REYUNHA软件介绍

 服务器应用的高可用性

提供双机热备的高可用解决方案是REYUNHA的核心优势。

其原理是,当一台服务器发生故障,用户业务和数据也可迅速切换到健康的备用服务器上,从而保证了整个系统对外服务的正常,从而保证关键业务系统的持续运行,避免了由于服务器宕机等故障所造成的业务停止将带来无法估量的损失。

业务正常运行时

当主机出现故障时,REYUNHA自动将核心业务切换到备机

 本地监控修复能力

在热备系统的每一台服务器内,REYUNHA具有两个核心进程:

Core和Monitor,他们进行互相监控(如:

系统宕机、REYUNHA进程被误删除、网络、SCSI线缆是否断开),如果其中一个进程失败,另一个进程会立即进行恢复,最大程度保证双机热备系统自身健壮,避免双机丢失。

支持多条心跳路径

支持网卡(私网/公网)、磁盘心跳等多种心跳方式,多重保障心跳检测途径,配置多条心跳路径可以避免系统的单点故障,进一步提高了系统的可靠性。

 共享磁盘的卷锁功能

软件管理共享磁盘上的数据,以防止多个服务器在同一时间访问数据。

REYUNHA在逻辑设备级(卷)上控制对数据的访问,管理员可以不必担心群中的其它服务器访问数据时,可能会带来的数据访问冲突。

REYUNHA自动在被应用程序定义为共享资源的磁盘卷上设置SCSI-2/SCSI-3持久保留。

当被保护的应用程序由一个服务器被移动/转换到另一个服务器时,REYUNHA控制这些锁定,以保证激活服务器对共享卷的访问。

 单机的热备高可用

在应用软件的检测时间间隔执行检测,以察看资源本身是否失效。

如果快速检查和深入检查均局部告失败,系统将根据用户设定的策略尝试局部恢复资源,实现单机的自动修复,从而达到用户单机系统同样得到高可用级别。

 支持自动迁回

当首选节点发生故障后又恢复正常,如果允许自动迁回,备份节点在指定的恢复时间窗口内将资源组切换回首选节点运行;如果不需自动迁回时,资源组将保留在备份结点上,管理员可在合适的时间进行手动切换。

 支持ARP提醒

当浮动IP切换到其它网卡上挂载时,Cluster会主动进行ARP广播通知客户端该IP的MAC地址发生改变,让客户端主动更新映射关系,这样客户端便会连接到相关的服务上,避免因浮动IP切换造成客户端无法访问的情况。

● 直观状态界面,便于管理员轻松管理

● 采用C/S架构,管理员可以远程管理双机资源

REYUNHA客户端界面可以装载在远程客户端,不用装载到服务端。

如果客户端装载了管理软件,管理员可以在任何远程客户端(该客户端不用安装客户端软件)通过IE进行远程管理双机热备,进行资源组的操作。

 

●全新的中文化界面,轻松配置双机热备软件∙

●支持快速切换

对于某些和数据无关的服务或数据变动很小的服务,譬如中间件服务,IIS等服务,REYUNHA提供快速切换功能,能保证在5秒内进行任务的切换。

●支持多种报警方式

当热备系统发生异常状态时,REYUNHA可以向管理者发送电子邮件形式或者SNMP协议进行障通知服务,极大的方便了管理员的维护工作,让管理员随时随地掌握集群最新状况。

 支持多种操作平台

支持目前国内几乎所有主流的Windows和Linux操作系统平台,如Windows2000/2003/2008,RedHat,RedFlag,NovellSUSE,Ubuntu等。

●支持主流存储构架

支持目前国内大多数主流的存储设备,如NEC、IBM、Dell、EMC、HP、联想、曙光等众多知名存储设备厂商的产品。

并且不仅支持单通路盘柜,还支持多通路盘柜,另外,对iSCSI型的盘柜设备也提供支持。

●支持多种应用保护

可以保护大量的应用程序和服务,几乎涵盖了目前Windows和Linux平台上所有主流的应用和服务,如Oracle、SQLServer、DB2、Sybase、PostgreSQL、MySQL、Appache、Samba等,除了这些主流的应用和服务。

 全面支持第三方应用程序和服务

用户自定义的程序不用任何改变,可以直接进行配置进行监控。

用户可以根据需要指定自定义服务或应用程序的运行身份,运行目录,甚至是否是agent方式进行检测运行。

方式灵活多样,完全适应用户的各种需求。

 

REYUNHA双机热备方案模式

  主/从模式(A/S)

简单双机热备是目前大多用户采用的高可用环境,即两台服务器共享一台磁盘阵列,通过REYUNHA软件实现主从工作方式的双机环境。

主从就是热备工作方式,容错软件作为不可缺少部分起到监控系统状态并在系统故障时,自动做出相应的反应,保证整个系统提供服务的不间断。

  主/主模式(A/A)

这个环境下,有两种不同的应用运行在集群环境中,每台服务器运行各自的应用,在其中一台出现故障时,另外服务器将接管其服务。

这种配置可以大大提高设备的利用率,双主方式是真正的双机互备,要求服务器具有较强的处理能力,来满足两个应用的需求。

在配置双主双机时,硬件的配置与主从双机略有不同,主要在网卡上。

对等需要至少两片网卡,每个网卡对应一个应用,可以是相同或不同网段的网络地址。

四.2REYUNHA软件参数

支持操作系统平台

●Windows2003orlater

●Windows2008sp2orlater

●Windows2012

●RedHatLinux5.0

●RedFlagLinux

●SUSELinux11以上

数据库支持

●SQLSERVER

●Informix7.xorlater

●OracleDataServer7.xorlater

●Sybaseallreleasedversion

●DB27.xorlater

●MySQL

服务器平台支持

HP/IBM/DELL/联想/方正/浪潮/华硕/HEAD/同方/富士通/宝德等基于Intel构架的PC服务器

支持32/64位硬件平台

支持32/64位操作系统

软件特性

●配置安装维护简单。

●自主产权软件产品,支持特殊环境功能定制。

●实现无人值守,全自动地实现应用资源切换,且图形界面操作,简单方便。

●软件自我监控功能,确保守护进程健康运行。

●支持SCSI-3PersistentReservation磁盘锁。

●采用层次结构图,清晰的表示出资源之间复杂的依赖关系,以确保用户比较容易地配置出正确的资源启/停顺序。

●对应用程序的灵活监控功能,可以对进程的子进程、特殊应用进行监控。

●节点和任务的可伸缩。

●通过集群管理平台可以对各操作系统平台集群进行集中统一的管理、图形化远程的管理、监控。

●任务的备援规则可以灵活配置,资源利用更加合理。

●支持快速切换,能够3秒内切换任何无需共享存储的资源组。

●基于系统级的集群实现应用级的集群,保证了足够的集群系统综合处理性能。

●完善的日志记录和错误报警,便于错误跟踪。

●应用的无关性,支持几乎所有的数据库环境。

●支持双节点到多节点的平滑扩展,方便整合现有资源。

●提供数据库应用的专业级保护,如ORACLE模块、SQL模块。

●支持全中文操作界面。

●配置DBM可扩展平台,可通过模块(可选件)添加服务器/终端;本地/异地数据备份功能。

切换时间

任务切换指令发布时间<1s,任务转移时间<30s(取决于服务器性能)

方案优势

●节省管理成本,集群中的节点统一管理,使管理变得轻松;

●整合了环境中的应用,使之达到整体高可用;

●方案价比高,关键业务子系统越多、方案的平均投入越低;

●方案伸缩性好,集群中主机可以灵活增加、减少;

●服务优势明显,依托本地服务平台,可得到全方位、及时的技术服务

技术服务

●免费电话支持

●网上专家技术支持

●异地远程故障解决

●上门服务包(可选三年、五年服务包)

●用户产品培训/服务期内有限的现场服务

四.3REYUNHA-Mirror软件介绍

随着信息化建设的不断推进,企业的信息化已经非常普遍,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用。

如果一些关键应用一旦发生宕机故障或应用停机,将给企业带来巨大的经济损失,并且由于业务的不可用而影响了企业的信誉,致使客户对企业失去信任,所造成的危害是致命的。

可见,对那些需要保障信息安全和提供不间断的信息服务的企业而言,业务系统的容错性和不间断性显得尤为重要。

如何保障各种关键应用持续运营,达到永续经营的良性循环,已成为当今企事业单位和IT领域急需解决的关键问题。

REYUNHA-Mirror软件是一款不需要共享磁盘,采用块镜像技术,保障企业的核心业务24小时在线的双机热备软件,也称之为纯软双机热备。

REYUNHA-Mirror支持Windows/linux操作系统平台,具有稳定可靠、易于管理、备援方式灵活多样、节点和任务伸缩性强、保护用户投资、整合和优化用户系统环境。

纯软方式的优点:

避免了存储的单点故障隐患:

共享存储方式的双机热备虽然稳定性好,能够保证业务的不间断,但是数据和一些主要应用通常放在存储里,一旦存储损坏或故障,高可用的效果就无法实现,备机无法正常启动,数据也会丢失。

节约投资:

不需购买昂贵的磁盘阵列。

不受距离的限制:

两台服务器不需受SCSI电缆的长度限制(光纤通道的磁盘阵列也不受距离限制,但投资会大得多)。

这样,可以更灵活部署服务器,包括通过物理位置的距离来提高安全性。

拓扑图如下:

如图所示,主服务器和从服务器都装上REYUNHA-Mirror软件,利用REYUNHA-Mirror软件功能把本地盘(或分区)和异地盘(或分区)组合为一块REYUNDisk磁盘(类似本地2块盘做RAID1),业务的数据放入REYUNDisk盘中,数据的IO通过千兆网络写入异地磁盘,保证数据一致性。

平时业务在主服务器上运行,一旦主服务器出现问题,REYUNHA-Mirror会把任务切换到从服务器上运行。

REYUNHA-Mirror双机热备功能特点

服务器应用的高可用性

提供双机热备(双机容错软件)的解决方案是REYUNHA-Mirror的核心功能。

其原理是,当一台服务器发生故障,用户业务和数据也可迅速切换到健康的服务器上,从而保证了整个系统对外服务的正常,从而保证关键业务系统的持续运行,避免了由于服务器宕机等故障所造成的业务停止将带来无法估量的损失。

本地监控修复能力

在集群系统的每一台服务器内,睿芸纯软群集软件具有两个核心进程:

Service和Monitor,他们互相监控(如:

系统宕机、网络、SCSI线缆是否断开),如果其中一个进程失败,另一个进程会立即进行恢复,最大程度保证双机热备系统自身健壮,避免双机丢失。

单机的热备高可用

在应用软件的检测时间间隔执行检测,以察看资源本身是否失效。

如果快速检查和深入检查均局部告失败,系统将根据用户设定的策略尝试局部恢复资源,实现单机的自动修复,从而达到用户单机系统同样得到高可用级别。

 块级数据镜像驱动同步

数据镜像组中,因为磁盘分区是以数据块级的镜像被复制到两个磁盘驱动器中,它被操作系统当作一个分区对待。

如果一个服务器上的I/O卡或磁盘驱动器失效,对于数据的访问不会发生任何事情。

因为在镜像组中还有一个激活的I/O卡或磁盘驱动器存在。

就像在单个服务器的内部进行磁盘复制一样,其中一个失效不会有任何影响,用户还可以从镜像组中存活的驱动器上访问数据。

(类似于RAID1)。

 本地网卡失败转移

在主服务器上,可以加上另外一个NIC作为主服务器的备份NIC。

当主NIC出现故障时,REYUNHA-Mirror将可切换的IP地址让由本地的备份NIC接管,本地资源不需要切换,有效的减少的切换时间。

 核心业务失败切换

当核心业务出现问题时,REYUNHA-Mirror会及时侦测到,并重新启动核心业务,从而不需要异地切换。

 漂移IP失败带入

当浮动IP被释放或出现问题时,双机热备会及时带入该漂移IP,实现单机的高可用。

块级数据实时镜像

睿芸纯软群集软件为块级实时镜像,其保证了数据在两台服务器上的完整一致性。

块镜像比只镜像文件和目录的软件更加强大,服务器所有的身份和功能都能够被镜像,包括:

磁盘、IP地址、共享、打印队列、甚至应用程序。

磁盘分区镜像

睿芸纯软群集软件能够对整个磁盘或磁盘的某个分区进行镜像,每一个在被管理分区上的数据块都被镜像/复制到镜像对的另一个磁盘设备上。

这一过程很像在一个服务器内部的磁盘复制,只不过镜像组中的磁盘分别在不同的服务器上。

当镜像组中每个磁盘设备上所有的数据块同步之后,该镜像组被认为是健康的(Health)。

当镜像组是健康状态时,对于关键任务数据的访问有两条途径,这样大大提高了系统对磁盘读的功能,增加了读的平衡功能。

真正的数据同步镜像

睿芸纯软双机软件的镜像功能采用真正的同步镜像功能,即主服务器上的一个写操作必须在两台服务器上都写入成功后再进行下一个写操作,从而保证任何时候两台服务器的数据完全一致。

目前文件系统一级的镜像软件并不真正支持实时同步(即使支持其效率特别低并且大大降低操作系统的性能),其通常采用异步复制模式进行实时同步,一旦出现意外宕机,就可能造成主从服务器的数据不一致。

快速重新同步

睿芸纯软双机软件第一次进行初始化完全同步镜像后,即使服务器重新启动或纯软双机软件服务重启把磁盘或分区重新成镜像组,便能够快速进行重新同步,而不用再进行数据的比较校验,大大提高效率减少不必要的校验。

该技术是目前文件系统级别镜像系统无法提供的,其服务或服务器一旦重新启动,为了保证数据完全一致性其必须进行数据集的数据校验,但如果集中的数据非常庞大或是小文件,那么校验的时间便非常长,在校验过程中服务是无法进行切换的。

镜像效率稳定

因为睿芸纯软双机软件采用的是块级别数据镜像,只镜像不同的数据块,因而镜像网络传输都以数据块为单位,有稳定的数据镜像效率。

文件系统的过滤系统,其复制效率根据文件的大小决定,如果是批量的小文件,其镜像效率将非常低,因为其IO瓶颈出在从

服务器上的写入操作上。

从服务器在写文件时,其必须先打开这个文件,写完后需要关闭这个文件,同时还需要修改文件属性等操作,因此会大大增加文件系统的IO量,和从服务器操作系统的系统资源。

块级别数据镜像的写操作是直接对磁盘进行裸操作,并不增加操作的负担,从而大大的提高效率。

采用C/S架构,支持远程管理双机资源

REYUNHA-Mirror客户端界面可以装载在远程客户端,不用装载到服务端。

如果客户端装载了管理软件,管理员可以在任何远程客户端(该客户端不用安装客户端软件)通过IE进行远程管理双机热备,进行资源组的操作。

 

支持多种应用保护

可以支持多种应用程序和服务,几乎涵盖了目前Windows和Linux平台上所有主流的应用和服务,如Oracle、SQLServer、DB2、Sybase、PostgreSQL、MySQL、Appache、Samba等,除了这些主流的应用和服务。

全面支持第三方应用程序

用户自定义的程序不用任何改变,可以直接进行配置进行监控。

用户可以根据需要指定自定义服务或应用程序的运行身份,运行目录,甚至是否是agent方式进行检测运行。

方式灵活多样,完全适应用户的各种需求。

 

REYUNHA-Mirror双机热备模式

主/从方式

主从模式是纯软双机的典型配置模式,一般用于以前企业只有一台服务器,该服务器完全能够提供企业核心业务的服务,为了提升服务的可用性,便再购置一台服务器作为从服务器,新购置的服务硬件配置可用不同于以前的服务器。

正常工作时,企业的核心业务在主服务器上运行,数据通过镜像实时保持主从服务数据完全一致,当主服务器出现故障时,企业的核心业务自动切换到从服务器上,保证业务不间断运行。

主/主方式

这个环境下,有两套不同的应用运行在集群环境中,每台服务器运行各自的应用,在其中一台出现故障时,另外服务器将接管其服务。

这种环境,在磁盘或

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 判决书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1