容灾技术概念全解.docx

上传人:b****5 文档编号:7943787 上传时间:2023-01-27 格式:DOCX 页数:15 大小:241.37KB
下载 相关 举报
容灾技术概念全解.docx_第1页
第1页 / 共15页
容灾技术概念全解.docx_第2页
第2页 / 共15页
容灾技术概念全解.docx_第3页
第3页 / 共15页
容灾技术概念全解.docx_第4页
第4页 / 共15页
容灾技术概念全解.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

容灾技术概念全解.docx

《容灾技术概念全解.docx》由会员分享,可在线阅读,更多相关《容灾技术概念全解.docx(15页珍藏版)》请在冰豆网上搜索。

容灾技术概念全解.docx

容灾技术概念全解

容灾技术的概念

第一章容灾技术及方案讨论2

1.1容灾技术的意义2

1.2容灾技术的分类3

1.3同步传输的数据复制4

1.4同步数据容灾的性能分析9

1.5异步数据复制方式12

1.6容灾技术性能总结和对照17

第二章广域网络的高可用技术(软件容灾方式)18

第-章容灾技术及方案讨论

1.1容灾技术的意义

当应用系统的一个完整环境因灾难性事件(如火灾、地震等)遭到破

坏时,为了迅速恢复应用系统的数据、环境,立即恢复应用系统的运行,保证系统的可用性,这就需要异地灾难备份系统(也称容灾系统)。

可以说,对于关键事物的处理系统,如联通的各项业务系统(客户服务、

计费、IDC等),建立最高级别的安全体系,也是提高服务质量、在竞争中立于不败之地的重要举措。

长期以来,对企业而言,建立一套可行的容灾系统相当困难,主要是高

昂的成本和技术实现的复杂度。

鉴于此,从可行性而言,必须具有良好的

性能价格比。

建立异地容灾系统,即指建立远程的数据中心,通过配置远程容灾系统将本地数据实时进行远程复制,同时实现本地系统故障时应用系统

的远程启动,确保系统的不中断运行。

建立异地容灾中心的优势在于:

1.强大的一级灾难抗御能力。

2.有效防止物理设备损伤产生的灾难后果。

3.提供99.9999%的安全机制。

4.实时数据复制提供强大的数据交换能力。

随着数据安全技术的发展,Cluster(HA)的技术越来越成熟,

Cluster的部署越来越普及,Cluster技术确实解决了用户系统的高可

用性问题,为业务的良性发展提供了稳定的基石。

随着业务的发展,商业环境对服务供应商提出的要求也越来越苛刻,这必将使应用系统及其数据对高可用性的要求走上一个新的台阶。

一个本地Cluster系统理论上可以提供99.99%以上的系统高可用性,但一旦发生火灾、自然灾害、人为破坏等意外事件,服务商将如何应对呢?

如果没有必要的准备和应对手段,这样的一次意外对服务上来说将是灾难性的。

对于IT部门来讲,要提高自己的抗灾能力,其必要的

技术就是建立起一个容灾系统。

1.2容灾技术的分类

一个容灾系统的实现可以采用不同的技术,一种技术是:

采用硬件进行远程数据复制,我们称为硬件复制技术。

这种技术的提供者是一些存储设备厂商。

数据的复制完全通过专用线路实现物理存储设备之间的交换。

另一种技术是:

采用软件系统实现远程的实时数据复制,并且实现

远程的全程高可用体系(远程监控和切换)。

这种技术的代表如VERITAS等一些著名存储软件厂商。

我们在下面的章节会对以上两种技术进行详细的论述。

容灾系统的归类在另一个方面要由其最终达到的效果来决定。

从其对

系统的保护程度来分,我们可以将容灾系统分为:

数据容灾和应用容灾。

所谓数据容灾,就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。

在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的数据。

该数据可以是与本地生产数据的完全实时复制,也可以比本地数据略微落后,但一定是可用的。

所谓应用容灾,是在数据容灾的基础上,在异地建立一套完整的与本

地生产系统相当的备份应用系统(可以是互为备份)。

建立这样一个系

统相对比较复杂,不仅需要一份可用的数据复制,还要有包括网络、主

机、应用、甚至IP等资源,以及各资源之间的良好协调。

应用容灾应该

说是真正意义上的容灾系统。

我们先讨论一下数据容灾。

数据容灾(硬件容灾方案和软件容灾方案均包括),又称为异地数据

复制技术,按照其实现的技术方式来说,主要可以分为同步传输方式和

异步传输方式(各厂商在技术用语上可能有所不同。

而根据容灾的距离,数据容灾又可以分成远程数据容灾和近程数据容灾方式。

下面,我们将主要按同步传输方式和异步传输方式对数据容灾展开讨论,其中也

会涉及到远程容灾和近程容灾的概念,并作相应的分析。

1.3同步传输的数据复制

有关同步数据容灾,在传统意义上讲,就是通过容灾软件(可以含在

硬件系统内),将本地生产数据通过某种机制复制到异地。

从广义上讲,同步数据容灾是指在异地建立起一套与本地数据实时同步的异地数

据。

 

同步传输方试异地数据夏制(容灾)原理

从上图,我们可以看出,采用同步传输方式进行异地数据容灾的过程包括:

1.本地主机系统发出第一个I/O请求A;

2.主机会对本地磁盘系统发出I/O请求;

3.本地磁盘系统完成I/O操作,并通知本地主机“I/O完成”;

2'.在往本地I/O的同时,本地系统(主机或磁盘系统)会向异地系统发出I/O请求A;

3'.异地系统完全I/O操作,并通知本地系统“I/O完成”

4.

I/O

本地主机系统得到“I/O完成”的确认,然后,发出第二个请^求Bo

不同的异地数据复制技术的实现方式是不同的,包括:

1.基于主机逻辑卷层的同步数据复制方式(软件复制方式);

2.基于磁盘系统I/O控制器的同步数据复制方式(硬件复制方

式);

基于主机逻辑卷的同步数据复制方式

基于主机逻辑卷的同步数据复制方式以VERITASVolume

Replicator(VVR)为代表,VVR是集成于VERITASVolumeManager

(逻辑卷管理)的远程数据复制软件,它可以运行于同步模式和异步模

式。

在同步模式下,其实现原理如下图:

搭于38辑卷的翩步异地裁攜复制(VW原理

 

当主机发起一个I/O请求A之后,必然通过逻辑卷层,逻辑卷管理层

在向本地硬盘发出I/O请求的同时,将同时通过TCP/IP网络向异地系统

发出I/O请求。

其实现过程如下:

1.本地主机系统发出第一个I/O请求A;

2.主机逻辑卷层会对本地磁盘系统发出I/O请求;

3.本地磁盘系统完成I/O操作,并通知本地逻辑卷“I/O完成”;

2'.在往本地磁盘系统I/O的同时,本地主机系统逻辑卷会向异地系

统发出I/O请求A;

3'.异地系统完成I/O操作,并通知本地主机系统“I/O完成”

4•本地主机系统得到“I/O完成”的确认,然后,发出第二个I/O

请^求Bo

二、基于磁盘系统的同步数据复制功能

基于磁盘系统的同步数据复制功能实现异地数据容灾,如SRDF和PPRC这两个软件运行的平台是磁盘系统,部署这样的系统必须要求在

两端采用相同种类的磁盘系统。

其同步数据复制的实现原理如下图:

堆]械盘系统的同步异地故据以制氐理

当主机发出一个I/O请求A之后,I/O进入磁盘控制器。

该控制器在接到I/O请求后,一方面会写入本地磁盘,同时利用另一个控制器(或称通道),通过专用通道(如:

ESCON、FC光纤通道(IPoverFC)或者租用线路,将数据从本地磁盘系统同步的复制到异地磁盘系统。

其实现过程如下:

1.本地主机系统发出第一个I/O请求A;

2.主机对本地磁盘系统发出I/O请求;

2'.在往本地磁盘系统I/O的同时,本地磁盘系统会向异地磁盘系统

发出I/O请求A;

3.本地磁盘系统完成I/O操作;

3'.异地系统完成I/O操作,并通知本地磁盘系统“I/O完成”

4•本地次盘系统向主机确认“I/O完成”,然后,主机系统发出第

二个I/O请求B。

1.4同步数据容灾的性能分析

利用同步传输方式建立异地数据容灾,可以保证在本地系统出现灾难

时,异地存在一份与本地数据完全一致的数据备份(具有完整的一致性)。

但利用同步传输方式建立这样一个系统,必须考虑“性能”这个因素。

采用同步数据传输方式时,从前面的描述来看,本地系统必须等到数

据成功的写到异地系统,才能进行下一个I/O操作。

一个I/O通过远程

链路写到异地系统,涉及到3个技术参数:

带宽、距离和中间设备及协

议转换的时延。

1.带宽

本地I/O的带宽是100MB/秒(SAN网络中),在I/O流量很大的情况下,如果与远程的I/O带宽相对100MB/秒==800Mbit/秒”窄得多的

话,女口E1:

2Mbit/秒;E3:

45Mbit/秒,将会明显拖慢生产系统的I/O,从而影响系统性能。

2.距离

光和电波在线路上传输的速度是30万公里/秒,当距离很长时,这种

线路上的延时将会变得很明显。

例如:

一个异地容灾系统的距离是1000KM,其数据库写盘的数据块大小是10KB(一次I/O的数据量),那

么:

*本地I/O时(100米距离内):

光电在线路上的延时:

=0.1km/300,000km*2

次/一个来回

=0.67*10

6秒

1秒钟内允许

I/O次:

=1/(0.67*10-6

)=1.5*10-6次

1秒钟允许的

I/O量:

=10KB*1.5*10

-6=15GB

此数字远远超过光纤通道带宽本身,也就是说,光电在100米距离的

线路上的延时对性能的影响可以忽略不计。

・异地I/O的(1000公里):

光电在线路上的延时=1000km/300,000km*2次

=1/150秒

1秒钟内允许I/O次=1/(1/150)=150次

1秒钟允许的I/O量=10KB*150=1.5MB

此数据表明,在1000公里距离上,允许的最大I/O量在不存在带宽

限制时,已经远远低于本地I/O的能力。

(注:

上面分析还未考虑中间

设备及协议转换的延时)。

3.中间链路设备和协议转换的时延

中间链路设备和协议转换的方式的不同,时延不同,对性能的影响也不同。

在对性能影响的分析中,这个因数也应计算在内。

目前不同异地

数据复制技术所依赖的介质和协议不同,我们将介质、协议和大概时延例表如下,这里提供的数据只精确到数量级,仅供参考,实际数据应该向设备供应商索取。

租用线路

任意

不受限制

约1ms

ESCON

136Mbit

66公里

<100us

LAN

1000Mbit

10公里

<100us

ATM

655Mbit

不受限制

<100us

IPoverFC

800Mbit

60公里

<100us

FC

800Mbit

60公里

<10us

F面是一个线路时延分析对照表,供参考

1000KM

100KM

10KM

线路时延/次I/O

6ms

600us

60us

支持的链路和协议

租用线路

ATM

租用线路

ATM

租用线路

ATM

ESCON

LAN

IPoverFC

FC

本地磁盘I/O能力

10KB/ms

在1000公里和100公里距离上,采用租用线路和ATM允许的最大

I/O能力(假定带宽足够,数据块大小以10KB为例):

 

在10公里距离上,采用各种传输协议允许的最大I/O能力,数据块

大小以10KB为例(假定带宽足够):

租用线路

ATM

LAN

ESCON

IPoverFC

FC

60us

60us

60us

60us

设备协议时延

>1ms

<100us

<100us

<10us

I/O次数/秒

485-930

900-5800

900-5800

900-12500

I/OMB/秒

4.8-9.3

9-58

9-58

9-125

备注

适合用同步传输

1.5异步数据复制方式

从前面的分析来看,同步数据容灾一般只能在较短距离内部署(10KM-100KM),大于这个距离,就没有实际应用价值了。

因为即使在

1000KM距离上,4.5MB的速率即使将数据复制到异地,每个I/O的响应

时间也会超过10ms,这种响应速度太慢。

异步数据容灾是在“线路带宽和距离能保证完成数据复制过程,同时,异地数据复制不影响生产系统的性能”这样的要求下提出来的。

考虑异步数据容灾,应该注意到以下几个技术条件和事实。

1.带宽必须能保证将本地生产数据基本上完全复制到异地容灾端,还要考虑距离对传输能力的影响。

按照前面的估算:

在1000公里范围内,一条带宽足够的线

路能支持的I/O流量最大为(数据块大小10KM):

1.4MBX3600秒X24小时=120GB/天

2.异地容灾远端数据会比本地生产端数据落后一定时间,这个时间随

采用的技术,带宽、距离、数据流特点的不同而不同。

一般而言,软件方式的数据复制技术具有完整的数据包的排队和断点重发机制,在灾难情况下可以保证灾难时间点的数据一致性。

3.异步容灾基本不影响本地系统性能。

与同步传输方式相比,异步传输方式对带宽和距离的要求低很多,它只要求在某个时间段内能将数据全部复制到异地即可,同时异步传输方式也不会明显影响应用系统的性能。

其缺点是在本地生产数据发生灾难时,异地系统上的数据可能会短暂损失(如果广域网速率较低,交易未完整发送的话),但不影响一致性(类似本地数据库主机的异常关机)。

通过异步传输模式进行异地数据复制的技术,包括:

1.基于主机逻辑卷的数据复制方式

2.基于磁盘系统I/O控制器的数据复制方式

*基于主机逻辑卷(Volume)的数据复制方式

首先申明:

针对这种方式,这以VERITASVVR为例,但并不表示所

有基于主机进行复制的其它软件采用同样方式,也不保证其它软件是有应用价值的。

VERITASVVR(VolumeReplicator)通过基于Volume和Log的

复制技术,保证在任何时刻本地系统发生自然灾难时,在异地的数据仍是可用的。

VERITASVVR在异步模式下采用了Log技术来跟踪未及时复制的数据

块,这个Log是一个先到先服务的堆栈,每一笔I/O处理都会首先被放进这个Log,并按到达先后顺序被复制到异地服务器系统。

下图是其工作的结构原理。

舉]逻酗也的昴歩掃地数抵奴制

从上图,我们可以看到整个I/O和复制的过程如下:

1.本地主机系统发出第一个I/O请求A到逻辑卷;

2.逻辑卷对本地磁盘系统发出I/O请求;

2'.在往本地磁盘系统I/O的同时,逻辑卷向本地磁盘系统上的VVR

Log发出相同的写请求;

3.本地磁盘系统完成I/O操作;并通知逻辑卷“I/O完成”;

3'.VVR完成针对这个I/O的远程操作,并通知逻辑卷;

4.逻辑卷向主机确认“I/O完成”。

服务器的另一个进程:

VVR的进程,负责将Log队列中的I/O复制到

异地服务器。

这个过程和上面的I/O过程在时间上无关。

如上图中的标

记:

“I”和“II”。

I:

本地VVR进程从Log队列中取出最先到达的I/O,复制到异地服

务器

II:

异地服务器接收到本地服务器VVR发出的I/O请求,将相应

数据写到异地磁盘系统,然后,通知本地系统VVR进程,要求下一个

I/O

这里,跟踪未及时复制的数据块的Log技术是保证异地数据可用的必

要条件。

一个数据库的I/O是有严格顺序的,这个顺序是保证数据库完

整性的必要条件,一个完整性被破坏的数据库一般是不可用的,比如根本无法启动、打开该数据库,且是无法修复的。

本地数据库的完整性是由数据库本身来维护的。

当一个数据库被实时复制到异地时,要保证异地数据库的完整性,必然保证在异地磁盘I/O上的I/O顺序和本地I/O

顺序完全相同,否则,异地数据库的完整性就无法保证。

VERITASVVR采用的I/O控制机制是支持先到先服务的Log技术,

因此,不管异地数据比本地数据落后多少时间,都能保证异地数据库数

据的一致性。

比如:

本地系统在12:

00时发生自然灾难,由于部分数据

未被及时复制到异地,如有10分钟的数据未完成复制,那么在异地系统

上存在11:

50分钟以前的所有数据,且这个数据库是可用的。

目前的基于磁盘系统的异地数据复制技术采用Bitmap技术和

Timestamp技术,这两种技术都不能保证本地向异地复制数据的顺序严格和本地I/O的顺序相同,所以,这两种方式都不能保证异地数据库的完整性。

Bitmap(位图)技术记录未被及时复制的数据块的方法是:

对于每个

数据块(如32KB)用一个Bit来对应,某一个Bit被置为“1”时,表示其对应的数据块已被修改过,正在等待处理(这里是等待被复制)。

由此可以看出,当有一块以上的数据块未被及时复制时,系统并无法确认哪一块数据块应该先复制到异地,所以,系统将任选一块,即不按到达的时间先后进行复制。

可以看出,这种方式不能根本保证异地数据库数据的完整性、一致性。

Timestamp方式是对每个未及时传送的数据块盖上一个时间戳。

从表

面上看,由于时间戳的关系,好像能确定一个数据块被修改的时间顺序

了。

其实不然:

当一个未被及时复制的数据块被第2次修改,并盖上新

的时间戳时,数据复制的顺序就被破坏了。

例如:

现在有10块数据块未被复制,编号“1、2、3、4、5、6、7、8、

9、10”;这时,第3块数据被再次修改,并被盖上一个新的时间戳“11”;这时,系统会按这样的次序进行复制:

“1、2、(没有3)、

4、5、&7、8、9、10、11”。

我们可以看到,在复制进行到“4~10”

之间时,异地数据的完整性被破坏。

事实上,在一个运行繁忙的系统中,出现这种情况机率极高,甚至每时每刻都处在这种状态之下。

所以,本着严格的,对系统可用性负责任的态度,我们认为“Timestamp”的技术虽然比Bitmap技术有一定优势,但实际上也无法保证异地数据的完整性和可用性。

1.Bitmap和Timestamp方式的技术弱点:

没有log;

作为磁盘系统内置的数据复制功能,传统的磁盘管理模式没有考虑在

磁盘系统内部开辟出一个磁盘块给磁盘系统控制器本身使用,所以,磁盘系统无法采用log模式进行异步数据复制。

2.磁盘系统保留异步传输模式的目的:

复制,但不是容灾复制;

数据复制的目的不仅仅是容灾。

数据容灾要求两地时时保持连接,数

据复制过程在任一时间都在进行(除非有线路或设备故障)。

而非容灾性复制只要求在某一个时间段里将数据复制到异地,复制告一段落后

(在某一时刻完全同步),复制工作会暂停。

这种复制可能是为一个特殊目的只做一次,如在线业务迁移;也可能每天或每月追加一次。

这样,在异地就会存在一份最大损失数据量为1天或1个月的生产数据复

制品,其对数据的保障能力,如同磁盘备份。

这种方式复制数据的目的包括:

1)在异地保存一份备份数据(如同磁带备份异地保存)。

2)在

线业务迁移,当信息中心或其中的一个服务要迁移到另一个地方,又希望少停机(实际上也可用磁带备份和恢复来实现)。

3)利用与磁盘快照

技术结合,为异地开发中心提供一个与生产数据尽量相同的测试数据源。

当然,也可用于其它可能的目的。

综上所述,我们可以看出,虽然基于磁盘系统的异地数据复制功能有

异步传输模式,但实际上并不支持异步数据容灾,只有像VERITASVolumeReplicator这样基于先进先出的Log技术的解决方案才真正支

持异步数据容灾。

1.6容灾技术性能总结和对照

以下我们对于各种容灾技术的工作方式进行总结。

理想距离

<100km

<1000km

60km(光纤)

链路要求

任何支持

任何支持

ESCON,ATM

TCP/IP的设备

TCP/IP的设备

IPoverFC

理想链路带宽

>40Mbit

相对较小

>40Mbit

对应用系统性能

很大

很小

很大

的影响

是否需要专用磁

不需要

不需要

必须

盘系统

部署的简单性

长距:

复杂

一般

硬件:

复杂

短距:

一般

软件:

一般

维护的简单性

一般

简单

一般

造价

中等

中等

很高

涉及软件

VVR

VVR

阵列内置

根据以上的分析,我们可以看出,硬件系统的容灾技术(指磁盘阵

列)在对主机系统的内部开销上较小,但是十分影响本地10的性能,同

时要求本地和异地均采用专用的磁盘阵列,成本和造价极高。

比较重要的是,这种方式的传输距离有限,仅限于同城传输。

采用软件的数据复制方式(如VVR),—般采用异步方式。

这种方式

具有对本地系统I0影响很小,传输距离长的优势,并且可以支持任意磁盘阵列,使得造价相对较小。

不足是如果线路速率较慢,会造成故障时轻微数据损失。

第二章广域网络的高可用技术(软件容灾方式)

软件容灾方式中,支持应用容灾,即应用系统的完全高可用和远程切换系统,这里指一整套完整的本地高可用系统和异地高可用系统的完整

结合体系。

我们知道,本地的高可用系统指在多个服务器运行一个或多种应用的情况下,应确保任意服务器出现任何故障时,其运行的应用不能中断,应用程序和系统应能迅速切换到其它服务器上运行,即本地系统集群和热备份。

而远程的容灾系统中,除了本地系统的安全机制外,还应具有广域网范围的远程故障切换能力和故障诊断能力。

实际上,广域网范围的高可用能力与本地系统的高可用能力应形成一个整体,实现多级的故障切换和恢复机制,确保系统在各个范围的可靠和安全。

广域网体系的远程故障切换机制的流程(软件方式):

1)本地系统的故障分级,常规级别在本地系统进行高可用

切换,如网卡故障、应用系统故障、文件系统故障

(本地cluster)。

2)高级别故障(如火灾、地震),通过远程监控体系和

报警体系实现远程切换(异地

cluster)。

切换包

括IP、域名、应用等。

3)恢复体系:

一旦故障解除,应用系统实现主备站点的恢复传输异地复制中断传输的恢复流程(软件方式复制):

1)断点序号重传

2)或增量异地同步实现增量块复制。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1