RAID与备份.docx
《RAID与备份.docx》由会员分享,可在线阅读,更多相关《RAID与备份.docx(7页珍藏版)》请在冰豆网上搜索。
![RAID与备份.docx](https://file1.bdocx.com/fileroot1/2023-1/9/b7a52f32-4e01-42eb-b3e8-70f7f58846b8/b7a52f32-4e01-42eb-b3e8-70f7f58846b81.gif)
RAID与备份
RAID与备份
一.RAID定义
RAID(RedundantArrayofIndependentDisk独立冗余磁盘阵列)技术是加州大学伯克利
分校1987年提出,最初是为了组合小的廉价磁盘来代替大的昂贵磁盘,同时希望磁盘失效时不会使对数据的访问受损失而开发出一定水平的数据保护技术。
RAID就是一种由多块廉价磁盘构成的冗余阵列,在操作系统下是作为一个独立的大型存储设备出现。
RAID可以充分发挥出多块硬盘的优势,可以提升硬盘速度,增大容量,提供容错功能够确保数据安全性,易于管理的优点,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。
二、RAID的几种工作模式
1、RAID0
即DataStripping数据分条技术。
RAID0可以把多块硬盘连成一个容量更大的硬盘群,可以提高磁盘的性能和吞吐量。
RAID0没有冗余或错误修复能力,成本低,要求至少两个磁盘,一般只是在那些对数据安全性要求不高的情况下才被使用。
(1)、RAID0最简单方式
就是把x块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起,形成一个独立的逻辑驱动器,容量是单独硬盘的x倍,在电脑数据写时被依次写入到各磁盘中,当一块磁盘的空间用尽时,数据就会被自动写入到下一块磁盘中,它的好处是可以增加磁盘的容量。
速度与其中任何一块磁盘的速度相同,如果其中的任何一块磁盘出现故障,整个系统将会受到破坏,可靠性是单独使用一块硬盘的1/n。
(2)、RAID0的另一方式
是用n块硬盘选择合理的带区大小创建带区集,最好是为每一块硬盘都配备一个专门的磁盘控制器,在电脑数据读写时同时向n块磁盘读写数据,速度提升n倍。
提高系统的性能。
2、RAID1
RAID1称为磁盘镜像:
把一个磁盘的数据镜像到另一个磁盘上,在不影响性能情况下最大限度的保证系统的可靠性和可修复性上,具有很高的数据冗余能力,但磁盘利用率为50%,故成本最高,多用在保存关键性的重要数据的场合。
RAID1有以下特点:
(1)、RAID1的每一个磁盘都具有一个对应的镜像盘,任何时候数据都同步镜像,系统可以从一组镜像盘中的任何一个磁盘读取数据。
(2)、磁盘所能使用的空间只有磁盘容量总和的一半,系统成本高。
(3)、只要系统中任何一对镜像盘中至少有一块磁盘可以使用,甚至可以在一半数量的硬盘出现问题时系统都可以正常运行。
(4)、出现硬盘故障的RAID系统不再可靠,应当及时的更换损坏的硬盘,否则剩余的镜像盘也出现问题,那么整个系统就会崩溃。
(5)、更换新盘后原有数据会需要很长时间同步镜像,外界对数据的访问不会受到影响,只是这时整个系统的性能有所下降。
(6)、RAID1磁盘控制器的负载相当大,用多个磁盘控制器可以提高数据的安全性和可用性。
3、RAID0+1
把RAID0和RAID1技术结合起来,数据除分布在多个盘上外,每个盘都有其物理镜像
盘,提供全冗余能力,允许一个以下磁盘故障,而不影响数据可用性,并具有快速读/写能力。
RAID0+1要在磁盘镜像中建立带区集至少4个硬盘。
4、RAID2
电脑在写入数据时在一个磁盘上保存数据的各个位,同时把一个数据不同的位运算得到的海明校验码保存另一组磁盘上,由于海明码可以在数据发生错误的情况下将错误校正,以保证输出的正确。
但海明码使用数据冗余技术,使得输出数据的速率取决于驱动器组中速度最慢的磁盘。
RAID2控制器的设计简单。
5、RAID3:
带奇偶校验码的并行传送
RAID3使用一个专门的磁盘存放所有的校验数据,而在剩余的磁盘中创建带区集分散数据的读写操作。
当一个完好的RAID3系统中读取数据,只需要在数据存储盘中找到相应的数据块进行读取操作即可。
但当向RAID3写入数据时,必须计算与该数据块同处一个带区的所有数据块的校验值,并将新值重新写入到校验块中,这样无形虽增加系统开销。
当一块磁盘失效时,该磁盘上的所有数据块必须使用校验信息重新建立,如果所要读取的数据块正好位于已经损坏的磁盘,则必须同时读取同一带区中的所有其它数据块,并根据校验值重建丢失的数据,这使系统减慢。
当更换了损坏的磁盘后,系统必须一个数据块一个数据块的重建坏盘中的数据,整个系统的性能会受到严重的影响。
RAID3最大不足是校验盘很容易成为整个系统的瓶颈,对于经常大量写入操作的应用会导致整个RAID系统性能的下降。
RAID3适合用于数据库和WEB服务器等。
6、RAID4
RAID4即带奇偶校验码的独立磁盘结构,RAID4和RAID3很象,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘,RAID4的特点和RAID3也挺象,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。
7、RAID5
RAID5把校验块分散到所有的数据盘中。
RAID5使用了一种特殊的算法,可以计算出任何一个带区校验块的存放位置。
这样就可以确保任何对校验块进行的读写操作都会在所有的RAID磁盘中进行均衡,从而消除了产生瓶颈的可能。
RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。
RAID5提高了系统可靠性,但对数据传输的并行性解决不好,而且控制器的设计也相当困难。
8、RAID6
RAID6即带有两种分布存储的奇偶校验码的独立磁盘结构,它是对RAID5的扩展,主要是用于要求数据绝对不能出错的场合,使用了二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载,很少人用。
9、RAID7
RAID7即优化的高速数据传送磁盘结构,它所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性和系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。
允许使用SNMP协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。
可以连接多台主机,当多用户访问系统时,访问时间几乎接近于0。
但如果系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和UPS一起工作,RAID7系统成本很高。
10、RAID10
RAID10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构,可以达到既高
效又高速的目的。
这种新结构的价格高,可扩充性不好。
11、RAID53
RAID7即高效数据传送磁盘结构,是RAID3和带区结构的统一,因此它速度比较快,也有容错功能。
但价格十分高,不易于实现。
三、应用RAID技术
要使用磁盘RAID主要有两种方式,第一种就是RAID适配卡,通过RAID适配卡插入PCI插槽再接上硬盘实现硬盘的RAID功能。
第二种方式就是直接在主板上集成RAID控制芯片,让主板能直接实现磁盘RAID。
这种方式成本比专用的RAID适配卡低很多。
此外还可以用2korxporlinux系统做成软raid.个人使用磁盘RAID主要是用RAID0、RAID1或RAID0+1工作模式。
几种常见的数据备份方案
常见的数据备份系统主要有Host-Base、LAN-Base和基于SAN结构的LAN-Free、Server-Free等多种结构。
综述
Host-Based备份方式:
Host-Based是传统的数据备份的结构这种结构中磁带库直接接在服务器上,而且只为该服务器提供数据备份服务。
在大多数情况下,这种备份大多是采用服务器上自带的磁带机,而备份操作往往也是通过手工操作的方式进行的。
Host-Based备份结构的优点是数据传输速度快,备份管理简单;缺点是不利于备份系统的共享,不适合于现在大型的数据备份要求。
LAN-Based备份方式:
LAN-Based备份,在该系统中数据的传输是以网络为基础的。
其中配置一台服务器作为备份服务器,由它负责整个系统的备份操作。
磁带库则接在某台服务器上,在数据备份时备份对象把数据通过网络传输到磁带库中实现备份的。
LAN-Based备份结构的优点是节省投资、磁带库共享、集中备份管理;它的缺点是对网络传输压力大。
LAN-Free备份方式:
LAN-Free和Server-Free的备份系统是建立在SAN(存储区域网)的基础上的,其结构如下图所示。
基于SAN的备份是一种彻底解决传统备份方式需要占用LAN带宽问题的解决方案。
它采用一种全新的体系结构,将磁带库和磁盘阵列各自作为独立的光纤结点,多台主机共享磁带库备份时,数据流不再经过网络而直接从磁盘阵列传到磁带库内,是一种无需占用网络带宽(LAN-Free)的解决方案。
目前随着SAN技术的不断进步,LAN-Free的结构已经相当成熟,而Server-Free的备份结构则不太成熟。
LAN-Free的优点是数据备份统一管理、备份速度快、网络传输压力小、磁带库资源共享;缺点是投资高。
利用IBMTivolyStorageManager软件,配合IBMLTO等磁带库产品,可以实现以上各种备份方式。
数据备份方式的选择
目前数据备份主要方式有:
LAN备份、LANFree备份和SANServer-Free备份三种。
LAN
备份针对所有存储类型都可以使用,LANFree备份和SANServer-Free备份只能针对SAN架构的存储。
基于LAN备份
传统备份需要在每台主机上安装磁带机备份本机系统,采用LAN备份策略,在数据量不是很大时候,可采用集中备份。
一台中央备份服务器将会安装在LAN中,然后将应用
服务器和工作站配置为备份服务器的客户端。
中央备份服务器接受运行在客户机上的备份代理程序的请求,将数据通过LAN传递到它所管理的、与其连接的本地磁带机资源上。
这
一方式提供了一种集中的、易于管理的备份方案,并通过在网络中共享磁带机资源提高了效率。
LAN-Free备份
由于数据通过LAN传播,当需要备份的数据量较大,备份时间窗口紧张时,网络容易发生堵塞。
在SAN环境下,可采用存储网络的LAN-Free备份,需要备份的服务器通过SAN连接到磁带机上,在LAN-Free备份客户端软件的触发下,读取需要备份的数据,通过SAN备份到共享的磁带机。
这种独立网络不仅可以使LAN流量得以转移,而且它的运转所需
的CPU资源低于LAN方式,这是因为光纤通道连接不需要经过服务器的TCP/IP栈,而且某些层的错误检查可以由光纤通道内部的硬件完成。
在许多解决方案中需要一台主机来管理共享的存储设备以及用于查找和恢复数据的备份数据库。
SANServer-Free备份
LANFree备份对需要占用备份主机的CPU资源,如果备份过程能够在SAN内部完成,而大量数据流无需流过服务器,则可以极大降低备份操作对生产系统的影响。
SAN
Server-Free备份就是这样的技术。
目前主流的备份软件,如IBMTivoli、Veritas,均支持上述三种备份方案。
三种方案中,LAN备份数据量最小,对服务器资源占用最多,成本最低;LANfree备份数据量大一些,对服务器资源占用小一些,成本高一些;SANServer-free备份方案能够在短时间备份大量数据,对服务器资源占用最少,但成本最高。
中小客户可根据实际情况选择。
传统备份:
黔驴技穷无奈何
在传统的备份模式下,每台主机都配备专用的存储磁盘或磁带系统,主机中的数据必须备份到位于本地的专用磁带设备或盘阵中。
这样,即使一台磁带机(或磁带库)处于空闲状态,另一台主机也不能使用它进行备份工作,磁带资源利用率较低。
另外,不同的操作系统平台使用的备份恢复程序一般也不相同,这使得备份工作和对资源的总体管理变得更加复杂。
后来,产生一种克服专用磁带系统利用率低的改进办法:
即磁带资源由一个主备份/恢复服务器控制,而备份和恢复进程由一些管理软件来控制。
主备份服务器接收其他服务器通过局域网或广域网发来的数据,并将其存入公用磁盘或磁带系统中。
这种集中存储的方式极大地提高了磁带资源的利用效率。
但它也存在一个致命的不足:
网络带宽将成为备份和恢复进
程中的潜在瓶颈。
有没有一种更先进的解决方案,在备份的时候尽可能减小对系统资源的消耗,同时又保证系统的高可用性和灵活性呢?
LAN-free备份:
平平常常第一招儿
办法之一采用LAN-free技术。
所谓LAN-free,是指数据不经过局域网直接进行备份,即用户只需将磁带机或磁带库等备份设备连接到SAN中,各服务器就可把需要备份的数据直接发送到共享的备份设备上,不必再经过局域网链路。
由于服务器到共享存储设备的大量数据传输是通过SAN网络进行的,局域网只承担各服务器之间的通信(而不是数据传输)任务。
2种常见的实施手段
LAN-free有多种实施方式。
通常,用户都需要为每台服务器配备光纤通道适配器,适配器负责把这些服务器连接到与一台或多台磁带机(或磁带库)相连的SAN上。
同时,还需要为服务器配备特定的管理软件,通过它,系统能够把块格式的数据从服务器内存、经SAN传输到磁带机或磁带库中。
还有一种常用的LAN-free实施办法,在这种结构中,主备份服务器上的管理软件可以启动其他服务器的数据备份操作。
块格式的数据从磁盘阵列通过SAN传输到临时存储数据的备份服务器的内存中,之后再经SAN传输到磁带机或磁带库中。
LAN-free备份不足之处
“人无完人”,LAN-free技术也存在明显不足。
首先,它仍旧让服务器参与了将备份数据从一个存储设备转移到另一个存储设备的过程,在一定程度上占用了宝贵的CPU处理时间和服务器内存。
还有一个问题是,LAN-free技术的恢复能力差强人意,它非常依赖用户的应用。
许多产品并不支持文件级或目录级恢复,映像级恢复就变得较为常见。
映像级恢复就是把整个映像从磁带拷回到磁盘上,如果您需要快速恢复某一个文件,整个操作将变得非常麻烦。
此外,不同厂商实施的LAN-free机制各不相同,这还会导致备份过程所需的系统之间出现兼容性问题。
LAN-free的实施比较复杂,而且往往需要大笔软、硬件采购费。
无服务器备份:
锦上添花第二招儿
另外一种减少对系统资源消耗的办法是采用无服务器(Serverless)备份技术。
它是
LAN-free的一种延伸,可使数据能够在SAN结构中的两个存储设备之间直接传输,通常是在磁盘阵列和磁带库之间。
这种方案的主要优点之一是不需要在服务器中缓存数据,显著减少对主机CPU的占用,提高操作系统工作效率,帮助企业完成更多的工作。
2种常见的实施手段
与LAN-free一样,无服务器备份也有几种实施方式。
通常情况下,备份数据通过名为数据移动器的设备从磁盘阵列传输到磁带库上。
该设备可能是光纤通道交换机、存储路由器、智能磁带或磁盘设备或者是服务器。
数据移动器执行的命令其实是把数据从一个存储设备传输到另一个设备。
实施这个过程的一种方法是借助于SCSI-3的扩展拷贝命令,它使服务器能够发送命令给存储设备,指示后者把数据直接传输到另一个设备,不必通过服务器内存。
数据移动器收到扩展拷贝命令后,执行相应功能。
另一种方法就是利用网络数据管理协议(NDMP)。
这种协议实际上为服务器、备份和恢复应用及备份设备等部件之间的通信充当一种接口。
在实施过程中,NDMP把命令从服务器传输到备份应用中,而与NDMP兼容的备份软件会开始实际的数据传输工作,且数据的传输并不通过服务器内存。
NDMP的目的在于方便异构环境下的备份和恢复过程,并增强不同厂商的备份和恢复管理软件以及存储硬件之间的兼容性。
无服务器备份的优势
无服务器备份与LAN-free备份有着诸多相似的优点。
如果是无服务器备份,源设备、目的设备以及SAN设备是数据通道的主要部件。
虽然服务器仍参与备份过程,但负担大大减轻,因为它的作用基本上类似交警,只用于指挥,不用于装载和运输,不是主要的备份数据通道。
无服务器备份技术具有缩短备份及恢复所用时间的优点。
因为备份过程在专用高速存储网络上进行,而且决定吞吐量的是存储设备的速度,而不是服务器的处理能力,所以系统性能将大为提升。
此外,如果采用无服务器备份技术,数据可以数据流的形式传输给多个磁带
库或磁盘阵列。
至于缺点,虽然服务器的负担大为减轻,但仍需要备份应用软件(以及其主机服务器)来控制备份过程。
元数据必须记录在备份软件的数据库上,这仍需要占用CPU资源。
与LAN-free一样,无服务器备份可能会导致上面提到的同样类型的兼容性问题。
而且,无服务器备份可能难度大、成本高。
最后,如果无服务器备份的应用要更广泛,恢复功能方面还有待更大改进。
平衡利弊再定夺
前面我们讨论了光纤通道环境下的LAN-free和无服务器备份技术,由于有些结构集成了基于IP的技术,譬如iSCSI,特别是随着将来IP存储技术在存储网络中占有的强劲优势,LAN-free和无服务器备份技术应用的解决方案将会变得更为普遍。
LAN-free和无服务器备份并非适合所有应用。
如果您拥有的大型数据存储库必须7×24随时可用,无服务器备份或许是不错的选择。
但必须确保您已经清楚恢复过程需要多长时间,因为低估了这点会面临比开始更为严重的问题。
另一方面,如果您拥有的大小适中的数据库可以容忍一定的停机时间,那么传统的备份和恢复技术也许是您比较不错的选择。