最全面的服务器的RAID详解.docx
《最全面的服务器的RAID详解.docx》由会员分享,可在线阅读,更多相关《最全面的服务器的RAID详解.docx(13页珍藏版)》请在冰豆网上搜索。
最全面的服务器的RAID详解
最全面的服务器的RAID详解
磁盘阵列(RedundantArraysofIndependentDisks,RAID),全称独立磁盘冗余阵列。
磁盘阵列是由很多廉价的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。
利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。
利用同位检查(ParityCheck)的观念,在数组中任意一个硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后重新置入新硬盘中。
相同的数据存储在多个硬盘的不同的地方的方法。
通过把数据放在多个硬盘上(冗余),输入输出操作能以平衡的方式交叠,改良性能。
因为多个硬盘增加了平均故障间隔时间(MTBF),储存冗余数据也增加了容错。
分类:
一是外接式磁盘阵列柜、二是内接式磁盘阵列卡,三是利用软件实现。
RAID实现的方式:
RAID0,RAID1,RAID2,RAID3,RAID4,RAID5,RAID6,RAID7,RAID01,RAID10,RAID50,RAID53。
常见的有:
RAID0,RAID1,RAID5,RAID6,RAID01,RAID10。
原理剖析:
RAID0:
RAID0又称为Stripe或Striping,中文称之为条带化存储,它代表了所有RAID级别中最高的存储性能。
原理:
是把连续的数据分散到多个磁盘上存取,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求。
这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能。
磁盘空间=磁盘总量=100%
需要的磁盘数≥2
读写性能=优秀=磁盘个数(n)*I/O速度=n*100%
块大小=每次写入的块大小=2的n次方=一般为2~512KB
优点:
1、充分利用I/O总线性能使其带宽翻倍,读/写速度翻倍。
2、充分利用磁盘空间,利用率为100%。
缺点:
1、不提供数据冗余。
2、无数据检验,不能保证数据的正确性。
3、存在单点故障。
应用场景:
1、对数据完整性要求不高的场景,如:
日志存储,个人娱乐
2、要求读写效率高,安全性能要求不高,如图像工作站
架构图:
RAID1:
RAID1又称为Mirror或者Mirroring,中文称之为镜像存储。
RAID1是磁盘阵列中单位成本最高的,磁盘利用率最低,但提供了很高的数据安全性和可用性。
原理:
将一个两块硬盘所构成RAID磁盘阵列,其容量仅等于一块硬盘的容量,因为另一块只是当作数据“镜像”通过镜像实现数据冗余,成对的独立磁盘上产生互为备份的数据。
当原始数据繁忙时,可直接从镜像拷贝中读取数据,因此RAID1可以提高读取性能。
当一个磁盘失效时,系统可以自动切换到镜像磁盘上读写,而不需要重组失效的数据。
最大允许互为镜像内的单个磁盘故障,如果出现互为镜像的两块磁盘故障则数据丢失。
磁盘空间=磁盘总量/2=50%
需要的磁盘数(n)≥2*n
读性能=优秀=I/O性能*n=200%
写性能=正常=I/O性能=100%
优点:
1、提供数据冗余,数据双倍存储。
2、提供良好的读性能
缺点:
1、无数据校验
2、磁盘利用率低,成本高
应用场景:
1、存放重要数据,如数据存储领域
架构图:
RAID2:
RAID0的优化版本
原理:
每次读写需要全组磁盘联动,,提供汉明码错误校验机制,将数据进行编码后分区为独立的位,并将数据分别写入硬盘中。
因为在数据中加入了错误修正码,输出数据的速率与驱动器组中速度最慢的相等。
磁盘空间≤磁盘总量
需要的磁盘数≥3
数据单位=字节
优点:
1、有数据校验机制
2、磁盘的寻道时间减少
缺点:
1、目前应用场景不多,基本被淘汰。
2、成本高
应用场景:
影像处理或者CAD/CAM的工作站
架构图:
RAID3:
类似于RAID2,
原理:
采用Bit-interleaving(数据交错存储)技术,它需要通过编码再将数据位分区后分别存在硬盘中,而将同位检查后单独存在一个硬盘中,但由于数据内的位分散在不同的硬盘上,因此就算要读取一小段数据资料都可能需要所有的硬盘进行工作,所以这种规格比较适于读取大量数据时使用。
磁盘空间=n-1
需要的磁盘数≥n+1
数据单位=字节
写性能=一般
读性能=良好
优点:
1、有数据校验机制
缺点:
1、校验盘很容易成为整个系统的瓶颈
应用场景:
1、写操作较少,读操作较多的应用环境,如:
数据库、WEB服务器等。
2、适合大文件类型且安全性要求较高的应用,如视频编辑、硬盘播出机、大型数据库等。
架构图:
RAID4:
与RAID3类似
原理:
RAID4和RAID3很象,数据都是依次存储在多个硬盘之上,奇偶校验码存放在独立的奇偶校验盘上,唯一不同的是,在数据分割上RAID3对数据的访问是按位进行的,RAID4是以数据块为单位。
磁盘空间=n-1
需要的磁盘数≥n+1
写性能=差
读性能=正常
数据单位=块(扇区)
优点:
1、按块存储可以保证块的完整
2、有校验机制
缺点:
1、写效率差,每次写入需要生成校验
2、硬盘损耗高
应用场景:
对数据安全性能高的环境,通RAID3
架构图和RAID3一致:
RAID5:
奇偶校验(XOR),RAID0和RAID1的折中方案。
原理:
数据以块分段条带化存储。
校验信息交叉地存储在所有的数据盘上。
数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上,其中任意N-1块磁盘上都存储完整的数据
磁盘空间=n-1
需要的磁盘数≥3
读写性能 ≈优秀=磁盘个数(n)*I/O速度=n*100%
优点:
1、读写性能高
2、有校验机制
3、磁盘空间利用率高
缺点:
1、磁盘越多安全性能越差
应用场景:
安全性高,如金融、数据库、存储等。
架构图:
RAID6:
与RAID5相比,RAID6增加了第二个独立的奇偶校验信息块。
双重奇偶校验
原理:
两个独立的奇偶系统使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。
但RAID6需要分配给奇偶校验信息更大的磁盘空间,写性能比RAID5差。
磁盘空间=n-2
需要的磁盘数≥4
优点:
1、良好的随机读性能
2、有校验机制
缺点:
1、写入速度差
2、成本高
应用场景:
对数据安全级别要求比较高的企业
架构图:
RAID7:
RAID7并非公开的RAID标准,而是StorageComputerCorporation公司的专利硬体产品名称。
是一个完整的存储阵列。
RAID7有自身的实时操作系统用来管理阵列。
原理:
1、物理上RAID7主要包括两部分:
一个运行实时操作系统的控制器;二.多个Channel磁盘组。
2、逻辑上RAID7类似于RAID3和RAID4。
磁盘分布于多个Channel,一个Channel包含一组磁盘,校验盘可以分布于任意Channel。
Channel之间通过X-BUS连接。
3、异步IO。
IO读写操作以及奇偶校验都直接在缓存里面完成。
控制器负责数据从缓存写入磁盘。
4、可以根据需求,将部分磁盘配置为HotStandy模式。
5、提供SNMP远程监控管理功能。
优点:
1、性能好,IO延迟低
缺点:
1、成本高
应用场景:
对存储性能要求高且没有高端技术团队的公司
架构图:
RAID01:
RAID0和RAID1的组合形式
原理:
先做RAID0再将RAID0组合成RAID1,拥有两种RAID的特性。
磁盘空间=n/2=50%
4≥需要的磁盘数≥2*n
读写性能=RAID0
优点:
1、较高的IO性能
2、有数据冗余
3、无单点故障
缺点:
1、成本稍高
2、安全性比RAID10差
应用场景:
特别适用于既有大量数据需要存取,同时又对数据安全性要求严格的领域,如银行、金融、商业超市、仓储库房、各种档案管理等。
架构图:
RAID10:
RAID0和RAID1的组合形式
原理:
先做RAID1再将RAID1组合成RAID0,拥有两种RAID的特性,安全性能高。
磁盘空间=n/2=50%
4≤需要的磁盘数≥2*n
优点:
1、RAID10的读性能将优于RAID01
2、较高的IO性能
3、有数据冗余
4、无单点故障
5、安全性能高
缺点:
1、成本稍高
应用场景:
特别适用于既有大量数据需要存取,同时又对数据安全性要求严格的领域,如银行、金融、商业超市、仓储库房、各种档案管理等。
架构图:
RAID50:
RAID50也被称为镜象阵列条带
原理:
先做RAID5再将RAID5组合成RAID0,拥有两种RAID的特性。
需要的磁盘数≥6
RAID53:
一个镜射条带数组,硬盘里其中一个条带就是一个是由3组以上的RAID5组成RAID3硬盘阵列
原理:
先做RAID5再将RAID5组合成RAID3,拥有两种RAID的特性。
需要的磁盘数≥6+1。