企业同城灾备系统解决方案建议书 NBU5220文档格式.docx
《企业同城灾备系统解决方案建议书 NBU5220文档格式.docx》由会员分享,可在线阅读,更多相关《企业同城灾备系统解决方案建议书 NBU5220文档格式.docx(52页珍藏版)》请在冰豆网上搜索。
●业务计算机系统抵御灾难的级别提高。
●提升了关键业务系统的高可用性,减少计划性停机对业务的影响。
●在生产系统正常运转的情况下,容灾系统还可以被用来开展诸如数据挖掘、经营分析等增值业务。
3XX集团灾备系统总体设计
3.1本次灾备系统覆盖的范围
本次灾备系统将集团公司的IT系统和财务公司的IT系统一并考虑,但鉴于集团公司和财务公司不同系统的RPO和RTO要求不同,建议的灾备技术也具有各自的针对性。
据初步统计,集团公司目前有2台IBMP570小型机,20台左右的WindowsPC服务器和1台LinuxPC服务器;
财务公司目前有2台IBMP520小型机和6-7台WindowsPC服务器。
本次针对这些服务器和应用系统将设计不同的灾备技术和策略。
3.2灾备系统建设目标
容灾系统在实践中主要表现为两个方面:
一是保证企业数据的安全;
二是保证业务的连续性。
通过在生产站点和灾难恢复站点运行同样的系统,包括操作系统、基础数据库和应用软件,并通过IP或FC通道完成实时或异步的数据复制。
假如生产站点突发灾难,不能再继续工作,这时容灾中心会将业务数据及时恢复到备用服务器上,并迅速将业务系统加载到备用服务器,然后实现业务的远程切换(Fail-over),恢复应用系统不间断的运行;
在此基础上,在灾难过后,生产系统恢复正常后,再将业务运行切换回正常的生产系统,实现业务系统的灾难恢复(Fail-back)。
本次项目,XX集团重要数据的异地保存是首要需求,首先要保证数据的远程可用,另外对于总公司和财务公司的一些关键业务系统,将考虑一定程度的应用级容灾。
3.3本次灾备系统的整体建议
一个较为完善的灾难恢复系统主要包括三个部分:
数据容灾系统、应用容灾系统和容灾演练系统。
可以说,数据容灾是抗御灾难的基本保障,应用容灾则是灾难恢复系统建设的最终目的,而容灾演练系统最终保证容灾系统的正常运行。
考虑到不同系统RPO和RTO的需求不一样,本次灾备系统的整体建议如下:
对于XX总部,我们提供两个方案供您选择,这两个方案的效果和投资成本均不同:
1.使用NetBackup软件整合本地所有数据的备份,再把备份的数据自动复制一份到远程保存,具体的指标见下表:
系统名称
型号
数量
灾备技术选择
参考的RPO范围
参考的RTO范围
容灾级别
ERP核算、人力
IBMP570
16Core
4个分区
2
NetBackup本地备份整合+远程备份
RPO≤24小时
1小时-24小时
RTO≤48小时
2小时-48小时
国标第4级
ERP数据库
测试系统
资金管理
集团OA数据库
Windows应用服务器
PC服务器
10个应用+10个数据库
20
培训系统
LinuxPC服务器
1
2.使用NetBackup软件整合本地所有数据的备份,同时包括2台小型机在内的所有关键服务器利用StorageFoundation的VVR复制软件将重要的数据准实时的复制到远程,如果需要,StorageFoundation的GCO功能还能实现业务的远程切换。
关键服务器暂定为2台Unix小机和10台应用服务器(5个应用+5个数据库),数量可根据需求进一步调整。
其余服务器上的数据通过NetBackup的远程备份来实现数据级的灾备。
另外,方案二还可以利用StorageFoundation的镜像功能在本地数据中心对关键服务器实现双机双柜,加强本地存储系统的高可用性。
具体的指标见下表:
NetBackup本地备份整合
StorageFoundation+VVR远程复制
RPO≤30分钟
1-30分钟
RTO≤8小时
2小时-8小时
国标第5级
Windows关键应用服务器
5个应用+5个数据库
10
Windows非关键应用服务器
对于财务公司,鉴于业务的连续性要求较高,我们建议在利用NetBackup本地备份整合的基础上,直接使用StorageFoundationVVR远程灾备的方式,具体的指标如下:
集团
财务管理
IBMP520
Windows前置机
7
4XX集团灾备系统的具体实现
4.1第一步:
本地备份整合
本地数据备份的整合是建立灾备系统的基础,因为数据同步复制技术不能完全代替备份的功能,即使使用了数据同步复制技术,也有可能需要将数据恢复到历史的时间点。
XX集团现在已经对关键的数据库系统进行了在线备份,但OA和ERP等不同的业务系统采用了不同的备份技术,而且操作系统和部分服务器上的文件还没有进行备份,建议XX建立一个统一的数据备份和管理平台,将所有的PC服务器和小型机都纳入进来,涵盖包括文件、操作系统和数据库等全部重要的内容,作为灾备系统的建设的后备保障力量。
目前,集团公司有2台P570小型机,每个小型机分为4个分区,运行着ERP核算、人力、预算合并、数据库、测试系统等;
2台小机为主备集群。
数据库为Oracle数据库,版本为9i,由于数据库版本较低,近期准备升级到11g。
另外还有大约20台WindowsPC服务器,约10个应用系统,架构均为1台应用服务器+1台数据库服务器,数据库有SQLServer、Oracle和Domino等。
之外还有1台Linux服务器作为培训系统。
本地备份整合的拓扑如下所示:
结合XX集团的实际情况,建议是利用SAN和LAN的存储架构,采用目前最先进的新型LAN-Free备份技术并结合LAN的备份技术,来减轻局域网的压力,是目前最成熟的技术解决方案。
推荐采用SymantecNetbackup(以下简称NBU)企业级备份软件作为统一的备份和管理平台来满足用户的需求。
NBU是目前业界市场占有率第一的备份软件,其主要模块如下:
NetBackup主服务器(MasterServer)负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库,实现多个客户端的数据备份。
NetBackup主服务器是备份域内集中管理的核心。
一般一个备份域配置1台MasterServer即可。
企业客户端(EnterpriseClient)可以让备份的客户端直接连接和管理备份设备,具有介质管理服务器的角色,这样客户端可以自己备份自己,不用再向备份服务器传送数据。
可用利用效率更高的SAN网络,而不用占用LAN网络带宽。
企业客户端上如果有数据库需要在线备份,还需要安装数据库代理模块(DatabasePack)。
标准客户端(StandardClient)可以让备份的客户端通过LAN网络进行备份。
所有备份的数据均需发送到备份管理服务器,由备份管理服务器写入备份设备。
标准客户端上如果有数据库需要在线备份,也需要安装数据库代理模块。
本次建议采用NBU5220备份一体机实现备份环境的整合和统一备份,NBU5220的本质是”NBU管理服务器+备份设备”,既承担了整合备份域的统一管理功能,又提供高性能大容量的磁盘备份空间,并且完全集成NBU的重复数据删除功能,优化了整个数据中心的备份性能。
如上图所示:
XX集团原有的系统架构无需做任何改变,只需要增加1台NBU5220备份一体机设备,该设备前端连接以太网,后端连接SAN网络,提供LAN和LAN-FREE等多种备份模式的支持。
NBU5220提供新型的LAN-FREE备份技术(又叫做SANClient技术),使用这种技术进行备份,LAN-FREE的客户端无需连接和管理备份设备,只需要利用SAN网络将备份数据备份到NBU5220即可。
由于无需客户端管理备份设备,降低了对客户端本身资源的占用,也减少了备份设备变更对客户端的影响,客户端的备份效率和整个备份系统的扩展能力大大增强。
备份的客户端只需安装NBU客户端代理,进行LAN-FREE备份的客户端安装NBU企业客户端代理,进行LAN备份的客户端安装NBU标准客户端代理,所有的数据库和应用程序服务器再安装数据库代理模块,提供对数据库进行在线的热备份。
NBU5220预装了NBU备份软件,支持NBU软件的所有新功能,包括NBU7.5最新的备份加速功能,可将文件系统的备份速度最高提高100倍以上。
另外,使用NBU5220内置的重复数据删除功能,可对整个备份域进行全局消重,降低了对备份空间的占用,可以让5220存储更多的备份数据。
NBU5220的硬件指标如下:
产品规范
形态构架
2U主柜+3U扩展柜
CPU
双IntelE5620CPU
内存
24GB或48GBDDR内存
存储设备
主柜:
2x1TBSATA系统盘,8x1TBSAS数据盘
扩展柜:
16x2TB或16x3TBSAS磁盘
服务端口
6个1Gb以太网端口
可扩展为2个10Gb以太网端口
可扩展为6个8GbFC端口
使用NBU5220构建统一的备份域具有以下明显的优势:
(1)提供管理服务器和备份空间等一体化方案,简单易用
(2)内置NBU备份软件,支持NBU所有的新功能和新技术
(3)内置重复数据删除功能:
支持10-50倍的压缩,节省最多99%的带宽
(4)提供源端和目标端的重复数据删除位置,方便用户的灵活选择
(5)高可用硬件设计,提供99.95%的可用性
(6)操作和配置简单易用:
只需要几分钟时间就可以完全配置好
(7)支持磁带的出库,可与磁带库完美配合
整个集团公司的统一备份平台所需的软硬件模块列表整体如下:
所需硬件:
NetBackup5220
名称
主要描述
NBU5220备份一体机
提供备份管理和磁盘备份空间的一体化硬件设备
所需软件:
NetBackup7.5
EnterpriseServer
备份管理服务器授权,Linux平台
EnterpriseClient
LAN-Free备份客户端,Unix平台
LAN-Free备份客户端,Windows平台
StandardClient
LAN备份客户端,Windows/Linux平台
11
DatabasePack
数据库和应用在线备份模块,Unix平台
数据库和应用在线备份模块,Win/Linux平台
DataProtectionOptimization
重复数据删除模块,1TB容量授权
4.2第二步:
同城灾备建议方案一(NBU远程备份)
4.2.1方案一的详细设计
方案一建议利用SymantecNetbackup备份管理平台实现备份数据的远程复制,整个复制过程基于容灾链路完全自动化运行,这样基本达到国标第3级的容灾目标;
另外,建议在容灾中心设立若干台应用服务器,例如可以为每一类服务器(Unix和Windows)配置1台备机,定期把备份数据在远程的应用服务器上进行恢复,以进行验证或使用,这样可达到国标第4级的容灾目标。
国标第4级的具体要求如下:
第4级:
电子传输及完整设备支持
要素
要求
A.4.1
数据备份系统
a)完整数据备份至少每天一次;
b)备份介质场外存放;
c)每天多次利用通信网络将关键数据定时批量传送至备用场地。
A.4.2
备用数据处理系统
a)配备灾难恢复所需的全部数据处理设备,并处于就绪状态或运行状态。
A.4.3
备用网络系统
a)配备灾难恢复所需的通信线路;
b)配备灾难恢复所需的网络设备,并处于就绪状态。
A.4.4
备用基础设施
a)有符合介质存放条件的备用场地;
b)有符合备用数据处理系统和备用网络设备运行要求的场地;
c)有满足关键业务功能恢复运作要求的场地;
d)以上场地应保持7*24运作。
A.4.5
技术支持
在备用场地有:
a)7*24专职计算机机房管理人员;
b)专职数据备份技术支持人员;
c)专职硬件、网络技术支持人员。
A.4.6
运行维护支持
a)有介质存取、验证和转储管理制度;
b)按介质特征对备份数据进行定期的有效性验证;
c)有备用计算机机房运行管理制度;
d)有硬件和网络运行管理制度;
e)有电子传输数据备份系统运行管理制度。
A.4.7
灾难恢复预案
有相应的经过完整测试和演练的灾难恢复预案。
为保证灾备机房设备运行环境的正常,需要为灾备机房增配机房环境监测、UPS电源、机柜等基础设施,保证机房条件满足设备运行环境。
整体拓扑如下所示:
方案一建议在灾备中心配置1台NBU5220备份一体机设备,生产机房和灾备机房之间通过IP链路连接即可。
灾备机房的NBU5220设置为MasterServer的角色,利用NBU的AIR技术把生产机房的MasterServer上的备份数据复制到灾备机房的MasterServer上。
生产机房的NBU5220与灾备机房的NBU5220需要能够正常通信,但彼此的通信并不频繁,只有在需要复制数据的时候才会互相通信,减少了由于通信问题或者网络问题影响复制的隐患,确保了整个复制架构的稳定性。
另外由于远程的NBU5220构成了一个单独的备份域,这样一旦本地的备份域完全瘫痪也可以在远程进行恢复。
下面就灾备系统的实现过程做一个简单的描述:
复制的功能通过NBU存储生命周期策略来实现。
首先在生产机房的NBU5220上建立一个存储生命周期策略,在这个策略中将主站点的NBU5220作为第一级备份设备,将远程的NBU5220作为第二级备份设备。
然后在生产机房的NBU5220上创建针对于每个备份客户端的备份策略,在这个备份策略中,调用存储生命周期策略。
这样在备份时,客户端的数据会先发送给本地的NBU5220,写入完成后不久便会自动复制到远程的NBU5220上,整个过程完全自动化执行。
在灾备机房的NBU5220上面创建一个同样名称的存储生命周期策略,生产机房的NBU5220和灾备机房的NBU5220互相验证,这样,复制过来的数据会自动导入灾备机房的NBU5220上。
当生产机房的业务系统发生故障导致数据丢失时,优先从本地的NBU5220中进行还原。
如生产机房遭遇重大灾难时,无法从本地进行还原,可以在异地重建业务系统,从异地数据备份进行还原,以保证数据安全和信息系统及时恢复正常运行。
这种情况,需要在远程为每一类操作系统主机设置1台或多台备机,以便在远程恢复和验证数据。
目前,NBU的AIR技术不仅支持对数据的远程复制和异机恢复,还支持对操作系统的远程复制和异机恢复,这样,整个灾备系统的RTO值将进一步降低。
备份管理员可以决定客户端的数据是否复制到远程,因为在很多时候,非重要的客户端上的数据,或者是重要的客户端上的非重要数据是没有必要复制到远程的,只在本地备份磁盘上保存即可。
这样,一方面是减轻备份管理服务器备份和复制的压力,另外也节省了对灾备链路带宽的抢占,保证灾备链路的带宽主要用于重要数据的复制。
提到灾备链路的带宽,一个基本原则是要保证一个全备份在合理的时间内(比如说12小时,时间越长,RPO就越大)可以复制过去。
目前集团公司的数据总量还不算大,全备份大约在几百GB,关键数据库的增量每天大约5GB,建议租用一条10Mb以上的SDH备份专用线路作为灾备数据传输线路。
生产机房和灾备机房各需要1套路由交换设备接入灾备专用网络。
以10MbSDH链路举例,假如链路带宽有效地传输效率为80%,每小时可以复制的数据为:
10/8*0.8*3600/1024=3.5GB,那么24小时可以复制的数据为:
3.5*24=84GB。
实际的传输效率可能会更小一点。
因此,我们认为在这种灾备链路的条件下,假如不使用重复数据删除技术,全部的灾备数据应控制在100GB左右,这就要求管理员需要明确区分重要和非重要的数据。
如果结合备份软件的重复数据删除功能,那么可以在本地备份时消除备份的重复数据。
这个功能非常好,这意味这需要复制的数据大幅减少。
以平均1:
8的消重率计算,假如原来备份的数据为800GB,那么使用消重技术之后,实际占用的空间仅为100GB,这意味着在10Mb的窄带链路下,可以承担的数据复制总量将提高8倍,达到800GB。
在灾备系统当中,最可能成为备份瓶颈的就是灾备链路带宽,今后如果数据传输的时间过长,可考虑进一步增加链路带宽。
采用NBU5220构建灾备系统,简单易用,优势明显:
1.NBU5220即插即用,配置非常简单(最快几分钟即可完成配置),对现有环境改造的影响极小。
2.直接支持基于IP灾备链路进行复制,对复制带宽的要求不高。
3.NBU5220支持NBU7.5最新的各种功能,没有任何兼容性问题。
4.可以本地备份的数据和需要容灾的备份数据分开,减轻对灾备网络资源的占用。
5.NBU5220的网络穿透能力很强,可以用在一个备份域内部复制,也可以用在多个备份域之间复制。
6.在远程灾备中心的部署简单,不需要额外的介质服务器,管理和配置也很便捷。
方案一所需的软硬件模块列表如下:
NetBackup5220(用于灾备)
用于远程恢复和验证数据,暂定2台
NetBackup7.5(用于灾备)
用于远程的异机恢复
4.2.2AIR技术的特点和优势
上节提到,方案一是用NBUAIR技术实现备份数据的远程灾备。
AIR是NBU7.1的新功能,全称是AutoImageReplication,主要的作用是将一个备份域的备份数据复制到另外一个备份中,然后可以在另外一个备份中恢复和验证数据。
NBU是唯一支持该技术的产品。
其主要特点如下:
1.自动的在两个独立的备份域间复制备份映像
2.数据自动的导入到目标备份域的目录库,无需人工干预
3.与重复数据删除技术集成,优化复制带宽
4.支持对数据和BMR(操作系统裸机恢复)的远程复制和异机恢复
5.数据可进一步在容灾站点复制到磁带及出库保存
4.2.3远程数据的验证
由于重要应用系统对数据可恢复性以及RTO指标要求较高,建议在灾备中心定期将复制的备份数据在恢复环境中进行恢复测试,一方面验证数据的可恢复性,另一方面对恢复操作进行演练,以保证RTO指标。
在管理上,建议将业务级别与恢复演练策略结合起来,根据业务的重要行规划恢复演练策略。
例如,针对高级别的业务系统,加大演练频率;
对于低级别的业务系统,适当延长演练频率。
建议XX集团对一级