数据灾备方案.docx
《数据灾备方案.docx》由会员分享,可在线阅读,更多相关《数据灾备方案.docx(113页珍藏版)》请在冰豆网上搜索。
数据灾备方案
第一章概述
项目背景
甘肃银行新的数据中心即将完工,新的数据中心涉及甘肃银行包括核心系统在内的88个业务应用和全部生产数据。
同城双中心的新架构应用,对数据保留的窗口时间、RTO/RPO都有新要求,为了保证业务系统的正常运行和数据安全,必须建设足够强壮的备份系统以满足现在和未来的使用需要。
数据保护原则
数据中心往往采用多种数据保护方法来满足不同服务等级的要求,备份是其中唯一采用离线手段,并能提供给用逻辑错误的保护手段,同时,备份能实现的RTO和RPO也是所有保护系统中最低的,只有提升备份系统的效率,才能提升数据中心的可用性,满足更为严格的RTO/RPO要求。
通常来说,可以把数据保护分为如下三个层次:
Ø在线保护
在线数据保护技术包括跨阵列的数据镜像,双活系统等,此类解决方案的RPO为0,RTO为0或者秒级。
在线保护适用于对实时性要求非常高的核心系统,同时它也是最昂贵的数据保护方案。
Ø近线保护
近线保护是最近几年在近线存储技术上发展起来的,最典型的就是CDP,它采用的技术有数据复制、克隆、快照等,可以实现秒级RPO和分钟级的RTO,近线保护技术是生产系统开销最大的保护方案。
Ø离线保护
离线保护就是传统的备份技术,特点是成本低廉,保存周期和拷贝数量不受限制,但受到备份频率的限制,RPO和RTO往往是小时级或者天级。
备份系统的位置
一套系统往往会采用多种保护技术来进行全方位的数据保护,根据前期的环境调研,为了保证备份系统对业务系统的完全保护和满足同城双中心业务运行的要求,备份系统在两个生产中心分别独立运行,同时互为备份。
项目设计目标
为了满足银监局的要求和保障我行未来生产系统的RTO/RPO要求,当前的备份方式已经无法满足业务发展要求,迫切需要建设一套集中高效的备份系统。
针对我行目前的业务要求、架构规划和灾难恢复要求,结合对现有备份现状和存在的问题的修正,我们将建设跨越生产中心和同城容灾中心的统一备份系统。
本次集中备份系统的目标是建设一个集中式的备份恢复平台,业务系统服务器为备份客户端;备份的调度、监控、管理由备份服务器负责,所有备份数据都由备份客户端以SAN或者LAN的方式写到备份存储或者物理带库中。
1.备份系统架构图:
2.备份功能性要求
Ø备份的SAN、LAN和生产是完全独立的网络。
Ø实现LAN和SANClient的备份。
Ø备份的所有数据将存放在统一的备份一体机和物理带库上。
Ø全面覆盖全行所有应用系统的数据,包括:
数据库〔ORACLE、DB2、SQL〕、应用程序产生的文件、虚机的操作系统、PowerVMclient端的操作系统。
Ø实现备份系统的本地容灾。
3.备份系统的特性
Ø通用性
支持绝大多数主流操作系统、数据库和备份设备,支持新一代项目的所有操作系统和数据库备份,可以为甘肃银行所有系统提供统一的备份保护。
Ø可扩展性
备份系统具有良好的扩展性,可以方便的添加或删除备份客户端、服务器和备份设备,支持跨数据中心数据备份和备份数据容灾,符合甘肃银行两地三中心的规划要求。
Ø高可靠性
生产中心的备份服务器和备份一体机都配置成集群和容错模式,具有极高的可靠性,满足甘肃银行7×24的数据中心备份需求。
对备份的数据按照数据的重要级别设置不同的备份策略,让备份软件自动备份,减少了人工备份易犯的错备、漏备等缺点,提高数据的安全性,且通过备份软件进行恢复验证,确保备份数据的可靠性。
Ø高效率
相比较甘肃银行原先备份体系,新的集中备份架构对数据的备份、恢复和维护更有效率。
对于大多数系统管理人员来说,备份是一项繁重的任务,每天都要花费大量时间用于手工数据备份,从而影响其他工作的开展。
统一备份系统能够实现定时自动备份,大大减轻管理员的压力。
Ø高度自动化
新的备份架构将自动完成数据备份,数据的备份对于应用系统来说完全透明理想的备份系统是全方位,多层次的。
首先,通过多台一体机的冗余结构和备份主服务器的高可用来防止硬件故障,保证备份业务的不间断运行。
其次,备份系统根据策略自动执行,全面保护电脑系统的数据。
再次,备份系统采用高可用冗余架构,切换全部自动化,完全排队单点故障,实现7*24小时运行。
Ø集中管理化
利用统一备份系统,系统管理员可通过WEB界面,对全网的备份进行状态查看、策略管理、故障监控、报表汇总等统一集中管理。
Ø灾难恢复
同城备份容灾的设计是做为同城灾备的辅助手段,把同城灾备不能覆盖的数据保护起来,可以在生产中心发生灾难需要恢复数据时,配合同城灾备进行数据的恢复,以便快速的恢复生产。
本架构设计将是后续备份系统详细设计和部署方案的基础和指引。
第一章备份设备规划
备份环境准备
在安装NetBackup之前需要确认如下的信息:
1、备份服务器〔MasterServer〕的硬件及操作系统版本、补丁情况;
2、客户机〔Client〕的硬件及操作系统版本、补丁情况;
3、所连接带库的硬件、驱动器类型;
具体的硬件及操作系统兼容性请见以下链接:
主机硬件及操作系统兼容性:
/docs/278064
带库和带机的兼容性:
/docs/278692
如有数据库需要备份,请查看数据库的兼容性:
/docs/279048
更多对操作系统的要求请见releasenotes:
/docs/290196
硬件安装规划
备份主服务器:
备份主服务器采用双电源,双口HBA,四个10GE网卡并配置相应的网线;
备份一体机:
充当介质服务器,采用双电源,八口HBA,四个10GE网卡并配置相应的网线;
软件安装规划
备份主服务器软件版本为Netbackup7.7.3;
备份一体机内置版本为2.7.3,等同于Netbackup7.7.3;
客户端统一部署Netbackup7.7.3客户端;
物理带库安装规划
物理带库参照物理带库安装要求,物理带库必须接入FC网络。
第二章备份系统整体架构
整体架构概述
数据中心的备份采用Veritas的第四代备份架构,利用SANClient技术实现客户端与备份平台的松耦合。
通过松耦合技术,实现备份平台整体的集中管理,所有操作无需在客户端完成,大幅提升管理效率,并实现“云”化的备份平台。
备份服务器规划
§二.1.1服务器
1.功能用途
备份管理服务器是整个备份平台的“大脑”,它的主要职能是调度备份任务,分配备份资源,同时也是备份平台管理的主要接口。
备份一体机和备份客户端接受备份管理服务器的统一管理。
OpsCenter是NetBackup的Web管理结构、告警平台以及报表心。
简单来说,管理服务器承担三个功能角色:
ØNetBackupMasterServer
ØNetBackupOpsCenter
2.拓扑结构
备份管理服务器由两台服务器组成,安装RedHatLinux64bit操作系统,使用VeritasClusterServer做成两节点集群,Catalog存放在中低端磁盘阵列上。
3.OpsCenter架构
在正常情况下OpsCenter和MasterServer分别运行在不同的节点上,当一个MasterServer节点出现故障时,VCS将自动把服务切换到另外一个节点。
OpsCenter通过Netbackup通用通讯组件pbx和MasterServer进行通讯,定期从MasterServer获取各种备份状态信息,然后SNMP或者邮件方式发送给管理员。
OpsCenter和集中监控系统的告警采用标准的SNMP协议。
4.备份一体机架构
备份一体机充当介质服务器〔MediaServer〕,负责备份存储〔一体机存储空间和物理带库〕的管理,双中心结构下每中心采用两台等容量的备份一体机进行整体备份、容灾和磁带出带。
首先,在日常工作中,每个中心的两台一体机分别负责一部分业务系统的备份,在各自完成备份任务后再后台进行两台一体机之间的优化复制,实现单中心两副本;其次,生产中心和容灾中心的备份一体机采用AIR复制技术进行容灾同步,实现全部备份数据四个副本。
§二.1.2客户端
备份客户端为新数据中心的所有应用和数据库服务器,在新的数据中心中,客户端的操作系统有PowerVMclient端的AIX,X86平台虚拟机操作系统linux、windows、SUSE系统,客户端的数据库有ORACLE、DB2和SQL及非结构化的文件和音视频文件,建议使用多网卡绑定技术提高网路带宽和可靠性。
新数据中心200多套系统使用的服务器、操作系统、数据库均在NBU支持列表之内。
备份设备规划
§二.1.3物理带库规划
物理带库作为长期保留和辅助备份设备,主要用于存放长期保留的数据和音视频文件。
建议新购一台企业级磁带库,新购磁带库配置建议如下:
Ø8个LTO-6磁带机
Ø非压缩225T以上可用容量。
§二.1.4备份一体机规划
备份存储的需求是通过对现网生产备份对存储需求调研的基础上,增加了新建应用的备份需求,同时对新数据中心虚机操作系统的备份对存储的需求做了预估,共需要可用存储容量为225T。
详细需求如下:
现网生产备份存储需求:
具体应用名称
系统名称
文件〔G〕
数据库〔G〕
二代支付
二代支付A
75
二代支付B
4770
二代支付前置
PMTSA机二代支付前置
3
二代管理密押服务器
二代支付前置定制机
1
龙图非税
嘉峪关
5
IC卡业务
IC卡业务管理
600
12
60
IC卡管理DB
1080
国际业务
国际业务A机
200
国际业务B机(左)
21
自助银行
自助银行APP1A机
169
1
自助银行APP2B机
1
1
1
150
乡村通
乡村通A机app
50
1
乡村通DB1
135
密码平台
密码平台A机
2
60
密码平台B机
60
电子验印系统
电子验印应用
14
电子验印数据库
90
电票系统
电票系统APP01
18
电票系统DB
60
ACS
ACSDB01
2
ACSAPP01
绩效考核管理系统
绩效管理数据库A
1000
出纳管理系统
出纳管理系统02
2
支付信息统计分析
支付信息统计分析数据库服务器
600
头寸
FTP头寸数据库应用服务器
2457
国库集中支付
国库集中支付APP01
1
国库集中支付DB01
8
网银电子银行系统
网银数据库服务器01
21
网银交易应用服务器1
100
网银交易应用服务器2
100
网银后台管理服务器2
160
网银后台管理服务器1
160
呼叫中心
呼叫中心VPAPPA机(左)
600
呼叫中心CTIA机(右)
600
呼叫中心CTIB机〔左〕
呼叫中心ASEA机(左〕
600
呼叫中心TTS服务器(右)
600
呼叫中心知识库A(左)
600
呼叫中心数据库A
21
短信平台
短信平台A机
移动营销
移动营销MDM数据库服务器
2
移动营销数据库服务器
14
内部网站B机(右)
91
理财系统
理财数据库服务器01
100
理财应用服务器01
21
审计系统
审计系统A机
1370
322
事后监督
事后监督及风险预警OCR数据库
161
事后监督及风险预警系统ECM数据库
196
FTP
FTP头寸数据库
1000
1104报表系统
1104数据库服务器A
220
1104WEB服务器〔右〕
200
积分客户管理
积分客户管理数据库服务器
600
CRM
CRM数据库服务器
12000
反洗钱
反洗钱数据库服务器AEAST数据库服务器B
20
反洗钱数据库服务器BEAST数据库服务器A
EAST数据库
反洗钱数据库服务器BEAST数据库服务器A
100
IT风险数据报送系统风险监控
web在虚拟机生产虚拟化池
源数据DB、Web服务器
10
指标数据DB服务器
10
人力资源平台
人力资源管理数据库,应用
21
人力资源管理数据库,应用
1
在线学习系统
在线学习系统
50
精准扶贫明细台帐系统
精准扶贫明细台帐系统
1
15
内控合规与风险管理三合一系统
内控合规与风险管理
100
内控合规与风险管理
3000
人力招聘系统
人力招聘应用服务器
人力招聘数据库服务器
60
IMC认证系统
IMC服务器A机
1
堡垒机系统
运维安全审计系统
应用发布系统
堡垒机1
96
桌面安全系统
桌面安全A
204
华三智能巡检管家
1
域控子系统
DC02域控子系统
20
ITSM监控
ITSM监控系统网络
ITSM监控系统
100
60
ITIL管理系统
ITIL管理系统
60
ITIL运维管理系统
30
档案管理系统
档案管理系统
500
IT应用监控平台
IT应用监控平台A机(左)
1
项目管理平台服务器
项目管理平台服务器
14
合计:
8T
30T
38T
新建应用备份存储需求:
序号
系统名称
数据类型
GB
1
新一代信贷管理
生产数据库
10500
报表数据库
文件数据
2
Bancs核心系统
3个数据库备份
30000
3个数据库备份
文件系统
3
CRM系统
数据库数据
1000
数据库数据
数据库数据
应用数据
4
ECIF系统
数据库数据
3000
数据库数据
数据库数据
应用数据
5
IBPS
超级网银系统
数据库数据
3000
数据库数据
数据库数据
应用数据日志
6
ODS系统
数据库数据
15000
文件数据
7
财务管理系统
8
风险预警系统
数据库数据
1200
9
ESB系统
数据库
4000
数据库
ESB应用〔日志文件〕
10
个人征信系统
数据库数据
2000
应用数据
11
企业征信系统
数据库数据
2000
应用数据
12
统一身份认证系统
数据库数据
200
目录数据
应用数据
13
总账系统
GL总账文件备份
50000
AE会计核算〔FDM〕文件备份
AEI会计引擎界面〔BPM〕文件备份
CUA文件备份
SolutionManager/SMP文件备份
GL总账数据库
AE会计核算〔FDM〕数据库
AEI会计引擎界面〔BPM〕数据库
CUA数据库
14
柜面系统
数据库数据
3500
15
批量系统
财政子系统
特色业务系统
小前置业务系统
中间业务系统
数据库数据
1500
合计
12
甘肃银行新数据中心备份存储需求统计:
现网生产数据库和文件
新建系统数据库和文件
现网改造加新建应用虚机操作系统
38T
127T
60T
合计:
225T
当前部署的应用是未来计划部署应用的一半,考虑未来应用的扩展,备份存储应该450T,备份一体机提供重复数据删除技术,从测试结果来看,数据库、虚机和文件的备份重复数据删除率都超过80%,故备份一体的可用空间在90T以上就能满足未来新数据中心备份的需求,空间使用率在80%以下时备份一体机性能最好,建议的备份一体机配置为112TB。
备份SAN规划
为了和生产SAN完全隔离,专门设计了备份的SAN网络。
为实现同城容灾需求,核心备份业务的VF〔VirtualFabric〕和其他业务备份SAN交换机,作为EdgeFabric通过备份路由VFCoreFabric与同城灾备中心备份VF实现级联。
保证每个生产区备份VF的主机可以与集中备份平台的存储和物理带库互通,以实现LANFree备份。
从SAN硬件底层做了高可用,保证了备份的可靠性。
物理机采用SANClient技术实现LANFree,虚拟化平台需要将DataStore所在的LUN以只读方式Mapping给备份一体机,实现LANFree。
备份LAN规划
备份LAN架构:
备份LAN的设计和生产是独立的,每台主机备份网先连到机柜的TOR,新的数据中心专门设计了两台备份汇聚交换机,从TOR上来的备份网络直接连到这两台备份汇聚交换机,在汇聚交换机上,为每个生产区的应用划分了独立的Vlan,使得每个生产区逻辑隔离。
备份服务器放在核心生产区,在备份汇聚交换机上设置的策略是备份服务器可以访问每一个区的每一台备份服务器,由于Vlan的隔离,各区之间服务器是不能互访的。
MasterServer与备份一体机以及Client之间的网络通讯必须通过特定的端口进行,具体要求如下:
备份软件现在只支持防火墙静态的NAT技术,不支持动态NAT转换。
需要打开443、902、1556、13724(双向通信)防火墙端口。
允许长连接,不要设置连接超时。
备份数据复制
双中心之间备份数据和备份索引Catalog通过AIR复制技术从生产中心复制到容灾中心。
单个中心内的两台备份一体机采用优化复制技术进行备份数据同步。
备份性能
总数据量÷备份窗口=备份性能
第三章备份系统容灾设计
备份系统容灾架构概述
两台MasterServer,安装Linux操作系统。
两台备份一体机充当MediaServer,负责LAN和SANClient备份;备份设备为两台一体机和一台物理带库。
正常情况下,MasterServer备机处于开机状态,分别部署NetbackupMasterServer和OPSCenter,利用VCS构成互备模式,备份一体机和Client由生产中心的MasterServer管理,备份设备由备份一体机管理。
当MasterServer发生故障时,通过VCS进行切换;当一台备份一体机发生故障时,由另一台备份一体机接管所有备份业务。
架构说明:
1.备份容灾环境由如下设备组成:
1)两台NBUmasterserver,两台备份一体机。
2)一台物理带库
2.在设计中加一台物理磁带库有两个作用:
1)直接出带。
2)数据归档和数据恢复。
3)音视频文件的直接备份。
3.备份数据和备份索引Catalog通过AIR复制技术从生产中心复制到容灾中心。
备份服务器规划
§三.1.1服务器
1.功能用途
灾备环境的备份服务器是热备机,平时用于容灾保护、容灾中心的业务保护和恢复验证,只有生产中心出现故障时会激活生产中心的备份策略,对生产中心进行备份保护。
2.拓扑结构
3.备份管理服务器为两台服务器,利用VCS形成集群,安装RedHatLinux64bit操作系统,备份服务器需要连接共享存储、备份SAN、备份LAN、生产LAN。
§三.1.2客户端
容灾中心的备份客户端为所有建设的同城灾备的系统,在同城容灾中,客户端的操作系统有PowerVMclient端的AIX,X86平台虚拟机操作系统linux、windows、SUSE系统,客户端的数据有ORACLE、DB2和SQL,建议使用多网卡绑定技术提高网路带宽和可靠性。
备份设备规划
§三.1.3物理带库规划
建议新购一台企业级磁带库,新购磁带库配置建议如下:
Ø12个LTO-6driver
Ø非压缩225T个以上可用容量
§三.1.4备份一体机规划
Netbackup5240112T两台。
备份SAN规划
参照备份系统整体架构中SAN规划。
备份LAN规划
参照备份系统整体架构中LAN规划。
磁带的保存
§三.1.5磁带异地保存
有效期超过1年的数据,将会复制一份,然后在专门的数据中心进行保管(建议在同城容灾中心)。
出库频率为每月一次。
当带库中没有可用磁带时,把保存时间最长的磁带取出保管,然后放入新磁带。
§三.1.6磁带离线管理
对于保管在同城容灾数据中心的出库磁带,建议放在专用的磁带介质保存柜,并定期进行恢复测试,以验证磁带的可用性;对于将要到达磁带保存寿命〔LTO6的磁带寿命是15年〕的磁带,可将磁带从数据中心取回放入生产中心的磁带库,使用集中备份软件的Copy功能来将此磁带复制到一盘新的磁带进行保管;
容灾切换
当生产中心出现灾难需要进行容灾切换时,备份系统的切换将分为如下两个层面进行:
备份平台的切换:
包括Masterserver、备份一体机,当MasterServer发生故障时,由于Catalog库在共享存储上,所以,通过VCS直接对Netbackup主服务器程序和服务IP进行切换后完成;备份一体机两台构成存储池,平时各负责一半的备份任务和备份后的快速同步,当一台发生故障时,由存储池中另一台备份一体机承担所有备份任务。
备份客户端切换:
备份系统在进行备份时,会访问客户端集群的服务IP,当客户端发生故障切换时,服务IP会随业务切换完成切换,对备份系统而言,这个过程是全透明,无感知的。
§三.1.7备份平台的切换
MasterServer切换
当生产中心发生灾难,需要使用容灾中心的备份平台进行备份时,切换流程如下:
1)在容灾端MasterServer上启用已经配置好的备份策略。
2)手工配置生产中心的MasterServer的IP地址至容灾中心备份平台。
3)生产中心客户端受容灾中心备份平台管理进行备份。
4)完成上述切换过程预计需要1小时。
§三.1.8介质服务器切换
介质服务器不需要切换,因为容灾端的备份一体机一直是Online的,可以直接使用。
§三.1.9备份客户端的切换
同城容灾中心的客户端不需要切换。
第四章数据备份方法与策略
备份对象分析
新数据中心统一备份系统备份的对象和内容如下表:
AIX
Linux
Windows
Suse
Oracle
DB2
SQL
应用
PowerVM平台
√
√
√
√
X86的VMware平台
√
√
√
√
√
√
X86物理机
√
√
√
Power物理机
√
√
√
§四.1.1数据库
数据库备份原则:
数据库是备份系统的主要保护对象,甘肃银行在新数据中心有88套数据库,数据库的类型有ORACLE、DB2、SQL,NBU都可以支持这些数据库的在线备份方式。
1.数