两地三中心容灾方案Word格式文档下载.docx

上传人:b****8 文档编号:22447980 上传时间:2023-02-04 格式:DOCX 页数:88 大小:2.36MB
下载 相关 举报
两地三中心容灾方案Word格式文档下载.docx_第1页
第1页 / 共88页
两地三中心容灾方案Word格式文档下载.docx_第2页
第2页 / 共88页
两地三中心容灾方案Word格式文档下载.docx_第3页
第3页 / 共88页
两地三中心容灾方案Word格式文档下载.docx_第4页
第4页 / 共88页
两地三中心容灾方案Word格式文档下载.docx_第5页
第5页 / 共88页
点击查看更多>>
下载资源
资源描述

两地三中心容灾方案Word格式文档下载.docx

《两地三中心容灾方案Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《两地三中心容灾方案Word格式文档下载.docx(88页珍藏版)》请在冰豆网上搜索。

两地三中心容灾方案Word格式文档下载.docx

在建设之前应做好详细的规划设计,并按照规划的内容,分清主次,依次实施。

全部建设完成后,还有定期组织演练,确保灾备系统能够正常工作。

平战结合原则。

灾难备份资源是为小概率事件准备的,平时处于备份、测试或者演练状态,设备闲置,因此我们可以在不影响灾难备份与恢复功能的前提下,本着平战结合的原则,充分利用数据灾备中心的各类资源,开展信息系统培训、开发等业务,真正让数据灾难备份中心的各类资源得到充分的利用和发挥作用。

2.1.2.建设策略

本项目建设策略上从过去注重单一部门、单一系统容灾问题的解决,向支撑全市电子政务系统安全高效运行的转变;

二是在建设方式上,从部门独立建设、自成体系,向跨部门跨区域的协同互动和资源共享转变;

三是在系统模式上,从粗放离散的模式,向集约整合的模式转变,确保电子政务项目的可持续发展,符合电子政务项目建设“集约化、专业化、规模化”策略。

2.1.2.1.集约化策略

在《关于加快推进国家电子政务外网建设工作的通知》(发改高技[2009]988号)文件之前,国家各部委应用系统采取垂直管理,各自独立的方式建设。

一套灾备系统牵涉到的有基础设施建设、灾备设备资源以及经验丰富的运维人员,往往需要大量的资金投资。

我市信息各委办局都有建设灾备系统需求如果都单独建设,将会是一笔巨大的投资,并且各个委办局都需要培养大量相关的专业运维管理人员。

如何更为集约化的建设灾备系统,如何更为简单的管理和维护复杂的灾备系统,是我们必须面对和解决的难题。

目前,已有地税局、人社局、国土局、财政局、建委等部门提出了灾备建设需求。

从这些部门的灾备建设方案来看,普遍包括:

服务器、存储设备、网络设备、安全设备、链路等内容,平均需要1000万左右的投资才能实现关键业务应用级容灾的目标。

此外,异地容灾还需要租用机房、聘用运维人员、支付链路费用等。

经初步估算,已经提出或具有潜在容灾备份需求的部门,若单独建设容灾系统,则最少需要9000万建设投资,灾备系统的运维费至少达到每年1800万。

本项目建议为各委办局的多个业务系统建立集中数据灾备中心,相比分别为各个业务系统建立独立的容灾系统,既节约IT设备资源,提高容灾资源利用率,又能大大减少后期的管理和运营成本。

系统建设充分调研了XX市电子政务信息系统建设情况设计开放性、可扩展性的容灾策略,支持已有投资系统功能性能,有效的保障了系统的可持续发展。

2.1.2.2.专业化策略

XX市电子政务的业务类型众多、业务系统建设和运行的历史比较长,从系统结构和数据结构两方面来说,都是比较复杂的。

全市电子政务各业务系统需要保护的数据类型复杂多样,既有各种数据库如Oracle、SQLServer多种版本、MySQL等)数据,也有各种应用程序(网站类,OA类,业务系统类等)各种文档(Word、Execle、TXT等)各种非结构化数据(关键视频,档案等),当然也需要对虚拟机镜像提供保护(VMWare和Cloudview等)。

本项目立足于XX市电子政务系统的容灾备份及安全建设,充分的调研了全市电子政务信息系统的建设和应用情况,从网络接入、系统业务功能及数据量、系统涉密情况、容灾策略需求、性能指标等多方面综合分析。

力争满足针对不同的性质的系统提出了数据级、应用级容灾策略,同时分析了不同策略的在线模式与离线模式、远程数据复制、同步与异步容灾、同城与异地等多种容灾方案,专业化的解决未来XX市电子政务信息系统的容灾备份需求。

2.1.2.3.规模化策略

本项目集约化建设的基础上实现规模化,项目建成之后将承载XX市95%以上电子政务信息系统的容灾工作,解决我市政府各部门内部业务系统、跨区域纵向业务应用、部门重点应该的容灾备份需求。

容灾备份中心依托电子政务外网建设二期工程将完成全市行政区划内共有15个区市县(包括先导区),下辖172个街道(乡、镇)(这里包括个别区市县所管辖的乡镇级别的经济开发区)、1512个社区(村)的全域覆盖。

在数据规模方面,容灾备份中心将解决包括国家重点民生工程在内的1000余个业务系统的容灾备份工作。

2.2.建设目标

2.2.1.总体目标

XX市政务信息化容灾备份及安全系统建设计划分成两个阶段,即同城灾备中心建设和异地灾备中心建设,最终建设成为两地三中心模式。

其中以新建的XX市云计算中心作为各委办局业务系统的主数据中心,XX市网站管理中心作为同城灾备中心,可以选用城市A或是城市B作为异地灾备中心。

云计算中心作为主生产中心,负责日常的各委办局所有业务系统的运行。

在灾难发生时,在同城容灾中心恢复各委办局关键业务的应用运行。

在城市A异地灾备中心完成各委办局关键数据的保护,在发生地区级(XX)的灾难时,保证各个业务系统的核心数据不丢失。

2.2.2.分期目标

一期目标:

实现xx个委办局关键数据在同城容灾中心的集中备份,以及xx个关键业务在同城容灾中心的应用级容灾。

二期目标:

实现xx个委办局关键数据在远程容灾中心的集中备份,以及xx个核心业务在同城容灾中心的应用级容灾。

2.3.建设内容

一期建设内容:

Ø

完成云计算中心、同城灾备中心、异地灾备中心两地三中心容灾总体设计

完成关键技术方案验证、实施方案编制、实施路径设计。

完成容灾中心运行管理模式设计。

建设同城应用级容灾中心

二期建设内容:

优化调整新建云计算中心

建设城市A或城市B异地数据级容灾中心

2.4.总体设计方案

根据各委办局的技术架构现状与策略制定,结合容灾技术的关键技术分析与最佳实践,制定如下总体容灾架构:

容灾模式为两地三中心灾备模式

容灾级别为数据库系统实现应用级别容灾,其他应用系统基于同城容灾中心实现应用级容灾,关键业务基于远程容灾中心实现应用级容灾

结构化数据复制采用支持异构平台的基于数据库层的数据复制技术,虚拟机镜像等这类关键非结构化数据复制采用基于存储层的数据复制技术

虚拟机之间的系统切换技术以自动切换方式为主,物理机之间以及物理机和虚拟机之间的系统切换以手工切换方式为主,并配合切换脚本减少系统切换时间

容灾网络,建议同城数据中心之间采用大二层的存储网络架构,数据网络和存储网络的物理连接采用DWDM裸光纤高速网络连接,本地和异地数据中心之间采用IP网络连接,网络带宽要保证系统切换的顺畅和数据复制的带宽需求

前端(客户端)网络切换技术有手工切换、DNS重定向和负载均衡器的健康路由注入几种,本方案建议根据实际情况选择以上切换技术的一种或几种

容灾系统和生产系统之间的配对关系为降级配对,就是容灾中心和生产中心之间的软、硬件配置不遵循1:

1比例,容灾中心硬件配置的性能低于生产中心,容灾应用服务器以虚拟机平台为主,从而进一步提升灾备系统的投入产出比

建成后的两地三中心结构拓扑图如下:

3.容灾的核心技术及选择

容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。

容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。

3.1.容灾系统衡量指标

衡量容灾系统的主要指标有RPO(灾难发生时允许丢失的数据量)、RTO(系统恢复的时间)、容灾半径(生产系统和容灾系统之间的距离)以及ROI(容灾系统的投入产出比)。

RPO是指业务系统所允许的灾难过程中的最大数据丢失量(以时间来度量),这是一个灾备系统所选用的数据复制技术有密切关系的指标,用以衡量灾备方案的数据冗余备份能力。

RTO是指“将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态”所需时间,其中包括备份数据恢复到可用状态所需时间、应用系统切换时间、以及备用网络切换时间等,该指标用以衡量容灾方案的业务恢复能力。

容灾半径是指生产中心和灾备中心之间的直线距离,用以衡量容灾方案所能防御的灾难影响范围。

容灾方案的ROI(ReturnofInvestment,投入产出比)也是用户需要重点关注的,它用以衡量用户投入到容灾系统的资金与从中所获得的收益的比率。

显然,具有零RTO、零RPO和大容灾半径的灾难恢复方案是用户最期望的,但受系统性能要求、适用技术及成本等方面的约束,这种方案实际上是不大可行的。

所以,用户在选择容灾方案时应该综合考虑灾难的发生概率、灾难对数据的破坏力、数据所支撑业务的重要性、适用的技术措施及自身所能承受的成本等多种因素,理性地作出选择。

3.2.容灾级别

按照容灾系统对应用系统的保护程度可以分为数据级容灾、应用级容灾和业务级容灾。

数据级容灾仅将生产中心的数据复制到容灾中心,在生产中心出现故障时,仅能实现存储系统的接管或是数据的恢复。

容灾中心的数据可以是本地生产数据的完全复制(一般在同城实现),也可以比生产数据略微落后,但必定是可用的(一般在异地实现),而差异的数据通常可以通过一些工具(如操作记录、日志等)可以手工补回。

基于数据容灾实现业务恢复的速度较慢,通常情况下RTO超过24小时,但是这种级别的容灾系统运行维护成本较低。

应用级容灾是在数据级容灾的基础上,进一步实现应用可用性,确保业务的快速恢复。

这就要求容灾系统的应用不能改变原有业务处理逻辑,是对生产中心系统的基本复制。

因此,容灾中心需要建立起一套和本地生产相当的备份环境,包括主机、网络、应用、IP等资源均有配套,当生产系统发生灾难时,异地系统可以提供完全可用的生产环境。

应用级容灾的RTO通常在12个小时以内,技术复杂度较高,运行维护的成本也比较高。

业务级容灾是生产中心与容灾中心对业务请求同时进行处理的容灾方式,能够确保业务持续可用。

这种方式业务恢复过程的自动化程度高,RTO可以做到30分钟以内。

但是这种容灾级别的项目实施难度大,需要从应用层对系统进行改造,比较适合流程固定的简单业务系统。

这种容灾系统的运行维护成本最高。

3.3.常见容灾建设模式

当前,市场上常见的容灾模式可分为同城容灾、异地容灾、双活数据中心、两地三中心几种。

3.3.1.同城容灾

同城容灾是在同城或相近区域内(≤200KM)建立两个数据中心:

一个为数据中心,负责日常生产运行;

另一个为灾难备份中心,负责在灾难发生后的应用系统运行。

同城灾难备份的数据中心与灾难备份中心的距离比较近,通信线路质量较好,比较容易实现数据的同步复制,保证高度的数据完整性和数据零丢失。

同城灾难备份一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。

3.3.2.异地容灾

异地容灾主备中心之间的距离较远(>200KM)因此一般采用异步镜像,会有少量的数据丢失。

异地灾难备份不仅可以防范火灾、建筑物破坏等可能遇到的风险隐患,还能够防范战争、地震、水灾等风险。

由于同城灾难备份和异地灾难备份各有所长,为达到最理想的防灾效果,数据中心应考虑采用同城和异地各建立一个灾难备份中心的方式解决。

3.3.3.两地三中心

结合近年国内出现的大范围自然灾害,以同城双中心加异地灾备中心的“两地三中心”的灾备模式也随之出现,这一方案兼具高可用性和灾难备份的能力。

同城双中心是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;

灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。

异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。

3.3.4.双活数据中心

所谓“双活”或“多活”数据中心,区别于传统数据中心和灾备中心的模式,前者多个或两个数据中心都处于运行当中,运行相同的应用,具备同样的数据,能够提供跨中心业务负载均衡运行能力,实现持续的应用可用性和灾难备份能力,所以称为“双活”和“多活”;

后者是生产数据中心投入运行,灾备数据中心处在不工作状态,只有当灾难发生时,生产数据中心瘫痪,灾备中心才启动。

“双活”数据中心最大的特点是:

一、充分利用资源,避免了一个数据中心常年处于闲置状态而造成浪费,通过资源整合,“双活”数据中心的服务能力是翻倍的;

二、“双活”数据中心如果断了一个数据中心,其业务可以迅速切换到另外一个正在运行的数据中心,切换过程对用户来说是不可感知的。

在“双活”的模式中,两地数据中心同时接纳交易,技术难度很大,需要更改众多底层程序,因而在现实中,国内还没有真正“双活”数据中心的成功应用案例。

3.4.常用的数据复制技术

在构建容灾系统所涉及的诸多要素中,数据复制技术是基础,只有保证了数据的安全可用,应用或是业务的恢复才有可能。

正常情况下系统的各种应用在数据中心运行,数据存放在数据中心和灾难备份中心两地保存。

当灾难发生时,使用备份数据对工作系统进行恢复或将应用切换到备份中心。

数据复制技术的选择决定灾备系统的RPO指标,灾难备份系统中数据备份技术的选择应符合数据恢复时间或系统切换时间满足业务连续性的要求。

数据复制(Replication)是指利用复制软件把数据从一个磁盘复制到另一个磁盘,生成一个数据副本。

这个数据副本是数据处理系统直接可以访问的,不需要进行任何的数据恢复操作,这一点是复制与D2D备份的最大区别。

根据不同容灾方案所采用数据复制技术位于企业IT架构不同层面,数据复制可分为基于存储层的复制、基于主机层复制和基于应用的复制。

具体到一个I/O从磁盘到应用的流程上,可能经由磁盘阵列、存储网络、卷管理软件、文件系统、数据库系统和应用系统全部流程或是其中的几个流程,那么数据复制就可以在这些流程的任一层次上实现,如下图所示:

基于存储层的复制可以是由存储设备的控制器执行,也可以是由网络层的虚拟化存储管理平台来执行,基于存储层的复制基于主机和应用的无关性,兼容性要求最低,实施难度最小,但是由于是卷级别的数据拷贝,对网络带宽要求最高;

基于主机的复制可以由安装在主机上的卷管理软件或是文件系统来实现,在实际的应用场景中,以基于卷管理软件的数据复制技术居多,这种方式通常要求主机平台相关,实施难度升高,但是带宽要求降低;

基于数据层的复制通过数据库的容灾功能模块来实现,对网络带宽要求最低,但是只能实现数据库数据的容灾;

基于应用层的数据复制需要对应用程序进行定制开发,现实场景中很难见到。

下面就重点介绍一下几种常见的数据复制技术。

3.4.1.基于存储层的容灾复制方案

3.4.1.1.基于存储设备的数据复制

基于存储设备的数据复制技术的核心是利用存储阵列自身的盘阵对盘阵的数据块复制技术实现对生产数据的远程拷贝,从而实现生产数据的灾难保护。

在主数据中心发生灾难时,可以直接利用灾备中心的数据建立运营支撑环境,为业务继续运营提供IT支持。

同时,也可以利用灾备中心的数据恢复主数据中心的业务系统,从而能够让企业的业务运营快速回复到灾难发生前的正常运营状态。

基于存储设备的数据复制技术示意图如下:

基于存储设备的复制可以是如上示意图的“一对一”复制方式,也可以是“一对多或多对一”的复制方式,即一个存储的数据复制到多个远程存储或多个存储的数据复制到同一远程存储;

而且复制可以是双向的。

基于存储的数据复制技术有两种方式:

同步方式和异步方式。

同步方式:

可以做到主/备数据中心磁盘阵列同步地进行数据更新,应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列将利用自身的机制同时将写I/O写入后备磁盘阵列,后备磁盘阵列确认后,主中心磁盘阵列才返回应用的写操作完成信息。

异步方式:

是在应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列立即返回给主机应用系统“写完成”信息,主机应用可以继续进行写I/O操作。

同时,主中心磁盘阵列将利用自身的机制将写I/O写入后备磁盘阵列,实现数据保护。

采用同步方式,使得后备磁盘阵列中的数据总是与生产系统数据同步,因此当生产数据中心发生灾难事件时,不会造成数据丢失,可以实现RPO为零。

为避免对生产系统性能的影响,同步方式通常在近距离范围内(FC连接通常是200KM范围内,实际用户部署多在35KM之内)。

而采用异步方式应用程序不必等待远程更新的完成,因此远程备份存储设备的性能的影响通常较小,并且生产中心的距离和灾备中心的距离理论上没有限制(通常基于IP连接来实现数据的异步复制)。

采用基于存储设备数据复制技术构建容灾方案的必要前提是:

通常必须采用同一厂家统一系列的且同时具有数据复制技术的高端存储平台,给用户的存储平台选择带来一定的限制。

采用同步方式可能对生产系统性能产生影响,而且对通信链路要求较高,有距离限制,通常在近距离范围内实现(同城容灾或园区容灾方案)

采用异步方式与其他种类的异步容灾方案一样,存在数据丢失的风险,通常在远距离通信链路带宽有限的情况下实施。

尽管有以上限制,基于存储设备的数据复制技术仍然是当前选择较多的容灾技术平台,这主要是由于基于存储的复制技术方案有如下优点:

采用基于存储的数据复制独立于主机平台和应用,对各种应用都适用,而且完全不消耗主机的处理资源;

基于存储得数据复制技术,由于在最底层,实施起来受应用、主机环境等相关技术的影响最小,非常适合于主机和业务系统很多、很复杂的环境,采用此种方式可以有效降低实施和管理难度;

采用同步方式可以完全不丢失数据,在同城容灾或园区内容灾方案中,只要通信链路带宽许可,完全可以采用同步方案,而不会对主数据中心的生产系统性能产生显著影响;

采用异步方式虽然存在一定的数据丢失的风险,但没有距离限制,可以实现远距离保护;

灾备中心的数据可以得到一定程度上的有效利用(用作测试或报表等)。

构建成本:

存储层容灾产品报价,都是采用磁盘阵列的高级功能许可授权方式进行报价。

并按照磁盘阵列的具体数量进行报价。

越是高端盘阵,高级功能模块授权价格成阶梯式增长。

除了这些高级功能授权的许可外,其还有MA(维护)费用以及实施费用,MA费用整体磁盘阵列报价(含高级功能模块)的25%左右。

实施费用一般按人天费用方式进行计算,总体成本很高。

另外,其对带宽要求很高,容灾网络建设费用更高。

适用场景:

存储设备复制技术利用磁盘阵列自身卷复制功能实现,首先要求必须是同构高端存储系统,其次对带宽要求较高,实现的是底层数据块级别的复制,属于数据层容灾范畴。

这类容灾产品由于其自身的功能特性,作为高端盘阵衍生出来的附加高级功能来实现容灾,其投资巨大,从盘阵本身到链路的要求都极高,需要专门的链路确保数据的一致性。

当灾难发生时,需要通过人工调整的方式,将镜像卷提供给远端生产业务系统,实现业务系统的容灾,RTO在数小时以上。

经过以上分析可以看出,基于存储层的灾备方案对存储平台要求非常严格,适合用于为底层存储平台单一、服务器平台构成复杂、上层应用繁多的IT系统构建数据级的容灾方案,不适合于复杂、异构存储平台的容灾场景需求。

3.4.1.2.基于虚拟化存储技术的数据复制

存储虚拟化的技术方法,是将系统中各种异构的存储设备映射为一个单一的存储资源,对用户完全透明,达到屏蔽存储设备异构的目的。

通过虚拟化技术,用户可以利用已有的硬件资源,把SAN内部的各种异构的存储资源统一成对用户来说是单一视图的存储资源(StoragePool),而且采用Striping、LUNMasking、Zoning等技术,用户可以根据自己的需求对这个大的存储池进行方便的分割、分配,保护了用户的已有投资,减少了总体拥有成本(TCO)。

另外也可以根据业务的需要,实现存储池对服务器的动态而透明的增长与缩减。

通过存储虚拟化技术可以实现数据的远程复制,这种数据复制技术原理和基于存储设备的原理基本一样,唯一的区别就是前者由存储虚拟化控制器实现,或者由磁盘阵列控制器实现,所以这种技术不要求底层磁盘阵列同构。

存储虚拟化技术通常在存储网络层面实现,其数据复制同样也可以有同步复制方案和异步复制方案,需要根据具体的需求选择合适的技术。

基于存储虚拟化控制器的两地三中心容灾方案架构

采用虚拟存储化技术建设容灾方案有以下优点:

主生产中心和容灾中心的存储阵列可以是不同厂家的产品,存储平台选择不受现有存储平台厂商的限制;

对不同厂家的存储阵列提供统一的管理界面。

在虚拟存储环境下,无论后端物理存储是什么设备,服务器及其应用系统看到的都是其熟悉的存储设备的逻辑镜像。

即便物理存储发生变化,这种逻辑镜像也永远不变,系统管理员不必再关心后端存储,只需专注于管理存储空间,所有的存储管理操作,如系

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 工学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1