国土资源信息系统灾难备份建设的探讨_精品文档.doc
《国土资源信息系统灾难备份建设的探讨_精品文档.doc》由会员分享,可在线阅读,更多相关《国土资源信息系统灾难备份建设的探讨_精品文档.doc(7页珍藏版)》请在冰豆网上搜索。
国土资源信息系统灾难备份建设的探讨
吴其斌、刘延东、周春磊、贾文珏
(国土资源部信息中心,北京100812)
摘要:
本文介绍了国土资源信息系统建设的背景,分析了国土资源信息系统及存储备份系统的基本现状。
在此基础上,结合国家标准《信息系统灾难恢复规范》(GB/T20988),探讨了国土资源信息系统灾备建设的若干重要问题,包括标准规范和指南,灾备类型、建设模式、灾难恢复能力等级以及技术方案等问题。
关键词:
国土资源信息系统;灾备建设;灾备类型与模式;灾难恢复能力等级
1背景
过去十多年间,“数字国土”工程和“金土工程”一期的顺利实施与圆满完成,极大地加快国土资源信息化建设步伐,明显提升了信息化的应用深度和广度,对规范和带动国土资源管理创新,实现国土资源精细化管理起到了积极的作用。
国土资源大调查、第二次全国土地调查、土地利用总体规划和矿产资源总体规划一系列重大专项的实施与完成,积累了海量的国土资源基础和专题数据。
在部和省两级,包括建设用地审批、矿业权审批等数十类行政许可已经基本纳入到政务信息系统中,实现了从网上申报、政务大厅受理到办结的网络化运行。
政务管理信息系统的运行同时也积累了大量的国土资源管理数据。
随着国土资源数据的不断积累以及上线运行政务信息系统的日益增多,其安全性和稳定性将越来越重要。
因此,为切实保障国土资源数据的安全管理和信息系统的安全稳定运行,需要在现有工作基础上,进一步提高认识,明确目标,开展国土资源信息系统灾难备份建设,制订有效的信息系统灾难备份管理制度,采取有力的技术手段和措施。
本文首先分析了国土资源部数据中心各类信息系统运行和数据存储备份现状,在此基础上,结合国家标准《信息系统灾难恢复规范》(GB/T20988-2007),探讨了国土资源信息系统灾备建设的若干问题,提出了国土资源信息系统灾备建设中关于灾备类型、建设模式、恢复能力等级和技术方案的建议。
2现状分析
目前,国土资源部土地、矿产、资质管理等3大类35项行政审批事项全部通过电子政务系统办理,基本实现“一站式”服务和无纸化办公,构建了业务远程申报、政务大厅受理、全程网上办理、结果公开发布的规范化、格式化审批流程。
从信息系统运行和备份的技术环境来看,现有信息系统分为如下几类。
2.1单机运行环境
信息系统(包括数据库和应用系统)安装并运行在单独的服务器上,备份数据存于另外的存储空间(如NAS盘阵等)。
按照业务规则和数据更新频率定时做业务数据备份,如每周全库备份、每日增量备份的策略。
当系统出现故障或宕机时,通过重建或恢复系统,然后恢复前期备份的业务数据。
在这种情况下,系统和业务数据可以恢复,但会丢失故障或宕机到最后一次备份之间的数据。
这种模式运行风险较大、抵御系统故障和突发灾难的能力也较低,可靠性较差。
2.2虚拟机运行环境
为了对数据中心基于Windows平台运行环境的信息系统集中管理和统一调配,采用VMware虚拟化技术对单机运行环境的信息系统进行了调整和改造,构建了基于x86平台的虚拟机运行环境。
虚拟机运行环境包括6台VMwareESX服务器、VC服务器和VCB备份服务器。
每台ESX主机配备HBA卡,连接到光纤交换机上,再连接到磁盘阵列(HDS9980V)上,信息系统的数据库管理系统及其数据实体均安装在磁盘阵列上。
VCB备份服务器也连接到磁盘阵列。
根据信息系统的应用需求,可以对每台ESX主机进行虚拟化,虚拟出3个虚拟机。
这种模式较单机运行环境可靠性高、灾备能力强。
但由于目前主机的配置较低、加之应用与数据库捆绑在一起,使得VMWARE的性能不能充分有效发挥。
因此,需要对这种模式做适当的升级改造,以提高数据安全性和系统性能。
一是用高配置的主机替代原有的机器,二是将应用与数据库分离;三是增加数据备份功能,对磁盘阵列上的数据实施备份。
2.3双机热备运行环境
利用高端主机和存储等技术,搭建了双机热备和大容量、高速存储体系的运行环境。
由四台IBMP690小型机、HDS9980V磁盘阵列、STKL700e自动磁带库和Brocade64端口光纤交换机组成的OpenSAN运行环境,形成稳定、可扩充的数据存储管理平台,实现了LANFREE的大容量及高速存储。
主机通过AIX动态分区及HACMP技术,实现双机Active/Standby双备。
利用BakBone备份软件实现Oracle数据库的在线备份。
在实现存储整合的同时保证了各业务系统的连续性、高可用性和高性能。
与前两种模式相比,该模式可靠性高、灾备能力强。
目前国土资源管理的关键业务系统运行在这种环境之下。
虽然该模式解决了主机系统等出现故障后的业务连续性问题,但对于电源、网络故障,以及由自然灾难引起的故障还不能解决数据备份与恢复问题。
为此,需要建立灾难备份中心。
2.4异地灾备中心
“金土工程”一期在重庆市建设了异地灾备中心。
该中心的作用包括两方面,一是针对数据量大、更新周期长同时还包含涉密信息的基础性数据,通过部数据中心与备份中心存储设备(磁带库)的一致性,采用人工方式将磁带搬运到重庆备份中心保存。
二是针对数据更新较快、数据量较小的非涉密部分管理数据,通过国土资源主干网(IP网络)和远程数据备份系统将部数据中心数据在线备份到重庆数据备份中心,实现部数据中心与异地备份中心的数据异步备份。
数据异步备份技术上采用的是基于IP网络的WSAN(广域SAN)远程数据备份机制,利用2M带宽的国土资源主干网,使用块增量的远程数据复制和备份功能,探索了国土资源数据远程复制与恢复的技术实现方法。
由于备份中心存储设备的容量以及主干网带宽的限制,目前在线备份的数据量还非常有限。
3灾备建设的若干问题
灾备建设是一项基础性系统工程,既包括技术、系统、数据和标准规范等技术问题,也涉及到政策、管理体系和制度、组织机构和经济等方面深层次问题。
这里仅就国土资源灾备建设中近期必须考虑的有关问题进行初步的探讨。
3.1关于标准、规范和指南
关于灾备建设,1992年出台了SHARE78国际标准,该标准将系统容灾划分为7个级别。
2007年,我国颁布了《信息系统灾难恢复规范》(GB/T20988,下文简称《规范》)国家标准。
继国标GB/T20988之后,银行、证劵和保险业率先响应,以国标为指引,先后制定了本行业的灾备规范或指引,如2008年2月中国人民银行正式发布和实施了《银行业信息系统灾难恢复管理规范》、2008年3月保监会下发了《保险业信息系统灾难恢复管理指引》,2009年中国证券业协会先后发布了《证券公司网上证券信息系统技术指引》等多个指引等。
民航、电力、通讯等部门或行业也制定了相应的规范、办法和制度。
鉴于我国信息系统具有行业分布广,信息量巨大,信息化建设程度和业务对其的依赖性参差不齐的特点,这就决定了我国不可能建立完全统一的、操作层面上的国家灾备标准来具体规范所有行业的信息系统灾备。
事实上,国标GB/T20988也是对灾备术语、工作流程、需求与管理等进行了规范和梳理,提出了灾备份建设的共性或通用性的标准,为各部门与行业起草、制定灾难恢复行业相关规范、指南和办法提供了充分的参考依据和方向指引。
目前,在各级国土资源管理部门,尤其是国家、省和市县级,国土资源管理和服务对信息化的依赖程度越来越大,信息系统和数据支撑国土资源监管的作用愈来愈大。
同时,鉴于国土资源数据具有海量、多源、时空性强和信息系统种类繁多、复杂等特点,国土资源系统或行业灾备规范或指南的制定应该提上议事日程。
针对国土数据和信息系统的特征,结合信息系统安全工作,起草并制定国土资源系统或行业的灾难备份指南,不仅涉及数据和系统运行安全、灾难恢复技术方案和预案的要求,而且应涵盖应急保障和管理制度等相关内容。
3.2关于灾备选型
灾难备份一般分为数据级、应用级和业务级三个级别。
国土资源灾备建设如何选型,应该从数据和应用系统的重要性及其与业务的关联度、基础设施条件、成本和管理维护等多个角度进行分析。
首先,国土资源数据是多年来经过调查评价和政务管理形成的各类基础和专题性数据,是国土资源管理和服务的基础,也是国家的宝贵财富,具有反复和长期利用的价值,其重要性不言而喻。
目前,各级国土资源管理部门对业务应用系统的依赖性也呈增强之势,尤其是对于政务审批、业务受理以及门户网站等业务系统。
这些系统一旦出现故障,势必影响到国土资源管理工作的正常运转。
当然,国土资源信息系统灾备的紧迫性和业务连续性的要求远不及金融、民航、税务等行业和部门。
其次,就灾备而言,具有“小概率,高风险;高投入,低效率;建设易,维持难”的本质特征。
有关资料表明,占灾难比重的39%的人为灾难(如人为失误、非授权操作等偶然故障,病毒入侵、骇客及人为破坏等)和占灾难比重的58%的技术灾难(设备故障、软件错误、电信网络中断和电力故障等),需要的都不是远程的灾备保护,而是本地的数据保护。
而剩下的3%的自然灾难和社会灾难(如人为的战争和恐怖袭击等),才真正需要异地远程灾备。
应用级灾备的投入会是数据级灾备投入的2-3倍,甚至更高,其技术复杂性也大大超过数据级灾备。
第三,灾备建设是一项系统工程,需要循序渐进,分级建设。
灾备建设的投入很大,不可能一蹴而就,是一个循序渐进的过程。
灾备中心的基础设施建设、IT系统也需要一个逐步建设的过程,运行维护团队、技术支持力量和管理工作也需要长期培养锻炼才能具备相应的应急能力。
数据级灾备是应用级灾备的基础。
打好基础,再开展应用级灾备建设就会容易得多。
基于上述分析,笔者认为,国土资源灾备系统应该立足点数据级灾备,先开展数据级灾备建设,确保数据的安全维护。
随着管理需求的增长、业务系统的发展和其他条件成熟,再扩展到应用级灾备。
3.3关于灾备建设模式
目前,国土资源部、各省(自治区、直辖市)和部分市县级国土资源管理部门建立了相应的信息化工作机构,建设了负责本级数据和业务系统管理运行维护的数据中心。
各级数据中心采取了技术手段和管理措施,实现本地的数据备份。
“金土工程”一期工程在重庆建立了异地数据备份中心。
针对国土资源业务工作对数据运行的要求,结合国土资源灾备建设的现状,建议部一级灾备建设可采用“两地三中心”建设模式,即在重庆异地建立灾备中心的基础上,在同城(北京)建立一个灾备中心,用于城市局部地方发生灾难时的应急备份措施。
同城灾备中心与生产中心数据实时复制,异地灾备中心备份生产中心的基础数据和复制重要的管理数据。
当生产中心发生灾难时,利用同城灾备中心可完全恢复数据,数据基本不会丢失;当生产中心和同城灾备中心同时发生灾难时,利用异地灾备中心可恢复基础数据和重要的管理数据。
此外,考虑到已建重庆异地灾备中心的基础设施的规模,为充分发挥其效用并节省投资,它不仅作为部数据中心的灾备中心,而且还可作为尚未开展异地灾备建设的省级数据中心的异地灾备中心。
3.4关于灾难恢复能力等级
《规范》定义了灾难恢复资源的七个要素:
数据备份系统
(1)、备用数据处理系统
(2)、备用网络系统(3)、备用基础设施(4)、专业技术支持能力(5)、运行维护管理能力(6)和灾难恢复预案(7)。
根据这些要素的要求,划分并界定了灾难恢复能力的6个等级(表1)。
表1灾难恢复能力等级
等级
名称
基本要素要求
1级
基本支持
(1)至少一周一次全备份;
(2)备份介质场外存放;(3)有符合介质存放条件的场地。
2级
备用场地支持
1级+
(1)配备灾难恢复所需的部分数据处理设备;
(2)配备部分网络设备;(3)配备部分通讯设备;(4)有恢复运作的场地。
3级
电子传输+部分设备支持
2级+
(1)每天多次利用通信网络将关键数据定时批量传送至备用场地。
4级
电子传输+完全设备支持
3级+
(1)配备灾难恢复所需的全部数据处理设备就绪或运行状态;
(2)配备部分网络设备,并处于就绪状态;(3)备用基础设施保持7x24小时运作。
5级
数据实时传输+完全设备支持
4