烟草行业信息系统容灾备份建设规范Word格式文档下载.docx
《烟草行业信息系统容灾备份建设规范Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《烟草行业信息系统容灾备份建设规范Word格式文档下载.docx(15页珍藏版)》请在冰豆网上搜索。
6.规划阶段
6.1.本地数据保护
6.1.1.生产中心加固
6.1.2.本地数据备份
6.2.灾难恢复范围和目标
6.3.灾备系统建设模式
7.建设阶段
7.1.信息系统现状梳理技术要求
7.2.方案设计
7.2.1.数据级灾备技术要求
7.2.2.应用级灾备技术要求
7.2.3.数据复制方案选择
7.2.4.数据复制方案技术要求
7.2.5.网络解决方案
7.2.6.域名解析部署要求
7.2.7.时间同步服务部署要求
7.3.预案开发
7.3.1.预案总体要求
7.3.2.预案组成
8.交付阶段
8.1.功能测试
8.2.预案验证
9.运维阶段
9.1.运行维护
9.1.1.运行维护原则
9.1.2.运行维护内容
9.2.容灾演练
附 录 A(资料性附录)
风险等级评估模板
前 言
本标准由国家烟草专卖局烟草经济信息中心提出。
本标准由全国烟草标准化技术委员会信息分技术委员会归口。
本标准主要起草单位:
国家烟草专卖局烟草经济信息中心、中国烟草总公司信息系统上海容灾中心、杭州新世纪电子科技有限公司。
本标准主要起草人:
本标准规定了烟草行业信息系统容灾备份建设应遵循的分析、规划、实施和运行管理要求。
本标准适用于烟草行业各单位开展信息系统容灾备份工作。
下列文件中的有关条款通过在本规范有关部分的引用而成为本规范的条款。
凡注明日期或版次的引用文件,其后的任何修改单(不包括勘误的内容)或修订版本都不适用于本规范,但提倡使用本规范的各方探讨使用其最新版本的可能性。
凡不注明日期或版次的引用文件,其最新版本适用于本规范。
GB/T20988-2007
信息安全技术
信息系统灾难恢复规范
GB/T30285-2013
灾难恢复中心建设与运维管理规范
GB50174-2008
电子信息系统机房设计规范
国烟办〔2016〕339号
国家烟草专卖局关于烟草行业信息系统容灾备份工作的指导意见
3.1
业务影响分析businessimpactanalysis
BIA
分析业务功能及其相关信息系统资源、评估特定灾难对各种业务功能的影响的过程。
[GB/T20988-2007,定义3.5]
3.2
恢复时间目标
recoverytimeobjective
RTO
灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。
[GB/T20988-2007,定义3.18]
3.3
恢复点目标
recoverypointobjective
RPO
灾难发生后,系统和数据必须恢复到的时间点要求
[GB/T20988-2007,定义3.19]
3.4
生产中心
productioncenter
利用数据中心场地和环境支撑机构生产系统运行,对机构的重要信息进行集中管理和处理的场所和组织。
[GB/T30285-2013,定义3.4]
3.5
灾难恢复中心
disasterrecoverycenter
满足机构关键业务运营连续性的要求,利用数据中心场地和环境支撑机构灾难备份系统运行,抵御导致生产系统全部或部分不可用的灾难,用以接替生产中心部分或全部职能,对机构重要信息进行集中管理和处理的场所和组织。
注:
灾难恢复中心也称为容灾中心或灾备中心。
灾难恢复中心按照其风险防范职能及与生产中心的距离,可分为同城灾难恢复中心和异地灾难恢复中心。
[GB/T30285-2013,定义3.5]
3.6
数据备份
databackup
数据备份是利用备份软件将信息系统数据按照既定备份策略定期备份到磁带或磁盘等介质的一种数据保护措施。
3.7
数据级灾备
dataleveldisasterrecovery
数据级灾备用于保护信息系统数据安全,通过数据复制工具在异地建立一个本地数据的可用副本。
当本地生产系统出现不可恢复的故障时,灾备系统提供数据恢复功能。
3.8
应用级灾备
applicationleveldisasterrecovery
应用级灾备是在信息系统数据级灾备的基础上,部署与原信息系统功能相同的后备系统,当生产系统发生灾难时,信息系统切换至后备系统运行,相关功能或服务可快速恢复并承担应用负荷。
根据GB/T30285-2013
4.2定义,灾难恢复项目分为五个阶段:
分析、规划、建设、交付、运维。
图1
灾难恢复中心建设与运维管理生命周期模型
风险识别的结果是列出生产中心面临的潜在风险。
可参考潜在风险包括但不局限以下内容:
a)自然灾害:
如洪水、地震、雪灾、台风、海啸等;
b)机房灾难:
如火灾、供电中断、UPS故障、空调故障、通信线路故障等。
c)系统故障:
如重大软硬件故障、人为误操作、病毒攻击等。
a)风险频率
根据经验或统计数据评估各类自然灾难、机房灾难风险发生的频率,并对风险发生的频率进行等级化处理,不同等级分别代表风险发生的频率的高低。
等级数值越大,风险发生的频率越高。
风险频率等级定义如下:
表1风险频率等级定义表
等级
标识
定义
5
很高
出现的频率很高;
或在大多数情况下几乎不可避免;
或可以证实经常发生过
4
高
出现的频率较高;
或在大多数情况下很有可能发生;
或可以证实多次发生过
3
中等
出现的频率中等;
或在某种情况下可能会发生;
或被证实曾经发生过
2
低
出现的频率较小;
或一般不太可能发生;
或没有被证实发生过
1
很低
几乎不可能发生;
仅可能在非常罕见和例外的情况下发生
b)风险影响力
风险影响力是各类自然灾难、机房灾难风险发生后对生产中心造成损害的严重程度。
将风险影响力进行等级化处理,不同的等级分别代表不同风险造成损害严重程度的高低。
等级数值越大,风险影响力严重程度越高。
风险影响力等级定义如下:
表2
风险影响力等级定义表
如果风险发生,将对生产中心基础设施及系统运行环境造成完全损害
如果风险发生,将对生产中心基础设施及系统运行环境造成重大损害
如果风险发生,将对生产中心基础设施及系统运行环境造成一般损害
如果风险发生,将对生产中心基础设施及系统运行环境造成较小损害
如果风险发生,对生产中心基础设施及系统运行环境造成的损害可以忽略
c)风险评估值
行业单位需要评估生产中心所面临的每一类风险,并得出风险评估值。
风险评估值的计算方法为风险频率和风险影响力等级的乘积。
风险评估值=风险频率等级×
风险影响力等级。
d)风险等级
风险评估结果值根据范围划分为5个风险级别,划分方法见表3。
行业单位需要根据生产中心面临的最高风险等级开展灾备建设工作。
风险等级评估方法参见附录B。
表3
风险评估值
1-5
6-8
9-14
15-19
20-25
风险等级
行业单位应开展本单位信息系统业务影响分析工作,采用定量分析和定性分析相结合的方式来评估各信息系统在发生灾难之后的损失。
灾难损失评估方法参考但不限于以下评估内容:
a)定量损失包括但不限于以下方面:
——由于业务停止导致资金损失,资金支出等;
——由于意外中断时间造成的运行费用支出;
——由于违反合同条款、法规条款招致的资金损失;
——由于违反调整所依赖的资源招致的资金损失。
b)定性损失包括但不限于以下方面:
——导致消费者、零售户、烟农、企业员工对相关信息系统的使用不便;
——消费者、零售户、烟农对企业的信任损失;
——企业市场份额和竞争优势的损失。
明确各信息系统的关联关系及其所必需的配套系统和基础设施。
门户、身份认证、消息中间件、企业服务总线等对于灾备系统切换后正常运行不可或缺,也需将其纳入相应容灾保护范围,并根据信息系统之间的依赖性关系确定其关键度等级。
行业单位根据业务影响分析和信息系统关联分析结果,结合行业单位实际情况,确定各信息系统关键度等级。
根据烟草行业特点,将信息系统划分为核心、重要、一般三个关键度等级。
a)核心:
影响面大、业务连续性要求高,系统中断或数据丢失会造成重大经济损失,对行业经营管理及社会公众服务产生重大影响。
b)重要:
影响面较大、业务连续性要求较高,系统中断或数据丢失会造成较大经济损失,对行业经营管理及社会公众服务产生较大影响。
c)一般:
信息系统对数据丢失或系统停顿具有一定容忍度。
行业单位需要首先完成生产中心加固和本地数据备份,抵御各类系统故障造成的风险。
生产中心加固包括生产中心机房基础设施以及应用支持环境加固,用于抵御应用中断的风险。
本地数据备份要求全面可靠,用于抵御数据丢失的风险。
a)机房环境达到《电子信息系统机房设计规范》(GB50174-2008)B类机房标准,并通过当地消防部门验收。
b)机房具有两路或两路以上的电力供应接入方式。
c)部署冗余的网络通讯接入线路。
d)核心和重要信息系统的应用支撑环境(如主机、存储、网络等)采用冗余部署模式,避免单点故障。
a)备份范围:
生产中心内所有信息系统。
b)备份内容:
各信息系统的数据库、非结构化文件、应用程序包和源代码、配置信息、基础软件等进行系统恢复时必要的数据资源。
c)备份指标:
RTO≤48小时,RPO≤24小时。
d)备份频率:
核心和重要信息系统数据每周至少全备1次,一般信息系统数据每月至少全备1次,其余每日做好增量备份。
e)保留周期:
备份数据保留周期2个月以上。
f)备份介质:
备份介质要求安全可靠,备份与恢复效率高。
有条件的单位应实现主备份介质与冗余备份介质分建筑物存放。
g)恢复手册:
针对各信息系统制定详细恢复操作手册,明确所需资源及详细操作步骤。
h)数据验证:
建立备份恢复环境并开展异机数据恢复测试,确保备份数据可用。
行业单位完成了本地数据保护后仍存在亟待抵御的自然及机房灾难,需要根据各信息系统的关键度等级以及生产中心面临的风险等级有针对性的选择灾难恢复策略,并制定本单位各级信息系统灾难恢复指标。
灾难备份策略包括数据级灾备和应用级灾备。
行业信息灾难恢复参考指标见表4。
表4
行业信息灾难恢复参考指标
信息系统
关键度等级
生产中心
灾难恢复策略
参考恢复指标
核心
应用级灾备
RTO≤6小时,RPO≤30分钟
数据级灾备
RTO≤6小时,RPO≤1小时
重要
很高、高
RTO≤24小时,RPO≤4小时
6.3.灾备系统