灾难恢复计划.docx
《灾难恢复计划.docx》由会员分享,可在线阅读,更多相关《灾难恢复计划.docx(18页珍藏版)》请在冰豆网上搜索。
灾难恢复计划
灾难恢复计划
编制:
批准:
版本:
1.2
日期:
2010年12月
版本历史记录
版本日期
版本号
更改记录
修订页码
2009-11
1.1
2010-12
1.2
公司名变更,IT小组人员变更,异地存储保险箱位置变更和软件升级
6、8、10、17、18
1.简介
1.1计划的使用
计算机信息系统发生灾难时激活这个计划,由IT小组按照本计划标准的操作程序组织实施灾难恢复,直到全部数据和功能被修复。
1.2灾难定义
灾难包括自然灾难和人为灾难,自然灾难是指由不可抗力造成的网络瘫痪、信息服务被强制中断,这种灾难是不可预测的。
人为灾难是指除自然灾难以外的信息系统的全部或部分出现瘫痪、信息服务被强制中断。
1.3概述
灾难恢复计划是做准备、定计划,以使灾难发生后能及时恢复计算机网络系统的文件。
它是一个管理公司潜在的数据丢失及灾难发生时执行的计划,它的主要目的是保护公司数据和信息资源,现在公司越来越多的应用了计算机及通信资源,当灾难发生时,这些资源的损失可能会使公司陷入瘫痪状态,它会在一段时间内直接或间接的影响到公司的运营状况,给公司造成损失。
制定灾难恢复计划,可以使灾难被有计划、有步骤的得到恢复。
1.4原则
灾难恢复计划文件是准备进行灾难恢复及测试计划有效性的文件,它必须能保证在灾难发生前、中、后都能使灾难在最短的时间内被恢复,它的详细内容是根据可能对公司网络通讯、计算机及数据资源造成损失的事件,做出实际、完整的响应步骤,使得灾难发生后能做到:
●保证将灾难的影响降低到最小的程度。
●在预定的时间内恢复网络系统和数据资源。
灾难恢复计划必须包括:
●网络系统内容的详细列表。
●软件及硬件故障的应急响应方法。
●员工职责。
●根据公司对网络和数据资源的要求定期做备份。
●网络和数据资源的恢复顺序。
●和相关人员及提供服务人员进行通信的方法。
●风险评估及分析
●进行灾难恢复计划的维护和测试。
⏹将灾难恢复计划形成文件,并保证实时更新。
⏹保证每年对灾难恢复计划进行测试。
2.恢复策略
2.1自然灾难(包括:
火、地震等等)
在发生自然灾难后,公司全体员工在保证人身安全的情况下做出紧急响应,应首先将本部门计算机转移到安全地点,在条件许可的情况下,尽力将计算机网络设备及附属设备(如打印机服务器、HUB等)转移到安全地点,然后等待灾难恢复小组进行修复。
2.2硬件故障
使用硬件设备的人员及时通知IT工程师,由IT工程师确定发生故障的原因,如有备件应及时更换,否则应立即与销售商联系,维修或更换设备。
2.3软件故障
使用软件的人员及时通知IT工程师,由IT工程师确定发生故障的原因,如果是一般应用软件故障,则应立即重新安装应用软件。
其它应用软件故障(如QAD)应立即与软件供应商联系,通过电话支持或要求供应商上门服务的方式解决软件故障。
操作系统故障应先备份数据信息,然后由IT工程师重新安装操作系统。
2.4病毒
每位员工发现病毒后应立即将感染病毒的计算机与计算机网络断开,并通知IT工程师清除病毒。
3.职责
3.1灾难恢复小组成员
3.2公司员工在灾难恢复时的职责
3.2.1发生自然灾难后依据人力资源部《SP-EHS-02应急准备与响应程序》执行,计算机网络系统的灾难由IT人员报行政人事部,由行政人事部对内、外宣布灾难。
3.2.2发生灾难后,公司办公楼无法使用时,由公司管理层和行政人事部门负责租用新的办公地点。
3.2.3公司全体员工都有在发生灾难时做出紧急响应的责任。
3.2.4IT小组和管理层一起制定一个详细、完整的恢复计算机网络系统的计划。
3.2.5IT工程师定期进行网络系统信息和数据资源的多重备份,保证信息资料的完整性和可靠性。
3.2.6IT小组对网络系统内部失效的部件(包括硬件和软件),及时进行维修和维护。
3.2.7灾难发生后,灾难恢复小组成员协同工作,共同完成信息网络的搭建及操作系统、应用系统的安装。
完成计算机网络信息数据的恢复工作。
4.信息系统详细内容及设备列表
4.1网关、防火墙服务器
计算机名称:
gateway
软件:
Windows2003server操作系统
MicrosoftISAServer2006中文标准版
硬件:
IBMX3250(IT机房)
XeonX3110
4*1G内存
2*146GSASHDD硬盘
2*1000Mb网络适配器
IP地址:
192.168.0.1(LAN),218.22.73.70(WAN)
4.2域服务系统
计算机名称:
ActiveDirectory
软件:
Windows2003server操作系统
硬件:
DELL320(IT机房)
酷睿双核2.0G
1G内存
160G硬盘
10/100Mb网络适配器
IP地址:
192.168.0.2
4.3文件服务器系统
计算机名称:
软件:
Windows2003server操作系统
硬件:
IBMX3550(IT机房)
至强四核5150/2G/500G*2/RAID1/
2G内存
500G*2硬盘
1000Mb网络适配器
IP地址:
192.168.0.3
4.邮件、防病毒系统
计算机名称:
mail-server
软件:
Windows2003server操作系统
VisNeticMailServer
Symantec11企业网络版
硬件:
DELL840
双核至强2.13G
2G内存
500G*2硬盘
1000Mb网络适配器
IP:
192.168.0.4
5.QADlinux系统
计算机名称:
qad-batabase
软件:
redhatlinux操作系统
硬件:
IBMX3650
XeonX5450
2G*4内存
146G*4SAS硬盘
1000Mb网络适配器
IP地址:
192.168.0.5
6QADwindows系统
计算机名称:
qad-app
软件:
Windows2003server操作系统
硬件:
IBMX3650
XeonX5450
2G*4内存
146G*2SAS硬盘
1000Mb网络适配器
IP地址:
192.168.0.6
7备份系统
软件:
Windows2003系统中的备份
硬件:
BMLTO2400-800G磁带机
4.9网络服务设备列表
华为3COMS3600-28TP-SI交换机(IT机房)
华为3COMS1050T交换机两台(IT机房)
光纤收发器四台(IT机房)
华为3COMS1008A交换机(厂房南边机柜)
华为3COMS1008A交换机(厂房北边机柜)
光纤收发器一台(厂房南边机柜)
光纤收发器一台(厂房北边机柜)
光纤收发器一台(北门门卫室)
光纤收发器一台(功能实验室)
NETGEAR无线路由两台(办公楼二楼)
TP-LinkR403M路由器(IT机房)
5.备份
5.1系统配置备份
网关服务器IP策略、DHCP策略、ISA防火墙策略、域服务器策略由磁带机和硬盘做两份备份,其中一份存于服务器硬盘,另一份存于远离计算机中心的交通银行开发区支行的保险柜内。
当硬盘损坏时可由磁带机或其它硬盘中恢复系统最新状态。
5.2数据资料备份
文件服务器中的所有存放文件及QAD每天的生产数据库由磁带备份和硬盘备份两份,其中一份存于服务器硬盘,另一份存于远离计算机中心的交通银行开发区支行的保险柜内。
5.3备份步骤
5.3.1系统配置备份:
在两台服务器中每周进行相关系统配置的备份,并用U盘将所有文件COPY到机器中d:
\中,等待进行磁带备份。
5.3.2数据资料备份
批处理程序(qad-database机器中)每天会将QAD系统中的生产数据库备份到/backup/db/prod/文件夹中,IT工程师每天早晨上班后在机器中用FTP软件COPYqad-database机器的/backup/db/prod/中的所有文件到机器的D:
/QADProductionbackup目录中,再用磁带对此目录进行备份;
机器中的D盘每周用磁带全备份一次,每月完全备份一次。
5.3.3磁带备份
每天\每周使用磁带备份,将磁带放入磁带机中,对公司内所有数据进行全备份(QAD数据库文件每天备份),每月进行一次完全备份。
6.灾难恢复内容及顺序
6.1主要恢复内容
∙文件服务器(Windows2003server)
∙备份系统
∙网关服务器(Windows2003server)
∙网络防火墙(ISA2006)
∙域服务器(Windows2003server)
∙电子邮件系统(VisNeticMailServer)
∙病毒防护系统(SymantecNortonAntivirus)
∙qad-database系统
∙qad-app系统
6.2主要软件及系统恢复步骤
6.2.1Windows2003server操作系统
根据Windows2003server安装时的提示,进行一步一步的安装,安装后使用备份好的”系统配置”文件恢复系统配置信息及安全策略。
各系统的配置文件如下:
网关服务器:
\\\D:
\gatewaybackup\DHCP
域服务器:
\\\D:
\ADbackup
6.2.2QAD操作系统
根据Linux和Windows2003server安装时的提示,进行一步一步的安装。
6.2.3其它应用软件
包括“ISA2006”、“Visneticmailserver”、“Symantec”、“QAD软件”都根据软件的安装提示进行安装,安装后使用备份好的各系统配置文件恢复系统配置。
以下为各软件配置文件的保存路径:
ISA2006:
\\\D:
\gatewaybackup\ISA
QAD正式数据库:
\\\D:
\QADProductionbackup
6.3恢复备份数据的条件:
●具备计算机一台,具有Windows2003server操作系统。
●IBMLTO3磁带机一台。
6.4恢复时间及顺序
总恢复时间
网关服务器
邮件服务器
文件服务器
域服务器
QAD
系统
顺序
时间
顺序
时间
顺序
时间
顺序
时间
顺序
时间
0-24
Windows2003server操作系统
0-24
Windows2003server操作系统
0-24
Windows2003server操作系统
0-24
Windows2003server操作系统
0-24
Linux
windows
0-24
24-124
124小时后可全部恢复网络内的服务器系统
网络防火墙
24-28
电子邮件系统
24-28
文件资料数据
24-48
域策略配置
24-48
QAD
软件
24-100
恢复系统策略配置
28-30
病毒防护系统
28-32
备份系统
48-52
QAD数据库数据
100-124
恢复防火墙数据
28-50
恢复系统配置
32-40
网络布局和各单机系统视缓急程度决定恢复顺序及时间
7.主要硬件及软件供应商联系方式
主要硬件名称
公司名称
联系人
联系电话
IBM磁带机、服务器
IBM中国有限公司
DELL服务器
DELL中国有限公司
QADSE2008软件
上海企安达
MicrosoftISAServer2006
Microsoft中国公司
8.风险分析
风险是指对计算机网络系统潜在的威胁,风险评估是分析和评估可能发生的全部风险。
它包括风险等级、风险分析、风险评价三部分。
8.1风险等级:
通过对潜在的风险进行分析,确定风险发生的可能性(高、中、低、),以及风险发生后可能造成的威胁(高、中、低)。
通过对两者的分析来确定风险的等级。
见下表:
风险等级
发生风险的可能性
造成威胁的高低
等级
H
M
L
N/A
H
M
L
N/A
X
X
*****
X
X
****
X
X
****
X
X
***
X
X
**
X
X
*
X
X
**
X
X
*
X
X
-
8.2风险分析列表:
下表中所包含的风险依据以下信息:
1.中国统计局
2.美国大使馆
3.中国平安保险公司
4.中国2004年灾难报告
5.中国2004年统计报告
6.
风险分析表
潜在的风险
发生风险的可能性
造成威胁的高低
等级
H
M
L
N/A
H
M
L
N/A
地震
x
x
**
飓风
x
x
-
暴风雨
x
x
-
火山爆发
x
x
-
洪水/山洪暴发
x
x
***
暴风雪
x
x
-
泥石流
x
x
-
雷击
x
x
***
海啸
x
x
-
森林火灾
x
x
-
干旱
x
x
-
建筑物失火/爆炸/漏气
x
x
****
水管破裂
x
x
**
气候条件恶劣(如:
温度过高)
x
x
*
网络设备故障
x
x
**
硬件故障
x
x
***
软件故障
x
x
-
媒体故障(磁带、光驱等)
x
x
*
人为的操作失误
x
x
-
黑客的阴谋破坏
x
x
*
数据无法打开
x
x
-
机密数据泄露
x
x
****
未被授权的访问
x
x
*
个人丢失钥匙
x
x
*
害虫侵扰(物理设备)
x
x
-
感染计算机病毒
x
x
****
电磁影响
x
x
***
干扰特性
x
x
-
通讯故障
x
x
-
油管断裂
x
x
-
抢掠
x
x
*
入室行窃/非法挪用
x
x
*
战争
x
x
*
8.3风险评价
根据上表所列出的各种风险类型进行分析,综合考虑各方面的因素,列出下表,有四种基本的控制方法,每种方法可以单独使用,也可以共同使用。
风险“A.T.E.R”
定义
控制方法
接受(Accept)
当控制风险的成本明显高于财务成本时,接受可能发生的风险
如果从成本角度考虑,对可能发生的风险可以不做控制。
转移(Transfer)
把财务责任转移到第三方
购买保险;
消除(Eliminate)
完全去除可能导致灾难或网络中断的因素
重新部署设施;
改变程序文件;
清除易燃材料等
降低(Reduce)
把可能导致灾难或网络中断的因素最小化
安将防盗门、建立防火墙;
安装病毒防护系统;
进行多重备份;
认真考虑风险和实施成本,实行有效缓解措施,可以避免小问题逐渐升级成大灾难。
下表中每项风险的评估(风险分析摘要)在下表作了概述。
风险按优先顺序列出,其中包括风险管理和应对策略:
风险评价(\)
潜在的风险
风险等级
风险管理策略
适用范围
建筑物失火/爆炸/气体泄漏
****
ART
SLWH
机密数据泄露
****
R
SLWH
感染计算机病毒
****
R
SLWH
硬件故障
***
AR
SLWH
电磁干扰
***
R
SLWH
洪水/山洪暴发
***
ART
SLWH
雷击
***
ART
SLWH
地震
**
ART
SLWH
水管破裂
**
ARE
SLWH
网络设备故障
**
ARE
SLWH
气候条件恶劣(如:
温度过高)
*
RE
SLWH
媒体故障(磁带、光驱等)
*
RE
SLWH
抢掠
*
RT
SLWH
入室行窃/非法挪用
*
RE
SLWH
战争
*
AR
SLWH
黑客的阴谋破坏
*
RE
SLWH
未被授权的访问
*
RE
SLWH
个人丢失钥匙
*
RE
SLWH
8.4降低风险的发生
8.4.1财务:
∙所有公司的财产都在保险公司投保,在财产被盗或遇到灾难时,不会在财务上发生困难
8.4.2IT机房:
∙机房24小时关门
∙关闭并锁上窗户
∙在IT机房放置灭火器
∙进出机房必须添写登记表,并有计算机管理人员陪同
∙保持房间清洁
8.4.3备份磁带:
∙为每一盘磁带标记序号,并标记备份日期及形式
∙备份磁带定期放到远离IT机房的交通银行开发区支行
∙对备份磁带定期做测试
8.4.4网络:
∙网络用户密码的长度必须大于7位,并符合复杂性要求(包含数字、字母、符号)
∙用户必须每30天更改一次密码,一年内密码不能重复
∙网络用户应定期清理,删除不再使用的用户名
8.4.5网络内的计算机:
∙公司内所有计算机都必须设置开机口令和屏幕保护口令
∙所有的屏幕保护口令必须设置在10分钟以内
∙对一些机密文件也应该设置保护口令
∙将公司内重要数据保存在服务器上,防止丢失
8.4.6软件:
∙每个月抽查每个部门的计算机,检查是否有非法软件,如果发现非法软件应当立即将其删除
9.培训
灾难恢复小组成员每年进行一次培训。
培训内容为最新的”灾难恢复计划”。