业务连续性计划BCP样本.docx
《业务连续性计划BCP样本.docx》由会员分享,可在线阅读,更多相关《业务连续性计划BCP样本.docx(10页珍藏版)》请在冰豆网上搜索。
业务连续性计划BCP样本
业务持续性筹划
事先制定一种完备业务持续性筹划(BusinessContinuityPlanning,缩写为BCP),积极防范并且应变解决劫难发生一系列后果,将劫难蔓延和损失控制在公司可以承担范畴以内,已成为当代公司管理范畴内一种十分重要任务。
【第一某些】
BCP基本要素
笼统地说,BCP目的只有一种,那就是拟定并减少危险也许带来损失,有效地保障业务持续性。
而关于BCP某些特定目的咱们将在如下各个某些中加以描述。
BCP实行最后成果是:
●一组防范危险评测指标;
●一支执行团队,在通过培训后可以解决各种危险事件;
●一套筹划,提供危险发生时路线图。
该筹划应当是充分和完备,必要详细贯彻到该筹划实行范畴内每一种单位、人员或设备。
咱们下面所要讨论重要是与公司中IT设施有关内容,没有涉及到公司人员在危险状况下安全管理问题。
每个公司所制定BCP都应当有每个公司或者所处行业独有特色,彼此之间不会完全一致,但大体上说来,一种完备BCP重要是由如下某些核心某些构成:
一、危险评估
危险评估就是结识并分析各种潜在危险成果。
这些危险来源也许是:
●各种区域性天然劫难,如洪水、地震、疫病等;
●人为事故或蓄意破坏导致严重劫难,如火灾、恐怖主义袭击等;
●安全威胁、硬件、网络或通信故障;
●劫难性应用系统错误。
所有危险都应纳入公司危险评估范畴,并且应对各种危险也许来源地进行较准拟定位。
对于每一种危险来源都应当结识到:
●危险类型;
●危险限度;
●危险发生也许性。
例如说,如果按照有无警示性先兆来分,各类危险还可以分为:
●有些危险也许没有任何先兆而突然发生,无法事先防范;
●有些危险可以有一定先兆,可以迅速启动应急筹划加以防范,例如疫病传播;
●有些危险也许从来不会发生。
如果按照危险破环类型或限度来分,它们对业务影响可以分为:
●经营场合及设备完全破环;
●经营场合及设备某些破环;
●经营场合及设备完好,但人员不能进入,例如疫病隔离、恐怖威胁导致人员输散等。
显然,对于公司来说,一种完备BCP必要尽量多地考虑到所有也许危险状况,只有解决劫难性事件筹划而没有解决应用系统失误筹划,这样BCP是不完备;反之亦然。
公司所制定BCP应当同步兼顾两个方面——防止和控制。
例如,人为事故和蓄意破坏可以通过物理安全和个人行为评测来防止。
而应用系统错误则可以通过对软件有效评测与测试来防止。
危险评估最后成果应当是一份关于危险效益分析详细陈述报告,要有对危险精准描述、哪些危险也许发生,以及需要采用保障业务持续性和缓和危险办法,同步要有由于克服了危险而带来收益分析。
这份报告还应当描述清晰任何既有前提或者限制因素。
二、业务影响分析(BIA)
业务影响分析(BusinessImpactAnalysis)实质上就是对核心性公司功能、以及当这些功能一旦失去作用时也许导致损失和影响分析。
对于公司业务运营核心人员来说,她们需要分析:
A.影响
●哪种功能对于公司整体战略而言是生死攸关
●该功能在多长时间内失效不会导致影响和损失
●公司其她业务功能由于该功能失效会受到何种影响——运营影响分析
●该功能失效也许导致收入影响——财务影响分析
●该功能与否会对客户关系导致影响——客户信心损失
●该功能与否会对市场份额导致影响——市场占有率下滑
●该功能与否会对公司在行业中地位导致影响——公司竞争力损失
●该功能与否会影响此后销售——机会丧失
●什么是最大/可承受/可容许失效
B.业务恢复需求
●要使该功能持续,需要哪些资源和数据纪录
●至少资源需求是什么
●哪些资源也许来自公司外部
●它与公司其她功能依赖关系以及依赖限度
●公司其她功能与该功能依赖关系以及依赖限度
●该功能与公司外部业务/供应商/其她厂商依赖关系以及依赖限度
●在缺少实验环境状况下进行恢复,需要采用如何防止办法或检查手段
在进行了这些分析之后,才有也许对公司各种功能进行分类:
a)核心功能——如果此类功能被中断或失效,就会彻底危及公司业务并导致严重损失。
b)基本功能——这些功能一旦失效将会严重影响公司长期运营能力。
c)必要功能——公司可以继续运营,但这些功能失效会在很大限度上限制公司效率。
d)有利功能——这些功能对公司是有利;但它们缺失不会影响公司运营能力。
依照各种功能恢复需求,公司便可为上述各类功能制定原则恢复时间架构。
例如,核心功能<1天;基本功能:
2~4天;必要功能:
5~7天;有利功能:
>10天。
影响分析可以协助公司拟定各类业务功能优先顺序,换句话说,也就拟定了各业务功能优先恢复顺序。
BIA有助于定义恢复对象。
在进行了影响分析之后也许会发现,在一次劫难之后恢复业务运营时,一方面恢复某些功能就足够了,例如说在24小时内先恢复寻常业务40%就够了。
详细定义好在劫难或业务中断之后保障业务功能运营资源需求也是也许。
这些资源需求涉及基本设施、人力资源、文档、记录、设备、电话、传真机等,无论需要什么资源都要有完备规范规定。
拥有恰当细节规定是非常重要,由于在危险事件发生时,会产生一定限度慌乱,到那时再决定此类细节已经不也许了。
成本因素在进行影响分析时也是不能忽视。
咱们需要记住如下某些事项:
●收入损失和商机丧失与恢复所需时间直接成正比
●一种恢复方略成本与恢复所需时间成反比
●也许恢复方略成本必要和在采纳该方略之前由于业务功能中断而导致实际损失进行比较。
如果所建议恢复方略成本远高于预测成本,那么这种方略就是不可取。
三、方略
BCP应涉及如下方略:
A.防止 防止目在于减少劫难发生也许性。
关于防止方略应当涉及制止和防止控制。
制止控制可以减少危险也许性。
防止控制则是保护公司弱点区域,以防御危险发生并减少其影响。
这两类控制在实际运营中广泛存在,例如经营场合安全、人员控制、有关基本设施(如UPS、后备电池、烟火探测器、灭火器等)、软件控制、有关存储和恢复等。
公司但愿保障其资源(涉及信息资产)可用性和安全性,其安全方略必要针对这些对象而制定,并且提供关于资源使用和管理指南。
在熟悉了公司所有资源、资源布局以及危险管理等之后,才也许拿出实行安全方略所需必要控制办法。
这些控制办法或安全举措必要时时加以检查和测试。
如果一种安全方略,能将防止办法都布置到位,可以监控对系统入侵并防范那些试图破坏系统行为,那么其自身就是一种制止控制。
防止筹划执行必要小心谨慎。
必要保证明行安全方略时既不能对寻常业务带来限制,浮现瓶颈,也不能引起可用性问题,或者给系统访问和使用带来障碍。
B.响应 响应就是当危险发生时反映。
它必要可以制止危险进一步扩大,评估危险限度,通过与外部世界正常通信联系挽回公司名誉,并启动必要恢复时间表。
对业务中断第一反映应当是告知所有有关人员。
如果危险有事前警示话(例如这次非典爆发),那么这种告知就可以提迈进行。
及时告知非常重要,由于这也许会给制止危险进一步扩大创造机会。
如果在恰当时机执行一次关机、一次转换或者一次撤离,甚至有也许完全防止危险发生。
但是这需要有诊断或探测控制存在。
此类控制或者可以持续扫描以探测发生中断征候(网络、服务器),或者可以从外部资源收集信息(自然灾害)。
精确告知程序必要事先制定好。
必要清晰地记录在案:
需要告知谁,如何告知,由谁告知,并且还得有逐渐扩大机制。
在BCP中必要设立好一棵告知树。
最初告知发送给一组人,然后再由她们中每个人去告知另一组人,依次类推。
属于这棵告知树人均有不同责任和作用,所涉及人员应涉及:
●管理团队——需要获得关于危险发展状况信息。
该团队有权力启动紧急响应体系和下一步行动。
管理团队还要负责与媒体、公众、客户以及股东们打交道。
●危险评估团队——需要立即对危险进行评估,评价业务中断严重限度。
●技术团队——应当为核心决策制定者如何采用下一步BCP行动提供服务。
●运营团队——应当执行BCP实际运作。
尚有很重要一点就是每一种团队都应明确第二负责人。
万一第一负责人没有告知到或者无法负起责任,那么必要告知第二负责人。
告知可以使用各种工具或手段:
如手机、呼机、短信、电话和E-mail。
每个团队都应当有相应配备。
危险评估团队应当是最早(或者与管理团队同步)被告知。
她们应当最早来到现场,以便评估所遭受危险限度和级别。
如果工作现场已经遭到破坏,那么她们就应当做好各项准备,一旦容许进入现场就开始工作。
评估过程自身也应有筹划地进行,必要与保障业务持续性优先顺序密切有关。
这就是说评估团队应当意识到危险所影响到工作区域和工作流程与否对整个业务运营至关重要。
这将有助于她们优化其评估进程,同步也可对的地关注核心性工作区域。
这支团队需要察看如下事项:
●中断因素是什么
●制止危险扩大前景如何
●基本设施和设备受损状况
●业务受影响状况
●核心记录受损状况
●可以挽回什么损失
●什么设备需要修理、恢复和更换
有了危险评估团队提供关于受损限度和受损区域详尽信息,技术团队便可立即投入工作。
BCP必要拥有一组基于业务影响分析和持续性目的预设参数,这些参数应当可以区别出中断和劫难不同性质,同步也能评价出危险严重限度。
当危险评估团队和技术团队开始工作时,其她BCP团队也应依照警示告知到位,以便按照持续性筹划采用应当采用行动。
C.业务接续(Resumption) 业务接续只涉及那些时间敏感业务流程,要么是在中断发生后及时接续,要么是在可容许一段平均时间后接续,但不是对所有业务恢复。
一旦BCP被激活,命令将从指挥中心发出。
这个指挥中心应当是在一种不同于寻常经营场合地方。
该中心应配备相应通信设施、办公设备,也许话还应当构建局域网和VPN。
需要做出第一种决策是,核心性业务运营能否在寻常工作场合或者在一种备选场合不久恢复运营。
备选场合可以提成如下几类:
(a)空场合(ColdSite)——该场合只需配备必要环境条件即可,例如说,应配备电话插座、电源以及UPS等,但要避免其内有任何其她设备,它作用就是准备将保障业务持续所需所有设备搬移进来。
(b)热场合(HotSite)——该场合是一种完全备份场合,有人员工作空间,所有设施一应俱全,数据备份也是最新。
一旦劫难发生,BCP团队只需进驻该场合就可开始工作,不会有额外时间迟延。
(c)温场合(WarmSite)——该场合事实上就是配备了某些设备热场合,数据备份不算最新,但也不能太旧。
(d)机动场合(MobileSite)——该场合是一种具备较小设施配备机动场合。
可以位于重要经营场合附近,因而也可节约核心人员在路程上耗费时间。
(e)镜像场合(MirroredSite)——该场合在所有方面都与重要经营场合完全相似,信息和数据也与重要场合同步。
事实上该场合就是正常状况下一种冗余场合,因而普通也是成本最高一种选取。
在备选场合(或重要场合,如果依然可用话),工作环境需要恢复。
通信、网络和工作站需要设立。
与外界联系必要持续畅通。
公司可以一方面手动恢复某些业务,直到核心IT业务可以继续运营为止。
固然,如果恢复筹划(下面就要讲到)容许,那么核心业务功能也可采用自动方式迅速恢复。
D.业务恢复(Recovery) 业务恢复是启动时间敏感度稍低某些业务流程。
业务恢复开始时间要取决于接续那些时间敏感业务流程需要时间。
在进行业务恢复场合(可以是重要经营场合或备选场合),需要在备份设备上恢复操作系统,并按照核心性顺序恢复必要应用系统。
当服务于核心功能应用系统恢复之后,则需要从备份磁带或其她异地备份媒介上恢复数据。
备份数据也必要经常保持同步,也就是说,重建数据应当与业务中断之前某一预先拟定期点数据相吻合。
该时点选取取决于核心业务规定。
由于商业数据有各种不同来源,因而重建每一种数据都必要达到所需数据一致性状态。
通过同步数据必要经常进行复查并保持其有效。
这种复查必要强制执行,由于在危险发生紧急关头,不也许再有闲暇来测试数据与否可用。
因而,必要要有一套清晰办法、方略或复查清单来执行这个让数据保持其有效性过程。
一旦数据达到了可靠状态,公司事务就可以加速运营,由于劫难已经得到解决,所有核心性功能都已得到接续。
逐渐地,其她业务也可开始恢复其功能。
E.复原(Restoration) 复原则是修复并恢复重要经营场合。
最后是要在原有场合或者一种全新场合完全恢复所有业务流程。
就在恢复团队开始从某个备选场合开始支持恢复运营时候,对重要场合所有功能进行复原工作也可以展开。
如果原有场合在劫难后确无法恢复,则需要在一种新场合进行复原工作。
恢复团队和复原团队成员有也许是同一组人。
必要保证该复原场配备必要基本设施、设备、硬件、软件和通信设备。
并且要对该场合能否解决所有业务流程进行测试。
执行上述所有行动筹划应当涉及一种时间跨度定义,拟定在某一跨度内必要完毕哪些行动。
这个时间跨度定义必要与公司恢复目的相一致。
BCP团队必要意识到,如果在任一时点,她们行动超过了规定期间跨度,那么这个意外事件就必要立即上报到指挥中心,由指挥中心立即制定相应解决办法,否则公司就无法实现其恢复目的。
四、指标定义
在危险评估和业务影响分析阶段之后,保持业务持续基本业务就已经显现出来。
咱们在上面已经说过,按照业务术语可将公司业务功能提成4类,即核心业务、基本业务、必要业务和有利业务。
这种分类可以让业务持续优先顺序十分清晰,这样,业务恢复目的就可以用下面指标进行量化:
●恢复时间目的(RTO)——最大可容许中断时间
●恢复时点目的(RPO)——数据损失可容许最远回溯时点
●由于引进了BCP评测指标而导致公司性能退化
●实行BCP成本
【第二某些】
技术需求
一、可用技术选取
A.存储与服务器解决方案
●老式备份——就是对服务器数据进行备份,然后将备份磁带送至一种安全备选场合
●RAID——是一种有效冗余解决方案。
依照需要,可以选取恰当级别RAID。
●远程日记——是收集各种工作记录和日记并将它们传送到一种远程场合解决过程。
这一过程可以实时进行,即同步传送纪录,也可以将记录存档然后定期传送。
这一过程不会更新数据库,只是传送日记,因而恢复就可以回溯到近来传送时点。
这几乎意味着没有数据损失。
远程日记并不是一种独立办法,它需要一种起点,亦即应用到日记那个点。
如下几种某些本报在此前报道中有过充分描述,此处不再赘述。
●异地备份
●磁盘复制(镜像和映射)
●后备系统
●虚拟存储(NAS和SAN)
B.网络解决方案
●HotNetworkNodes——即在备选场合拥有一种可运营网络。
这个网络可以经常进行功能监控,因而可以节约灾后设立和测试网络时间。
●VPN——可用于远程恢复。
VPN在公用网络上运营,并容许接入公司网络。
一旦接入公司网络,它特性就像是在Internet上公司Intranet。
当劫难发生时,VPN容许恢复团队甚至在尚未到达备选场合之前就可以开始在恢复服务器上进行恢复工作。
二、实行
不同类型IT系统或业务流程也将决定实现BCP目的技术手段。
依照业务影响分析制定出实际技术方案是很重要。
1台式电脑——虽然它们普通对BCP不会产生影响,但如果必要,台式机也应当涉及进BCP中。
应当指引台式机顾客备份她们数据。
如果这不是可以接受方式,那么就可以使用网络磁盘。
网络磁盘可以经常进行备份,然后将备份介质送达至某个异地存储场合。
2软件及其允许证——这些资源由于最初是花了不少投资获得,因而必要加以备份并保存到异地存储场合。
3LAN——复原规定网络配备以及所有设备都必要记录在案。
在重要场合被破坏后,后备场合LAN应当与本来LAN设立保持一致。
4服务器——服务器一旦遭受损失,后果是极为严重。
因此应采用异地备份、RAID、远程日记、虚拟存储等办法。
5网站——网站很容易受到黑客袭击,因此必要实行安全控制。
网站文档、配备、应用代码都需要迅速恢复。
恢复过程中,有也许需要具备不同IP地址后备网站,因而在进行网站设计时就应当考虑到这一点。
6业务流程——在进行业务流程设计时应当考虑冗余设计。
例如银行系统除了柜台交易外,还应当设计好电话银行和网上银行。
构建冗余系统需要额外成本,因此公司重要应当为其最经常使用业务或最获利业务流程实行冗余设计。
关于支持BCP技术保障办法,请读者参阅本专刊《BC基石论》。
如何制定一种BCP
一、典型内容
下面咱们给出一份较典型业务持续性筹划大纲。
业务持续性筹划既可以提成几种单独筹划:
即防止、响应、业务接续、业务恢复和复原筹划,也可以由每一种这样筹划构成总筹划书中不同章节。
1.基本项目
●目
制定筹划目必要加以阐明。
还应当阐明即划分几种阶段试时,每个阶段所要实现目的是什么。
●范畴
阐明有哪些部门和运营业务需要实行BCP。
如果一种BCP只针对某些劫难而非所有劫难,则需要针对这些特殊劫难制定专门实行解决脚本。
●必备条件/前提条件和限制因素
形成一份BCP前提条件需要在此阐明。
在某些状况下,还须阐明BCP成功必备条件。
例如说,服务器数据备份间隔不得超过多少小时,受过训练运营恢复团队必要呼之即来,备选场合必要在劫难发生之后多少小时之内一切准备就绪等等。
如果BCP筹划执行还存在某些限制条件话,也应在此列出。
●团队
BCP团队组织/负责人选、下属哪些分支团队、团队作用和责任等,都必要在此阐明。
●指标
作为一种方略,公司必要由用于恢复RPO和RTO指标,以及性能指标等,这些指标应当在此加以阐明,并向客户和股东阐明。
2.防止保护
作为BCP中一种实行某些,防止办法需要在此阐明。
这些办法可以概括如下:
●监督
●访问控制
●身份认证
●防病毒
●过滤
●入侵检测系统
●备份筹划
3.紧急响应
●响应准备
在响应阶段需要哪些资源应当在此列出,同步详细声明这些资源配备和所需数量。
如果还需要某些文档和记录硬拷贝,也必要在此声明。
●告知树
●危险评估
●何时对外宣布
●激活BCP核心原则
4.业务接续
从紧急响应阶段到业务接续阶段如何进行衔接是需要在这里阐明。
关于业务接续运营决策过程、在哪里以及如何进行业务接续、需要采用什么行动,以及接续哪些业务到何种限度等等,都需要在此加以阐明。
还要为BCP团队中各个小组指定各自应当采用行动,每个小组要完毕指定任务。
BCP中这一某些也称为业务接续筹划(BRP)。
5.业务恢复
执行业务恢复程序在此加以阐明。
BCP这一某些也可称为劫难恢复筹划(DRP)。
这一某些筹划文档组织可以有诸各种方式。
一种方式就是简朴地列出所有恢复目的(按照RPO、RTO、目的服务器/网络等来列)。
依照每一目标进行筹划分解,同步明确相应团队/负责人以及任务。
尚有一种方式就是按部门来组织。
无论采用哪种方式,都应保证所有BCP目的都能覆盖到。
筹划这一某些必要编排得像一本操作手册,由一系列简朴明确指令构成,恢复团队完全可以按照这些指令进行恢复操作。
各种操作之间互有关系也必要加以明确阐明。
所有指令和阐明必要明白无误,以免因也许引起误解或不明了而导致时间损失。
6.复原
为业务运营复原原有场合应采用环节在此加以阐明。
需要标明每个团队/负责人责任和任务。
二、BCP测试
制定好BCP需要进行恰本地测试才干投入使用。
这一过程必要经常周期性地进行。
省略了这一过程就意味着BCP只能等劫难实际发生之后进行实地测试,这样做风险太大,恐怕任何一家公司都不敢做这种尝试。
规划一次BCP测试需要规定如下事项:
●测试脚本——将也许发生劫难定义为测试一种某些。
●测试筹划——定义检查程序、各种测试脚本、任务类型、任务参加者,例如说重要团队或者重要团队与预备团队混合行动。
简而言之,在测试BCP时,需要执行下列行动
●准备一份测试筹划,选取测试脚本,阐明预期要达到成果。
●执行该筹划
●记录测试成果
●评估测试成果,报告存在差距
●将测试成果和报告向团队发布
●确认需要做何改进以弥补差距
●培训团队
三、BCP维护
一种BCP必要周期性地加以检查和维护。
一旦有新系统、新业务流程、或者新商业行动筹划加入公司生产系统或者信息系统,引起公司整体系统发生变化时,就更应当强制启动这种检查程序。
除此之外,像联系人名单更改这样微小变动都也许触发BCP筹划更新。
每一次在进行这种检查程序时,最佳是与对BCP改进互相结合。
例如,在测试过程中发现问题、公司为了实现持续性对机构所作调节,或者在保持业务持续性测试时发现了更好行动方式和筹划等等。
因而,BCP维护应当是变化和改进结合与不断增进。
每一次对BCP筹划所作改动都应当及时告知所有BCP团队,并详细贯彻到每一次培训和测试过程中去。
最后,与业务持续性有关资源——人和设备——也会受到维护影响。
人员会通过培训和测试程序受到影响,设备会通过维护程序受到影响。
只有当这些资源始终处在良好状态,才干在危机发生时成为可靠和可依赖资源。
(完)