xx银行综合业务系统应急操作手册.docx
《xx银行综合业务系统应急操作手册.docx》由会员分享,可在线阅读,更多相关《xx银行综合业务系统应急操作手册.docx(7页珍藏版)》请在冰豆网上搜索。
xx银行综合业务系统应急操作手册
xx银行
综合业务系统应急操作手册
V1.1
制定日期:
2013年7月22日
编号
修订内容
修订日期
版本号
修订人
批准人
1.
2.
3.
4.
5.
一、总则
(一)编写目的
综合业务系统主要负责处理我行的核心业务处理,包括:
储蓄、对公、卡业务、结算业务、贷款业务、客户信息管理、中间业务、网点业务、日终处理等业务。
综合业务系统的稳定性直接影响我行的业务正常进行,关系我行的品牌形象,因此提升综合业务系统的稳定性,提高系统异常的应急处理能力,是当前最重要的一项维护工作。
编写此文档目的规范我行的综合业务系统应急处理方法,严格执行银监会的银行系统应急处理要求。
(二)编写依据
依据《GB/Z20988信息系统灾难恢复规范》、银监会《银行业重要信息系统突发事件应急管理规范(试行)》等有关法规和标准,以及《xx银行信息系统应急预案》,制定本文档。
(三)范围
本文档适用于xx银行综合业务系统突发事件的应急处置。
(四)编写原则
本应急预案的工作原则为:
以人为本,预防为主;统一领导,分级负责;依法规范,加强管理;快速反应,协同应对。
二、组织机构与职责
(一)决策机构
xx银行综合业务系统应急处置管理的领导决策小组,由高级管理层和相关部门总经理组成,人员名单如下表所示:
序号
姓名
职务
应急角色
领导决策小组所担负的职责包括:
Ø审核并批准应急处置策略和计划
Ø负责应急指挥、组织协调和过程控制
Ø批准应急处置计划的启动执行
Ø宣布应急状态降级或解除
Ø向董事会和高级管理层就应急处置进展情况和事后总结进行报告
Ø组织应急响应计划的测试和演练
(二)执行机构
xx银行综合业务系统应急处置管理的执行处置小组,由银行卡部、科技信息部骨干组成,人员名单如下表所示:
序号
姓名
职务
应急角色
执行处置小组所担负的职责包括:
Ø实施综合业务系统的具体应急处置工作
Ø事件发生后的外部协作
Ø对事件业务影响情况进行分析和评估
Ø收集分析应急处置过程中的数据信息和日志
Ø向应急领导小组报告应急处置进展情况和事态发展情况
三、事件分级及汇报机制
(一)事件分级
本文档仅关注直接影响综合业务系统的局部事件,其它影响范围较大的全局性事件,如火灾、不可抗自然灾害等,均参照我行现有信息系统重大事件管理的有关规定进行处置。
根据我行应急预案相关定义,故障对业务的影响程度从大到小分Ⅴ、Ⅳ、Ⅲ、Ⅱ、Ⅰ五级。
Ⅴ级故障:
对我行业务产生特别重大影响,全行柜面业务无法正常开展且预计一小时内无法正常修复。
Ⅳ级故障:
对我行业务产生特别重大影响,全行柜面业务无法正常开展但一小时内能恢复生产业务。
Ⅲ级故障:
对我行业务产生重大影响,一个以上(含)分行或两个以上(含)支行柜面业务无法正常开展,或我行银联系统故障,或办公核心网络发生故障导致办公系统全面故障。
Ⅱ级故障:
对我行业务产生一般影响,某个支行柜面业务无法正常开展或大小额支付系统等重要的中间业务无法正常进行。
Ⅰ级故障:
对我行业务产生轻度影响,某一支行部分柜台无法进行正常的综合业务处理或某一分支行的办公系统出现故障。
(二)汇报机制
四、系统环境
(一)系统架构图
(二)环境配置
主要硬件基本信息
资产名称
服务器类别
操作系统
IP地址
区域
操作系统:
数据库:
中间件:
(三)系统目录结构
前后台目录结构
前后台用户
生产环境目录
主要文件
主要功能
五、主机异常处理
(一)故障说明
1、核心主机出现严重故障,导致全行综合业务系统无法运行,全行临柜综合业务无法办理;
2、全部或部分业务前置机出现故障,导致全行所有网点或部分网点临柜综合业务无法办理;
综合业务系统相关主机:
主机描述(机型)
IP地址
主机名
存储
软件
备份方式
(二)环境说明
(三)应急处置流程
1、主机电源故障
2、主机网卡故障
3、主机操作系统故障
4、综合业务前置机故障
5、主机HA切换
6、服务器重启
六、存储故障
(一)故障说明
核心存储设备故障是指核心主机连接的存储设备发生故障,导致核心数据库无法存取数据,临柜综合业务无法办理。
(二)环境说明
(三)应急处置流程
1、存储控制器故障
2、单个磁盘故障
3、存储电源故障
七、数据库&中间件异常处理
(一)故障说明
(二)环境说明
(三)应急处置流程
1、主机数据库故障
2、主机中间件故障
3、数据库锁表处理
4、数据库常用命令
八、应用异常处理
(一)故障说明
核心应用故障是指核心后台程序或者前台程序出现故障,一个或多个网点临柜无法办理业务。
(二)应急处置流程
1、主机服务检查
2、服务启动和停止
九、供电异常处理
(一)故障说明
供电故障是指核心相关服务器所在机柜PDU故障或者机房UPS供电出现故障无法持续供电的情况。
(二)应急处置流程
十、灾备切换和恢复
核心系统的灾备切换包括灾备存储的切换和灾备主机的切换。
(一)灾备存储切换
当生产机房无法正常使用或生产机房两台存储同时宕机时,可以进行灾备存储的切换。
当生产主机宕机或者生产机房SAN交换机宕机但存储正常时,无需进行切换。
.1、应急操作流程
(1)第一时间通知IBM的工程师,以便他们尽快赶到现场或者进行电话支持。
(2)检查存储的状态,是否有异常的灯亮起以及宕机
(3)检查光纤链路光纤交换机的状态
(4)运维中心负责人向分管行领导及信息技术部总经理汇报故障情况;
2、PPRCFailover/Failback切换步骤
3、具体切换恢复步骤
(二)灾备主机切换
附件:
附件1:
相关联系人员
附件2:
常用命令