社保容灾项目建设方案.docx

上传人:b****3 文档编号:5472945 上传时间:2022-12-16 格式:DOCX 页数:50 大小:1.14MB
下载 相关 举报
社保容灾项目建设方案.docx_第1页
第1页 / 共50页
社保容灾项目建设方案.docx_第2页
第2页 / 共50页
社保容灾项目建设方案.docx_第3页
第3页 / 共50页
社保容灾项目建设方案.docx_第4页
第4页 / 共50页
社保容灾项目建设方案.docx_第5页
第5页 / 共50页
点击查看更多>>
下载资源
资源描述

社保容灾项目建设方案.docx

《社保容灾项目建设方案.docx》由会员分享,可在线阅读,更多相关《社保容灾项目建设方案.docx(50页珍藏版)》请在冰豆网上搜索。

社保容灾项目建设方案.docx

社保容灾项目建设方案

 

XXXX劳动保障信息系统容灾项目建设方案

 

 

AAAAA

二〇一〇年七月

 

一、项目背景

随着金保工程建设不断推进,信息化建设得到了广泛和深入的应用,劳动和社会保障系统各业务部门越来越依赖于信息系统进行业务流程和数据处理,其覆盖范围越来越广,涉及人群越来越多,信息系统的高可用性和数据的安全性就显得日益更为重要。

而实际上,信息系统的运行过程中充满了风险和威胁,很多不可测的譬如自然灾害、设备故障、误操作、病毒感染及黑客攻击等因素随时可能发生。

任何一个环节发生故障和灾难,都可能会导致业务无法正常进行,使得重要数据破坏和丢失,给各个部门造成损失、给民众造成不便,严重时甚至会造成恶劣的政治影响,影响社会稳定。

因此,作为一种保证数据安全和业务连续的重要技术和管理手段,容灾系统建设的必要性不言而喻。

近年来,国信办、人社部、我省以及我厅出台的有关信息化发展规划和信息系统建设要求的相关文件多次指出,各地要建立容灾中心,实现数据级容灾备份,有条件的应实现应用级容灾备份。

作为金保工程一期建设总体规划中的重要内容,2006年原劳动保障厅信息化领导小组研究决定建设省本级劳动保障信息系统容灾备份项目,省财政也已落实了项目专项建设经费。

信息中心根据前期的需求调研和相关项目建设要求,进行了容灾技术和设备的选型,提出了我省人力资源和社会保障厅劳动保障信息系统容灾项目的建设方案。

1

2

(一)政策依据

1.《2006-2020年国家信息化发展战略》(中办发【2006】11号)

提出“重视灾难备份建设,增强信息基础设施和重要信息系统的抗毁能力和灾难恢复能力”

2.《信息系统安全等级保护基本要求》

等级保护第三级关于数据安全及备份恢复的基本要求中提出“应提供异地数据备份功能,利用通信网络将关键数据定时批量传送至备用场地。

3.《关于印发劳动和社会保障信息化建设“十一五”规划的通知》(劳社部发〔2007〕15号)

“容灾中心应首先实现数据级容灾,条件成熟的,可实现应用级的容灾备份。

4.《关于进一步加强劳动保障数据安全管理的通知》(劳社厅〔2006〕31号)

“建立完备的数据维护、管理等工作机制,定期做好数据备份工作,有条件的地区要建立异地容灾中心,以全面、有效地防范和化解信息系统及数据库的风险。

5.《关于加强社会保险基础数据备份工作的通知》(社保中心函〔2008〕19号)

“各地在建立社会保险管理信息系统时,必须同时建立数据备份系统。

数据备份系统应至少提供本地数据备份与恢复的功能,有条件的地区还应提供异地(同城或其他地区)数据备份功能或建立容灾系统。

6.《浙江省国民经济和社会信息化“十一五”规划》(浙发改规划〔2006〕683号)(第四章第四节“强化信息安全保障”)

“建立信息安全保障体系,增强信息系统灾难备份与生存恢复能力。

7.《关于印发浙江省劳动和社会保障信息化建设指导意见的通知》(浙劳社计财〔2007〕17号)

“地级以上城市要建立异地容灾中心,实现数据级容灾备份,有条件的应实现应用级容灾备份。

8.关于印发《2010年浙江省人力资源和社会保障信息化工作要点》的通知(浙人社发〔2010〕101号)

“启动省本级灾备系统建设,提高数据的安全性和系统服务的连续性。

(二)技术标准

XXXX劳动保障信息系统容灾项目建设需遵循以下标准:

1.《重要信息系统灾难恢复规划指南》国信办 

2.《信息系统灾难恢复规范》(GB/T20988-2007)。

3.计算机通讯技术条件(GB9813-88)

4.信息技术设备的安全(GB4943-95)

5.电子计算机机房设计规范(GB50174-93)

6.遵循电子与电气工程师协会制定的计算机和电子工业参考标准

7.遵循国际参考标准化组织制定的各种国际技术参考标准

(三)信息系统现状

目前,XXXX主要有省级医疗保险、省级养老保险、金保工程联网监测、劳动监察、12333电话咨询服务和门户网站等劳动保障信息系统。

1

2

2.1

1.省级医疗保险系统

省级医疗保险系统定级为三级,是7×24小时实时系统,承载着1200家省级机关及企业20万人员医疗保险业务,系统包括参保管理、医疗保险基金征缴管理、医疗管理、稽核管理和查询、决策支持等功能,是所有业务系统中服务等级、业务连续性、数据重要性要求最高的系统。

省级医疗保险系统拓扑结构如图2所示:

图2:

省级医疗保险系统拓扑结构

目前,省级医保网络采用电信MPLSVPN链路作为主链路,网通MPLSVPN链路作为备份链路。

主链路采用OSPF协议,备份链路采用RIPV2协议,并且由运营商进行协议权值调整,实现链路冗余与自动切换。

中心端通过两条电信的MPLSVPN链路和两条网通的MPLSVPN链路接入省级医保网络;杭州市190多家“两定”机构通过电信MPLSVPN链路接入省级医保网络,其中三甲医院和新加入的“两定”机构共50多家采用了网通链路作为备份。

省级医疗保险系统部署了防火墙、IPS等安全设备,通过安全策略控制只允许“两定”机构接入访问中心端应用服务器的特定端口,并实时阻断非法攻击。

2台省级医疗保险系统服务器通过分区技术虚拟成4台,一组作为数据库服务器,采用ORACLE9iRAC架构,一组作为应用服务器,采用Tuxedo8.1中间件。

通过备份软件将每天做数据库逻辑全备份,每周三、周日做rman全备,每天做三次归档增量备份。

“两定”机构接入访问拓扑结构如图3所示:

图3:

“两定”机构接入访问拓扑结构

当前,省级医疗保险系统存在以下两点不足之处:

1.Tuxedo8.1中间件不能有效实现群集模式,无法做到服务负载均衡和节点自动切换,每次增加“两定”机构时,都需要对节点负载情况进行评估,人为指定优先连接节点。

2.由于应用程序无法有效支持OracleTAF(TransparentApplicationFailOver)连接方式,目前Tuxedo中间件和数据库之间采用了一对一的连接方式。

一旦某个Oracle节点出现故障,与其连接的Tuxedo应用无法访问数据库,将导致连接在该Tuxedo应用上的“两定”机构客户端不能访问省级医疗保险系统。

省级医疗保险系统采用主机集群软件和操作系统镜像功能,实现了双机集群和存储镜像,保证了本地高可用性。

但是备份数据只存放在本地,假如备份介质损坏或机房出现灾难,数据将丢失。

而且省级医疗保险系统涉及到参保人员的看病就医,要求7*24小时不间断运行,系统可靠性和实时性要求非常高,一旦系统出故障,参保人员无法刷卡就医,将造成严重的社会负面影响。

因此需要建立应用级容灾系统,保障数据安全和业务连续,以符合金保工程建设规划。

2.其他信息系统

XXXX其它重要信息系统有:

省级养老保险、联网监测、劳动监察、12333电话咨询服务和门户网站等系统。

省级养老保险信息系统定级为三级,业务连续性要求5×8小时,承载着全省行业养老保险和省属企业养老保险业务,主要承担着省本级养老金征稽、审核、发放,企业网上申报等功能,参保人员约35.6万人。

联网监测信息系统定级为三级,业务连续性要求5×8小时,实现省本级及全省医保、养老、工伤、失业数据联网监测、上传和统计分析。

每月由全省各统筹地区上传数据,汇总后上传人社部,用于统计分析和决策管理。

劳动监察系统业务连续性要求5×8小时,实现了劳动监察工作流程的信息化,提高劳动保障书面审查的工作效率和准确性,加强劳动保障监察系统的协同作战能力,同时建立用人单位劳动保障守法诚信档案,供社会各界和劳动者查询。

12333电话咨询服务信息系统定级为二级,人工业务连续性要求5×8小时,语音业务连续性要求7×24小时,运用电话、传真、电子邮件和网站等手段,提供劳动保障政策咨询、办事指南、信息查询,接受投诉举报建议,开展社会调查等服务。

查询数据来源于省级医疗保险和省级养老保险等系统的生产库以及自身的政策法规库。

门户网站信息系统定级为二级,业务连续性要求7×24小时,通过网上咨询、网上信息发布等功能,向社会公众发布劳动保障政策和最新信息。

是体现政府形象的窗口,是与公众交流的桥梁,也是政务公开、政策宣传的门户。

这些重要信息系统都做到了应用和数据库双机集群,省级养老保险信息系统数据存放在核心存储上,联网监测信息、劳动监察、省12333电话咨询服务、门户网站等信息系统数据存放在非核心存储上。

 

其拓扑结构如图1所示:

图1:

信息系统拓扑结构

(1)重要业务系统服务器和网络全部采用双机架构,同时建立了全冗余SAN网络架构。

(2)核心业务系统(省级医保和省级养老)数据存放在EMCDMX1000(6TB)上,通过操作系统镜像技术将数据镜像到H3CIX3240上,实现本地数据冗余保护;其它业务系统数据存放在另一台H3CIX3240(12T)上。

(3)通过NBU6.5备份软件实现数据D2D2T(磁盘阵列→虚拟带库→物理带库)备份,所有业务系统数据先备份到数据中心机房的H3CDL1000VTL(10T)上,每晚定时通过网络复制到2号楼机房DL1000上,在DL1000上数据保留一个月,月末数据归档至Adici2000物理带库,同时将相应磁带出库。

各系统数据存储及备份情况如下:

系统名称

存储分配

容量

备份数据容量

每周增长容量

备份情况

省级医疗保险系统

2500G

53.5G

exp:

0.2Grman:

2G*2

arc0.4G

每天export,每周2次全库RMAN热备,每天3次归档增量,每月初备份出库。

省级养老保险系统

1500G

5.1G

0.06G*7

每天export,每月初备份出库。

联网监测信息系统

1400G

38.5G

0.5G*7

联网检测系统每天做export备份,每月初备份出库。

劳动监察系统

300G

3.8G

0.01G*7

劳动监察系统每天做rman全备,每月初备份出库。

12333系统

300G

1G

0.001G*7

数据库每天做export备份

门户网站系统

100G

40.2G

0.1G*7

文件系统备份每周一备份,每天增量;

数据库每天做rman全备

系统存放的数据涉及到参保单位和个人的劳动保障信息,一旦数据丢失或损坏,将造成重大的社会影响。

因此,建立异地数据备份系统、保障数据的安全性势在必行。

二、建设目标

建立同城异地(60公里以内)的容灾中心,建立生产中心和容灾中心的双活中心架构;省级医疗保险系统实现应用级容灾,所有信息系统实现异地数据备份容灾。

各信息系统具体容灾建设目标如下:

应用系统

容灾目标

省级医疗保险系统

实现应用级容灾,生产中心故障后,应用自动切换到备份中心,不需人工干预。

做到零数据丢失,零切换时间,

达到容灾等级国信办6级要求(实现数据零丢失,可实时无缝切换,做到数据远程实时备份,备份介质场外存放,最终用户可通过网络同时接入生产、容灾中心等);

省级养老保险系统

通过备份软件进行本地数据备份,并将数据复制到容灾中

心,实现异地数据备份容灾,生产中心故障后,采用备份

恢复技术能使数据恢复到最近一次备份点,达到容灾等级

国信办3级要求(实现备份介质场外存放,每天利用通信

网络将关键数据定时批量传送至备用场地,有满足信息系

统和关键业务功能恢复运作要求的场地等);

联网监测信息系统

劳动监察系统

12333系统

门户网站系统

三、建设原则

本次XXXX劳动保障信息系统容灾建设项目应遵循以下原则:

1.利旧性、合理性

需充分利用和保护原有投资,合理利用原有设备,提高再利用率,避免造成资源浪费,同时减少新系统建设的投入。

2.开放性、扩展性

选择开放的容灾技术,可以较好地兼容各种主流品牌软硬件;具有很好的扩展性,适合未来几年的业务发展需求。

3.先进性、成熟性

立足先进技术,所选用的容灾软件和硬件设施要求较为成熟,性能稳定,在业界有着广泛应用,无需二次开发,即可满足用户复杂的业务环境,并能提供强有力的技术支持服务。

 

4.高可靠、高性能

系统的设计应采用冗余设计,实现线路冗余、设备冗余、数据异地容灾等,从而改善系统整体性能,保障系统的高可靠运行,增强业务的持续性。

5.易维护、易管理

选用的容灾技术和设备需具备易管理和易维护的特性,本项目中的容灾软件、服务器、存储、负载均衡设备和网络设备必须支持远程维护和管理功能,易于维护,易于监管。

四、容灾系统建设方案

(一)建设思路

根据项目建设目标:

建立同城异地(60公里以内)的容灾中心,省级医疗保险系统实现生产中心、容灾中心双活架构的应用级容灾;所有信息系统数据实现异地数据备份容灾,我们提出容灾系统建设思路具体如下:

1.租用IDC机房作为容灾中心机房,同时租用两条运营商裸光纤,采用CWDM链路复用技术实现生产中心与容灾中心之间IP网络和SAN网络互通。

2.服务器、数据库和中间件采用同构方式,在容灾中心部署与生产中心相同品牌、相互兼容的服务器和平台软件。

存储系统采用同构或异构方式,通过第三方容灾软件实现生产中心和容灾中心的数据复制,做到数据实时同步。

3.在生产中心和容灾中心均部署负载均衡设备,实现应用服务器的负载均衡,“两定”机构网络、前置机的配置无需进行任何修改,实现无缝切换。

并通过其动态智能探测功能,保证应用的高可用性。

4.租用运营商链路并由运营商调整路由协议权值,保障生产中心和容灾中心的链路负载均衡。

部署防火墙、入侵防御系统实现“两定”机构接入的访问安全控制。

5.通过备份软件将所有信息系统的数据在生产中心备份,同时每天定时复制到容灾中心的虚拟磁带库上,实现数据的异地备份保护。

(二)建设内容

3.应用级容灾系统建设

(1)系统架构

图4:

系统架构

(2)系统建设

XXXX劳动保障信息系统容灾建设分为7个内容,分别是租用容灾机房、网络层建设、主机层建设、存储层建设、数据库层建设、应用层建设和容灾集中管理平台建设。

1.租用容灾机房

由于自建机房存在周期长,投资大,维护不方便等不利因素。

因此本次容灾建设租用IDC机房作为容灾中心机房,机房环境要求如下:

电力系统:

保障充足、持续的电力供应,保证99.99%的持续供电率。

双路大功率市电冗余供电;双路大功率UPS电源不间断供电,配有充足后备电池,蓄电池容量在满负荷情况下可持续供电2小时;双备份大功率柴油发电机组提供可靠的后备供电能力;每个机架都保证双路供电。

空调系统:

配有大功率机房专用空调,采用下送风、上回风方式;机房要求恒温、恒湿,温度:

夏季23±2℃,冬季20±2℃;相对湿度:

45%-65%温度。

消防系统:

配有火灾自动报警系统、自动气体灭火系统,保证在第一时间发现火灾隐患,在不中断电源的情况下可紧急灭火,灭火气体对设备本身不会造成任何损害。

安全系统:

监控系统配有彩色摄像机对设备安全、防盗防火及人员出入提供7×24小时全天候全方位机房监控。

电子门禁系统采用计算机控制的电子感应锁及IC卡,自动识别客户身份并对客户进入时间等详细资料进行记录。

防止任何无关人员进入,保证机房空间的私密性。

标准机架:

服务器机架48U、19英寸,尺寸600X1200X2200(mm)

综合布线系统:

通信电缆布放整齐、绑扎牢固,通信电缆和电力电缆分开走不同的桥架,安装有ODF、DDF、MDF配线架。

防震系统:

机架具有防震支撑,能够避免来自各个方位的任何细微和剧烈震动,8级以上抗震能力。

容灾系统建设需要租用3个标准机柜:

1个机柜用于放置主机设备,1个机柜用于放置网络设备,1个机柜用于放置存储设备。

2.网络层建设:

配置4台CWDM设备,租用两条裸光纤,通过链路复用技术实现生产中心和容灾中心之间IP网络和SAN网络数据的传输。

配置4台32口SAN交换机,用于容灾中心SAN网络建设,实现与生产中心SAN网络的高速互联。

配置1台高端路由器,用于容灾中心网络搭建。

配置1台防火墙,用于对服务器访问的安全控制。

3.主机层建设

容灾中心配置一台高性能主机与生产中心两台主机通过StorageFoundation的VCS远程集群功能实现主机的高可用性。

生产中心、容灾中心任意一台或两台主机出现故障,业务都不会中断。

4.存储层建设

容灾中心配置1台高性能存储,与生产中心存储通过StorageFoundationforOracleRAC中的卷镜像技术实现数据跨阵列远程镜像,生产中心、容灾中心任意一台存储出现故障,业务都不会中断。

系统数据通过备份软件,集中备份到生产中心VTL上,定时将备份数据复制到容灾中心VTL上,实现数据的异地备份;生产中心配置一台物理磁带库,将原有的ADIC磁带库放在容灾中心,用于数据离线出库。

5.数据库层建设

生产中心和容灾中心3台数据库主机通过ORACLERAC技术实现跨生产中心和容灾中心3节点RAC,实现ORACLE数据库系统的高可用性;生产中心、容灾中心任意一个或两个数据库实例出现故障,业务都不会中断。

6.应用层建设

生产中心和容灾中心各配置1台负载均衡设备,实现应用的负载均衡。

7.容灾集中管理平台建设

运用容灾管理软件对应用级容灾系统进行统一管理,实时监控系统的运行状态,确定Oracle、卷组、文件系统等运行是否正常,并自动实现报警。

(3)系统部署

1)主机和存储系统部署

根据浙江省社会保障“一卡通”总体建设方案(异地就医部分),省本级医保系统软硬件支撑平台将进行升级改造,改造后数据库主机配置要求为:

8CPU,32G内存;应用主机配置要求为:

8CPU,32G内存,分为两个分区;存储配置要求为:

32G缓存,8TB裸容量。

本次容灾建设项目中的主机、存储将采用与省本级医保系统软硬件平台升级建设项目相同档次的设备,具体配置要求如下:

设备

描述

数量

主机

配置16CPU/64G内存/6*146GHD/8*1000M光纤网卡/2*1000M以太网卡/4*4GBHBA卡/3物理分区/控制台

1

存储

配置28*300G15kFCHD/双控制器/双电源/32GCache

1

主机和存储部署如图5所示:

图5:

主机和存储部署

容灾中心主机分成三个分区:

一个作为容灾中心医保数据库服务器,一个作为容灾中心医保交易服务器,一个作为容灾中心医保应用服务器,实现主机层容灾。

容灾中心存储与生产中心存储通过第三方容灾软件实现生产中心和容灾中心的数据镜像,做到数据零丢失。

2)容灾软件部署

此次容灾项目建设的核心就是容灾软件的部署,容灾软件的部署涉及到主机、存储和数据库层面。

采用StorageFoundation跨阵列磁盘镜像技术来实现同城应用级容灾,实现生产中心与容灾中心在线数据完全同步,保证了数据零丢失,应用零切换。

具体部署如图7所示:

图7:

容灾软件部署

StorageFoundationforOracleRAC在各层次部署相应的组件来实现主机、存储和数据库层面容灾,具体部署如下:

a)RemoteMirror:

利用RemoteMirror功能,在生产中心和容灾中心的两台存储之间形成跨阵列镜像;生产中心、容灾中心任意一台存储出现故障,业务都不会中断。

镜像进程高度可控,可以随时暂停、继续、终止,并能指定控制在一定的性能范围内实施数据镜像。

故障修复时通过增量数据同步功能,对系统的影响极小。

b)DMP(Dynamic):

采用SymantecDMP组件(动态多路径)实现主机对存储的多路径读写;在I/O路径出现故障时,确保可以访问存储设备,保证数据的可用性;通过I/O路径优化算法改进I/O性能。

其主要功能如下:

a.光纤多通道的Fastfailover快速切换;

b.I/O路径优化,提供六种算法:

平衡路径,循环,最小队列长度,自适应,优先级,单个活动路径;

c.自动发现光纤路径;

d.动态监测多路径的状态;

e.异构环境支持,支持所有主流的磁盘阵列。

c)CVM(ClusterVolumeManager):

在集群环境下,采用CVM使所有节点能迅速识别磁盘组(DISKGROUP)和卷(VOLUME)信息,实现双中心三台数据库主机同时共享数据卷。

d)CFS(ClusterFileSystem):

通过部署CFS,将相同的文件系统同时MOUNT到多个节点上,实现双中心三个数据库节点同时共享文件系统。

e)ODM(OracleDiskManager):

采用SymantecODM替换OracleODM实现Oracle对磁盘的读写,提升文件系统的性能;

f)VCS(VeritasClusterServer):

是Symantec集群软件,采用SymantecVCS控制启动和停止RAC组件层。

数据写入流程如图6所示:

图6:

数据写入流程

数据读取流程如图7所示:

3)数据库部署

采用OracleRAC技术实现生产中心和容灾中心三节点数据库集群,根据服务器的资源使用情况,实现业务的自动负载均衡,资源的合理利用。

数据库部署如图8所示:

图8:

数据库部署

RAC允许多个实例同时访问同一数据库(存储器)。

它通过允许系统进行扩展,提供了容错、负载均衡和性能效益,同时由于所有节点访问同一数据库,因此一个实例的故障不会导致无法访问数据库。

OracleRAC的核心是共享磁盘子系统。

集群中的所有节点必须能够访问集群中所有节点的所有数据、重做日志文件、控制文件和参数文件。

数据磁盘必须在全局范围内可用,以便允许所有节点访问数据库。

每个节点拥有自己的重做日志和控制文件,但是其他节点必须能够访问这些文件,以便在系统故障时恢复该节点。

4)负载均衡设备部署

通过部署负载均衡设备实现应用服务器自动切换,负载均衡设备对服务器作负载均衡时,主要包括以下几个过程:

a)截获和检查分析流量:

保证只有合适的数据包才能通过;

b)服务器监控和健康检查:

随时了解服务器群的可用性状态;

c)负载均衡:

通过各种策略或负载均衡算法将访问请求导向到合适的服务器;

d)会话的保持:

通过会话保持,保证一系列相关的会话不会被负载均衡到不同的服务器上。

负载均衡设备部署如图9所示:

图9:

负载均衡设备部署

本次容灾建设将在生产中心和容灾中心各部署一台负载均衡设备,采用A/S模式(生产中心为Active,容灾中心为Standby)。

在负载均衡设备上配置2个VIP地址(对外虚拟服务IP地址),分别为原有生产中心两台Tuxedo应用服务器的IP地址,“两定”机构接入访问无需任何改变。

将生产中心和容灾中心三台Tuxedo应用服务器加入到负载均衡设备服务池,实现资源统一合理分配。

Tuxedo应用服务器与Oracle数据库仍旧采用一对一的连接方式,同时通过负载均衡设备的服务状态智能探测功能,实现Tuxedo与Oracle服务可用性一对一绑定。

负载均衡设备发现任何一个Oracle实例出现故障,都会从服务池中逻辑删除该Oracle对应的Tuxedo服务,保证后续的连接请求不会被分配到该Tuxedo服务器上,从而解决了原有的单一Oracle节点故障引起的Tuxedo应用不可用。

由于采用的是C/S应用架构,应用程序由于其自身的会话原因,在切换服务后,单纯的刷新可能无法重新连接服务器。

对于该问题的处理是:

只需重启客户端软件或者电脑,连接表得到更新,就会释

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1