机房搬迁标准方案精编版Word文档格式.docx
《机房搬迁标准方案精编版Word文档格式.docx》由会员分享,可在线阅读,更多相关《机房搬迁标准方案精编版Word文档格式.docx(24页珍藏版)》请在冰豆网上搜索。
搬迁过程应满足各系统维护及业务部门高可靠性及高稳定性的要求。
5、可管理性原则:
搬迁过程应保证系统的可管理、实施过程的可管理、实施风险的可控制。
2.需求分析
2.1搬迁设备需求
本次搬迁包括本医院机房内所有的IT系统,迁移设备包括服务器、交换机、网络设备、安全设备等。
涉及搬迁的设备清单如下表:
现机柜配置:
共计8个机柜,具体如下:
序号
名称
数量
备注
1
综合布线柜
2
楼层骨干级联、外线接入、四楼水平配线、电话线路
网络设备柜
核心交换设备
3
视频前端柜
院内有线电视转换前端
4
移动终端机柜(32U)
中国移动线路接入及终端设备
5
医疗业务服务器柜
医疗业务系统
表2.1-1搬迁设备清单
原机柜位置
机型
设备用途
U数
电源接口数
序列号
A机
ciscocatalyst2960
1u
A12U
A18U-20U
AVAYAG450
3u
A22U-23U
dellPER710
2u
A25U-26U
IBMX3650M3
2.2搬迁时间要求
要求在2017年*月*日下午下班后开始搬迁,22日8:
00完成现机房内全部IT设备至新整改机房的搬迁,并恢复系统的正常运行。
其中网络部分要求在19日全部恢复正常运行。
3.搬迁实施方案
3.1总体方案
根据现场调研,目前机房内涉及搬迁的设备除个别设备外均处于在线运行使用状态,且旧、临时机房不考虑并行一段时间,因此必须在一次系统停机时间段内完成全部设备的搬迁工作。
即,从某年9月18日18:
00停机后,至某年9月22日12:
00前为搬迁时间窗口,在该时间段内完成旧机房所有IT设备至新整改机房的搬迁及系统恢复工作。
在某年9月18日之前,需要完成机房的建设(装修、强电、弱电、空调、消防、安防等)、机房网络系统建设(局域网、互联网、专网等)、机房主机系统建设(存储、核心业务备机系统)、现机房运行系统健康检查、物流准备(搬迁环境、路线考察,物流方案制定等)等前期准备工作。
在某年9月18日搬迁开始后,首先停止业务系统的对外服务,之后进行系统数据的备份,然后进行系统停机。
在某年9月19日12:
00前完成搬迁系统网络部分的恢复上线,使系统能够正常提供服务。
在某年9月22日8:
00前完成所有业务系统的恢复上线,使系统能够正常提供服务。
在搬迁完成后,进行系统功能测试,并安排技术人员进行现场值守,保障系统正常运行。
3.2搬迁前准备工作
3.2.1机房环境检查
机房在某年9月9日需要具备先期网络、主机系统调试条件,即配电(市电)、新购空调、装修、新不间断电池系统、新购机柜安装等调试相关工程必须完成,且剩余机房工程不能影响先期进入的网络、主机、存储等设备正常使用(配电、温湿度、洁净度),如需要进行产生对设备不良影响的操作时,需要提前告知,以便进行相应设备保护措施。
搬迁前机房必须建设完毕,并通过相关测试。
由于有一台20KUPS系统使用利旧设备,因此必须提前做好配电系统安装、调试、切换方案,保证配电系统的施工不会影响系统电力供应,并配备相应技术、设备资源。
使用这些机柜的综合布线系统配线架需要在当日进行安装,为了降低线路故障造成的影响,需要配备综合布线工程师及线缆测试、安装工具,以便及时修复。
落实机房通信线路准备情况(电信、联通,数据、语音,互联网、专网)。
责任人:
*工(甲方)、张工(乙方)
3.2.2搬迁设备统计
对搬迁涉及的设备进行统计,确认设备型号、实际安装位置、电源、数据线缆、IP地址、系统安装、应用安装、保修等信息,形成统计表和设备机柜安装图。
具体见附件一:
现机房设备安装情况统计表、附件二:
现机房设备系统情况统计表、附件三:
现机房机柜布局图、附件四:
现机房设备机柜安装图。
责任人:
3.2.3系统关联性分析
分析应用系统之间的相互联系、逻辑依存关系、数据交换情况、共用硬件设备情况等,从而得出停机顺序及开机顺序。
3.2.4系统拓扑结构
1
2
3
3.1
3.2
3.2.1
3.2.2
3.2.3
3.2.4
3.2.4.1搬迁前拓扑结构
现在运行系统拓扑图如下:
图3.2.4-1现在运行系统拓扑图
网络为单核心二层结构(核心、接入),专线路由器连接总部和医院楼,互联网为中国电信4M光纤。
3.2.4.2搬迁后拓扑结构
办公地点网络系统结构在现有的单核心基础上增加到双核心冗余,采用双核心冗余二层结构,其中一台路由器利旧,新购4台锐捷网络设备,一台路由器,两台核心交换机,一台网关行为安全设备,在出口增加链路负载均衡设备。
拓扑变动部分如下图:
图3.2.4-2办公地点系统拓扑图
3.2.5IP地址规划
本次搬迁不对系统IP地址进行调整,依旧采用原有地址。
3.2.6设备位置规划
机房机柜布局按照机房承重、最大限度利用空间、网络线缆连接最短、应用系统设备归类等原则,进行机柜及设备安装的重新规划。
因此搬迁设备需要全部下架,至新机房后重新安装。
3.2.7系统健康检查
3.2.5
3.2.6
3.2.7
3.2.7.1系统健康检查
对运行状态中的系统进行状态检查,查看设备外观,是否有故障报警灯;
查看系统运行情况,CPU、内存、磁盘使用情况,系统日志分析。
3.2.7.2开关机测试
进行系统开关机测试,一方面可以提前发现系统故障,尽早解决;
二是可以比较精确的估计系统停机时间,便于更好的掌握搬迁时间进度。
为了尽可能的规避风险,首先停止业务系统对外服务(关闭互联网、专网路由器,关闭用户接入交换机),对数据进行备份,然后停止应用、关机、开机、启动应用、测试业务系统。
开关机的顺序受到系统关联关系的影响,需要按照系统关联性分析结果进行顺序开关机。
3.2.8机房网络系统建设
在机房初步具备设备进场调试条件后,将现运行中的核心路由器、出口防火墙停机,搬运至新机柜,按照新办公地网络规划进行组网安装调试。
需要尽早落实ISP线路(互联网、专网)。
3.2.9新机房主机系统建设
在新机房初步具备设备进场调试条件后,服务器、网络等设备运抵现场,进行安装调试。
医院系统由维保厂家负责安装和调试。
安装完成后进行一次数据恢复测试,然后在新环境中进行恢复,验证方案的可行性。
*工(甲方)、张工(乙方)、维保厂家
3.2.10设备标签制作
按照设备在新机房的安装位置,制作设备标签及对应表。
标签一式三份,其中两份在设备下架时分别粘贴在设备及包装箱上,另一份留作备用。
设备标签对应表见附件八。
张工(乙方)
3.2.11搬迁物流方案
制定搬迁详细物流方案,包括现场环境保护、设备下架、清点、设备上架等过程。
方案制定后。
3.2.12搬迁通知
下达搬迁通知的前提条件:
●已经完成了网络扩展连接测试;
●系统统计及确认完成;
●改造后机房环境检查完成;
●已经获得相关部门进入机房的批准。
需要在搬迁前3天通知相关部门具体的搬迁时间和搬迁实施要求:
1、业务部门:
1)对业务影响
搬迁从某年9月18日18:
00开始,至某年9月22日8:
00止,其中实时投保类和实时核保类业务系统至某年9月19日12:
00止。
期间业务中断,无法使用。
2)需要配合的工作
验证测试和集成测试时需要业务参与配合测试。
3)向业务部门提供相关搬迁资料及方案
2、维护部门(甲方信息部)
3、工程实施部门(乙方、运营商、设备供货商、医院系统维护商)
4、维保厂商
1)程控交换机;
2)业务系统开发、维护厂商。
5、搬运公司(乙方)
3.3搬迁实施
3.3.1现场环境保护
由实施单位(乙方)对机房内部通道,及以上地点的地面、墙面、门及门把手等所有在作业中可能会受到破坏的区域进行保护作业。
在搬迁设备运抵新址后,开始对新址的环境保护作业。
作业时间:
现址某年9月19:
00~某年9月18日21:
00,共2小时
新址某年9月18日23:
30~某年9月18日24:
00,共半小时
3.3.2数据备份
停止业务系统对外服务(关闭互联网、专网路由器,关闭用户接入交换机),完成搬迁前最后一次系统数据备份。
某年9月18日18:
00~某年9月18日20:
3.3.3系统停机
系统按照先业务系统后网络系统的顺序进行业务停机。
先关停服务器、呼叫中心设备,然后关闭网络系统设备。
某年9月18日20:
3.3.4搬迁设备拆卸、清点
搬迁设备停机完成后,进行下架、打包工作,同时拆除*个配线柜中配线架,将这两个机柜随设备同时搬迁,用作该批设备在新机房的安装机柜。
UPS、空调系统也同时进行搬迁(原厂负责)。
设备打包完成后进行清点。
某年9月18日21:
00~某年9月18日23:
3.3.5监督设备搬运过程
设备清点完毕后从现址搬迁至新址,期间对设备的搬迁过程进行全程监督。
某年9月18日23:
30,共半小时
3.3.6目的地设备清点、拆包、上架
设备搬迁至新址临时机房后拆包、清点。
如果一些部件必须在设备加电后才能进行清点,则可以在安装完成后的检测时再进行剩余部件的清点。
之后,进行设备的上架工作。
某年9月18日24:
00~某年9月19日2:
3.3.7设备功能恢复
对完成上架的设备进行线缆(电源线、数据线)连接,按照应用系统关联关系,依序启动主机设备。
某年9月19日2:
00~某年9月19日3:
00,共1小时
3.3.8启动应用系统
设备加电启动完毕后,按照应用系统关联关系,依序启动业务应用。
某年9月19日3:
00~某年9月19日5:
3.3.9系统功能测试
测试网络功能是否正常,业务系统是否可以正常提供服务。
某年9月19日5:
00~某年9月19日12:
00,共7小时
3.4搬迁后系统保障
在系统搬迁完成后,为保障系统顺利运行,我们将提供技术支持服务。
主要服务内容包括:
●设备软/硬件维修:
✧发现设备软/硬件故障,协助用户报修
✧协助用户配合厂商完成维修工作
●处理用户临时技术服务要求:
✧临时故障处理
✧网络配置变更
✧系统配置变更
✧系统补丁安装
4.
方案关键步骤
4.1搬迁技术方案必须周密细致、切实可行。
重点是如何将生产服务器的搬迁与网络迁移方案有机结合。
网络的迁移是最基础的工作,只有在网络畅通的前提下才能考虑服务器的搬迁。
同时,网络迁移又势必造成维护重心的转移,最关键的应用必须随着网络的迁移而同步迁移。
因此线路割接、交换机调整等网络迁移操作不能与生产服务器的迁移分开而单独实施。
4.2提前预测搬迁风险。
根据多次的搬迁经验,我们总结出对于机房的搬迁主要存在四方面的风险,包括:
设备故障风险,即设备在搬迁过程中所出现的损坏;
操作风险,即线路割接、上联路由器切换、集中存储系统迁移、关键应用数据迁移(包括数据备份与恢复)、大型设备搬迁等均属于高风险操作,这些环节虽经反复论证在理论上可实施,但操作复杂且无法进行演练,在搬迁过程中很可能由于操作问题带来安全隐患;
人员风险,即在搬迁过程中现有技术人员既要负责搬迁工作,又要负责日常生产运行的维护管理,搬迁人员少或精力不够也容易产生风险;
其余不可预知风险,如系统的意外瘫痪、运营商线路问题等。
在预知这些风险以后才能提前做好预防工作。
4.3充分调动一切资源。
机房搬迁是一项极为复杂的工作,不仅涉及行内众多的技术人员,还涉及相关业务部门、服务商、搬运公司等各个方面的人员及各种搬迁所用的器材,其中任何一项都与搬迁进度紧密相关。
我们除了与各业务部门密切分工协作外,还提前召集所有相关的服务商进行了方案论证,并要求各服务厂商最大限度地准备技术支持人员和相关配件。
4.4采用流程化搬迁方式。
搬迁前,机房管理员专门绘制图纸,详细对比搬迁前后的情况;
提前规划各个机柜、各个网络设备的摆放位置,还要事先量好机器的具体尺寸,对所有设备进行编号,并填入登记表中之后到现场规划机器的具体摆放位置,力争最合理、最充分地利用机房的有效空间。
搬迁工作大致分为关机、拆卸、装箱、运输、装机、连线、验证等几个环节,由于每次搬迁都有严格的时间要求,而且涉及人员较多,所以搬迁要有条不紊、高效有序。
在搬迁之前,对所有设备信息进行了详细的统计,在此基础上形成了每次搬迁的搬迁调度表和搬迁流程表,交由各组掌握。
在搬迁过程中要求各组必须按照这两份表格进行,每完成一个环节,该组组长都必须要在搬迁调度表上确认后,下一环节才能继续进行。
按照这样的流程执行之后,我们每次搬迁都没有出现因各环节的衔接问题而耽误进度的情况,更没有出现误操作的现象。
4.5做好系统的充分验证。
根据每一批搬迁的特点我们提前与相关的业务部门沟通,由业务部门负责根据在变更时间内对业务的影响程度及时向外发布公告,同时,在系统恢复后进行系统验证。
5.
风险及应对措施
编号
风险
几率/影响
应对措施
项目组内部配合
中/中
制定详细的实施计划,明确各方职责
及时通报项目组进行协调
机房工程工期延误
高/大
加快机房工程进度
加快新机房网络、主机调试进度
搬迁需采购设备到货延期
低/大
密切关注并推动采购流程
调整系统技术方案/加快到货后调试进度
新机房综合布线系统故障
提前做好综合布线系统测试工作
准备布线工程师及工具,及时处理
使用其他线路或临时线缆替代
新机房设备出现故障
尽早接入线路,提前测试
准备相应备机、备件进行替代
安排设备商在搬迁时现场配合
6
业务系统单机运行环境
中/大
提前准备好安装相同业务系统的备机
做好系统数据备份
7
业务停止窗口超出计划
低/中
提前做好业务系统健康检查和测试
及时通报项目组调整计划
8
搬迁中硬件发生损坏
安排专业硬件平台专家
安排可能损坏硬件的相关现场备件或备机
设备运输保险
9
搬迁中软件故障
搬迁前健康检查
搬迁前进行备份
相关产品技术支持人员现场待命
10
备份介质损坏
使用可靠性高的介质备份
核心业务多拷贝备份
搬迁前进行备份恢复演练
11
设备运输过程中出现冷凝水珠
在机房内用防静电膜包裹设备
设备运抵现场后延迟加电时间
12
搬迁过程中设备丢失
设备清单多次多方核查
搬迁过程专人监控
13
搬迁过程中数据泄露
项目组成员签订保密协议
14
备机、备件损坏
低/小
备机到场后进行测试
多个相同备件
专业技术支持
15
备机、备件数量不够
优先满足核心业务系统
备件库有足够的备件
16
搬迁后设备无法正常开机
在搬迁前进行系统健康检查及开关机测试
使用备机、备件进行替代
按照应急预案处理
17
搬迁后应用系统异常
6.应急预案
6.1.1搬迁过程中设备硬件损坏
针对系统运输过程中硬件损坏,我们采用加强运输管理来规避此处风险。
另外对网络设备采用备份操作系统文件、配置文件进行应急,应用系统采用数据级备份进行系统应急,同时准备相应备机、备件,紧急时进行硬件或系统替换,并及时联系进行设备维修。
6.2设备开机无法正常运行
在搬迁前进行设备开关机测试及搬迁后设备开机过程中,如果发生设备无法正常运行故障时,按照下图所示流程进行处理:
图5.2-1设备维修流程图
附件一:
现机房设备安装情况统计表
A10U
B1U-4U
工控机
4u
B5U-8U
联想服务器
B9U-12U
研华工控机
B16U-17U
1(只配1个)
B19U-20U
C17U-19U
C37U
C38U-39U
cisco2821
C41U
ciscoASA5510
附件二:
现机房设备机柜安装图
附件三:
现有网络拓扑图
附件四:
现有网络设备连接图
设备名称
端口
IP地址
用途
GigabitEthernet0/0
GigabitEthernet0/1
Serial0/0/0:
FastEthernet0/1/0
FastEthernet0/1/1
Serial0/2/0
Serial0/2/1
Serial0/3/0
Serial0/3/1
cisco2960
FastEthernet0/1
FastEthernet0/2
FastEthernet0/5
FastEthernet0/11
FastEthernet0/12
FastEthernet0/13
FastEthernet0/14
FastEthernet0/16
FastEthernet0/19
FastEthernet0/21
FastEthernet0/22
FastEthernet0/23
FastEthernet0/25
FastEthernet0/33
FastEthernet0/34
FastEthernet0/35
FastEthernet0/36
FastEthernet0/37
FastEthernet0/38
FastEthernet0/39
FastEthernet0/42
FastEth