集群及双机热备.docx

上传人:b****7 文档编号:23778813 上传时间:2023-05-20 格式:DOCX 页数:7 大小:30.25KB
下载 相关 举报
集群及双机热备.docx_第1页
第1页 / 共7页
集群及双机热备.docx_第2页
第2页 / 共7页
集群及双机热备.docx_第3页
第3页 / 共7页
集群及双机热备.docx_第4页
第4页 / 共7页
集群及双机热备.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

集群及双机热备.docx

《集群及双机热备.docx》由会员分享,可在线阅读,更多相关《集群及双机热备.docx(7页珍藏版)》请在冰豆网上搜索。

集群及双机热备.docx

集群及双机热备

集群系统实现方案详解

有一种常见的方法可以大幅提高服务器的安全性,这就是集群。

  1、集群的基本概念

  Cluster集群技术可如下定义:

一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。

此单一系统为客户工作站提供高可靠性的服务。

  大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。

Cluster必须可以协调管理各分离的组件的错误和失败,并可透明地向Cluster中加入组件。

  一个Cluster包含多台(至少二台)拥有共享数据存储空间的服务器。

任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。

每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。

  Cluster内各节点服务器通过一内部局域网相互通讯。

当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。

当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。

当以上任一故障发生时,客户将能很快连接到新的应用服务上。

  2、集群的硬件配置

  镜像服务器双机

  集群中镜像服务器双机系统是硬件配置最简单和价格最低廉的解决方案,通常镜像服务的硬件配置需要两台服务器,在每台服务器有独立操作系统硬盘和数据存贮硬盘,每台服务器有与客户端相连的网卡,另有一对镜像卡或完成镜像功能的网卡。

  镜像服务器具有配置简单,使用方便,价格低廉诸多优点,但由于镜像服务器需要采用网络方式镜像数据,通过镜像软件实现数据的同步,因此需要占用网络服务器的CPU及内存资源,镜像服务器的性能比单一服务器的性能要低一些。

  有一些镜像服务器集群系统采用内存镜像的技术,这个技术的优点是所有的应用程序和网络操作系统在两台服务器上镜像同步,当主机出现故障时,备份机可以在几乎没有感觉的情况下接管所有应用程序。

因为两个服务器的内存完全一致,但当系统应用程序带有缺陷从而导致系统宕机时,两台服务器会同步宕机。

这也是内存镜像卡或网卡实现数据同步,在大数据量读写过程中两台服务器在某些状态下会产生数据不同步,因此镜像服务器适合那些预算较少、对集群系统要求不高的用户。

  硬件配置范例:

・网络服务器两台

・服务器操作系统硬盘两块

・服务器数据存贮硬盘视用户需要确定

・服务器镜像卡(部分软件可使用标准网卡)两块

・网络服务网卡两块

双机与磁盘阵列柜

  与镜像服务器双机系统相比,双机与磁盘阵列柜互联结构多出了第三方生产的磁盘阵列柜,目前,豪威公司、精业公司等许多公司都生产有磁盘阵列柜,在磁盘阵列柜中安装有磁盘阵列控制卡,阵列柜可以直接将柜中的硬盘配置成为逻辑盘阵。

磁盘阵列柜通过SCSI电缆与服务器上普通SCSI卡相连,系统管理员需直接在磁盘柜上配置磁盘阵列。

  

  双机与磁盘阵列柜互联结构不采用内存镜像技术,因此需要有一定的切换时间(通常为60――180秒),它可以有郊的避免由于应用程序自身的缺陷导致系统全部宕机,同时由于所有的数据全部存贮在中置的磁盘阵列柜中,当工作机出现故障时,备份机接替工作机,从磁盘阵列中读取数据,所以不会产生数据不同步的问题,由于这种方案不需要网络镜像同步,因此这种集群方案服务器的性能要比镜像服务器结构高出很多。

  双机与磁盘阵列柜互联结构的缺点是在系统当中存在单点错的缺陷,所谓单点错是指当系统中某个部件或某个应用程序出现故障时,导致所有系统全部宕机。

在这个系统中磁盘阵列柜是会导致单点错,当磁盘阵列柜出现逻辑或物理故障时,所有存贮的数据会全部丢失,因此,在选配这种方案时,需要选用一个品质与售后服务较好的产品。

  硬件配置范例:

・网络服务器两台

・服务器操作系统硬盘两块

・第三方生产的磁盘阵列柜一台

・磁盘柜专用SCSI电线两根

・磁盘阵列柜数据存贮硬盘视用户需求确定

・网络服务网卡两块

除此之外,一些厂商还有更优秀的技术的解决方案,比如HP。

  HP双机双控容错系统

  HPNetServer为双机双控容错系统提供了高品质和高可靠的硬件基础。

  HP双机双控容错系统结合了HP服务器产品的安全可靠性与Cluster技术的优点,相互配合二者的优势。

  硬件配置范例:

・HPL系统的网络服务器两台

・服务器操作系统硬盘两块

・HP硬盘存贮柜(SS/6,RS/8,RS/12)一台

・磁盘柜专用SCSI集群适配电缆两根

・磁盘柜数据存贮硬盘视用户需求确定

・HP集群专用阵列卡两块

・网络服务网卡两块

  HP光纤通道双机双控集群系统

  光纤通道是一种连接标准,可以作为SCSI的一种替代解决方案,光纤技术具有高带宽、抗电磁干扰、传输距离远、质量高、扩展能力强等特性,目前在FC-AL仲裁环路上可接入126个设备。

  光纤设备提供了多种增强的连接技术,大大方便了用户使用。

服务器系统可以通过光缆远程连接,最大可跨越10公里的距离。

它允许镜像配置,这样可以改善系统的容错能力。

服务器系统的规模将更加灵活多变。

SCSI每条通道最多可连接15个设备,而光纤仲裁环路最多可以连接126个设备。

  光纤集群系统组成:

  HP光纤集群系统硬件设备包括有两台HP服务器(需支持光纤卡,目前有LC2000、LH3000、LH4、LH6000、LT6000、LXr8000、LXR8500)及光纤适配卡,可以使用RS/12FC光纤磁盘阵列柜,需另加一对或两对网卡用于心跳检测和与客户端连接。

在配置过程中还需另外选配光纤卡到光纤存贮设备的光纤电缆。

  硬件配置:

・HPL系统的网络服务器两台

・服务器操作系统硬盘两块

・HP光纤阵列存贮柜(RS/12FC)一台

・光纤磁盘柜专用光纤电缆两根

・光纤磁盘柜数据存贮硬盘视用户需求确定

・HP光纤适配卡两块

・网络服务网卡两块

  3、集群的软件配置

  基于NT平台的集群软件

  microsoft的MSCS,也有许多第三方的专业软件公司开发的集群软件,如豪威的DATAWARE,VINCA公司的STANDBY SERVER,NSI公司的DOUBLE-TAKE。

  MS WolfPack的特点

  MSWolfPack是MS Clusterserver的别称,是微软针对Cluster技术研制开发的双机软件。

它集成在NTSERVER上,支持由二台机器组成的双机系统,提供一种高可用且易管理的应用环境。

  主要特点:

・自动检测和修复服务器或应用程序的错误

・可实现对服务器中应用程序的切换

・可通过TCP/IP连接各种客户端,如MS-DOS、WINDOWS 3.X/9X/NT,AppleMacintosh、UNIX等

・生产主机无需人工干涉即可自动恢复数据并接管任务

・易管理性:

・可自动审核服务器和应用程序的工作状态

・可建立高可用性的应用程序、文件共享、打印请求等

・可灵活设置应用程序和数据的恢复策略

・简单操作即可进行应用程序的离线,重新再线,服务器间的迁移。

  目前,WINDOWS2000AdvancedServer与WINDOWS2000DataCenterServer都集成有更先进集群技术。

  其它的网络操作系统平台上也有许多集群软件,比如:

  基于novell平台的集群软件有NovellHAServer、NovellSFTIII

  基于scoUNIX平台的集群软件有Sentinel集群软件

  基于Linux平台的集群软件有TurboCluster

给服务器找个替身实战双机热备不间断

  系统故障可能由各种原因引起,服务器若想恢复正常可能需要10分钟、几小时甚至几天。

  我原来的单位作为北京市某区的网络核心,针对不同的业务部门的应用平台就有20多个。

而重要部门的外网网站和内部的OA也有20余个。

其中政府网络自动化办公平台搭建于2001年初,经过了5年的升级改造后,现在运行的已经是第四版了。

这个平台不但作为区内所有政府单位、各委办局、街道办事处等等部门的信息通讯平台,同时也是整个公文的流转载体,地位之重可想而知。

  给服务器找个替身

  某日,该区的核心服务器出现严重故障,导致数据丢失。

我作为一名有十年工作经验的信息主管,对于这台服务器几年内遇到的故障问题可谓是胆战心惊,想必大家也都清楚一个网络管理的常识,那就是使用率越高,故障率也越高。

  在修复服务器之后的一个月,单位派我参加网络安全的学习班。

其实我早就听说过“双机热备”这个名词,不过真正了解它还是得益于学习班中的“保障业务连续性”的内容。

  很多厂商为我们解释的“零”时间转换,其实是不可能做到的,从实际应用的效果当中,或者从一些真实的案例中我们不难看到这只是一种相对的“零”时间。

一般的系统能够保持1分钟进行主机转换已经是一种比较好的设计了。

  双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题,但在实际应用中,可能会出现多台服务器的情况,即服务器“群集”。

(这里我需要说明一下,根据Cluster的正确翻译我们应当将这种多服务器正是命名为——群集,而不是集群)如果我们更加具体的解释双机热备系统,那么就可以理解为Active(活动)与Standby(备用)方式存在的两台服务器,它们共同使用一个共享的存储设备。

在同一时间内只有一台服务器运行,当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(通常叫做心跳诊断)将备用服务器激活,保证应用在短时间内完全恢复正常使用。

  准备部署双机热备系统

  从学习班回来后,我们单位按例召开每月的工作交流会,借助我区建立安全信息平台的计划,我提出了建立双机热备的必要性。

我们系统部每天接到的系统故障保修电话不下30个,这些故障类型繁多,如设备故障、操作系统故障、软件系统故障等等。

  网络操作人员和系统管理员人为的恢复服务器正常可能需要10分钟、几小时甚至几天。

而如果技术人员不在现场,则恢复服务的时间就更长了。

这次OA的故障实属特殊,可能有些系统工程师干一辈子都遭遇不到这样的情景:

RAID5磁盘阵列中的两块硬盘同时掉线;备份系统刚刚迁移到新的机房。

当时感到的压力是从来没有遇到过的,在感谢IBM工程师及时修复的同时,我感到建立更加完善的保障体系更加重要。

  大家都清楚一个道理:

服务器故障率要比交换机、存储设备的故障高得多。

原因很容易理解,服务器是比交换机、存储设备复杂得多的设备,它既包括硬件,还要包括操作系统合应用软件系统。

决定是否使用双机热备,正确的方法是要分析现有系统的重要性以及对服务中断的容忍程度,以此来决定是否使用双机热备。

  不仅设备故障可能引起服务中断,而且软件方面的问题也可能导致服务器不能正常工作。

决定采用双机热备系统的“最终条件=用户容忍时间-系统恢复时间”,根据以前的调查表,和每天接到的咨询电话,OA的用户端最长的等待时间不超过一小时,而我们要从备份中恢复的最快时间要超过6小时。

由此可见,建立双机热备系统势在必行。

  选择部署双机热备的方式

  报告也打了,资金也批了,到了开始组建阶段我到犯了难。

我了解到双机热备有两种实现模式,犹豫的原因是到底选择哪种方式建立?

一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。

  存储共享式

  对于这种方式,采用两台服务器,使用共享的存储设备(磁盘阵列柜或存储区域网SAN)组成。

在对外提供服务过程中,两台服务器将以一个虚拟的IP地址对外提供服务,当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。

由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。

  纯软件方式

  简单地讲,纯软件方式就是通过镜像软件,将数据实时复制到另一台服务器上,这样同样的数据就在两台服务器上各存在一份,如果一台服务器出现故障,可以及时切换到另一台服务器。

还有一种情况,群集也不需要使用共享的存储设备,而可以直接使用双机或群集软件即可。

但这种情况其实与镜像软件无关,只不过是上面的共享模式下的一种变化而已。

  经过了系统组的讨论,最终选择了“存储共享式”。

原因有三:

  1.OA是建立在WindowsIIS+SQLServer平台上,采用Windows的ClusterServices不会出现兼容性的问题。

  2.WindowsCluster的建立通过简单的培训整个系统组都能进行管理,具有通用性,也能保证今后的升级不会造成麻烦。

  3.考虑到OA今后的数据量,将购买软件的资金投入到存储设备上更加合理。

  在随后的一年多时间里,其间双机热备系统出现过单点故障。

其中有一次是一个系统补丁安装完以后造成IIS无法启动,和OA的厂商共同模拟故障后找到了原因。

不过,OA在这一年里却没有停止过。

  

  群集服务器备份解决方案

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 军事

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1