服务器集群技术方案1.docx
《服务器集群技术方案1.docx》由会员分享,可在线阅读,更多相关《服务器集群技术方案1.docx(15页珍藏版)》请在冰豆网上搜索。
服务器集群技术方案1
服务器集群技术方案
集群(Cluster)技术是发展高性能计算机的一项技术。
它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。
其出发点是提供高可靠性、可扩充性和抗灾难性。
一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。
当一台服务器发生故障时,它所运行的应用程序将由其它服务器自动接管。
在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用。
采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。
当前主流的集群方式包括以下几种:
1.服务器主备集群方式
服务器主-备方式由一台服务器在正常运行状态提供对外服务,其它集群节点作为备份机,备份机在正常状态下不接受外部的应用请求,实时对生产机进行检测,当生产机停机时才会接管应用服务,因此设备利用率最高可达50%。
主备方式集群如下图所示,节点2为正常提供服务的服务器,运行多个应用(pkgA,pkgB..),节点1平时只监控节点2的状态,不对外提供服务,当节点2出现故障时,节点1将把两个应用接管过来,并对外提供服务。
图表Error!
Notextofspecifiedstyleindocument.1主备方式集群
2.服务器互备份集群方式
多台服务器组成集群,每台服务器运行独立的应用,同时作为其它服务器的备份机,当主应用中断,服务将被其它集群节点所接管,接管服务的节点将运行自身应用和故障服务器的应用,这种方式各集群节点的硬件资源均可被应用于对外服务。
互备方式集群如下图所示,节点1和节点2分别运行1个或多个不同的应用,但只对外提供本地的主应用,两个节点之间互相进行监控,集群中任何一个节点出现故障后,另一个节点把故障节点的主应用接管过来,所有应用服务由一台服务器完成。
图表Error!
Notextofspecifiedstyleindocument.2互备份方式集群
这种方式的主要缺点在于:
由于需要重新启动数据库核心进程,无法保证数据库系统连续不间断地运行
在系统切换的过程中,客户端与服务器之间的数据库连接会中断,需要重新进行数据库的连接和登录工作
由于数据库系统只能在一台服务器上运行,另一台服务器无法分担系统的负载,实际上造成了客户投资的浪费。
在有些系统中,为了解决双机负载分担的问题,将应用系统人为分割为两个数据库系统,分别在两台服务器上运行。
这种方式在一定程度上解决了负载分担的问题,但给系统管理、统计分析等业务处理带来了很多额外的复杂性
3.服务器并行集群方式
集群有多台服务器构成,同时提供相同的应用,可以实现多台服务器之间的负载均衡,提供大访问量的应用需求,如Web访问及数据库等应用,服务器并行集群方式一般由应用系统自身(如OracleRAC、中间件负载均衡等)或外部专用服务器负载均衡设备实现。
图表Error!
Notextofspecifiedstyleindocument.3服务器并行方式集群
以下是上述群集技术对比表:
集群技术
资源利用率
故障收敛时间
可靠性
主备集群技术
资源有效利用率低
相对较慢
较高
互备集群技术
资源有效利用率高
相对较慢
较高
并行集群技术
资源有效利用率高
快
高
图表Error!
Notextofspecifiedstyleindocument.4群集技术对比表
RealApplicationCluster(以前称作OracleParallelServer,OPS)用来在集群环境下实现多机共享数据库,以保证应用的高可用性。
同时可以自动实现并行处理及均分负载,还能实现数据库在故障时的容错和无断点恢复。
RealApplicationCluster为大多数关键业务要求的数据库环境提供了极高的性能和完善的纠错功能。
RealApplicationCluster允许集群系统或大型并行系统中的多个节点共享同一物理数据库。
RealApplicationCluster可以自动进行负载平衡、故障修复和规划停机时间,以支持高可用性应用程序。
它还显著地提高了大型数据仓库和决策支持系统的性能。
通过与并行查询选件结合,它还提供了节点间的并行性和节点内的并行性,以得到更高的性能。
多服务器的Cluster(集群)结构,因其具有高可靠性、大容量共享磁盘支持、以及无断点的故障恢复,越来越受到业界的关注,越来越多的硬件厂商都相继推出自己的Cluster机种和机型,它已经成为硬件平台的一个新的发展方向。
Oracle公司在1989年率先推出ParallelServer选件,以支持这种体系结构版)。
随着Cluster技术自身的成熟,以及Oracle对这一技术的经验,RealApplicationCluster目前已能支持几乎所有的Cluster集群系统。
在share-nothing或shared-disk模式的集群系统上,RealApplicationCluster均可以实现多节点共享数据库,并自动并行处理及均分负载,在数据库故障时进行容错和无断点恢复处理。
Oracle提供一个通用的、集成的分布式锁定管理器(DLM)替代了原来的,由不同操作系统厂商提供的锁管理器,从而提高了在大多数工作平台上的执行性能和可移植性。
这些使得Oracle并行服务器的运行速度显著加快。
Oracle集成的DLM使Oracle并行服务器能够跨平台工作。
当并行服务器中某节点失效,透明的应用程序容错能够把用户自动转接到另一节点上继续运行,应用程序在用户没有察觉的情况下继续执行。
这使周期性和非周期性发生故障的系统增大了连续可用性。
进程的失效可以完全透明地转移到另一节点上去,通过适当地配置,可以指定所有查询都在客户端进行缓存,这样它们便可以在转移后的节点上重新设置。
同时,还可以在没有失效时预先与容错节点建立一个连接,这样可以减少容错时在连接所花的时间。
Oracle不仅支持第一代、第二代并行处理技术,还最先支持第三代多节点并行处理机。
能够在ClusterMode3及MPP结构的各节点上实现并行处理,均分负载。
Oracle并行处理技术的另一大优势在于,无论在任何平台上,从单机到并行处理机,从OLTP应用到OLAP应用,Oracle数据库均为同一核心,因此在不同平台之间应用系统可平滑移植,提高了开发效率,降低了维护费用。
目前,Oracle并行服务器技术在业界处于绝对领先地位,已在全球数千个实际应用系统中运行,经过十多年的不断完善和发展,其可靠性及稳定性已得到彻底检验。
与双机热备份方式相比,Oracle10gRealApplicationCluster并行服务器方式有以下优点:
各服务器共享一个数据库,在正常运行时可以进行负载分担,无需考虑应用数据的人为分割
并行服务器方式对应用完全透明,在应用程序设计和开发的过程中也不需要进行特殊编程,简化了开发的复杂程度,同时今后系统扩展也无需修改应用程序
不需要重新启动数据库核心进程,缩短了故障造成的停机时间
总结以上ORACLERAC的功能和特点,ORACLERAC主要具有如下好处:
1.可伸缩性
用户或者中间层应用服务器客户,可以通过虚拟数据库服务名连接到数据库上。
Oracle在集群中多个节点之间自动平衡用户负载。
不同节点上的RealApplicationClusters数据库实例预订所有数据库服务或者部分子集数据库服务。
这使得DBA高度灵活地选定,连接到特定数据库服务的特定应用程序客户是否可以连接到某些或者全部的数据库节点。
虽然每一个节点有一个不同的物理IP地址时,应用客户仍可以在一个逻辑数据库服务名的水平上进行连接。
因此客户端对于不相关的事情如多服务器的多个地址可以毫不关心。
随着业务的增长,电子商务可以从容地增加处理能力。
CacheFusion体系结构直接地利用新节点的CPU和内存资源。
DBA无需用手工对数据重新分区。
这个优点是这种体系结构的副产品,因为有透明度的数据存取是CacheFusion的一项基本功能。
CacheFusion体系机构自动适应快速变化的电子商务需求及随之而来的工作负荷的改变。
DBA也不必因为工作负荷变化而对数据进行手工的重新分区。
RealApplicationClusters通过动态地重新分配数据库资源,从而在节点之间用最小化的磁盘I/O和低的延迟通信来优化利用集群系统资源。
这使得RealApplicationClusters可以从容实现增加的应用吞吐量和优化的响应时间。
2.高可用性
RealApplicationClusters提供了真正的高可用性解决方案,关键的突破是在大多数数据库恢复期间能提供完整的数据库访问。
这使得RealApplicationClusters成为电子商务应用所要求的24x7可用性的最佳平台。
RealApplicationClusters在高可用性上在三个关键领域胜出:
提供了数据库恢复期间的数据块访问
透明的失效转移对最终用户屏蔽了系统失效
N-1节点失效的容错能力
只要有一个数据库节点幸存,RealApplicationClusters就能够提供完全的数据库访问和相对不间断的操作。
3.可管理性
RealApplicationClusters实现了真正意义上的一个单系统访问数据库,它提供了从任何节点到所有磁盘设备和远程高速缓存进行无缝数据访问的能力。
此单系统映像延伸到所有数据库管理操作。
安装、配置、备份、升级以及监控等操作只需进行一次,然后会自动发布到集群中所有节点上去。
各种Oracle工具(如OracleUniversalInstaller、DatabaseConfigurationAssistant以及RecoveryManager)将发现集群数据块中所有不同的节点并以它们为目标分配给想得到的任务。
在Oracle10g的RealApplicationCluster技术中,全面采用了Oracle独特的CacheFusion(缓存熔合)技术,消除了多台服务器争用数据时产生的碰撞(Ping)现象,极大的提高了Cluster系统的可扩展性。
使Cluster系统可以支持更多的节点,而且数据库应用完全不需要做任何复杂的修改或特殊设计就可以良好的运行在Cluster系统上,并且充分发挥多节点的处理性能。
根据本次项目服务器系统需求,结合具体情况,我们将针对不同的业务系统采用不同的集群方式,满足业务系统的应用高性能和高可靠性要求。
数据库服务器系统采用两台P550,通过集群技术实现双机冗余。
操作系统通过HA来实现,数据库通过ORACLERAC集群技术实现。
说明如下:
一、硬件方案
12、数据库服务器
数量
P550(8C/32G)
8*32GB/2*146GB/2*HBA/2*1000兆集成网口/2*1000兆光口网卡/异步卡、心跳线/HACMP双机软件/P6550用控制台和机柜
P550
2
8204-E8A
Server1:
8204ModelE8A
1
265
AIXPartitionSpecify
1
1877
OpPanelCableforRack-mountDrawerw/DASD
1
2146
PrimaryOS-AIX
1
3125
Serial-to-SerialPortCableforRack/Rack
1
3647
146GB15KRPMSASDiskDrive
2
3925
SerialPortConverterCable,9-Pinto25-Pin
1
4532
4096MB(2x2048MB)RDIMMs,667MHz,1GbDRAM
8
4651
RackIndicator,Rack#1
1
4966
2-coreGHzPOWER6ProcessorCard
4
4986
OneProcessorActivationforProcessorFeature#4966
8
5005
SoftwarePreinstall
1
5623
Dual-Port1GbIntegratedVirtualEthernetDaughterCard
1
5723
2-PortAsynchronousEIA-232PCIAdapter
1
5743
SATASlimlineDVD-ROMDrive
1
5768
1GBETHERNETFIBER2-PORT
1
5774
4GigabitPCIExpressDualPortFibreChannelAdapter
1
6458
PowerCable--DrawertoIBMPDU,14-foot,250V/10A
2
7146
IBM/OEMRack-MountDrawerRailKit
1
7360
IBMRack-mountDrawerBezelandHardware
1
7707
PowerSupply,1700WattAC,Hot-swap,BaseandRedundant
2
7982
PowerVMStandard
8
8308
DASD/MediaBackplaneforDASD/SATADVD/Tape
1
9722
LanguageGroupSpecify-SimplifiedChinese(PRC)
1
5313-HPO
IBMPowerSoftwareHIPO
1
537
8204-E8ARoutingCode
1
967
BaseOS
1
1061
OSSpecifycodefor
1
2215
IBMPowerHA
1
5000
Preload
1
5987
TraditionalChinesePreinstallPIILanguage
1
9210
HWisRackintegrated
1
5662-HMP
IBMPOWERHAReg:
3Yr
1
A0CV
IBMPOWERHABaseSWMAperproc3YRegSMALL
8
5692-A6P
SystemSoftware
1
1101
DVDProcessNoCharge
1
1404
VIOSExpansionPack
1
2201
VirtualI/OServer
1
3435
DVD/CD-ROM
1
5692-A6P
SystemSoftware
1
967
AIXStandardEdition
1
968
AIXV6ExpansionPack
1
970
AIXV6UpdateCD
1
1100
DVDProcessCharge
1
2215
IBMPOWERHA
1
3435
DVD/CD-ROM
1
5692-LOP
SPOforLinuxonPOWER
1
1005
Processno-charge
1
1479
SystempAVEx86Media
1
3410
CD-ROM
1
5765-AVE
IBMPowerVMLx86forx86Linux
1
B8RK
Perserver
1
5765-F62
IBMPOWERHAV5
1
B8NE
PerProcwith1YearSWMaintSMALL
8
5765-G62
AIX6forPOWER
1
B8TB
PerProcessorE5AIX6forPOWER
8
5765-PVS
PowerVMStandardEdition
1
B9HC
PerProcessorlargesystem
8
5773-SM3
SoftwareMaintenanceforAIX,3Year
1
462
E53YrSWMAforAIXperProcessorReg/Ren
8
HMC
1
7042-CR4
HMC1:
7042-CR4Rack-mounted
31
Nomodem
1
962
HardwareManagementConsoleLicensedMachineCodev7
1
1924
2GB(2x1GB)PC2-5300CL5ECCDDR2ChipkillFB-DIMM667MHz
1
4651
RackIndicator,Rack#1
1
4767
HMCCR4RedundantPowerSupply,670W
1
5767
PCIe1GbEthernetUTP2Port
1
6458
PowerCable--DrawertoIBMPDU,14-foot,250V/10A
2
7801
EthernetCable,6M,HardwareManagementConsoletoSystemUnit
1
9069
HMC/ServerOrderLinkageIndicator
1
9722
LanguageGroupSpecify-SimplifiedChinese(PRC)
1
5773-RS3
InitialSoftwareSupport3Year
1
569
PerProcessorSoftwareSupport3Year
1
7000
AgreementforMCRSA
1
T42
1
7014-T42
Rack1:
RackModelT42
1
233
RackContentSpecify:
7316/TF3-1EIA
1
284
RackContentSpecify:
7042/CR41U
1
288
RackContentSpecify:
8204/E8A-4EIA
2
4651
RackIndicator,Rack#1
4
6069
Frontdoor(Black)forHighPerforation(2mracks)
1
6098
SidePanel(Black)
2
6491
PDUtoWallPowercord14',200-240V/48A,UTG0247,IEC30963AP+N+G
2
7188
PowerDistUnit-SideMount,UniversalUTG0247Connector
1
9188
PowerDistribUnitSpecify-Base/SideMount,UniversalUTG0247Connector
1
9722
LanguageGroupSpecify-SimplifiedChinese(PRC)
1
二、软件方案
(1)安装配置HACMP集群
所需购买的软件
序号
软件名称
版本
方式
操作系统名
数量
1
HACMP
数据库集群
1
安装配置HACMP集群:
本次HACMP集群提供OracleRAC使用的并行卷组和逻辑卷,虚拟ip等其他资源由OracleCRS自行创建。
上述软件的配置方法,见附件。
(2)ORACLE数据库
所需购买的软件:
序号
软件名称
版本
CPU个数
方式
数据库名
数量
1
RealApplicationClusters集群
10g
4CPU
数据库集群
ORACLE
1
上述软件的配置方法,见附件。