Power Enterprise Pool结合PowerHA的高可用技术实践Word文档格式.docx
《Power Enterprise Pool结合PowerHA的高可用技术实践Word文档格式.docx》由会员分享,可在线阅读,更多相关《Power Enterprise Pool结合PowerHA的高可用技术实践Word文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
1.PowerEnterprisePool技术介绍
1.1PowerEnterprisePool概述
1.1.1CoD(CapacityonDemand)概述
谈到PowerEnterprisePool,不可避免需要先了解CoD(CapacityonDemand)。
我们知道Power服务器上除了激活的CPU和内存资源外,还安装着了非激活的计算资源。
已激活的CPU和内存资源是可以直接在服务器上使用的,而非激活的CPU和内存资源需要激活操作后才能使用。
CoD(CapacityonDemand)则提供了一种能激活服务器上那些非激活的CPU和内存资源的方式。
通过使用CoD相关产品,可以在业务高峰期间动态激活服务器上的计算资源,从而满足系统弹性的性能需求。
CoD一般是配合HMC(硬件管理控制)来实现,主要包括了CUoD(永久激活)、TrialCoD(30天使用)、ElasticCoD(临时弹性)、UtilityCoD(计费型)、PowerEnterprisePool(企业共享池)、PowerVMEditions这些产品技术。
这边将重点介绍PowerEnterprisePool技术。
1.1.2PowerEnterprisePool概述
PowerEnterprisePool是一种将多台Power服务器的CPU和内存组成可以共享的可移动的CoD资源池的技术。
在同一个PowerEnterprisePool中,服务器除了自身原来已激活的静态资源外,还可以按需激活CoD资源。
当然可激活的资源不能超过CoD资源池的总量,也不能超过单台服务器总的非激活资源总量。
处理器和内存资源主要是需要HMC来控制许可指派和移除。
其本质上是通过HMC发出CoD许可指派指令,激活机器上的未激活计算资源,获得MobileCoD资源,从而实现了CoD资源池能被多台机器共享使用。
借助于PowerEnterprisePool技术,Power服务器的性能管理可以更加灵活应对大量的工作负载,弹性的资源使用也可以轻松处理性能容量管理,也一定程度能缩减服务器性能预算。
可移动激活的按需分配的计算资源也给DRP(灾难恢复计划)提供了更多的管理功能支持。
1.2软硬件要求与技术规范
1.2.1HMC硬件要求及使用规范
为了管理PowerEnterprisePool,HMC需要至少2G的物理内存,而且需要将HMC升级到V7.7.8以上微码版本。
每一个PowerEnterprisePool只能通过一个masterHMC来创建和管理,但是配置其他non-masterHMC以保证冗余性是一种最佳实践。
HMC之间需要保证互相之间的网络通信,masterHMC会将池的配置修改信息实时同步到non-masterHMC,以保证non-masterHMC能够在需要时接管masterHMC。
MasterHMC提供如下的EnterprisePool管理功能:
1、MobileCoD的资源从系统中添加和移除
2、在Pool中添加和移除新的主机
3、在Pool中添加和移除新的资源
4、查看Pool相关信息,包括Pool资源和历史变动日志。
除了通常的HMCWeb网页操作和命令调用外,HMC还可以通过RESTAPIS来管理EnterprisePool,具体使用如下表所示
(点击图片可放大)
1.2.2可支持配置EnterprisePool的PowerSystems硬件
EnterprisePool对PowerSystems的型号是有着明确的要求,根据Power小型机的型号分为有三种不同类型的PowerEnterprisePool:
1、Power770+,E870,E870C以及E880C型号小型机组成的Pool
2、Power780+,795,E880,E870C以及E880C型号小型机组成的Pool
3、PowerE980,E870,E870C,E880以及E880C型号的小型机组成的Pool
这三种Pool都支持不同的机器型号和不同的主频处理器的服务器来组建,但是同一个服务器同一时间只能属于一个Pool。
不同型号的小型机都有不同数量的最小静态CPU数需求,而且所有的Power小型机需要至少25%的已激活内存作为静态内存。
1.2.3可与EnterprisePool结合使用的的PowerSystems软件
2.EnterprisePool结合PowerHA高可用技术方案
2.1案例背景
行内信贷系统和ODS数据仓库系统需要各搭建一套数据库服务器,计划部署于Power小型机上。
这两套数据库系统的重要性较高,尤其是日终批量对处理器和内存资源的消耗较多。
而行内小型机处理器资源使用紧张,而且Power系统普遍采用PowerHA双机热备的方式来实现高可用部署,所以需要至少采购两台Power小型机,目标的软件硬件配置如下:
硬件环境:
2台Power770(9117-MMD),已安装处理器64C内存512G
软件环境:
AIX6.1,PowerHAforAIX6.1,数据库软件DB2等
两台P770需要各创建两套AIX分区,其中ODS数据仓库的服务器计算资源规划是32C260G,信贷系统的服务器计算资源规划是16C200G,这样新的服务器必须超过48C460G的配置。
2.2高可用Power架构设计
我们知道Power服务器的计算资源成本较高,特别是处理器资源更是极为重要。
而PowerEnterprisePool拥有着处理器和内存资源池的可移动共享的特性,可以与PowerHA双机热备的场景贴合。
根据上述的案例背景,设计了EnterprisePool结合PowerHA的高可用架构。
EnterprisePool的配置对Power770的要求是至少4个静态激活的CPU以及至少25%的静态激活内存。
最终行内确认的配置是:
2台Power770服务器各4个静态激活CPU和312G静态激活内存,池MobileCoD的配置是64C和400G内存。
高可用架构示意图:
53个MobileCoDCPU将用于这两套数据库PowerHA的使用,其中HA的备机各使用1个CoD,其余的MobileCoDCPU可用于HA的主机。
2.3具体实现步骤
2.3.1前置条件
在配置PowerEnterprisePool之前,需要先完成硬件的上架、加电、安装以及HMC的连接配置工作。
值得注意的是,HMC有最低微码版本要求,且最佳实践要求是1个masterHMC,至少一个non-masterHMC,且HMC之间的网络需要打通。
本案例中部署了两台HMC,微码版本V8R8.2.0.0。
除了硬件环境准备之外,还需要准备PowerEnterprisePool配置文件。
该配置文件由厂商提供,其中包含了池、池成员信息以及MobileCoD的激活码。
2.3.2EnterprisePool配置
PowerEnterprisePool是通过HMC来完成创建的。
在HMC的“系统管理”模块界面中有专门的一个“PowerEnterprisePool”的页面,通过“创建池”的导航步骤依次输入池的名字、上传PowerEnterprisePool配置文件即可。
HMC会按照上传的配置文件来创建PowerEnterprisePool,最终实现效果如下图所示:
在我们创建的P770_EP池中,总共包含了64个MobileCoD处理器和400GMobileCoD内存,而且通过HMC可以去管理EnterprisePool的计算资源。
以处理器为例,如下图所示,通过编辑MobileCoD的数量来调整服务器的CPU资源。
还可以通过HMC更改masterHMC
另外还可以查看池历史记录日志。
2.3.3PowerHA额外的配置
PowerHA集群软件可以实现PowerEnterprisePool的可移动计算资源在PowerHA主备机之间的自动调配。
其实现原理是在HA发生切换时,通过主机向HMC发起移除和添加CoD资源的命令来实现的。
除了PowerHA的常见安装配置之外,还需要安装额外EnterprisePool的组件,如图所示:
安装完该组件后,再在PowerHA的软件中添加EnterprisePool的资源配置。
通过SMIT菜单,可以完成如下图的配置.
其中P770A1&
P770B1作为一组HA,配置了31个MobileCoD处理器;
P770A2&
P770B2作为一组HA,配置了15个MobileCoD处理器,剩余的MobileCoD处理器作为新建分区以及后期扩容使用。
2.4实现效果及意义
2.4.1EnterprisePool资源自动切换效果展示
以P770A1和P770B1的PowerHA切换为例,可以通过/usr/es/sbin/ep/bin目录下的HA_EP_diag.log来查看EnterprisePool资源的切换情况。
在HA切换之前,31个CoD处理器资源在P770A1上,而备机P770B1上只有1个处理器,如下图所示:
在P770A1上发起HA切换后,PowerHA会对HMC发送去除P770A上的资源命令。
然后PowerHA再对HMC发送添加给P770B资源的命令。
在完成Pool资源添加之后,可以看到P770B1上获取了31个CoD处理器资源,如下图所示:
这样在PowerHA切换的过程中,也自动发起了EnterprisePool计算资源的切换。
2.4.2实现意义
长期以来,为了保证PowerHA集群的正常切换,主备机的计算资源都是保持一致的,存在着集群备机的计算资源严重浪费的情况。
而PowerHA的切换过程与EnterprisePool计算资源的自动调整形成了一套完整的解决方案,可以将PowerHA集群主备机的计算资源组成一个Pool,极大程度的减少了计算资源的浪费。
2.5PowerEnterprisePool计算资源自动切换的故障点及建议
2.5.1masterHMC与系统的网络连接与信任关系
PowerHA之所以能实现EnterprisePool中计算资源的自动调整,是因为在操作系统中发起了对HMC的远程调用命令,并且是通过SSH的方式。
为了保证PowerHA切换过程中计算资源能自动调整,我们还需要保证两点:
一是PowerHA主备机与HMC的网络通信要畅通;
二是需要配置PowerHA主备机的root用户和HMC的hscroot的SSH信任关系,实现免密登录。
如果出现两者之间网络通信故障以及失去SSH信任关系,不仅会无法实现EnterprisePool中计算资源的自动调整,而且会导致PowerHA切换的失败。
2.5.2matserHMC与服务器启停
服务器的MobileCoD资源是通过masterHMC来获取到的,如果服务器在启动时无法连接到masterHMC,就无法获取MobileCoD资源。
所以在出现服务器和masterHMC都关掉的情况下,需要先重启matserHMC,再重启服务器。