运维手册HARHCS日常运维手册923.docx
《运维手册HARHCS日常运维手册923.docx》由会员分享,可在线阅读,更多相关《运维手册HARHCS日常运维手册923.docx(8页珍藏版)》请在冰豆网上搜索。
运维手册HARHCS日常运维手册923
文档标识
文件状态:
[]草稿
[√]正式发布
[]正在修改
RedHatHA维护手册
版本:
1.0.0
编制
孟东
2015年12月20日
审核
批准
年月日
生效日期:
年月日
修订历史记录
日期
版本
修订说明
作者
**.显示群集和服务状态4
**.日志查看6
**.初始化RHCS6
**.开启RHCS7
**.关闭RHCS7
**.查看RHCS状态7
**.手动切换资源组命令7
**.ilo界面登录与主机硬重启8
**.异常应急情况处理步骤:
9
**.Failover测试9
第一章引言
本章描述在群集被安装和配置后所涉及的管理和维护任务。
第二章集群状态工具总览
群集状态工具显示了群集服务、群集成员、和应用程序服务的状态,以及和服务操作有关的统计数据。
群集配置文件(由群集配置工具所维护)被用来决定如何管理成员、服务和群集守护进程。
使用群集状态工具来启动和停止那个成员上的群集服务、重新启动应用程序服务、或把应用程序服务转移到另一个成员上。
2.1.显示群集和服务状态
监视群集和应用程序服务状态能够帮助识别和解决群集环境中的问题。
以下工具可以在显示群集状态方面提供帮助:
clustat命令
日志文件消息
群集监视GUI
群集和服务状态包括以下信息:
群集成员系统状态
心跳频道状态
服务状态以及哪个群集系统在运行该服务或拥有该服务
监视群集系统的服务状态
使用群集状态工具来启动和停止那个成员上的群集服务、重新启动应用程序服务、或把应用程序服务转移到另一个成员上。
当配置了群集服务,并相关的群集进程启动后,在shell提示符中,运行system-config-cluster,点击ClusterManagement标签,就会显示当前群集的服务状态:
在shell提示下显示当前集群状态的快照,启用clustat工具,其示例的具体输出如下:
2.2.日志查看
hundsun70log:
tail–f/var/log/message:
Aug403:
38:
31hundsun70gconfd(root-9085):
GConfserverisnotinuse,shuttingdown.
Aug403:
38:
31hundsun70gconfd(root-9085):
Exiting
Aug403:
52:
14hundsun70clurgmgrd[2629]:
Stoppingserviceservice:
oracle
Aug403:
52:
18hundsun70rhsmd:
InorderforSubscriptionManagertoprovideyoursystemwithupdates,yoursystemmustberegisteredwiththeCustomerPortal.PleaseenteryourRedHatlogintoensureyoursystemisup-to-date.
Aug403:
52:
35hundsun70avahi-daemon[2512]:
Withdrawingaddressrecordfor192.168.56.90oneth0.
Aug403:
52:
45hundsun70clurgmgrd[2629]:
Serviceservice:
oracleisstopped
Hundsun71log:
tail–f/var/log/message:
Aug403:
52:
46hundsun71clurgmgrd[2396]:
Startingstoppedserviceservice:
oracle
Aug403:
52:
46hundsun71kernel:
kjournaldstarting.Commitinterval5seconds
Aug403:
52:
46hundsun71kernel:
EXT3FSonsdc,internaljournal
Aug403:
52:
46hundsun71kernel:
EXT3-fs:
mountedfilesystemwithordereddatamode.
Aug403:
52:
50hundsun71avahi-daemon[2287]:
Registeringnewaddressrecordfor192.168.56.90oneth0.
Aug403:
53:
10hundsun71clurgmgrd[2396]:
Serviceservice:
oraclestarted
第三章集群状态维护
三.1.初始化RHCS
在节点1上运行
servicecmanstart(同时在节点2上开启servicecmanstart)
在节点1上运行
servicergmanagerstart
在节点2上运行
servicergmanagerstart
三.2.开启RHCS
在节点1上运行
servicecmanstart
servicergmanagerstart
在节点2上运行
servicecmanstart
servicergmanagerstart
三.3.关闭RHCS
在节点2上运行
servicergmanagerstop
servicecmanstop
在节点1上运行
servicergmanagerstop
servicecmanstop
三.4.查看RHCS状态
#clustat
三.5.手动切换资源组命令
#clusvcadm–rstsrv–mstapp2
三.6.ilo界面登录与主机硬重启
三.7.异常应急情况处理步骤:
1)节点1假死或登录不了,HA未切换
手动reboot重启节点1
(ssh登录不了的情况下,登录ilo进行硬重启)
2)节点1硬重启后,HA仍未正常切换
手动切换资源组:
clusvcadm–rstsrv–mstapp2
3)手动切换仍未成功
用ilo登录节点2,更改节点2的IP,再重启应用。
4)切换成功后,节点1重启正常后,不要启节点1上的cman和rgmanager服务
这样会造成资源回切,从而形成二次故障。
三.8.Failover测试
[root@hundsun70~]#clustat-l
ClusterStatusfornew_cluster@MonAug403:
49:
342015
MemberStatus:
Quorate
MemberNameIDStatus
--------------------
Hundsun701Online,Local,rgmanager
Hundsun712Online,rgmanager
ServiceInformation
------------------
ServiceName:
service:
oracle
CurrentState:
started(112)
Flags:
none(0)
Owner:
vrhcs1
LastOwner:
none
LastTransition:
MonAug402:
44:
352015
SQL>colhost_namefora30
SQL>selectinstance_name,status,host_namefromv$instance;
INSTANCE_NAMESTATUSHOST_NAME
----------------------------------------------------------
hundsunOPENhundsun70
[root@hundsun71~]#clusvcadm-r"oracle"-mhundsun71
Tryingtorelocateservice:
oracletohundsun71...Success
service:
oracleisnowrunningonhundsun71
SQL>colhost_namefora30
SQL>selectinstance_name,status,host_namefromv$instance;
INSTANCE_NAMESTATUSHOST_NAME
----------------------------------------------------------
hundsunOPENhundsun71