ESS快速维护手册Word格式.docx
《ESS快速维护手册Word格式.docx》由会员分享,可在线阅读,更多相关《ESS快速维护手册Word格式.docx(33页珍藏版)》请在冰豆网上搜索。
Message黄灯灭OFF黄灯灭OFF
若与上面正常状态不符,应立即处理。
(对应下图)
PowerComplete绿色显示灯显示LineCord1和LineCord2的情况:
PowerComplete绿色显示灯长亮表示ESS启动结束并且没有出错
PowerComplete绿色显示灯慢闪表示电源有问题
PowerComplete绿色显示灯快闪表示正在启动或关机
PowerComplete绿色显示灯熄灭表示已关机
Messages黄色显示灯显示Cluster1和Cluster2的情况:
Messages黄色显示灯长亮表示licensedinternalcode(LIC)或cluster检测
到错误,需要干预
Messages黄色显示灯快闪表示cluster正在启动
二、控制面板开关的使用
LocalPower白色开关,控制ESS里直流电的开关,在ESS加电正常后按此键开始加电。
在异常情况下,当某个clusterpoweroff后不能由另一个clusterpoweron时,可以尝试用此键poweroncluster。
UnitEmergency红色紧急开关,只有在紧急情况下才使用(如:
天花板漏水),正常启动和关机不应使用此开关。
三、ESS的开关机步骤
●ESS下电步骤:
1.确认在该ESS上运行的应用与操作系统已下完毕。
2.按ESS面板上的白色开关的下端。
大约3到5分钟后PowerComplete绿色显示灯熄灭。
上图中用蓝色表示的风扇仍然保持几分钟转动,以利于散热保护机器。
如果PowerComplete绿色显示灯不熄灭,请通知NextLevelSupport。
3.等到面板上所有指示灯关闭。
(约10分钟)
4.如需断电,先把红色紧急开关(UnitEmergencyOnly)置于OFF位置,然后将两个主电源(BulkPowerAssembly)开关置于OFF位置。
●ESS上电步骤:
注意:
紧急开关必须在开的位置
1.将两个主电源(BulkPowerAssembly)开关置于ON位置。
等待约3分钟,电源模块上电结束。
2.按ESS面板上的白色开关的上端。
3.按下开关后,可以观察到LineCord1和LineCord2的PowerComplete绿色显示灯来回闪大约3–10秒。
如果PowerComplete绿色显示灯慢闪,请检查电源并通知NextLevelSupport;
如果PowerComplete绿色显示灯快闪表示机器正在启动。
4.等到面板上两个CLUSTER的READY灯都亮起来(约25分钟),如果任意一个ClusterReady显示灯不亮,请通知NextLevelSupport。
5.将硬盘交系统操作员恢复使用。
四、通过ESS串口连接,进入控制台菜单查看运行状态
五、如何登陆ESS的ServiceTerminal
1.通过ThinkPad或旧式的ESSNet主控台(WindowsNT4.0的PC,默认的Adminstrator密码是password)
1)用ESS标配或连接RS/6000的9对9串口线连接Cluster1或Cluster2的串2口S2
(注意,一定要连在S2,千万不能连错)
2)打开NetTerm,选择"
IBM2105ESS(Directconnect,IBM3151emulation)"
3)用户名为"
service"
,密码会在所连接的Cluster的LCD面板上显示
2.通过新式的MasterConsole主控台(RedHatLinux的PC,默认的service密码是service)
1)用鼠标双击"
ESSTerminalSelector"
2)根据序列号选择相应的Cluster
,密码会在相应Cluster的LCD面板上显示
六、如何查看ESS的错误日志(ProblemLog)
1.ESS在有Problem发生时,控制面板上的Message灯会亮起,这时需要登陆进ServiceTerminal进行查看,登陆后Message灯会自动熄灭,如果Problem没有Close或Cancel,Message灯会在结束登陆后一天重新亮起:
1)在主菜单里选择"
RepairMenu"
2)选择"
Show/RepairProblemsNeedingRepair"
3)选择相应的Problem进行查看细节信息
2.如果问题发生后7天不登陆进ServiceTerminal进行查看,Problem状态会转为Expire,RepairMenu里就看不到了。
这时需要在Utility菜单里查看:
Utility"
ProblemLogMenu"
3)选择"
ListProblems"
4)继续按回车,查看有没有处于"
OPEN"
,"
PENDING"
EXPIRE"
状态的Problem
5)选择相应的Problem进行查看细节信息
七、如何全面检查ESS的工作状态是否正常
1.在主菜单里选择"
2.选择"
EndofCallStatus"
判断标准如下:
1)"
ThefollowingproblemsarestillOPENorPENDING"
一栏是"
None"
2)"
Thefollowingresourcesarestillquiesced"
3)"
Thefollowingresourcesarestillfenced"
4)"
PinnedData"
5)"
DDM,ArrayorRankStatus"
Normal"
6)"
Clusterdualharddrivesstatus"
(ESS800才有)
如果任何一项状态不正常,则按"
d"
查看细节信息,否则按"
q"
退出
PE用户供日本的L2/L3支持专家远程拨号访问ESS时使用,它的密码需要在现场随机生成。
(注意PEPassword大小写敏感,有效期7天*24=168小时,过期失效)
1.通过ESSNETConsole或MasterConsole的图形界面生成PEPassword:
1)打开ESSNETConsole或MasterConsole中的游览器
2)连接到ESSSpecialist
3)点击Communication按键
4)点击"
ResetPEpassword"
按键
5)在出现警告信息时选"
yes"
2.通过ServiceTerminal生成PEPassword:
ConfigurationOptionsMenu"
ConfigureCommunicationsResourcesMenu"
CallHome/RemoteServicesMenu"
4)选择"
EnableProductEngineeringAccess"
九、如何获取ESS的PEPackage
PEpackage是ESS的日志和配置信息集合,相当于RS/6000的snap文件,是L2/L3支持专家分析ESS故障的基本条件。
每次ESS的维护都必须收集2个cluster
的PEPackage。
除非有一个cluster不能启动到AIX基本操作系统。
A:
软盘方式
Trace/StateSaveMenu"
3.选择"
BuildPEPackageandOff-loadtoDiskettes"
4.在"
PEdata"
一栏选择"
,在"
PECopyServicesdata"
一栏,只有要分析CopyService的相关问题时才选"
,否则选默认值"
no"
5.回车后按"
y"
确认软盘数量,并按"
a"
选择生成AIX格式的软盘,然后按屏幕操作即可,一般只需要1张软盘(切记要选“AIX”格式)
6.每个cluster都要收集PEpackage
注意:
多带几张软盘,因为在恢复的过程中对软盘的质量要求比较高
B:
FTP方式,这种方式不需要使用软盘和软驱,强烈推荐使用
在serviceterminal中设置如下:
1.ConfigurationOptionsMenu->
ConfigurationCommunicationsResourcesMenu->
Callhome/RemoteServicesMenu->
Change/ShowCallhomeviaMasterConsoleorviaModemExpander选masterconsole选项
2.ConfigurationOptionsMenu->
Change/showCallhome/RemoteServices->
EnableincomingRemoteSupport?
和EnableoutgoingCallhome选项都要改成YES。
1.将ThinkPad连入ESS的内网,配一个和MasterConsole相同网段的IP地址,例如172.31.1.88
千万不要和ESS的2个cluster的IP冲突。
可以通过以下菜单查看2个cluster的IP地址:
MachineTestMenuExternalConnectionsMenuCluster-ClusterCommunicationTest
2.在ThinkPad上启动一个FTPserver,例如Netterm自带的NetFtpd
3.以NetFtpd为例,在Options菜单的DefineFTPServerAccess里面,选择Acceptanyonewhocalls和Allowanonymousaccess。
关闭Windows的防火墙软件。
(如果使用Serv-U做FTPserver,必须disablesecurity)
4.在MasterConsole的ConsoleLauncher里面更改CallHomeSetting
5.在“DumpsandTraces”一栏,选择UsetheIBMFTPDataRepositoryServer
“SelectCallHomeInterface”一栏应该选择“Modem”,图示不对。
6.不要选择”UsePassiveTransfers”
7.在DestinationserverHostName一栏填入ThinkPad的IP地址
8.UserID/passwd/Port维持不变anonymous/******/21,DestinationServerdirectory填入”/”
9.用support或PE用户登陆鲨鱼,选择InitiatePEPackageorTrace/DumpRetrieval(Service用户登陆没有这项菜单)
10.根据实际需要选择是否需要Local/Alternatecluster的PEdata,PhoneNumber的地方随意填一个数字。
11.回车后系统会自动开始在相应cluster上收集PEPackage并发给MasterConsole,完成后会回到步骤8的界面
12.MasterConsole一般会在步骤9完成后5分钟之内收到文件。
在ConsoleLauncher的QueryManagement里面可以看到处于PendingTransfer状态的callhome记录。
13.点击QueryManagement里面的Callhome记录,选择IncreasePriority可以加快文件发送
14.打开ConsoleLauncher的ConsoleStatus的Displaymessagefile,可以查看MasterConsole的全日志。
可以看到文件是否成功发送到ThinkPad。
当然,查看FTP软件的窗口也能判断。
15.ThinkPad接受到的文件将自动放在c:
\下面。
不要更改通过FTP方式接收到的PEpackage的文件名,可以直接上传Testcase服务器
十、如何获取ESS的Statesave文件
Statesave文件是ESS内存的关于应用程序的snapshot文件,相当于RS/6000的coredump文件。
只有L2/L3的专家要求下,才需要获取。
Off-load-Statesave/Trace/DumpFilestoDiskettes"
4.选择"
Off-loadStatesaveFilestoDiskettes"
5.根据支持专家在PMH里的指导选择相应的Statesave文件(往往可能会存在很多个,支持专家会在PMH里说明需要哪一个文件)
6.根据屏幕的提示操作即可,一般文件大小为4~7M,需要4~6张软盘
7.登陆到另一个Cluster重复上述步骤
不要更改通过FTP方式接收到的Statesave的文件名,可以直接上传Testcase服务器
FTP方式
与收集PEpackage的方法相同。
只是在鲨鱼的InitiatePEPackageorTrace/DumpRetrieval菜单里不选择收集PEdata,而是在Local/Alternateclusterdump/tracefilestoretrieve的地方选择相应的Statesave文件。
十一、如何将PEpackage和StateSave软盘恢复成IMG格式文件
(FTP方式不需要这一步)
方法一:
利用工具软件“EMT4WIN”,最快捷的方式是跳过前面的startwizard,进入入下图的主界面,点击“I”快捷图标――’buildimagefromA:
’,选择放置路径并命名好image的名字,保存。
方法二:
利用P-Series机器的软驱,这种方法不需要使用ThinkPad的软驱
将软盘插入P-Series机器的软驱,运行:
ddif=/dev/rfd0of=/tmp/xxxxxx.img
建议以及技巧:
1.选用新的软盘做image,以免失败以及影响软驱
2.如果刚开始做image就报软盘读写错,未必会是软盘问题,可以重复尝试,超过十次以上就可以确认是软盘问题,则另外更换软盘重做PEpackage或StateSave。
十二、如何将ESS用软盘做成的IMG格式文件转换为Testcase服务器支持的格式文件
(FTP方式不需要这一步)特点:
必须要依赖P-Series机器
1.请工程师将生成好的IMG格式文件下载到本地,再上传至客户现场或者公司内部可用的P-Series机器上
上传目录如:
/tmp/PE
在此目录下请使用restore-xvfxxxx.IMG命令恢复IMG文件:
恢复PEpackage:
上传文件为:
PE_CLL_1.IMG和PE_CLL_2.IMG(一个PEPackage包含多张软盘的情况)
1)cd/tmp/PE
2)restore-xvfPE_CLL_1.IMG
(系统提示:
Pleasemountvolume1onPE_CL1_1.IMG.PresstheEnterkeytocontinue)
3)回车后,因为有第二张盘,系统还会继续提示上面同样的内容,因此我们需要将PE_CL1_2.IMG改名为PE_CL1_1.IMG(如果一个PEPackage只包含一张软盘,那么就结束了,直接跳到第5)步)
4)打开第二个telent窗口后
cd/tmp/PE
mvPE_CLL_2.IMGPE_CLL_1.IMG(将PE_CLL_2.IMG改名为PE_CLL_1.IMG)
回到第一个telnet窗口,因为我们已经将第二张盘改名了,继续回车即可。
5)恢复成功后,由于ESS的微码不同,可能会展开两种类型的文件:
A:
header和PE.tar.zip
B:
PE.tar
对于A:
直接将这两个文件tar成一个文件即可:
tar-cvf2105XXXSNcx.PExxxxxxheaderPE.tar.zip
对于B:
因为该文件中包含A中的两个文件,且目录为绝对路径,PFE使用的DFSserver不允许展开到别的目录中,因此我们需要在P-Series机器上重新封装,如下:
tar-xvfPE.tar文件将被释放到/var/adm/searas
cd/var/adm/searas
tar-cvf2105XXSNcx.PE0uydqcheaderPE.tar.zip
至此,PEpackage处理完毕,可以上传到testcase上。
恢复statesave:
CL1_dump2_1.IMG,CL1_dump2_1.IMG(一个Statesave文件肯定会包含多张软盘)
可参照恢复PEpkg的步骤1)2)3)4)
5)恢复成功后,可以看到两个文件:
DumpTrace.tar,header(目前,我只看到这一种格式,可能也有类似于PEpkg的另外一种绝对路径的格式,如果是,请参照上面的方法重新封装即可)
验证DumpTrace.tar是否为tar格式相对路径:
tar-tvfDumpTrace.tar
drwxrwx---000May1410:
55:
332006DumpTrace/
“DumpTrace/”为相对路径,绝对路径应该是“/DumpTrace/”
-rw-rw-rw-7043May1410:
332006DumpTrace/DumpTrace.package_errata
-rw-rw-rw-700May1410:
332006DumpTrace/DumpTrace.package
-rw-rw-rw-70222May1410:
332006DumpTrace/DumpTrace.rsProduct
-rw-rw-rw-7090May1410:
332006DumpTrace/DumpTrace.rsLocalClusterName
-rw-rw-rw-7069May1410:
332006DumpTrace/cpssdump03.02.level_cpss
-rwxrwxrw-7018May1410:
332006DumpTrace/level_dump
drwxrwxrw-700May1410:
332006DumpTrace/var_adm_searas/
-rw-rw-rw-701645809May1410:
342006DumpTrace/var_adm_searas/cpssdump03.02.0.zip
格式正确,打包即可:
tar-cvf2105xxxSNc1.DTxxxxxxDumpTrace.tar,header
(机器的序列MTMS可以参见header文件)。
十三、ESS的上传文件命名规则
如果是通过FTP方式收集到的日志文件,请保持原文件名,直接上传即可。
如果使用软盘方式收集到的日志文件,请参照上面第十一章和第十二章介绍的方法转换为所要求的格式,再按照下面的规则重命名,然后上传。
命名规则说明如下
MTMScluster.typeextension
MTMS:
4charmachinetype.3charmachinemodel.Full7charserialnumber.
cluster:
cl0orcl1
type:
PEmeanPEpackage
dtmeanstatesave/dump
extension:
6randomcharacters随机的字符,可以是字母或数字
forexample:
21058001328615c0.PEFPlgac<
=PEpkgfromcluster0
2105F201319646c1.PE0uydqc<
=PEpkgfromcluster1
21058007525876c1.DTxggbqc<
=statesave/dumpfromcluster1
21058007526606c0.HBPMksib<
=HBAcarddump
十四、TestcaseESS日志文件服务器
(日本的esfsc4服务器已经停止使用):
地址:
ftp:
//
用匿名用户登陆
十五、如何远程拨号登陆ESS
在设置好modem后,可以远程拨号登陆ESS,进行测试,以及进行一些基本的诊断。
Tips:
如果没有人在现场生成PEPassword,可以尝试用“support”用户登陆,默认的密码是“supp0