IBM小型机故障处理指导书10424B.docx

上传人:b****6 文档编号:3260421 上传时间:2022-11-21 格式:DOCX 页数:22 大小:165.51KB
下载 相关 举报
IBM小型机故障处理指导书10424B.docx_第1页
第1页 / 共22页
IBM小型机故障处理指导书10424B.docx_第2页
第2页 / 共22页
IBM小型机故障处理指导书10424B.docx_第3页
第3页 / 共22页
IBM小型机故障处理指导书10424B.docx_第4页
第4页 / 共22页
IBM小型机故障处理指导书10424B.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

IBM小型机故障处理指导书10424B.docx

《IBM小型机故障处理指导书10424B.docx》由会员分享,可在线阅读,更多相关《IBM小型机故障处理指导书10424B.docx(22页珍藏版)》请在冰豆网上搜索。

IBM小型机故障处理指导书10424B.docx

IBM小型机故障处理指导书10424B

资料编码

产品名称

IBM小型机

使用对象

产品线

产品版本

编写部门

集成产品部

资料版本

V1.0

IBM小型机故障处理指导书

拟制:

日期:

审核:

日期:

审核:

日期:

批准:

日期:

华为技术有限公司

版权所有XX

修订记录

日期

修订版本

描述

作者

2005-3-28

V1.0

整合HACMP故障处理到文档中

李静

2006-4-11

V1.1

1、修改错误的命令示例;

2、调整文档格式。

胡建锋

目录

第1章故障的定义1

第2章故障信息的收集1

2.1收集故障信息对于判断诊断故障原因修复系统非常重要1

2.2系统故障记录(errorlog)1

2.3控制面板上的LED代码3

2.4SMS(SystemManagementService)故障记录4

2.5MAIL4

2.6运行故障诊断程序(Diagnostic)对系统硬件进行检查和诊断4

2.7其他用于收集系统信息的命令4

第3章硬件故障定位方法7

3.1IPL流程7

3.2系统的启动顺序:

7

3.3系统不能启动8

3.4系统停在551555或5578

3.5CDE图形界面挂死9

3.6系统dump10

第4章7133-D40SSA磁盘柜的故障定位12

第5章软件故障定位方法12

5.1文件系统空间不够12

5.2检查文件系统的完整性13

5.3查看卷组信息(lsvg-lvg_name)13

5.4检查内存交换区(pagingspace)使用率(lsps-s)13

5.5小型机内存泄漏问题13

第6章常用的系统状态查询命令15

第7章网络故障定位方法16

7.1网络不通的诊断过程16

7.2网络配置的基本方法16

第8章HACMP环境下的排错17

8.1了解问题的存在17

8.2判断问题的出处17

第9章附常用命令列表19

关键词:

故障处理IBMAIXHACMP

摘要:

缩略语清单:

参考资料清单:

内容简介

《IBM小型机故障处理指导书》主要包括以下内容:

故障的定义、故障信息的收集、硬件故障定位方法、7133-D40SSA磁盘柜的故障定位、软件故障定位方法、常用的系统状态查询命令、网络故障定位方法、HACMP环境下的排错、附常用命令列表。

故障的定义

根据以下这些方面来考虑故障定位:

弄清楚系统发生了什么问题

系统现在能做什么不能做什么

故障什么时候发生的

有没有做平时不同的操作

故障有没有规律定时还是不定时发生的频率有多高

是一台机器出现故障还是多台机器故障故障现象是否相同

最近有没有做改动如安装了新的硬件软件改变了系统的一些设置

故障信息的收集

收集故障信息对于判断诊断故障原因修复系统非常重要

系统故障记录(errorlog)

errdemon

errdemon进程在系统启动时自动运行

记录包括硬件软件及其他操作信息

故障记录文件为/var/adm/ras/errlog可备份下来或拷贝到别的机器上分析

errpt命令的使用(普通用户权限也可使用)

#errpt|more(列出简短出错信息)

ERROR_IDTIMESTAMPTCRESOURCE_NAMEERROR_DESCRIPTION

192AC0710723100300T0errdemonErrorloggingturnedoff

0E017ED10720131000PHmem2Memoryfailure

9DBCFDEE0701000000T0errdemonErrorloggingturnedon

038F25800624131000UHscdisk0UNDETERMINEDERROR

AA8AB2410405130900TOOPERATOROPERATORNOTIFICATION

TIMESTAMP:

MMDDHHMMYY(月日时分年

T类型:

P永久;T临时;U未知永久性的错误应引起重视

C分类:

H硬件;S软件;O用户;U未知

#errpt-dH(列出所有硬件出错信息)

#errpt-dS(列出所有软件出错信息)

#errpt-ajERROR_ID(列出详细出错信息)

#errpt-aj0502f666<---ERROR_ID用大小写均可

LABEL:

SCSI_ERR1

ID:

0502F666

Date/Time:

Jun1922:

29:

51

SequenceNumber:

95

MachineID:

123456789012

NodeID:

host1

Class:

H

Type:

PERM

ResourceName:

scsi0

ResourceClass:

adapter

ResourceType:

hscsi

Location:

00-08

VPD:

<---VirtalProductData

DeviceDriverLevel00

DiagnosticLevel00

DisplayableMessageSCSI

ECLevelC25928

FRUNumber30F8834

ManufacturerIBM97F

PartNumber59F4566

SerialNumber00002849

ROSLevelandID24

Read/WriteRegisterPtr0120

Description

ADAPTERERROR

ProbableCauses

ADAPTERHARDWARECABLE

CABLETERMINATORDEVICE

FailureCauses

ADAPTER

CABLELOOSEORDEFECTIVE

RecommendedActions

PERFORMPROBLEMDETERMINATIONPROCEDURES

CHECKCABLEANDITSCONNECTIONS

DetailData

SENSEDATA

000000000000000000000000000000000000000000000000

操作面板上的LED代码

8位代码通常系统故障灯会同时亮起某些机型还会同时显示故障设备位置代

4位代码通常是Exxx

3位代码通常为0yyy只看后3位

8位和4位代码可查看系统服务手册(ServiceGuide)

3位代码可查看IBM网站《RS/6000液晶显示屏上显示代码(LED)的含义》(

闪动的888,系统崩溃硬件或软件原因造成按reset键会显示更多内容

888-102一般为软件故障888-102-207例外

系统会产生一个dump

888-102-xxx-0C9系统正在做dump,请等待

888-102-xxx-0C0系统dump完成可关电重启

888-103或105

硬件故障一般有SRN代码及位置代码

SMS(SystemManagementService)故障记录

如何进入SMS菜单

当主控台出现键盘图标后(LED显示E1F1时)按1键

选择"Utilities"

选择"ErrorLog",抄下8位故障代码

在SMS中还可以更改系统启动顺序表

MAIL

#mail

系统会向root用户发mail报告出错信息通常系统出现故障后没有进行检查

修复系统会定时提醒root

运行故障诊断程序(Diagnostic)对系统硬件进行检查和诊断

当发现有硬件故障时应立即使用diag

#diag

>选高级诊断AdvanceDiagnostic)

>选问题诊断ProblemDetermination)或

选系统检查SystemVerification)

(选PD会对系统错误记录进行分析)

diag运行后会给出SRN代码故障设备名称及百分比地址代码等

对于PCI机型应在系统报错7天之内运行diag程序对出错记录里的sense数据进行分析

其他用于收集系统信息的命令

lsdev-C系统设备信息

#lsdev-Ccdisk

hdisk0Available00-06-00-2,045GB16BitSCSIDiskDrive

hdisk1Available00-06-00-1,045GB16BitSCSIDiskDrive

hdisk2Defined00-06-00-4,016BitSCSIDiskDrive

lspv查看物理卷信息

#lspv

hdisk00007821160af3d76rootvg

hdisk1000782117f571294rootvg

hdisk20000000045c45bdedatavg

lsvg查看卷组信息

#lsvgdatavg

VOLUMEGROUP:

datavgVGIDENTIFIER:

0000000055e2458b

VGSTATE:

activePPSIZE:

4megabyte(s)

VGPERMISSION:

read/writeTOTALPPs:

2169(8676megabyt

MAXLVs:

256FREEPPs:

1(4megabytes)

LVs:

3USEDPPs:

2168(8672megabyt

OPENLVs:

2QUORUM:

2

TOTALPVs:

1VGDESCRIPTORS:

2

STALEPVs:

0STALEPPs:

0

ACTIVEPVs:

1AUTOON:

yes

MAXPPsperPV:

2032MAXPVs:

16

#lsvg-lrootvg

rootvg:

LVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINT

hd5boot111closed/syncdN/A

lv00jfs511021closed/stale/ibmcxx

lv01jfs111open/syncd/cics_regions

lv02jfs441open/syncd/var/mqm

lslpp查看文件组信息

#lslpp-L|grep77102e01

devices.pci.77102e01.diag5.2.0.0CF1000Base-TXPCI-XiSCSITOE

devices.pci.77102e01.rte5.2.0.0CFPCI-X1000Base-TXiSCSITOE看某个文件组是否已安装如以太网卡驱动也用于查询补丁程序的版本

lsattr查看设备参数设置

#

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1