hpux日常维护手册.docx

上传人:b****5 文档编号:27706636 上传时间:2023-07-04 格式:DOCX 页数:12 大小:60.99KB
下载 相关 举报
hpux日常维护手册.docx_第1页
第1页 / 共12页
hpux日常维护手册.docx_第2页
第2页 / 共12页
hpux日常维护手册.docx_第3页
第3页 / 共12页
hpux日常维护手册.docx_第4页
第4页 / 共12页
hpux日常维护手册.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

hpux日常维护手册.docx

《hpux日常维护手册.docx》由会员分享,可在线阅读,更多相关《hpux日常维护手册.docx(12页珍藏版)》请在冰豆网上搜索。

hpux日常维护手册.docx

hpux日常维护手册

hp-ux日常维护手册

HP-UX日常检查

日常维护检查项目,主要由以下:

机房环境、硬件、操作系统、备份以及应用

硬件

1.硬件主要从面板指示灯和服务器中各个扩展卡的指示灯来查看:

面板指示灯:

在大多数的服务器中,都有一个液晶面板或多个指示灯,用来显示服务器的运行状态。

在系统出现故障时,液晶面板上会出现WARNING或FAULT的提示;WARNING或FAULT的指示灯会亮。

(1).服务器中的各个扩展卡的指示灯

在服务器中存在多种扩展卡,例如SCSI卡、以太网卡等。

这些卡上都有一个或多个指示灯,从这些指示灯可以了解这些卡的工作情况。

SCSI卡:

在正常情况下,自检灯(selftest)应该是暗的;终结电源指示灯(TerminatorPWR)应该是亮的。

以太网卡:

在正常情况下,自检灯(selftest)应该是暗的;连接灯(Link)是亮的。

(2).外设的状态

大部分外设也都有自己的状态指示。

下面是比较常见的几种:

RAID磁盘阵列:

该磁盘阵列有一个液晶面板。

如果出现故障,在面板上会出现WARNING提示信息。

磁带库:

磁带库一般也有一个液晶面板。

如果出现故障,在面板上会出现报错提示信息。

2.MP(管理处理器)是基于单元服务器的独立支持系统,可以连接到服务器组合系统。

同时,还可以执行服务器硬件的管理或监视任务。

主要功能包括:

(1).从MP上检查硬件—PS

ps:

显示详细的电源和硬件配置状态

(2).从MP上检查硬件—LS

ls:

显示Lan连接的控制台

(3).从MP上检查硬件—SYSREV

Sysrev:

显示组合系统中所有固件实体的版本

操作系统

在这一部分,通过一些实用、简单的命令,检查系统的运行情况。

在系统出现问题时,常常会在控制台上显示一些出错信息,应该定期检查这些信息,这往往是最便捷的方式。

•系统日志

syslog.log,ccerrlog,eventlog,dmesg

•系统运行状态

cmviewcl、bdf、ioscan、vgdisplay、top、sar、swapinfo、netstat

(1).系统日志--syslog.log

系统日志:

syslog是系统重起到当前的日志,重起后将自动保存为OLDsyslog.log

应检查的内容:

•有无SCSIReset告警(启动前后的SCSIreset信息可忽略)

•有无EMS告警。

如:

09:

43:

05bj_rz3EMS[2286]:

------EMSEventNotification------Value:

"SERIOUS(4)"forResource:

"/system/events/core_hw/core_hw"(Threshold:

>="3")Executethefollowingcommandtoobtaineventdetails:

/opt/resmon/bin/resdata-R149815298-r/system/events/core_hw/core_hw-n149815299-a

•凡是Value为Majorwarning、Serious或Critical的报警都应关注。

•有无“PVPowerfail、”IOerror报错

如有重起操作,建议保存当前的syslog日志

(2).系统日志---dmesg

驻留在内存中的系统最近一段时间的日志信息:

$Revision:

vmunix:

vw:

-projselectors:

CUPI80_BL2000_1108-c'VwforCUPI80_BL2000_1108build'--cupi80_bl2000_1108'CUPI80_BL2000_1108'WedNov819:

24:

56PST2000$

MemoryInformation:

physicalpagesize=4096bytes,logicalpagesize=4096bytes

Physical:

4177920Kbytes,lockable:

3859368Kbytes,available:

3859944Kbytes

Using3162bufferscontaining24576Kbytesofmemory.

常见的异常信息:

SCSIResetDetected

LPMCI-Cacheerror

FileSystemFull

发现后应及时察看syslog.log中的相应条目

(3).系统运行状态—cmviewcl

观察双机状态,执行cmviewcl–v,确认STATUS和STATE为up和running,同时包自动切换(AUTO_RUN)属性为enable

CLUSTERSTATUS

hpclusterup

NODESTATUSSTATEGMS_STATE

bjscp1auprunninghalted

Network_Parameters:

INTERFACESTATUSPATHNAME

PRIMARYup0/5/0/0lan1

PRIMARYup0/0/0/0lan0

STANDBYup1/12/0/0lan2

PACKAGESTATUSSTATEAUTO_RUNNODE

scppkguprunningenabledbjscp1a

NODESTATUSSTATEGMS_STATE

bjscp1buprunninghalted

Network_Parameters:

INTERFACESTATUSPATHNAME

PRIMARYup0/5/0/0lan1

STANDBYup1/12/0/0lan2

PRIMARYup0/0/0/0lan0

(4).系统运行状态—bdf

检查文件系统的使用率

 

Filesystemkbytesusedavail%usedMountedon

/dev/vg00/lvol32048004816815542424%/

/dev/vg00/lvol12950243885622666415%/stand

/dev/vg00/lvol847063041523976315759233%/var

/dev/vg00/lvol7116326470830445146461%/usr

/dev/vg00/lvol42048009640810756847%/tmp

/dev/vg00/lvol6104857676602428036073%/opt

/dev/vg00/lvol51048576445610360240%/home

应检查有无使用率大于90%的文件系统

(5).系统运行状态--文件系统维护

发现文件系统已满,应及时删除无用文件或扩大文件系统。

可定期清理日志:

#/var/adm/syslog/syslog.log(系统日志)

#/etc/rc.log(运行日志)

#/var/adm/wtmp(登录成功日志)可清理(#>wtmp)

#/var/adm/btmp(登录失败日志)可清理(#>btmp)

core文件的清理(#find/-namecore-execrm{}\大文件(#find/-name-size+10000)

注:

以上文件确认无用后rm删除

/var/adm/crash:

内核的卸入卸出目录。

内核崩溃时映像文件会自动保存到这个目录下。

该目录下的文件建议应该由hp的工程师删除.

(6).系统运行状态--ioscan–fn

检察IO设备是否正常:

ClassIH/WPathDriverS/WStateH/WTypeDescription

======================================================================================

root0rootCLAIMEDBUS_NEXUS

ioa00sbaCLAIMEDBUS_NEXUSSystemBusAdapter(803)

ba00/0lbaCLAIMEDBUS_NEXUSLocalPCIBusAdapter(782)

lan00/0/0/0btlan3CLAIMEDINTERFACEHPPCI10/100Base-TXCore

/dev/diag/lan0/dev/ether0

ext_bus00/0/1/0c720CLAIMEDINTERFACESCSIC895UltraWideSingle-Ended

target00/0/1/0.1tgtCLAIMEDDEVICE

disk00/0/1/0.1.0sdiskNO_HWDEVICEHPDVD-ROM305

/dev/dsk/c0t1d0/dev/rdsk/c0t1d0

应检查有无状态为NO_HW的设备

(7).系统运行状态—vgdisplay

显示卷组状态,重点检查vg00,执行vgdisplay–vvg00

---Volumegroups---

VGName/dev/vg00

VGWriteAccessread/write

VGStatusavailable

MaxLV255

--Logicalvolumes---

LVName/dev/vg00/lvol1

LVStatusavailable/syncd

LVSize(Mbytes)100

CurrentLE25

AllocatedPE50

UsedPV2

---Physicalvolumes---

PVName/dev/dsk/c4t0d0

PVName/dev/dsk/c6t0d0AlternateLink

PVStatusavailable

TotalPE12992

FreePE0

AutoswitchOff

检查各项status值为available/sync,不是stale

(8).系统运行状态—top

观察CPU和内存使用情况

CPULOADUSERNICESYSIDLEBLOCKSWAITINTRSSYS

00.2820.2%0.0%2.6%77.2%0.0%0.0%0.0%0.0%

10.1714.6%0.0%3.4%82.0%0.0%0.0%0.0%0.0%

20.3318.6%0.0%3.0%78.4%0.0%0.0%0.0%0.0%

30.2013.0%0.0%4.2%82.8%0.0%0.0%0.0%0.0%

40.1114.4%0.0%2.0%83.6%0.0%0.0%0.0%0.0%

50.4419.8%0.0%4.2%76.0%0.0%0.0%0.0%0.0%

60.2813.2%0.0%11.2%75.6%0.0%0.0%0.0%0.0%

70.1714.8%0.0%1.8%83.4%0.0%0.0%0.0%0.0%

-----------------------------------------------

avg0.250.0%0.0%0.0%100.0%0.0%0.0%0.0%0.0%

Memory:

1106604K(999800K)real,1527608K(1362680K)virtual,1987924KfreePage#1/6

CPUTTYPIDUSERNAMEPRINISIZERESSTATETIME%WCPU%CPUCOMMAND

2?

18777informix156207404K5052Ksleep9233:

0230.4930.43oninit

6?

19002tellin1542029248K22572Ksleep5256:

0317.0517.02manager

1?

18779informix156207404K4784Ksleep1681:

279.629.60oninit

重点检查有无占用CPU过大的进程,并检查freememory是否足够

(9).系统运行状态--sar–u

观察CPU使用情况:

sar–u–M310

10:

02:

18cpu%usr%sys%wio%idle

10:

02:

210372160

1185175

21510272

394285

4213175

5232470

6104383

7155179

system195275

检查%idle是否足够(一般不小于25%)

(10).系统运行状态--sar–v

观察文件线程资源使用情况:

sar–v310

HP-UXbjscp1aB.11.00U9000/80007/07/03

10:

02:

48text-szovproc-szovinod-szovfile-szov

10:

02:

51N/AN/A189/66402119/736001127/120180

10:

02:

54N/AN/A188/66402102/736001121/120180

10:

02:

57N/AN/A187/66402067/736001114/120180

10:

03:

00N/AN/A187/66402037/736001108/120180

10:

03:

03N/AN/A187/66402033/736001108/120180

10:

03:

06N/AN/A187/66402036/736001108/120180

10:

03:

09N/AN/A187/66402033/736001108/120180

10:

03:

12N/AN/A188/66402032/736001113/120180

10:

03:

15N/AN/A187/66402032/736001108/120180

10:

03:

18N/AN/A187/66402032/736001108/120180

重点检查有无即将达到上限的值

(11).系统运行状态--sar–d

观察IO使用情况:

sar–d310

HP-UXbjscp1aB.11.00U9000/80007/07/03

10:

03:

18device%busyavquer+w/sblks/savwaitavserv

10:

03:

21c1t6d04.330.507495.975.57

c2t6d03.670.506435.864.78

c4t0d01.000.5010515.112.94

c4t0d11.670.5011534.493.27

c4t0d21.670.5010525.162.63

c4t0d31.670.5016755.012.97

重点检查有无%busy过大的设备

(12).系统运行状态—Swapinfo

观察交换区使用情况:

MbMbMbPCTSTART/Mb

TYPEAVAILUSEDFREEUSEDLIMITRESERVEPRINAME

dev3072030720%0-1/dev/vg00/lvol2

dev3000030000%0-0/dev/vg00/lv_swap

reserve-2161-2161

total60722161391136%-0-

通常swap区的使用率为0,如有0以上数值,需进行进一步检查

(13).系统运行状态--netstat–in

观察网络连接情况,检查有无网络连接中断,执行netstat-in

NameMtuNetworkAddressIpktsOpkts

lan1*1500192.9.200.0192.9.200.100

lan0150015.79.48.015.79.48.170745893334436

lo04136127.0.0.0127.0.0.12654026540

如在网卡后带*号则表示网络不通

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1