05 IBM AIX系统管理.docx

上传人:b****7 文档编号:23368919 上传时间:2023-05-16 格式:DOCX 页数:30 大小:58KB
下载 相关 举报
05 IBM AIX系统管理.docx_第1页
第1页 / 共30页
05 IBM AIX系统管理.docx_第2页
第2页 / 共30页
05 IBM AIX系统管理.docx_第3页
第3页 / 共30页
05 IBM AIX系统管理.docx_第4页
第4页 / 共30页
05 IBM AIX系统管理.docx_第5页
第5页 / 共30页
点击查看更多>>
下载资源
资源描述

05 IBM AIX系统管理.docx

《05 IBM AIX系统管理.docx》由会员分享,可在线阅读,更多相关《05 IBM AIX系统管理.docx(30页珍藏版)》请在冰豆网上搜索。

05 IBM AIX系统管理.docx

05IBMAIX系统管理

目录

第1章例行检查1

1.1常用的命令1

1.2语法介绍1

1.3其它命令4

第2章逻辑卷相关工作6

2.1IBMAIX系统管理的日常工作6

2.2关于IBMAIX的逻辑卷管理6

2.2.1LVM命令7

第3章键参数检查9

3.1AIO参数检查9

3.2磁盘阵列queue_depth参数检查9

3.3用户参数检查9

3.4激活SSAFast-WriteCache10

3.5IO参数设置10

3.6syncddaemon的数据刷新频率10

3.7检查系统硬盘的镜像10

第4章性能分析12

4.1性能瓶颈定义12

4.2性能范围12

第5章SHUTDOWN13

5.1概念13

5.2关机命令13

第6章备份与恢复14

6.1用SMIT备份14

6.2手工备份14

第7章错误检测15

7.1故障信息的收集15

7.1.1错误信息检测15

7.1.2控制面板上的LED代码16

7.2其他用于收集系统信息的命令17

7.3硬件故障定位方法19

7.3.1系统的启动顺序20

7.3.2系统不能启动20

7.3.3系统停在551,555或55721

7.3.4CDE图形界面挂死22

7.3.5系统dump22

7.47133-D40SSA磁盘柜的故障定位24

7.5软件故障定位方法24

7.5.1文件系统空间不够24

7.5.2检查文件系统的完整性25

7.5.3查看卷组信息25

7.5.4检查内存交换区25

7.5.5小型机内存泄漏问题25

第1章例行检查

1.1常用的命令

CPU

Memory

Disk

Network

标准UNIX命令(包括HP、SUN等)

vmstat,sar,ps

vmstat,ps

iostat,sar,vmstat,

netstat,nfsstat

AIX详细输出

tprof

svmon,rmss

filemon,fileplace

entstat

AIX非常详细输出

syscalls,trace,emstat

trace

trace

trace,iptrace

分析工具

topas

topas

topas

topas

1.2语法介绍

1.vmstat

vmstat:

检查内存、CPU、进程状态等。

#vmstat115

kthrmemorypagefaultscpu

----------------------------------------------------------------

rbavmfrerepipofrsrcyinsycsussyidwa

10281328127700000013237567651340

20281328127700000012733813199000

20281328127700000013231613199000

20281328127700000012031712699000

20281328127700000014631612799000

20281328127700000013031712599000

20281328127700000013531612799000

20281328127700000012931712499000

20281328127700000013330412799000

r:

正在运行的进程

b:

被阻挡的进程

avm:

活动的虚内存,单位4kb

fre:

自由列表,位4kb

po:

页换出

pi:

页换入

sy:

系统占用CPU

id:

空闲CPU

wa:

等待的CPU

2.sar

sar:

检查CPU、IO

例如:

sar-u130

sar-PALL110

语法:

sar-[abckmqruvwyA]intevalrepetition

-bbuffer活动

-c系统调用

-k内核进程统计.

-m消息及信号量活动

-q正在运行的队列数及等待队列数

-r页交换统计

-uCPU利用

-PCPU负载.

3.ps

PS:

检查进程状态命令

ps:

显示当前SHELL重所有进程

ps-ef:

显示系统中所有进程,-f显示更详细信息

ps-uoracle:

显示oracle用户进程

ps–emoTHREAD:

显示线程信息

psau;psvg:

按使用时间显示进程(最近一次调用)

psaux:

按使用时间显示进程(进程启动)

4.svmon

svmon:

显示进程占用内存

svmon–G:

显示系统占用内存

svmon-Ccommand_name:

显示某个用户进程占用内存

svmon-Ppid

显示某个进程占用内存

svmon–S:

显示段占用内存

5.iostat

iostat:

显示磁盘IO

tty:

tintoutavg-cpu:

%user%sys%idle%iowait

0.04.00.91.395.42.5

Disks:

%tm_actKbpstpsKb_readKb_wrtn

hdisk058.4218.341.2172920

hdisk116.885.621.44280

hdisk250.6223.955.6110020

hdisk316.885.621.44280

hdisk40.00.00.000

hdisk543.4279.169.813960

hdisk60.00.00.000

hdisk716.427.220.20136

hdisk80.00.00.000

hdisk99.4156.011.40780

hdisk1016.427.220.20136

cd00.00.00.000

6.netstat,entstat

netstat,entstat:

显示网卡信息

netstaten0:

显示en0信息

netstat–s:

显示网络信息

netstat-m

显示网络buffers.

netstat-i

显示网卡状态

netstat-Ien01

显示eno网卡塞(1秒间隔)

7.no

no:

显示tcpip参数设置

no–a:

显示tcpip所有参数当前设置

no-otcp_keepalivetime=7200000

设置tcp_keepalivetime等于3600000秒

no-d恢复默认值

注:

该方法在重启后失效

1.3其它命令

检查文件系统

df-k

检查设备

lsdev-C

检查物理卷

lspv

检查交换区

lsps-a

检查配置

lscfg-vp

检查软件

lslpp-l

检查用户

who

第2章逻辑卷相关工作

2.1IBMAIX系统管理的日常工作

系统管理员对小型机系统的正确管理是系统稳定运行的保障,作为系统管理员应注意以下几个方面:

1.开关机步骤

2.用户组及用户管理

3.文件系统维护

发现文件系统已满,应及时删除无用文件或扩大文件系统。

4.系统日常管理

系统管理员最好用smit来进行系统管理。

Smit是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。

5.系统备份

备份是保护用户数据不丢失的重要手段。

一般系统备份的要求如下:

A.每一台机器的操作系统至少有一个全备份。

B.每天备份用户数据。

C.操作系统配置修改后重新备份操作系统。

6.定时清洗磁带机

7.定时检查设备指示灯状态

8.简单故障的判断

9.熟悉ibmaix操作系统

2.2关于IBMAIX的逻辑卷管理

IBMAIX存储管理的五个基本概念:

物理卷PhysicalVolume,称为PV:

指物理上硬盘,一个硬盘就是一个PV,名字为HDISK0、HDISK1。

物理分区(PhysicalPartitions):

物理卷被划分成大小一样的物理分区PPs

逻辑卷组LogicalVolumeGroup,称为VG:

一个VG包含整数个PV,可理解为一个大硬盘。

逻辑卷LogicalVolume,称为LV:

相当于对大硬盘进行逻辑分区,一个VG里可有若干个LV,对用户讲,LV上的数据是连续的,但PV上的数据可能是分散的。

逻辑分区(LogicalPartitions):

每个LV有若干逻辑分区(LPs)组成,每个逻辑分区至少有一个PV组成。

文件系统FileSystem:

在逻辑卷的基础上,可建立文件系统JFS,然后MOUNT到一个目录下,这样就可以文件存取的方式来使用这块硬盘了。

当然,您也可以不建文件系统,而直接把LV当作裸设备,以TRUNK方式来存取数据,许多数据库都是用这种方式存取数据。

2.2.1LVM命令

1.smit

一般采用smit命令可对PV、VG、LV、JFS等进行图形化管理,命令如下:

smitlvm

屏幕显示如下:

AddaLogicalVolume

LogicalvolumeNAME[scratch]

*VOLUMEGROUPnametestvg

*NumberofLOGICALPARTITIONS[64]#

PHYSICALVOLUMEnames[hdisk1hdisk2hdisk3]+

LogicalvolumeTYPE[jfs]

POSITIONonphysicalvolumemiddle+

RANGEofphysicalvolumesminimum+

MAXIMUMNUMBERofPHYSICALVOLUMES[]#

touseforallocation

NumberofCOPIESofeachlogical2+

partition

MirrorWriteConsistency?

yes+

Allocateeachlogicalpartitioncopyyes+

onaSEPARATEphysicalvolume?

RELOCATEthelogicalvolumeduringyes+

reorganization?

LogicalvolumeLABEL[]

MAXIMUMNUMBERofLOGICALPARTITIONS[512]#

EnableBADBLOCKrelocation?

yes+

SCHEDULINGPOLICYforreading/writingparallel+

logicalpartitioncopies

EnableWRITEVERIFY?

no+

FilecontainingALLOCATIONMAP[]

StripeSize?

[64K]

2.其他命令

lsvg:

查看vg名字

查看vg详细信息:

lsvg

查看vg内的LVs:

lsvg-l

查看vg内的PV:

lsvg-p

查看激活的VG:

lsvg–o

lspv:

查看物理卷组pg名字

查看PV详细信息:

lspvhdiskN

查看PV内的LVslspv-lhdiskN

查看PV内的PP:

lspv-phdiskN

lslv:

查看LV的信息

查看LV名字:

lsvg-l

查看LV详细信息:

lslv

查看PV内的LVs:

lslv-l

查看PV内的PP:

lslv-p

查看镜像的LV:

lslv-m

第3章键参数检查

3.1AIO参数检查

#lsattr-Elaio0

minserversXMINIMUMnumberofserversTrue

maxservers80MAXIMUMnumberofserversTrue

maxreqs4096MaximumnumberofREQUESTSTrue

kprocprio39ServerPRIORITYTrue

autoconfigavailableSTATEtobeconfiguredatsystemrestartTrue

fastpathenableStateoffastpathTrue

MaxServers=10*numberofdisks

MinServers=MaxServers/2

其中MaxServers最大为80

可用命令#smittyaioChange/ShowCharacteristicsofAsynchronousI/O

修改相应的值。

3.2磁盘阵列queue_depth参数检查

假设DATAVG的RAID盘为hdisk2

#lsattr-Elhdisk2

pvid00019081a0dc91ea0000000000000000PhysicalvolumeidentifierFal

queue_depth8QueuedepthTrue

queue_depth值设置为7133硬盘个数

可用命令#chdev–lhdisk2–aqueue_depth=x修改,但VG必须为VARYOFF状态。

3.3用户参数检查

#smittychlicense

修改MaximumnumberofFIXEDlicenses为10

#lsattr-Elsys0|grepmaxuproc

maxuproc200MaximumnumberofPROCESSESallowedperuserTrue

用#smittychgsys修改

利用lsattr-Elsys0检查maxuproc,minpout,maxpout等参数的大小。

maxuproc为每个用户的最大进程数,当应用涉及大量的顺序读写而影响前台程序响应时间时,可考虑将maxpout设为33,minpout设为16,利用smittychgsys来设置。

3.4激活SSAFast-WriteCache

利用smittyssafastw来激活每一个逻辑盘hdiskn的Fast-WriteCache:

选择硬盘后,把EnableFast-Write一项改为Yes后回车即可。

对于OPS必须关闭,对于GAILOVER或单机必须打开。

3.5IO参数设置

HighwatermarkforpendingwriteI/Osperfile(maxpout)和LowwatermarkforpendingwriteI/Osperfile

它们缺省值为0,在双机环境中一般应设Highwatermark为33,Lowwatermark为24,这两个参数可用smittychgsys来设置。

3.6syncddaemon的数据刷新频率

该值表示刷新内存数据到硬盘的频率,缺省为60,一般可改为20,也可根据实际情况更改。

该参数通过vi/sbin/rc.boot更改,其中一行如下:

nohup/usr/sbin/syncd60>/dev/null2>&1&

改为:

nohup/usr/sbin/syncd20>/dev/null2>&1&

3.7检查系统硬盘的镜像

#lsvg–lrootvg

rootvg:

LVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINT

hd5boot122closed/syncdN/A

hd6paging48962open/syncdN/A

paging00paging32642open/syncdN/A

hd8jfslog122open/syncdN/A

hd4jfs122open/syncd/

hd2jfs32642open/syncd/usr

hd9varjfs5102open/syncd/var

hd3jfs482open/syncd/tmp

hd1jfs122open/syncd/home

注意:

PPs为LPs的两倍,PVs为2

如果系统盘未镜像,而系统盘为18G盘,用命令镜像

#mirrorvgrootvghdisk0hdisk1

(对rootvg进行镜像)

#bosboot–a

在两块盘上重建bootimage

#bootlist–mnormalhdisk0hdisk1

设置机器的启动顺序

第4章性能分析

4.1性能瓶颈定义

项目

检查命令

判断标准

CPU

vmstat

%user+%sysgreater大于75%

DiskI/O

vmstat

%iowait大于30%(AIX4.3.3orlater)

应用程序磁盘

iostat

%tm_act大于60%

交换区

lsps–a

大于60%

页交换数量

iostatvmstat

大于10×CPU数量

4.2性能范围

极差

CPU

60%

75%

90%+

Disk

<30%

<40%

<50%+

Memory

0

10

pages/秒CPU>50

第5章SHUTDOWN

5.1概念

IBMAIX的启动分为多用户(normal)和单用户(service)模式,在正常情况下,一般选择多用户模式。

5.2关机命令

快速关机,不警告用户

shutdown-F;halt

快速关机并重启

shutdown–Fr;reboot

警告一分钟后关机并重启

shutdown-r

发送关机命令,但不关机

shutdown-k

关机并警告用户推出

Shutdownnow

关机到单用户模式

Shutdown-m;inits;telinits

第6章备份与恢复

6.1用SMIT备份

#smittymksysb进行系统备份

当COMMANDSTATUS页面中Command:

OK出现后,表示备份成功。

取出制作完毕的磁带,在磁带上的标签上注明备份机器的名称和序列号。

6.2手工备份

#mksysb/dev/rmt0

第7章错误检测

7.1故障信息的收集

7.1.1错误信息检测

errdemon进程在系统启动时自动运行,记录包括硬件、软件及其他操作信息故障记录文件为/var/adm/ras/errlog。

使用errpt命令,列出简短出错信息:

#errpt|more

ERROR_IDTIMESTAMPTCRESOURCE_NAMEERROR_DESCRIPTION

192AC0710723100300T0errdemonErrorloggingturnedoff

0E017ED10720131000PHmem2Memoryfailure

9DBCFDEE0701000000T0errdemonErrorloggingturnedon

038F25800624131000UHscdisk0UNDETERMINEDERROR

AA8AB2410405130900TOOPERATOROPERATORNOTIFICATION

TIMESTAMP:

MMDDHHMMYY(月日时分年)

T(类型):

P永久;T临时;U未知(永久性的错误应引起重视)

C(分类):

H硬件;S软件;O用户;U未知

#errpt-dH列出所有硬件出错信息

#errpt-dS列出所有软件出错信息

#errpt-ajERROR_ID列出详细出错信息

#errpt-aj0502f666<---ERROR_ID用大小写均可

例:

LABEL:

SCSI_ERR1

ID:

0502F666

Date/Time:

Jun1922:

29:

51

SequenceNumber:

95

MachineID:

123456789012

NodeID:

host1

Class:

H

Type:

PERM

ResourceName:

scsi0

ResourceClass:

adapter

ResourceType:

hscsi

Location:

00-08

VPD:

<---VirtalProductData

DeviceDriverLevel.........00

DiagnosticLevel............00

DisplayableMessage.........SCSI

ECLevel....................C25928

FRUNumber..................30F8834

Manufacturer................IBM97F

PartNumber.................59F4566

SerialNumber...............00002849

ROSLevelandID............24

Read/WriteRegisterPtr.....0120

Description

ADAPTERERROR

ProbableCauses

ADAPTERHARDWARECABLE

CABLETERMINATORDEVICE

FailureCauses

ADAPTER

CABLELOOSEORDEFECTIVE

RecommendedActions

PERFORMPROBLEMDETERMINATIONPROCEDURES

CHECKCABLEANDITSCONNECTIONS

DetailData

SENSEDATA

000000000000

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1