AIX日常维护手册.docx

上传人:b****8 文档编号:9294642 上传时间:2023-02-04 格式:DOCX 页数:23 大小:1.20MB
下载 相关 举报
AIX日常维护手册.docx_第1页
第1页 / 共23页
AIX日常维护手册.docx_第2页
第2页 / 共23页
AIX日常维护手册.docx_第3页
第3页 / 共23页
AIX日常维护手册.docx_第4页
第4页 / 共23页
AIX日常维护手册.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

AIX日常维护手册.docx

《AIX日常维护手册.docx》由会员分享,可在线阅读,更多相关《AIX日常维护手册.docx(23页珍藏版)》请在冰豆网上搜索。

AIX日常维护手册.docx

AIX日常维护手册

 

日常简易维护与报修指南

 

一、系统命令

检查系统状态:

Ø系统整体:

prtconf

Ø文件系统:

df–k,df-g

设备:

lsdev–C获取设备名称、状态、位置和描述。

Ø

例:

查看硬盘:

lsdev–Ccdisk

查看磁带机:

lsdev–Cctape

查看适配卡:

lsdev–Ccadapter

处理器个数lsdev–C|grepproc

系统配置lscfg–vp获取所有已配置硬件设备的详细信息。

Ø

例:

查看硬盘信息:

lscfg–vlhdiskxx表示数字

查看网卡信息:

lscfg–vlentxx表示数字

查看磁带机:

lscfg–vlrmtxx表示数字

查看硬件属性:

lsattr–El获取已配置设备的属性信息。

Ø

例:

查看硬盘属性:

lsattr–Elhdiskxx表示数字

查看网卡属性:

lsattr–Elentxx表示数字

查看磁带机属性:

lsattr–Elrmtxx表示数字

内存大小:

lsattr–Elmem0

Ø磁盘lspv

Ø交换分区lsps–a

Ø软件lslpp–l文件包名字

Ø用户who

关机命令:

–shutdown

一分钟后关机

–shutdown+2

二分钟后关机

–shutdown–Fr

关机重启(-r)

 

关机命令调用/etc/rc.shutdown关闭程序

可以在这个文件里加上你自己的脚本

 

其它基本命令

#passwd

passwd:

—输入旧口令

newpasswd:

—输入新口令

re-enternewpasswd:

—重新输入新

•mkdir/rm/mv/cd-用于创建目录/删除文件或目录/更改文件或目录名/进入某一目录

•ls显示目录中的内容(文件名)

#ls–a列出当前目录中的所有文件

#ls–l显示文件的详细信息

•ps/kill显示后台进程的有关信息或杀死后台进程

#kill-9253432

•find在一个/多个目录中查找符合条件的文件

#find–name‘t*’-print

•head/tail显示文件头/尾声的内容

#tail+200filename

•who/finger列出系统注册/已登录的用户

#whoamI

#fingeruser2

 

光驱cdrom

•加载cdrom

•使用:

mount-rvcdrfs/dev/cd0/cdrom

–或者创建一个CD-ROM文件系统并进行加载

•smitcdrfs

•mount/cdrom

•卸载cdrom

–unmount/cdrom

 

二、备份与恢复

rootvg备份—mksysb

●只备份rootvg

●只备份已挂接的文件系统

●以备份格式创建可启动磁带

●保存rootvg中的换页空间设备定义

●保存逻辑卷策略

●备份时应使活动的用户和应用减至最少

注:

mksysb创建操作系统备份,如果rootvg中有用户创建的文件系统,只要它已挂接,也被备份,用户创建的不含文件系统的逻辑卷内容及定义不备份。

mksysb创建的备份磁带是可启动的,并可以进行BOS安装。

从磁带恢复rootvg备份时,所有文件系统被恢复,启动逻辑卷自动创建,文件系统日志设备按照默认大小(一个逻辑分区)创建,根据保存的换页空间设置生成同样大小的换页空间设备。

用户可以用一个系统上生成的rootvg备份恢复到另一系统上,前提是两个系统的结构相同,总线结构不同(MCA和PCI)或SMP(支持多CPU)与非SMP(只支持一个CPU)的系统间不能进行上述操作。

#smitmksysb

 

 

•CreationofaMAPfile:

是否为卷组中每个要备份的逻辑卷生成逻辑分区到物理分区的映像文件。

这个映像文件可以使恢复时逻辑卷策略和逻辑分区到物理分区的映射关系保持相同。

建议创建。

•EXCLUDEfiles:

如果选择yes,将使得文件/etc/exclude.rootvg文件中列出的文件和目录不被备份。

•MakeBOOTABLEbackup:

是否生成可启动备份,一般取默认值——yes。

•EXPAND/tmpifneeded:

是否在需要时自动扩展/tmp文件系统。

强烈建议选yes。

•NumberofBLOCKStowriteinasingleoutput:

选择每次写出的数据量,以512字节块为单位。

非rootvg的卷组备份

#smitsavevg

 

恢复rootvg备份

●依照从磁带安装操作系统的步骤用mksysb磁带启动

WelcometoBaseOpertingSystem

Installation&Maintenance

1StartInstallNowWithDefaultSettings

2Change/ShowInstallationSettingsandInstall

>>>3StartMaintenanceModeforSystemRecovery

Maintenance

1AccessARootVolumeGroup

2CopyaSystemDumptoRemovableMedia

3AccessAdvancedMaintenanceFunctions

>>>4InstallfromaSystemBackup

ChooseTapeDrive

TapeDrivePathName

>>>1tape/scsi/4mm/12GB/dev/rmt0

恢复非rootvg卷组备份

#smitrestvg

 

依文件名备份-smit屏幕

#smitbackfile

 

 

其他UNIX备份命令

●tar(tapearchive)

◇适用范围广

◇非常适合在不同UNIX平台间传送文件

◇可恢复空目录(-d选项)

◇不支持AIX访问控制列表(ACL,属于扩展inode内容)

●cpio(copyinputtooutput)

◇适用范围广

◇符号链接较多时可能不能正常工作

◇不支持AIX访问控制列表(ACL,属于扩展inode内容)

●dd(devicetodevice)

◇创建精确相同的备份映像,可用于精确备份逻辑卷

◇可用于转换某些内容(例如大小写、ASCII与EBCDIC互转等)

三、AIX安全

控制增长迅速的文件

●/var/adm/wtmp

●/var/spool/*/*

●/smit.log

●/smit.script

●/etc/security/failedlogin

●/var/adm/sulog

显示文件和目录的空间占用量

du/home|sort–rn

安全性记录文件

●/var/adm/sulog

记录每次su命令的执行。

这是个文本文件。

使用任何观看文本文件的命令查看。

●/var/adm/wtmp和/etc/utmp

记录用户的成功登录。

使用who命令查看。

●/etc/security/failedlogin

记录所有不成功的登录尝试。

如果用户名不存在,记录为UNKNOWN项目。

使用who命令查看。

安全性相关文件

●包含用户属性和访问控制的文件

●/etc/passwd合法用户(无口令内容)

●/etc/group合法用户组

●/etc/security/passwd含有加密形式的用户口令

●/etc/security/user用户属性,口令限制

●/etc/security/limits对用户的限制

●/etc/security/environ用户环境设定

●/etc/security/login.cfg登录设置

●/etc/security/group用户组属性

用户环境的合法性检查和修正

●检查/etc/passwd/与/etc/security/passwd的一致性,以及/etc/security/login.cfg和/etc/security/user,同时修正错误:

pwdck-yALL

●检查//etc/security/user、/etc/security/limits、/etc/security/passwd,以及是否每个组在/etc/group和/etc/security/group中都有对应条目,并修正错误:

usrck-yALL

●检查/etc/group、/etc/security/group、/etc/passwd和/etc/security/user中关于用户组的内容的一致性,并修正错误:

grpck-yALL

四、错误日志查看

•所有AIX错误都记录在一个记录文件中/var/adm/ras/errlog

•显示错误

–errpt[-a]-a为详细显示

可以输出到文件或用more、pg察看

•清空错误记录信息

–errclear0

建立/修改口令

通过errpt产生错误报告

•显示所有的错误报告

–#errpt

•只报告硬件错误

–#errpt-d-H

•描述ID为F49E2A17的错误报告

–#errpt-a-jF49E2A17

例:

#errpt

•标识‘C’:

错误归类

–H:

硬件

–S:

软件

–O:

操作错误

–U:

不能确定

•标识‘T’:

错误类型

–PERM(并且C为H):

显示系统遇到硬件问题并且无法自动修复

–PERD(并且C为H):

系统硬件变为不可用并引起一系列错误系统

–PERM(并且C为S):

显示系统遇到软件问题并且无法自动修复

–TEMP(并且C为S):

显示系统遇到软件问题并且已经自动修复

•root用户通过手工命令errclear直接清除错误日志

–#errclear10

•清除10天以前的所有日志

–#errclear-dH0

•清除所有硬件的错误

–#errclear-Ndisk0

•删除所有资源组为disk的记录

–#errclear-TUNKN0

•删除所有类型为unknown的记录

–#errclear0

•删除所有记录

•显示errorlog的特性

–#/usr/lib/errdemon-l

ErrorLogAttributes

--------------------------------------------

LogFile/var/adm/ras/errlog

LogSize1048576bytes

MemoryBufferSize8192bytes

五、PerformanceTools

常用命令

•#ps

•#sar

•#vmstat

•#iostat

•#tprof

•#svmon

•#filemon

例:

CPU的使用情况(sar–u)

这条命令的语法是:

#sar[options]intervalnumber

例如:

#sar–u603

AIXNODE230000021107/06/99

%usr%sys%wio%idle

08:

25:

11485200

08:

26:

10633700

08:

27:

12594100

.Average564400

当%usr+%sys>80%时,CPU紧张

查看运行队列(sar–q)

这条命令的语法是:

#sar[options]intervalnumber

例如:

#sar–q603

AIXNODE230000021107/06/99

08:

41:

21runq-sz%runoccswap-sz%swpocc

08:

42:

211.2100

08:

43:

211.0100

08:

44:

211.1100

.

.

Average1.2100

注:

命令#sar–q的输出:

-runq-sz=运行队列的平均长度。

(运行队列的平均长度就是等待在队列中的进程数目)

-%runocc=运行队列被占用的时间百分比。

-swap-sz=等待被内存页交换的进程的平均数目。

-%swapocc=内存页交换队列被占用的时间百分比。

这些数据会更有意义,如果收集一段时间并且研究它的趋势。

在有些环境下可以接受庞大的运行队列,而另外的环境就不一定适用。

例如,在一个传统的商业环境中,进程都是简单而运行快速的,这时系统性能还可以忍受大的运行队列。

而在一个工程或者科学计算环境中,进程一般都是巨大且需要更密集的资源的,此时就不能忍受大的运行队列。

Paging信息

#vmstat13

注:

命令vmstat的输出:

-procs=(每秒)

r在运行队列中的进程

b在等待队列中的进程

-memory=(那个时刻的统计数据)

avm活动的虚拟页的数目

fre在空闲列表中的物理内存槽数

-page=(每秒)

re收回的页

pi/po交换进内存的页/交换出内存的页

fr/sr空闲的页/被时钟计算法则检测的页

cy时钟循环(一般为0)

-faults=(每秒)

in设备中断数

sy系统调用数

cs上下文交换数

-cpu=(就象命令sar–u,为百分比)

us用户进程

sy核心进程

id空闲时间

waI/O等待时间

这些信息是sar报告的补充。

wa如果超过25%,那么磁盘子系统可能没有平衡好。

 

与AIX存储相关的基本概念

PV:

PhysicalVolume 物理卷

VG:

VolumeGroup卷组

PP:

PhysicalPartition物理分区

LP:

LogicalPartition逻辑分区

LV:

LogicalVolume逻辑卷

LVM:

LogicalVolumeManager逻辑卷管理器

 

六、错误报告流程

常见错误代码

在上电的每一阶段,LCD面板都要显示一些数字信息:

它为您指示:

Ø正在进行加载的设备

Ø当前的工作状态

Ø加载失败的原因

可以在诊断手册中查到数字信息的含义

主机启动时的常用LED错误代码

Ø0223-0229:

Invalidbootlist.

Ø0551,0555,0557:

Corruptedfilesystem,corruptedJFSlog,andsoon

Ø0552,0554,0556:

SuperblockcorruptedandcorruptedcustomizedODM

Ø0553:

Corrupted/etc/inittabfile

硬件报错通常LED会显示8位代码,请将这8位号码记录下来

除了8位代码外,报修还需要记录故障服务器的型号和序列号,这些号码在服务器的前面板上,也可以通过prtconf命令来查看:

设备型号一览表:

550的型号为:

9113-550

570的型号为:

9117-570

DS4300的型号为:

1722-60U

DS4500的型号为:

控制柜:

1742-90U

扩展柜:

1740-1RU

3582的型号为:

3582-L23

3583的型号为:

3583-L36

光纤交换机的型号为:

2026-E12

报修方法:

拨打IBM24小时报修热线,8008101818-5100

附录一硬件接线图

 

附录二、IBM设备前后视图

IBMeServerp550前视图

 

IBMeServerp550后视图

 

IBMeServerp570前视图

 

IBMeServerp570后视图

 

DS4300磁盘阵列前视图

 

DS4300磁盘阵列后视图

 

DS4500磁盘阵列前视图

 

DS4500磁盘阵列后视图

 

错误指示灯:

琥珀色:

亮表示接口模块有错误

正常状态:

错误状态:

出口旁路指示灯:

琥珀色:

l亮表示GBIC端口没有连接或连接断开。

正常状态:

灭(当连接了光纤)

错误状态:

亮(当连接了光纤)

 

IBM3582磁带库前视图

 

 

IBM3582磁带库后视图

 

 

IBM3583磁带库前视图

 

 

IBM3583磁带库后视图

 

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1