Linux服务器巡检分析报告.docx
《Linux服务器巡检分析报告.docx》由会员分享,可在线阅读,更多相关《Linux服务器巡检分析报告.docx(9页珍藏版)》请在冰豆网上搜索。
Linux服务器巡检分析报告
Linux服务器巡检报告
————————————————————————————————作者:
————————————————————————————————日期:
Linux服务器巡检指导
设备
PowerEdge
硬件配置信息
机型号
PowerEdgeR710
CPU
4颗Intel®Xeon®CPUE5520@2.27GHz
内存
16G
硬盘
600G
系统信息
操作系统
LINUX2.6.18
IP
主机名
(一)服务器硬件检查
检查项
检查操作
参考标准
巡检情况
机柜或者机器上的防尘网
观察机柜以及机器上的防尘网上的灰尘
是否在防尘上堵塞导致气流不畅。
系统风扇运转检查
观察并用手感觉进风和出风是否正常
主机和磁盘柜的所有风扇运转正常。
系统运装噪音检查
仔细听系统运转声音
噪音是否过大,有无异常声音
系统电源指示灯检查
观察液晶面板、电源指示灯、硬盘报警灯等显示
液晶面板、电源指示灯、硬盘报警灯等显示情况正常
服务器硬盘工作状态
硬盘指示灯指示是否正常,一般绿色为正常
绿色闪烁
检查网线是否连接正常
检查网线与交换机之间的连线是否正常,以及双机心跳网线连接是否正常
交换机连接主机的所有端口指示灯为长亮,双机系统的公网与交换机之间的连接应为交叉连接。
服务器网卡工作状态
服务器插上网线后,若有数据传输,则网卡指示灯呈现规律性闪烁;若闪烁不正常或指示灯指示颜色不正常,则说明系统数据传输将不正常
网卡指示灯正常闪烁
服务器散热检测
靠近服务器检查是否有热风吹出
服务器电源连接检查
电源连接线是否有松动、接触不良等情况
服务器外壳整体检查
服务器整体是否有移动或损害痕迹
服务器机房温度
机房的温度是否异常变动,温度数值多少
参考值温度:
20℃-26℃
服务器机房湿度
机房的湿度是否异常变动,湿度计数值多少
参考值温度:
45%-60%
服务器机房静电防护
防静电地板是否损坏,防静电设备是否正常
服务器标签检查
标签是否松动、脱落,字体是否模糊不清
(二)操作系统检查
检查项
检查操作
参考标准
巡检情况
操作系统版本检查
执行命令uname–a
系统账户检查
利用root身份、口令登陆
能够正常登陆到系统
系统运行状态
#uptime
系统UP时间应该为上次重启导目前的时间
(二)性能检查
检查项
检查操作
参考标准
巡检情况
检查各进程资源CPU占用率
#top-c
CPU使用率小于80%
检查各进程资源内存占用率
#top–c
内存使用率小于80%
检查各进程资源内存交换区使用率
#top–c
内存交换区使用率小于80%
进出占用资源检查
#top–c进程名
察看系统最占资源的进程
察看具体某个进程占用资源的具体情况
Top命令
统计信息区
前五行是系统整体的统计信息。
第一行是任务队列信息,同uptime命令的执行结果。
其内容如下:
16:
35:
22
当前时间
up17day5:
45
系统运行时间,格式为时:
分
4user
当前登录用户数
loadaverage:
0.15,0.15,0.08
系统负载,即任务队列的平均长度。
三个数值分别为1分钟、5分钟、15分钟前到现在的平均值。
Tasks:
366total
进程总数
1running
正在运行的进程数
364sleeping
睡眠的进程数
0stopped
停止的进程数
1zombie
僵尸进程数
Cpu(s):
0.3%us
用户空间占用CPU百分比
0.0%sy
内核空间占用CPU百分比
0.0%ni
用户进程空间内改变过优先级的进程占用CPU百分比
99.9%id
空闲CPU百分比
0.0%wa
等待输入输出的CPU时间百分比
0.0%hi
0.0%si
第五行以后内容是内存信息。
内容如下:
Mem:
16429816ktotal
物理内存总量
16366812kused
使用的物理内存总量
63004kfree
空闲内存总量
377544kbuffers
用作内核缓存的内存量
Swap:
18481144ktotal
交换区总量
320kused
使用的交换区总量
18480824kfree
空闲交换区总量
7835708kcached
缓冲的交换区总量。
内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖,该数值即为这些内容已存在于内存中的交换区的大小。
相应的内存再次被换出时可不必再对交换区写入。
PID每个进程的父进程ID。
USER每个进程所有者的用户名。
PR每个进程的优先级别。
NI该进程的优先级值。
VIPT该进程的代码大小加上数据大小再加上堆栈空间大小的总数。
单位是KB。
RES该进程占用的物理内存的总数量,单位是KB。
SHR该进程使用共享内存的数量。
S该进程的状态。
其中S代表休眠状态;D代表不可中断的休眠状态;R代表运行状态;Z代表僵死状态;T代表停止或跟踪状态。
CPU%该进程自最近一次刷新以来所占用的CPU时间和总时间的百分比。
MEM%该进程占用的物理内存占总内存的百分比。
TIME+该进程自启动以来所占用的总CPU时间。
如果进入的是累计模式,那么该时间还包括这个进程子进程所占用的时间。
且标题会变成CTIME。
COMMAND该进程的命令名称,如果一行显示不下,则会进行截取。
内存中的进程会有一个完整的命令行。
(三)安全检查
检查项
检查操作
参考标准
巡检情况
检查当前登陆用户
#who
除了管理员外没有其他用户登录
文件系统占用率
#df–ah
没有文件系统超过80%的现象
系统账户安全检查
#more/etc/passwd
#more/etc/shadow
没有异常账户信息存在
文件系统日志
#dmesg
无错误日志或错误日志不会影响系统的正常运行
系统开放端口检查
#netstat
指显示出提供对于服务的端口,无关的端口一律关闭
系统登陆情况检查
#lastlog
无异常账户或异常时间登陆
显示登录在系统里的用户,检查他们正在做什么以及他们的处理器使用状况。
属于常用的安全方面的命令。
#w
查看硬件配置:
本地硬盘
2、文件系统占用率df–k表示的是文件系统名称使用空间、空闲空间、使用率、文件所在位置。
(四)网络管理命令
检查项
检查操作
参考标准
巡检情况
显示内核路由表
#route–n
主机连接系统网络情况
ping命令
观察5分钟是否有丢包情况
主机网络配置情况
执行命令ifconfig–a
端口应该UP,IP地址、子网掩码正确
服务器整体巡检结果
巡检时间:
巡检人: