服务器硬件运维x年x月巡检报告记录XXX模板.docx
《服务器硬件运维x年x月巡检报告记录XXX模板.docx》由会员分享,可在线阅读,更多相关《服务器硬件运维x年x月巡检报告记录XXX模板.docx(10页珍藏版)》请在冰豆网上搜索。
服务器硬件运维x年x月巡检报告记录XXX模板
服务器硬件运维x年x月巡检报告记录XXX模板
————————————————————————————————作者:
————————————————————————————————日期:
XX服务器硬件运维服务年月巡检报告
XXXX工程师:
XXXX
一、物理环境检查
检查内容
检查结果
备注
环境温度
☑正常□异常;
环境湿度
☑正常□异常;
清洁状况
□不清洁;□一般;□清洁;
通风状况
□一般;□好;□良好;
线缆状况
□一般;□好;□良好;
二、服务器检查
(1)每日上下午进行机房巡检,确认硬件没有故障,仔细聆听有无杂音和报警音。
查看服务器前后指示灯有无异常,线缆链接情况。
(2)对异常服务器进行故障诊断,通过告警灯,诊断版和诊断码进行故障的确认,有些复杂的故障则由远程ssh进行cpu,磁盘和内存占用的情况查看。
有条件的进行IPMI的管理接口链接查看日志,分析故障。
(3)在确认故障后对保内机器提交厂家维护,过保机器则由XX维保。
与用户协调迅速有效的解决故障。
(4)对故障原因进行分析,故障类别进行整理,以方便建立常用操作及运行故障应急处理资料库
(5)整理备件库,针对故障情况的分析调整备件库,以形成高效的备件库应对多发故障。
三、故障服务器
服务器【001】
品牌型号:
序列号:
安装地址:
XX机房XX机柜XX-XXU
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
□正常☑异常
电源指示灯
☑正常□异常
磁盘指示灯
☑正常□异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
☑正常□异常
CPU使用情况
☑正常□异常
内存使用情况
☑正常□异常
磁盘使用情况
☑正常□异常
网络连接
☑正常□异常
系统日志检查
系统日志检查
☑正常□异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
服务器【002】
品牌型号:
序列号:
06ZD337
安装地址:
XX机房XX机柜XX-XXU
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
☑正常□异常
电源指示灯
☑正常□异常
磁盘指示灯
□正常☑异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
☑正常□异常
CPU使用情况
☑正常□异常
内存使用情况
☑正常□异常
磁盘使用情况
☑正常□异常
网络连接
☑正常□异常
系统日志检查
系统日志检查
☑正常□异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
服务器【003】
品牌型号:
序列号:
安装地址:
XX机房XX机柜XX-XXU
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
□正常☑异常
电源指示灯
☑正常□异常
磁盘指示灯
☑正常□异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
☑正常□异常
CPU使用情况
☑正常□异常
内存使用情况
☑正常□异常
磁盘使用情况
☑正常□异常
网络连接
☑正常□异常
系统日志检查
系统日志检查
☑正常□异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
服务器【004】
品牌型号:
序列号:
安装地址:
XX机房XX机柜XX-XXU
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
□正常☑异常
电源指示灯
☑正常□异常
磁盘指示灯
☑正常□异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
☑正常□异常
CPU使用情况
☑正常□异常
内存使用情况
☑正常□异常
磁盘使用情况
☑正常□异常
网络连接
☑正常□异常
系统日志检查
系统日志检查
☑正常□异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
服务器【005】
品牌型号:
序列号:
安装地址:
XX机房XX机柜XX-XXU
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
□正常☑异常
电源指示灯
☑正常□异常
磁盘指示灯
□正常☑异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
☑正常□异常
CPU使用情况
☑正常□异常
内存使用情况
☑正常□异常
磁盘使用情况
☑正常□异常
网络连接
☑正常□异常
系统日志检查
系统日志检查
☑正常□异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
四、巡检结果以及总结
巡检日期
2018年3月5日---2018年3月31日
巡检内容
此月巡检包括XX机房以及XX的灾备机房所有x86服务器XXX台。
每日上下午各巡检一次。
主要负责硬件故障的发现与排除。
检查结果
本月共巡检服务器机房:
次。
其中:
发现故障处;修复故障个;顺延至下个月的故障个,并进行移机台。
故障以及处理措施
1.XXX专有云/曙光I620-G20内存损坏,更换内存。
2.XXX专有云/曙光I620-G20主板损坏,更换主板。
3.VMware集群inside/浪潮NF5280M4内存损坏,更换内存。
4.统计分析报送-数据节点6/华为RH2288HV3硬盘损坏,更换硬盘(SAS900GB10K02311HAL)。
5.网络监控/XXX硬盘损坏,更换硬盘(IBMSAS300G10KMODEL:
ST9300603SS)。
五、服务器位置更新
于3月26下班后对以下两台服务器进行移机操作
序号
机器型号
产品序列号
应用名称
机房
位置
1
B631-32U->A47-8U
2
B631-32U->A44-5U
客户:
巡检工程师: