运维服务巡检操作手册.docx
《运维服务巡检操作手册.docx》由会员分享,可在线阅读,更多相关《运维服务巡检操作手册.docx(16页珍藏版)》请在冰豆网上搜索。
运维服务巡检操作手册
IT服务外包预防性巡检操作手册
一、服务人员行为规范
1、服务礼仪规范;
1)穿着工作装或衬衣等正装,佩服服务工牌,并保持整洁、干净,及时清洗及更换;
2)头发保持清洁平整,长度适中。
3)胡须每日刮净,不得蓄留。
4)手部随时维持清洁,指甲经常剪修,不得留长及有污垢。
5)随时保持愉快精神,举止大方,仪态自然,以热情诚恳的态度提供顾客满意的服务。
6)前往顾客服务,应主动打招呼,说明来访原因。
7)巡检完毕后应向顾客说明故障原因及简易处理对策。
8)与顾客言谈过程中语调力求明朗、清晰、态度和蔼、亲切、表情自然。
9)处理故障时,如影响顾客工作环境时,应尽力防止,如有影响应及时清洁。
10)工具箱严禁放置地上及机器上;
11)尽量使用普通话与客户沟通与交流,并努力学习使用服务规范用语;
12)不得随意拿取客户现场资料、物品等;
13)不得收取客户一针一线;
14)进入客户机房等机密重地,需取得客户同意,方可进入;
15)不得使用服务禁语;
2、服务响应规范;
1)严格按巡检计划,及时到达客户现场,进行巡检工作;
2)如因特殊原因,无法及时到达,必须至电客户,预约到达时间,并同步转告服务经理及相关客户人员;
3)完成客户巡检,离开客户现场时,需向客户礼貌道别,并简单说明此次巡检的结果及建议;
4)不得随意承诺客户时间,而无法达成;
3、服务交付规范;
1)按标准服务流程完成巡检、故障排除等服务事项;
2)服务完毕,保持服务现场整洁、清洁;
3)如需更换物料、备件,需口头及书面向客户说明,并征得客户同意;
5)如在现场无法完成服务交付,需向客户说明,并告知客户,我司下次会上门服务解决的时间;
6)向客户简要说明,此次巡检的结果,以及后续使用建议,并记录客户的相关需求;
4、服务文档填写规范;
1)完整填写客户信息栏;
2)完整填写客户联系人信息栏;
3)完整填写客户设备配置信息栏;
4)完整填写设备巡检情况;
5)完整填写设备故障排除步骤及方法;
6)完整填写遗留问题,并告知服务台进行升级处理;
7)完整填写物料、备件更换说明;
8)按公司要求,定期呈交服务水平报告;
二、巡检流程规范;
1、电话预约;
2、提前一周做好巡检计划表;
3、与客户面对面沟通巡检计划,并取得客户同意;
4、按客户信息中心的联络进度,逐步完成巡检计划;
5、在巡检完毕后三个工作日内,向用户呈交巡检报告及相关工作建议;
6、服务经理三日内完成现场回访;
7、针对巡检过程中发现的问题,依照SLA协议提交方案,直至解决。
三、预防性巡检操作规范;
(一)视频会议巡检操作规范
1、会议室环境检查
1)温度(16℃~28℃)
2)湿度;(45%~65%)
3)噪音;
4)光线;
5)防静电措施;
6)色彩;
2、外围配套设备检查;
1)外围硬件安装情况;
2)外围硬件运行状态;
3)IP带宽、承载等;
4)线缆长度等;;
5)其他;
3、会议管理平台检查;
1)软件版本检查;
2)病毒查杀;
3)操作系统检查;
4)补丁及升级;
5)数据备份;
6)登录、管理权限检查;
7)其他;
4、多点控制单元检查;
1)MC模块工作正常
2)主控单元检查;
3)音频、视频检查;
4)各接口单元检查;
5)MCU检查;
6)图像台检查;
7)用户认证、版本信息、日志等;
5、会议功能检查;
1)召开会议功能检查;
2)导演、主席控制检查;
3)混音、远程控制检查;
4)终端视频功能检查;
6、会议终端检查;
1)查看后面板E1指示灯
2)各接线正常,显示设备能正常显示,音频设备能输出声音
3)能正常上会,图像正常,无杂音
4)检查终端各项配置
5)系统诊断功能正常(菜单系统诊断项)
6)PC控制台版本匹配,并能正常使用,包括控制摄像头等。
(如安装控制台)
7)相关操作后能正常显示画中画
8)会议中正常挂断会议,并能在挂断后正常呼叫上会议
9)图像中会场名显示正常
(二)中心机房、网络、服务器及存储系统巡检
1、机房环境检查
1)温度(16℃~28℃)
2)湿度(45%~65%)
3)机器清洁(依需要清洁机器各部)
2、机房精密空调检查
1)过滤器:
检查气滤网气流是否通畅透光目测,看滤材的干净程度,对灰尘进行清除,如有外观的上的损坏,进行更换。
检查过滤器开关,用物件挡住空调回风口1/2的面积,检查过滤器开关是否动作。
2)主风机:
检查并调整皮带轮和电机的装配,检查是否牢固和正确,用直尺检查皮带轮有无位移,偏心。
检查并调整皮带松紧程度和状况,用张力计进行测量。
检查风机轴承,运行是否平稳,无异常噪音,并且不发热,润滑是否良好。
检查风机电机和风机电流,与开机的测试报告进行比较,看数据是否正常。
3)压缩机:
检查是否有漏油及油位,如有泄漏,应找到漏点,并进行处理。
若油位不够,应补充冷冻油。
检查压缩机电流,与开机的测试报告进行比较,看数据是否正常。
检查压缩机运转声音和机身温度(运转中)是否正常。
检查压缩机高低压传感器的工作参数,与开机的测试报告进行比较,看数据是否正常。
吸气过热度不能超过10℃,排气温度的过热度不能超过150℃。
4)风冷凝器:
检查风扇绕组,测量风扇电流,同开机的测试报告进行比较,看数据是否正常。
检查风扇是否紧固轴承工作状态是否正常,运行是否平稳。
调整控制板及温度开关工作状态
清洁状况
5)蒸汽系统及加湿器
检查加湿罐内是否沉积,并进行清除。
检查所有的蒸气软管的工作状态,是否通畅,老化。
检查进水阀和排水阀(或者排水泵)是否工作正常。
检查是否进、排水。
6)红外线加湿器:
检查水盘排水管是否被堵塞。
检查工作状态是否正常。
检查加湿器是否有水垢。
检查进水流量是否适当。
7)制冷循环部分
检查制冷管路是否有泄漏,通过检查管路是否有油迹。
通过视镜,检查系统是否有水汽,色圈的颜色是否表示正常,并判断制冷剂是否需要补充。
检查吸气压力,同开机的测试报告进行比较,看数据是否正常。
检查排气压力,同开机的测试报告进行比较,看数据是否正常。
检查热气旁通。
8)电气装置
所有电器外观和动作情况,所有电器外观完好,设置正确。
检查和紧固所有导线连接,所有导线无发热。
检查校验运行状态显示,有无报警记录及自动控制是否正常。
3、系统硬件检查
1)检查系统硬件情况:
主机状态,各硬件状态,是否有设备故障灯亮
2)系统错误报告(errlog)
3)是否有发给root用户的错误报告(mail)
4)检查log文件
5)关键文件系统的使用率
6)逻辑卷组活动情况检查
7)文件系统使用情况检查
8)交换页面检查
9)检查备份情况(有否系统备份、用户数据备份、磁带机是否需要清洗)
10)通信(网卡、IP、路由表、ping、/etc/hosts、DNS设置等)
11)数据保护方式的工作状态
12)检查系统参数是否正确
13)机房环境(电压、湿度)
14)系统性能:
有否性能瓶颈(topas,vmstat)
15)系统硬件诊断
16)机器清洁和除尘
4、操作系统巡检:
1)操作系统进程,应用系统进程
2)处理的队列长度,主机性能
3)系统日志,群集日志
4)群集的调整和优化
5)系统备份与恢复
6)系统性能优化
7)系统的troubleshooting
5、数据库巡检:
1)数据库系统环境参数
2)数据库企业管理器维护
3)设备或表空间、表、视图
4)SPC、触发、函数、链接
5)用户、角色、安全
6)告警日志、事务日志
7)数据库设置参数、数据库调优
8)数据库的备份与恢复
9)备份策略的设置和优化
10)提供数据库热备的设备
11)数据库系统移植和升级
12)数据库的troubleshooting
13)小型机系统的管理和维护
A、小型机:
设备运行物理状态;
电源稳定性和线路检查;
系统性能检查;
补丁程序是否满足需求;
系统DUMP设置;
文件系统检查;
逻辑卷检查;
内存交换区检查;
系统硬件诊断;
数据安全存储检查;
数据备份状况;
系统错误报告的分析、记录和清理;
及时更换损坏的或有潜在故障的部件;
设备物理检查(包括机体、风扇、风道及过滤器等)与清洁;
如果客户需要,协同客户进行生产系统的切换测试(HA)
系统进程状况;
B、磁盘阵列:
检查所有指示灯和风扇的状况,针对异常现象采取维护措施消除故障;
通过维护软件联入阵列的维护网络口进行信息收集;
C、光纤交换机
检查所有指示灯和风扇的状况,针对异常现象采取维护措施消除故障;
通过维护软件联入阵列的维护网络口进行信息收集;
D、磁带库
查看主机LOG,进行故障记录分析。
对带机(和机械手)故障苗头提出解决方案。
经审批后进行修复动作,及时更换隐患部件。
检查所有指示灯和风扇的工作状况,确认设备完好性。
通过带库液晶面板,检查有无错误日志,确认设备完好性。
6、中间件软件检查和分析
1)应用性质描述
2)应用逻辑
3)数据库的物理设计
4)数据库的逻辑对象的设计
5)应用调优(核心SQL语句的使用与性能的关系)
6)检查分析备份结果
7)检查分析应用服务器负载均衡工作状况以及资源利用状况
8)检查分析应用服务器安全运行状况
7、UPS电源:
1)检测整个系统的运行参数,确保设备正常运行。
2)检查各主要部件的装配及内部间的连接情况。
3)检查所有螺丝、螺栓等连接点的紧固性及热腐蚀状况并做必要的调整。
4)检查是否有损坏及烧毁的元件及电缆。
5)对电池进行充放电测试。
6)对机组内外部进行清洁和除尘。
7)检测电池组/柜的完整性。
8)测量设备的输入、输出电压及电流。
9)检测UPS的同步及输出频率的稳定性。
10)对并机系统,检查每个UPS之间的负载均衡情况。
11)必要时调校UPS的一些基准点和设置参数。
12)对电池容量进行检测,内容包括:
外观是否有损坏、变形及漏水。
电池线及接线端子是否有过热及腐蚀情况。
各电池组或箱内是否有松脱。
测量每节电池的浮充电压。
在电池电极上重新涂上油脂,预防腐蚀。
电池组20%容量在线放电检测。
13.提交所有服务报告及测试记录。
14.汇报任何异常情况,提出解决方案并给予解决。
(三)软交换系统巡检规范
1、硬件检查;
1)机架和单板物理检查
2)电源和接地检查
3)机房环境检查
2、前后台系统工作检查;
1)当前告警检查
2)单板运行状态检查
3)时间同步状态检查
4)重要数据区占用情况检查
5)重要前台表容量检查
6)单板内存占用检查
7)告警箱功能检查
8)前后台数据同步
9)互为容灾的SS之间数据同步检查
10)版本检查(一致性)
3、数据安全检查;
1)口令管理检查
2)防病素和补丁检查
3)远程操作维护能力检查
4)自动备份功能检查
5)数据备份功能检查
4、重要数据检查;
1)前后台组网方式检查
2)License容量检查
3)系统容量规划检查
4)网络属性配置、静态配置的基本功能、
5)网关簇基本属性
6)网关簇临时响应定时器
7)网关簇附加属性
8)CGAS链路检测
9)全局业务参数
10)大容量网关的设备属性
11)OTHERSS的设备属性
12)端口控制列表
13)CPU拥塞控制功能登记
14)全局话务量控制配置
15)CPU占用率的话务统计
16)CPU占用率采集周期
17)SPC板的CPU占用百分比(包括主节点和普通节点)
18)CS单板属性配置
19)SPC板负荷向分布检查
20)SCTP连接配置
21)SCIP公共配置
22)SIP定时器配置
23)SIP代理服务器
24)Sip公共配置
25)计费拥塞配置
26)前台SC不保存话单配置
27)前台硬盘空间告警设置
28)SS超长话单分割定时器配置检查
29)积压话单文件检查
30)HLR配置数据
31)GT转换关系本局配置
32)GT转换关系SHLR局向配置
33)SHLR配置
34)SHLR的SCTP链接检查
35)SIP链路检测参数
36)H248链路检测参数
37)SCTP链路检测参数
5、计费服务器检查;
1)日志文件检查
2)计费文件检查
3)原始话单入库情况检查
4)JFCENTER话单保留个数检查
5)数据库空间检查
6)硬盘空间检查
7)话单分割情况检查
8)计费话单流水号检查
9)超长超短话单过滤设置检查
10)计费服务器安全管理
6、后台数据库检查;
1)Oracle优化检查
2)后台服务器检查
3)后台数据库补丁检查
4)后台服务器数据库表空间检查
5)后台服务器重启动检查
6)其它系统参数检查
7、告警与日志分析;
1)历史告警分析
2)通知消息分析
3)后台服务器日志分析
4)前台日志纪录分析
8、网络性能分析;
1)中继忙时占用情况检查
2)CPU忙时占用率检查
3)网络接通率检查
4)忙时呼损情况分析
(四)指挥调度系统巡检
1、调度系统检测
1)调度主机及配置版检查
2)UPS电源检查
3)电话模拟线路检查
4)电脑调度台及控制软件检查
2、主要项目检查
1)RGB信号显示正常
2)复合视频信号显示正常
3)网络信号显示正常
4)大屏能够任意组合,显示任意视频源
5)屏幕亮度不均匀度检查
6)屏幕有无明显色差检查
7)多视窗显示检查
8)窗口缩放检查
9)信号源能被控制PC正常调用
10)灯泡大于3000小时
11)大屏处理器检查
12)投影显示系统检查
13)LED显示系统检查
14)数字桌牌系统检查
15)会议室液晶电视机检查(显示和控制)
16)中控室电视墙检查
17)IDB检查
(五)桌面终端巡检;
1、应用系统的优化、数据的整理、常见故障的排除。
2、升级防病毒软件,检查系统软件补丁情况。
3、协助用户备份重要资料,对用户进行指导。
4、系统软件补丁升级,数据备份与恢复。
5、计算机病毒的查杀与升级。
6、调试计算机,将设备调试到最佳状态。