运维方案模板.docx
《运维方案模板.docx》由会员分享,可在线阅读,更多相关《运维方案模板.docx(8页珍藏版)》请在冰豆网上搜索。
运维方案模板
运维方案-模板(总9页)
XXXX有限公司
服务器平台运维说明书
北京XXX有限公司
1日常运维
服务级别
1、7*24*4(工作时间4小时响应,非工作时间4小时响应),具体为:
服务期间,对于需要现场维修的问题,工程师将在记录了服务请求后的4小时内到达现场,到达现场前电话技术支持;
备件到达现场时间:
对于影响设备运行的部件,在判明故障后4小时内运抵用户现场,对于不影响设备运行的需要更换的备件在24小时内运抵现场;(可选,暂不提供)
疑难故障处理时间:
若硬件故障不能及时恢复,在8小时内提供不低于原设备配置的备机服务,直到硬件故障解决并正常运行应用。
(可选,暂不提供)
2、5*8*NBD(工作时间4小时内响应,非工作日电话响应,工作时间上门响应支持),具体为:
对于电话支持能解决的问题,4小时电话内配合解决问题;
工作时间内,对于需要现场维修的问题,XX工程师将在记录了服务请求后的4小时内到达现场;
非工作时间内,对于需要现场维修的问题,XX工程师将在记录了服务请求后,工作日上班后4小时内到达现场;
备件到达现场时间:
对于影响设备运行的部件,在判明故障后,次日运抵用户现场,对于不影响设备运行的需要更换的备件在两天内运抵现场;(可选,暂不提供)
疑难故障处理时间:
若硬件故障不能及时恢复,将协商提供不低于原设备配置的备机服务,直到硬件故障解决并正常运行应用。
(可选,暂不提供)
日常巡检
XX每周会对所有运维服务器进行现场预防性检查,巡检完毕填写巡检报告,每月提交现场预防性检查报告并通过用户确认;
XX每月对所有服务器的数据库集群及负载均衡运行状况记录性能参数,提出性能优化建议,每季度提交一次性能优化报告并通过客户确认;
XX每季度对日常巡检提供维护报告和建议,交付用户存档,同时提交半年和全年维护报告。
参与现场值班和重要时段现场维护
如需要,XX可以安排至少一名经原厂认可的工程师不低于一个工作日参与用户现场运维值班服务;
如需要,对于用户业务重要时段或公司安排的敏感日期和重大会议期间,XX派至少一名经原厂认证的工程师全程参与用户现场运维值班服务,具体时间由用户提前通知;
如需长期派驻现场服务,XX会根据用户需求建立项目运维团队,安排专职项目经理进行项目管理,安排多名经原厂认证的工程师参与系统运维,保障系统工作。
Oracle数据库调优服务
需根据具体情况提供优化方案。
数据库健康巡检及LVS负载均衡巡检服务
运维开始,XX将安排资深工程师负责数据库环境及负载均衡信息的获取,建立详细配置档案库,并根据现有配置做出相应分析,提出优化建议方案。
根据应用及服务的运行情况,每月对数据库及负载均衡情况进行巡检,每月巡检结束,编写巡检报告,每季度向用户提供巡检汇报文档。
2运维案例
3提交件列表
一.巡检报告(服务器)
客户名称:
报告日期:
年月日机器类型:
机器序列号:
检查内容
具体项目
检查结果
机
房
环
境
电源状况(220±20V)
机房温度(24℃±2℃)
机房湿度(50%±10%)
零地电压(<1V)
卫生状况,对机器做适当的清洁和除尘
检查联线状况是否合理
检查机器硬件配置,首次PM时,打印出相关内容
机
器
状
况
检查设备故障灯有无异常状况
检查系统错误日志及mail信息,永久的硬件错误信息需要及时汇报
检查操作系统备份情况,每次系统的改变都要及时备份
检查文件系统空间状况,对于根文件系统、临时文件系统等影响系统启动及运行性能的重点关注
检查机器性能,查看CPU、Memory及内存交换区相关参数,并记录相关数据,WAIT较大时,察看io性能
检查HA软件的运行状况,在用户业务允许情况下,验证系统资源是否可以正常接管
检查内存交换区使用情况
检查网络配置及性能情况
清除垃圾文件
检查磁盘空间使用情况,调整数据分布
查看系统服务资料是否齐全
数
据
库
运
行
检查日志文件和跟踪文件记录,确认所有数据库INSTANCE运行状态正常
状
况
检查数据文件状态及表空间的使用情况,对于空间扩展过快的表空间,提醒用户扩展或调整应用
检查用户的数据库备份及归档,验证用户备份的有效性
数据库系统健康检查:
检查数据库有无无效的或者无用的数据库对象
检查数据库性能,寻找数据库性能调整的机会,并进行调整
备注:
客户签字:
XX科技工程师签字:
二.健康检查及服务报告(服务器)
三.运行故障处理报告(服务器)
报告编号:
________________
客户签字:
日期:
年___月___日
工程师签字:
日期:
年_月日
四.纠正/预防措施报告单
编号:
NO.
存在(潜在)不合格事实陈述及责任部门:
填表人:
日期:
原因分析:
责任部门负责人:
日期:
拟采取的纠正(预防)措施:
责任部门负责人:
日期:
管理者代表:
日期:
完成情况:
责任部门负责人:
日期:
验证结果:
验证部门:
日期:
备注: