运维项目计划书Word格式文档下载.docx
《运维项目计划书Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《运维项目计划书Word格式文档下载.docx(9页珍藏版)》请在冰豆网上搜索。
建立xxx培训制度,持续提高xxx运维技术。
与xxx人员一起对xxx所属的服务器、网络设备、存储设备、操作系统、数据库、中间件、应用程序等IT资产进行维护及持续改进,保障其所支撑的业务系统持续、稳定运行,保障xxx对内、外服务的正常开展。
xxx运维体系整体规划咨询并交付相关文档、制定信息系统维护计划、信息系统日常运维监控、信息系统健康检查、日常备份与数据清理、日常及紧急变更、计划内演练、容量分析与优化、运行报告编写。
服务周期1年,XXXX年XX月XX日——XXXX年XX月XX日
各阶段交付物
3服务岗位与人员要求
数据中心运维人员岗位设置原则通常有以下两种方式:
按业务区域(如网络分区、应用系统类型)设置运维岗位;
按技术方向(如安全、路由交换、数据库、中间件)设置运维岗位,两种岗位设置方式各有利弊,需要根据数据xxx实际情况进行选择。
通过对xxx运维现状调研结果的分析,建议xxx按如下方式配备运维人员:
运维岗位:
1、网络岗(高级)1人
负责网络生产环境运维、网络安全策略实施、应用系统上线支持、应急事件处理、网络优化方案制定及实施等日常工作。
检查网络设备运行情况,及时发现相关的报警信息,收集网络设备数据,分析性能问题提出优化建议;
配置、调整网络设备配置参数,实现应用程序的特定要求和最佳性能;
2、网络岗(高级)1人
负责xxx日常网络运行维护,协助制定网络建设、优化建议和管理章程,及时处理网络设备使用中的各类问题,保障生产、开发、测试网络的正常工作,协助生产环境相关运维工作,构成AB角。
3、系统岗1人(高级)
负责检查系统和数据库运行情况,及时发现相关的报警信息,收集系统、数据库运行数据分析性能提出优化建议;
配置、调整系统和数据库参数,保障应用程序高效运转;
根据实际需要安装系统和数据库官方发布补丁程序。
设计并优化数据库物理建设方案;
制定数据库备份和恢复策略及工作流程与规范,针对数据库应用系统运行中出现的问题,提出解决方案;
对空间数据库进行分析、设计并合理开发,实现有效管理;
监督数据库的备份和恢复策略的执行,数据迁移策略制定和执行;
为应用开发、系统知识等提供技术咨询服务。
4、系统岗1人(高级)
负责xxxIBM,DELL小型机,服务器系统硬件和系统平台正常运行;
及时分析系统硬件,软件问题;
监控xxx核心数据库、统一数据库运行情况,及时处理系统和数据库问题,给出建设性意见和建议;
负责xxx集中存储硬件和配置,适时调整存储划分,根据业务和开发、测试需要合理分配存储资源,及时发现存储设备存在问题,给出合理化建议;
监控xxx核心数据库性能,发现数据库引擎可能存在的隐患,及时处理数据库问题。
构成系统AB角。
5、数据库岗1人(中级)
负责xxxWindows平台及SQL-SERVER2000监控,问题处理;
配合xxx管理人员调整数据库监控、优化、自动作业执行、数据抽取;
配合相关人员调整Oracle数据库参数,监控核心数据库、统一数据库运行;
根据需要调整参数配置,优化数据库运行效率;
执行数据备份和恢复策略;
按照安全要求提供相关数据给业务部门并跟踪和记录数据使用情况。
运维项目经理1人,由以上运维人员兼任,职责如下:
负责xxxIT运维相关流程的规划、设计、推行、实施和持续改进;
负责xxx运维服务流程和服务标准执行情况跟踪;
负责运维工作任务内部分派下发,对实施结果负责;
负责定期提交运维情况汇总报告。
人员要求:
4服务管理
4.1总体工作要求
4.1.1人员进场要求
乙方派出工程师应与乙方签订正式劳动合同并满足甲方资质中明确的其他技能要求。
乙方工程师在甲方办公场地工作之前,乙方应针对甲方工作环境、工作要求、规章制度等方面的要求组织内部培训。
乙方工程师在甲方办公场地工作,乙方应按甲方相关流程办理人员入场手续,并签订保密承诺函。
4.1.2人员行为与服务要求
乙方人员应按甲方管理规定每日签到。
乙方工程师在甲方办公场地工作,须遵守甲方对工作场所的相关管理规定和规章制定。
一旦有违反甲方管理规定的,乙方有义务配合甲方进行人员的调整。
乙方应保证派驻甲方工作的人员稳定性,乙方派出工程师的人员变动将作为对乙方服务情况的考评内容,并根据乙方服务人员的总数及变动次数,确定合理的人员变动上限,若超出上线,则需要支付一定的违约金。
自初始名单确定后,后期涉及人员名单变化的,均列入人员变动范畴。
4.1.3工作内容总体要求
乙方工程师必须服从甲方的统一协调,在甲方要求的时间内保质保量完成各项工作。
甲方有权裁决乙方的职责范围,乙方必须执行。
乙方工程师将参与的主要工作内容如下文所列,但不仅限于下述内容,甲方有权根据项目、安全系统、安全管控等实际工作需求,进行工作内容的调整,乙方必须配合。
4.2咨询服务工作的组织实施
咨询服务工作拟按下述步骤开展
步骤1:
项目启动
步骤2:
调研访谈
步骤3:
运维体系明晰
里程碑:
第一阶段交付——xxx运维体系报告
步骤4:
xxx运维体系相关文档编写
步骤5:
xxx运维体系相关文档交流
步骤6:
xxx运维体系相关文档修改
第二阶段交付——xxx运维体系相关文档
步骤7:
xxx运维体系优化及持续改进
4.2.1制定信息系统维护计划
乙方须协助甲方编写信息系统的日常运维保障维护计划,包括值班监控安排、日常备份计划、数据清理计划、定期巡检计划、重要维护日系统停起计划、自行组织的演练安排等,工作开展情况,对运维保障计划做必要的修订与更新。
乙方须协助甲方编写、修订相关维护计划和文档。
包括:
提出维护内容,制定维护计划;
编写常见问题处理手册;
编写应急预案;
编写变更模板、变更审核控制点。
4.2.2信息系统日常运维监控
乙方须协助甲方确定系统监控内容,提出监控指标,实施日常监控,根据监控和运行情况,完善监控内容;
编写运行维护手册和监控操作手册;
按维护计划实施日常值班监控,做好监控内容的记录;
对于值班期间发生的故障或告警等进行跟踪处理;
定期完成运行报告,提出监控的优化建议。
乙方协助甲方开展系统、网络、数据库、中间件和应用系统等的监控工作,包括:
告警接收与处理;
监控指标维护;
定期分析报警内容;
对监控指标提出优化、完善建议。
4.2.3信息系统健康检查
乙方须协助甲方开展所运维系统的健康检查、日常巡检、深度巡检,包括网络、应用、系统、数据库、中间件、相关设备等,部署健康检查脚本,调整健康检查阈值,收集整理和分析处理健康检查结果;
负责特殊时点的应用运行状况健康检查,方案实施和问题处理。
收集整理和分析处理健康检查结果,编写健康检查报告,提出整改建议。
乙方协助甲方开展系统、网络、数据库、中间件的健康检查工作,包括:
编写健康检查脚本;
确认分析健康检查结果;
编写健康检查分析报告;
完善健康检查指标。
4.2.4日常备份与数据清理
根据甲方现场的实际条件,乙方须协助甲方制定应用系统备份策略、数据备份策略、应用系统备份策略;
根据备份和归档策略实施系统备份;
根据数据清理策略编写数据清理脚本,实施数据清理,检查执行结果。
4.2.5计划内演练
乙方须协助甲方编写应急处置方案、演练方案、制定演练计划;
按计划实施演练;
编写应急演练总结报告,对演练中出现的问题进行处理,就演练发现的问题进行分析,提出整改建议;
不定期更新、修订相关文档、方案。
4.2.6容量分析与优化
乙方须协助甲方定期进行系统容量性能分析,收集应用系统交易数据、业务数据、运行数据,根据业务发展和系统资源实用情况,分析系统资源使用趋势,提交系统容量性能分析报告,提出优化改进建议。
乙方协助甲方开展性能容量分析工作,做好系统容量和资源管理。
编写操作系统、数据库、容量数据收集脚本;
性能容量分析,完成报告并提出优化扩容建议;
提交系统资源分析报告。
4.2.7风险分析与优化
乙方须协助甲方定期进行系统风险分析,对信息系统在设计、配置、管理方面的风险定期进行分析、研究,提交风险分析报告,提出优化改进建议。
4.2.8版本升级
乙方协助甲方,结合系统运行情况和厂商建议,评估现有版本(固件版本、设备驱动、操作系统版本、数据库软件版本等);
制定版本升级计划和方案;
组织进行新版本的测试和验证;
选择个别非关键系统进行版本试点,对版本升级后运行情况进行重点监控;
按方案实施版本升级;
编写版本升级总结报告。
4.2.9运行报告
乙方须协助甲方,按照运行管理的要求,定期完成运行周报、运行月报、年度运行报告等。
5.1运维服务工作内容
5.1.1服务目标
运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。
同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:
硬件设备和软件系统。
硬件设备包括网络设备、安全设备、主机设备、存储设备等;
软件设备可分为操作系统软件、典型应用软件(如:
数据库软件、中间件软件等)、业务应用软件等;
用户自行开发的应用软件。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
运行状态、故障情况
配置信息
可用性情况及健康状况性能指标
5.1.2IT资产统计服务
服务内容包括:
硬件设备型号、数量、版本等信息统计记录
软件产品型号、版本和补丁等信息统计记录
网络结构、网络路由、网络IP地址统计记录
综合布线系统结构图的绘制
其它附属设备的统计记录
5.1.3网络、安全系统运维服务
从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。
设备基础性能检测:
cpu、内存使用情况监测;
设备日志查看;
设备snmp状态;
测试ping,tracert等工具的连通性;
网络安全策略应用是否正常;
Internet带宽流量的实时监测;
网络拓扑链路状态监测;
异常网络数据包流量;
Dos、ddos等网络攻击情况监测;
Internet线路的误码率、丢包率监测;
5.1.4主机、存储系统运维服务
提供的主机、存储系统的运维服务包括:
主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
进行监控管理的内容包括:
CPU性能管理;
内存使用情况管理;
硬盘利用情况管理;
系统进程管理;
主机性能管理;
实时监控主机电源、风扇的使用情况及主机机箱内部温度;
监控主机硬盘运行状态;
监控主机网卡、阵列卡等硬件状态;
监控主机HA运行状况;
主机系统文件系统管理;
监控存储交换机设备状态、端口状态、传输速度;
监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;
对存储的性能(如高速缓存、光纤通道等)进行监控。
5.1.5数据库系统运维服务
提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。
通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。
同时,密切注意数据库系统的变化,主动地预防可能发生的问题。
数据库基本信息:
文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句。
表空间使用信息监测;
数据库文件I/0读写情况;
Session连接数量监控;
数据库监听运行状态监测;
查看每日数据备份、数据同步是否正常;
报警日志监测;
对表和索引进行Analyze,检查表空间碎片;
检测数据库后台进程;
数据库对象的空间扩展情况监测;
5.1.6终端、外设运维服务
负责对终端PC、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设的故障处理工作。
6.1服务流程管理
事件处理
乙方须协助机房对来自系统监控的事件进行响应并处理。
对接到的电话、短信通知或事件处理单,及时做出响应,完成事件的处理;
在事件处理完毕后,及时整理、完成事件分析报告;
定期回顾历史事件,分析潜在风险,提出优化建议。
乙方协助甲方对事件和问题进行响应并处理。
具体工作如下:
负责事件和问题的诊断及处理;
负责制定应急预案;
负责应急处理;
负责事件和问题分析,负责提交报告、完善应急预案或提交知识。
问题处理
乙方须协助甲方对事件处理中未找到原因的事件进行分析处理流程,结合系统日志、事件现象等数据,对问题做分析处理,力求找出问题原因,形成解决方案。
变更与上线
乙方协助甲方对涉及系统变更的需求(外部需求、扩容需求、上线需求等)进行分析,完成需求分析报告;
与基础设施资源管理部室落实变更所需资源,确认涉及到的资源到位;
编写变更、系统上线方案、回退方案及其他上线资料;
核实或确定上线版本;
填写变更申请单,提出变更申请;
参加变更、上线实施工作。
知识管理
乙方协助甲方对已处理的事件、问题等进行总结,形成知识点,提交甲方人员审核后,归入中心知识库。
风险管理
乙方应遵守关于系统安全性管理、设备口令管理、数据安全性管理、人员进出机房管理等相关管理规定。
协助甲方定期开展系统安全性检查,以满足风险管理相关规定与要求。
服务响应
乙方协助甲方对客户的服务请求做出响应、满足或支持客户服务请求,提供技术支持。