运维项目计划书2.docx
《运维项目计划书2.docx》由会员分享,可在线阅读,更多相关《运维项目计划书2.docx(14页珍藏版)》请在冰豆网上搜索。
运维项目计划书2
莃xxx运维服务项目工作任务书
艿XXXX有限公司
莆2015年7月16日星期三
芇1现状描述和需求
肅xxx随着业务的不断拓展,生产系统越来越复杂。
目前xxx已经建成若干套系统,支付系统、办公系统、存储服务器、线下支付系统、清算系统、审批系统、加密机、堡垒机、对账平台、防病毒系统、统计分析平台、电信合约机、外网行为审计系统等。
xxx系统实时性要求很高,xxx系统运营团队目前有3人,分别负责网络,服务器,数据库等一个或多个方面,随着业务量的增长和日益复杂的生产系统及基础环境,人员数量与系统运营岗强度之间的矛盾日益突出。
莂为解决系统运营人员数量不足的情况,拟启动IT运维外包项目,从一家技术实力雄厚的科技公司引入5名专业工程师,分别承担信用xxx运维流程体系建设、网络、主机及数据库等方面的技术支持,对xxx系统运维人员提供咨询和帮助,同时为xxx现有生产系统提供技术支持。
蒆2服务内容描述
蒄2.1咨询服务内容描述
蒃服务目标:
肁xxx运维体系整体规划咨询并协助实施落地;合规、内控管理体系满足业务持续性及信息安全监管要求。
薆服务范围:
袅xxx运维管理体系优化。
芅服务内容:
袀依据监管部门有关规定,梳理、修订、完善xxx运维体系
羀服务周期和计划:
芆服务周期3个月,XXXX年XX月XX日——XXXX年XX月XX日
蚂交付物:
袃序号
羀交付物名称
蚇拟完成日期
莄1
蚁《xxx机房管理操作规程》
肀2
肇《xxx重要信息系统突发事件应急管
理操作规程》
袂3
蒀《xxxIT服务管理操作规程》
膀4
膄《xxx计算机终端安全管理操作规
程》
薄5
腿《xxx系统软件版本管理操作规程》
芀6
薅《xxx信息安全管理操作规程》
羂7
节《xxx信息系统事件管理操作规程》
荿8
羆《xxx计算机及相关设备管理操作规
程》
螄9
羁《xxx软件版本管理操作规程》
葿10
莇《xxx数据安全管理操作规程》
膂⋯
螀2.2运维服务内容描述
蕿服务目标:
蒄保障xxx业务系统高可用及持续运行;袄系统和网络日常运维工作,提升运维工作质量和响应效率;蕿建立IT资产管理制度;
蕿建立xxx培训制度,持续提高xxx运维技术。
袅服务范围:
莁与xxx人员一起对xxx所属的服务器、网络设备、存储设备、操作系统、数据库、中间件、应用程序等IT资产进行维护及持续改进,保障其所支撑的业务系统持续、稳定运行,保障xxx对内、外服务的正常开展。
薂服务内容:
虿xxx运维体系整体规划咨询并交付相关文档、制定信息系统维护计划、信息系统日常运维监控、信息系统健康检查、日常备份与数据清理、日常及紧急变更、计划内演练、容量分析与优化、运行报告编写。
芅服务周期和计划:
肃服务周期1年,XXXX年XX月XX日——XXXX年XX月XX日
莀各阶段交付物
蝿序号
蚆交付物名称
薁交付频次或日期
腿1
衿运行日志
肇每工作日
芃2
膂运维周报
罿每周
芄3
羅运维月报
羁每月
肈4
蚅运维年报
莃每年
蚀5
莂容量分析报告
芀每季度
荿6
螃风险分析报告
蒂每季度
螁7
袇培训教材及培训记录表
螆每半年
薂3服务岗位与人员要求
袈数据中心运维人员岗位设置原则通常有以下两种方式:
按业务区域(如网络分区、应用系统类型)设置运维岗位;按技术方向(如安全、路由交换、数据库、中间件)设置运维岗位,两种岗位设置方式各有利弊,需要根据数据xxx实际情况进行选择。
通过对xxx运维现状调研结果的分析,建议xxx按如下方式配备运维人员:
蕿运维岗位:
薅1、网络岗(高级)1人
蚂负责网络生产环境运维、网络安全策略实施、应用系统上线支持、应急事件处理、网络优化方案制定及实施等日常工作。
检查网络设备运行情况,及时发现相关的报警信息,收集网络设备数据,分析性能问题提出优化建议;配置、调整网络设备配置参数,实现应用程序的特定要求和最佳性能;
艿2、网络岗(高级)1人
肆负责xxx日常网络运行维护,协助制定网络建设、优化建议和管理章程,及时处理网络设备使用中的各类问题,保障生产、开发、测试网络的正常工作,协助生产环境相关运维工作,构成AB角。
芃3、系统岗1人(高级)
螂负责检查系统和数据库运行情况,及时发现相关的报警信息,收集系统、数据库运行数据分析性能提出优化建议;配置、调整系统和数据库参数,保障应用程序高效运转;根据实际需要安装系统和数据库官方发布补丁程序。
设计并优化数据库物理建设方案;制定数据库备份和恢复策略及工作流程与规范,针对数据库应用系统运行中出现的问题,提出解决方案;对空间数据库进行分析、设计并合理开发,实现有效管理;监督数据库的备份和恢复策略的执行,数据迁移策略制定和执行;为应用开发、系统知识等提供技术咨询服务。
虿4、系统岗1人(高级)
螈负责xxxIBM,DELL小型机,服务器系统硬件和系统平台正常运行;及时分
析系统硬件,软件问题;监控xxx核心数据库、统一数据库运行情况,及时处理系统和数据库问题,给出建设性意见和建议;负责xxx集中存储硬件和配置,适时调整存储划分,根据业务和开发、测试需要合理分配存储资源,及时发现存储设备存在问题,给出合理化建议;监控xxx核心数据库性能,发现数据库引擎可能存在的隐患,及时处理数据库问题。
构成系统AB角。
莆5、数据库岗1人(中级)
螂负责xxxWindows平台及SQL-SERVER200监0控,问题处理;配合xxx管理人员调整数据库监控、优化、自动作业执行、数据抽取;配合相关人员调整Oracle数据库参数,监控核心数据库、统一数据库运行;根据需要调整参数配置,优化数据库运行效率;执行数据备份和恢复策略;按照安全要求提供相关数据给业务部门并跟踪和记录数据使用情况。
肀运维项目经理1人,由以上运维人员兼任,职责如下:
膆负责xxxIT运维相关流程的规划、设计、推行、实施和持续改进;负责xxx运维服务流程和服务标准执行情况跟踪;负责运维工作任务内部分派下发,对实施结果负责;负责定期提交运维情况汇总报告。
肅人员要求:
袂网络高级工程师
蒁1、针对网络开展
袈1.熟悉主流网络厂商产品和网络技术,具有
架构设计、结构审核工作。
2、按照业务发展提出网络结构变更,地址规划优化等建议,并提交建议报告。
3、协助完成对重大变更、重大故障等解决方案的设计和审核。
4、对网络设计方案和工程实施方案进行技术指导和审核。
CCNP(或同等)认证或相当能力水平。
袄2.熟悉通信线路,通信接入设备的运维管理。
3.熟悉行业业务流程和系统应用需求。
羁4.具有技术规范撰写能力和制度编纂工作经验。
薈5.具有技术方案设计经验,主持或参与过大型网络项目的设计建设工作。
6.学历资质要求本科以上。
7.10年以上在金融行业网络系统集成相关工作经验。
8.从事网络运维工作工作年限5年以上。
莆网络高级级工程师
蚃1、负责完成网络系统某一区域或基础服务系统运维工作,完成对全网的监控保障任务;2.根据工作总体目标,能动地设计工作方法和规程:
制订完成系统运行任务所需要的管理规定和不同使用者执行正确操作任务所需要
罿1熟悉主流网络和网络技术,CCNP以上认证(或Juniper、HW、H3C同等认证)或相当能力水平。
肈2.熟悉行业业务流程和系统应用需求。
蚆3.具有具有撰写技术方案文档经验。
膁4.具有技术方案设计经验,参与过网络项目的设计建设工作。
的指令,在工作中根据实际情况不断改进或更新这些规定和指令;
3.及时规划和申请完成工作目标所需资源,根据工作任务,制订网络规划和方案设计;
4.负责配置管理、变更管理和故障管理;
莀5.学历资质要求本科以上。
薆6.5年以上在金融行业网络集成相关工作经验。
蒅8.精通线路故障处理,具有线路维护经验
芁9.从事网络运维工作工作年限8年以上
螁10.综合布线设计经验。
芈系统岗3人
(高级)
肁5.做好各种文挡的归档工作,保证技术知识的总结积累;
1、
2、膄负责xxx主机系统的安全运行
3、
4、莁配合xxx建立健全运维制度并按照制度完成相关运维工
莁1,负责xxx关键业务主机日常软硬件维护工作;
莈2,按照xxx相关要求调整主机配置;
蒇3,负责xxx系统变更操作,填写相关文档;
肅4,负责监控xxx系统运行状态,提出优化合理性建议
蒁5,建立机器档案,记录每次变更调整内容,确
作
5、
6、膂及时处理xxx系统、数据库或存储出现的故障
7、
8、蚅熟练使用系统的监控工具跟踪系统运维状态
9、
10、芇配合其他部门完成xxx信息系统上线工作
定进程访问关系和所使用的端口。
蝿6,硬件状态监控,配合硬件维护团队更换故障部件
腿7、熟悉windowsserver,Linux系统,能熟练配置WindowsServer,Linux相关服务。
螄8、使用跟踪工具跟踪系统和数据库运行状态及性能状态。
薁9、熟悉,Dell、HP、Lenovo等主流服务器硬件特性。
膀10、具备错误排查能力,常见问题快速、及时处理。
薇11、具备3年以上WindowsServer或Linux运维经验;3年或以上Oracle管理,运维经验。
薃12、监控xxx系统核心数据库,整体数据库状态
蚀13、跟踪自动作业执行结果。
薁14、执行备份和恢复策略
艿15、配合业务部门数据要求,经授权后提供
业务数据
薆16、了解sql-server,oracle数据库工作机制,能够发现数据库异常信息,做相关处理
螀4服务管理
蚈4.1总体工作要求
螇4.1.1人员进场要求
(一)
(二)莅乙方派出工程师应与乙方签订正式劳动合同并满足甲方资质中明确的其他技能要求。
(三)
(四)袀乙方工程师在甲方办公场地工作之前,乙方应针对甲方工作环境、工作要求、规章制度等方面的要求组织内部培训。
(五)
(六)聿乙方工程师在甲方办公场地工作,乙方应按甲方相关流程办理人员入场手续,并签订保密承诺函。
葿4.1.2人员行为与服务要求
(一)
(二)膄乙方人员应按甲方管理规定每日签到。
(三)
(四)膄乙方工程师在甲方办公场地工作,须遵守甲方对工作场所的相关管理规定和规章制定。
一旦有违反甲方管理规定的,乙方有义务配合甲方进行人员的调整。
(五)
(六)蒀乙方应保证派驻甲方工作的人员稳定性,乙方派出工程师的人员变动将作为对乙方服务情况的考评内容,并根据乙方服务人员的总数及变动次数,确定合理的人员变动上限,若超出上线,则需要支付一定的违约金。
(七)
(八)羇自初始名单确定后,后期涉及人员名单变化的,均列入人员变动范畴。
膇4.1.3工作内容总体要求
(一)
(二)芄乙方工程师必须服从甲方的统一协调,在甲方要求的时间内保质保量完成各项工作。
甲方有权裁决乙方的职责范围,乙方必须执行。
(三)
(四)袁乙方工程师将参与的主要工作内容如下文所列,但不仅限于下述内容,甲方有权根据项目、安全系统、安全管控等实际工作需求,进行工作内容的调整,乙方必须配合。
蚈4.2咨询服务工作的组织实施
羆咨询服务工作拟按下述步骤开展
莄步骤1:
项目启动
芁步骤2:
调研访谈
肆步骤3:
运维体系明晰
蚄里程碑:
第一阶段交付——xxx运维体系报告
蒄步骤4:
xxx运维体系相关文档编写
蒈步骤5:
xxx运维体系相关文档交流
袈步骤6:
xxx运维体系相关文档修改
薄步骤7:
xxx运维体系优化及持续改进
衿4.2.1制定信息系统维护计划
芆乙方须协助甲方编写信息系统的日常运维保障维护计划,包括值班监控安排、日常备份计划、数据清理计划、定期巡检计划、重要维护日系统停起计划、自行组织的演练安排等,工作开展情况,对运维保障计划做必要的修订与更新。
蒆乙方须协助甲方编写、修订相关维护计划和文档。
包括:
(一)
(二)薃提出维护内容,制定维护计划;
(三)
(四)芀编写常见问题处理手册;
(五)
(六)羈编写应急预案;
(七)
(八)芅编写变更模板、变更审核控制点。
蚃4.2.2信息系统日常运维监控
蚁乙方须协助甲方确定系统监控内容,提出监控指标,实施日常监控,根据监控和运行情况,完善监控内容;编写运行维护手册和监控操作手册;按维护计划实施日常值班监控,做好监控内容的记录;对于值班期间发生的故障或告警等进行跟踪处理;定期完成运行报告,提出监控的优化建议。
蒆乙方协助甲方开展系统、网络、数据库、中间件和应用系统等的监控工作,包括:
肄告警接收与处理;
(四)螃监控指标维护;
(五)
(六)螈定期分析报警内容;
(七)
(八)膈对监控指标提出优化、完善建议。
螃4.2.3信息系统健康检查
袃乙方须协助甲方开展所运维系统的健康检查、日常巡检、深度巡检,包括网络、应用、系统、数据库、中间件、相关设备等,部署健康检查脚本,调整健康
检查阈值,收集整理和分析处理健康检查结果;负责特殊时点的应用运行状况健康检查,方案实施和问题处理。
收集整理和分析处理健康检查结果,编写健康检查报告,提出整改建议。
腿乙方协助甲方开展系统、网络、数据库、中间件的健康检查工作,包括:
二)
蚅编写健康检查脚本;
三)
四)
袆确认分析健康检查结果;
五)
六)
羃编写健康检查分析报告;
七)
八)
薀完善健康检查指标。
莇4.2.4日常备份与数据清理
薄根据甲方现场的实际条件,乙方须协助甲方制定应用系统备份策略、数据备份策略、应用系统备份策略;根据备份和归档策略实施系统备份;根据数据清理策略编写数据清理脚本,实施数据清理,检查执行结果。
肃4.2.5计划内演练
羀乙方须协助甲方编写应急处置方案、演练方案、制定演练计划;按计划实施演练;编写应急演练总结报告,对演练中出现的问题进行处理,就演练发现的问题进行分析,提出整改建议;不定期更新、修订相关文档、方案。
螅4.2.6容量分析与优化
莃乙方须协助甲方定期进行系统容量性能分析,收集应用系统交易数据、业务数据、运行数据,根据业务发展和系统资源实用情况,分析系统资源使用趋势,提交系统容量性能分析报告,提出优化改进建议。
膃乙方协助甲方开展性能容量分析工作,做好系统容量和资源管理
莁包括:
(一)
(二)蒇编写操作系统、数据库、容量数据收集脚本;
(三)
(四)蒆性能容量分析,完成报告并提出优化扩容建议;
(五)
(六)膃提交系统资源分析报告。
蒈4.2.7风险分析与优化
艿乙方须协助甲方定期进行系统风险分析,对信息系统在设计、配置、管理方面的风险定期进行分析、研究,提交风险分析报告,提出优化改进建议。
膅4.2.8版本升级
节乙方协助甲方,结合系统运行情况和厂商建议,评估现有版本(固件版本、
设备驱动、操作系统版本、数据库软件版本等);制定版本升级计划和方案;组织进行新版本的测试和验证;选择个别非关键系统进行版本试点,对版本升级后运行情况进行重点监控;按方案实施版本升级;编写版本升级总结报告。
衿4.2.9运行报告
蚇乙方须协助甲方,按照运行管理的要求,定期完成运行周报、运行月报、年度运行报告等。
羄5.1运维服务工作内容
莂5.1.1服务目标
芀运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。
同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
荿用户信息系统的组成主要可分为两类:
硬件设备和软件系统。
硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:
数据库软件、中间件软件等)、业务应用软件等;用户自行开发的应用软件。
螃服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指
标:
蒂运行状态、故障情况螁配置信息
袇可用性情况及健康状况性能指标
螆5.1.2IT资产统计服务
薂服务内容包括:
袈硬件设备型号、数量、版本等信息统计记录
蕿软件产品型号、版本和补丁等信息统计记录
薅网络结构、网络路由、网络IP地址统计记录
蚂综合布线系统结构图的绘制
艿其它附属设备的统计记录
肆5.1.3网络、安全系统运维服务
芃从网络的连通性、网络的性能、网络的监控管理三个方面实现对
网络系统的运维管理。
螂设备基础性能检测:
cpu、内存使用情况监测;
虿设备日志查看;
螈设备snmp状态;莆测试ping,tracert等工具的连通性;螂网络安全策略应用是否正常;莄Internet带宽流量的实时监测;蒀网络拓扑链路状态监测;荿异常网络数据包流量;膆Dos、ddos等网络攻击情况监测;螅Internet线路的误码率、丢包率监测;
膂5.1.4主机、存储系统运维服务
膈提供的主机、存储系统的运维服务包括:
主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
芆进行监控管理的内容包括:
CPU性能管理;
内存使用情况管理;硬盘利用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;
监控主机HA运行状况;主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;对存储的性能(如高速缓存、光纤通道等)进行监控。
5.1.5数据库系统运维服务提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。
通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。
同时,密切注意数据库系统的变化,主动地预防可能发生的问题。
进行监控管理的内容包括:
数据库基本信息:
文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句。
表空间使用信息监测;数据库文件I/0读写情况;Session连接数量监控;数据库监听运行状态监测;查看每日数据备份、数据同步是否正常;报警日志监测;
对表和索引进行Analyze,检查表空间碎片;检测数据库后台进程;
数据库对象的空间扩展情况监测;
5.1.6终端、外设运维服务
负责对终端PC、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设的故障处理工作。
6.1服务流程管理
事件处理乙方须协助机房对来自系统监控的事件进行响应并处理。
对接到的电话、短信通知或事件处理单,及时做出响应,完成事件的处理;在事件处理完毕后,及时整理、完成事件分析报告;定期回顾历史事件,分析潜在风险,提出优化建议。
乙方协助甲方对事件和问题进行响应并处理。
具体工作如下:
(一)负责编写应急场景收集脚本并部署;
(二)负责事件和问题的诊断及处理;
(三)负责制定应急预案;
(四)负责应急处理;
(五)负责事件和问题分析,负责提交报告、完善应急预案或提交知识。
问题处理
乙方须协助甲方对事件处理中未找到原因的事件进行分析处理流程,结合系统日志、事件现象等数据,对问题做分析处理,力求找出问题原因,形成解决方案。
变更与上线乙方协助甲方对涉及系统变更的需求(外部需求、扩容需求、上线需求等)
进行分析,完成需求分析报告;与基础设施资源管理部室落实变更所需资源,确认涉及到的资源到位;编写变更、系统上线方案、回退方案及其他上线资料;核实或确定上线版本;填写变更申请单,提出变更申请;参加变更、上线实施工作。
知识管理
乙方协助甲方对已处理的事件、问题等进行总结,形成知识点,提交甲方人员审核后,归入中心知识库。
风险管理
乙方应遵守关于系统安全性管理、设备口令管理、数据安全性管理、人员进出机房管理等相关管理规定。
协助甲方定期开展系统安全性检查,以满足风险管理相关规定与要求。
服务响应
乙方协助甲方对客户的服务请求做出响应、满足或支持客户服务请求,提供
技术支持。