运维制度及流程.docx

上传人:b****7 文档编号:9246480 上传时间:2023-02-03 格式:DOCX 页数:11 大小:93.08KB
下载 相关 举报
运维制度及流程.docx_第1页
第1页 / 共11页
运维制度及流程.docx_第2页
第2页 / 共11页
运维制度及流程.docx_第3页
第3页 / 共11页
运维制度及流程.docx_第4页
第4页 / 共11页
运维制度及流程.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

运维制度及流程.docx

《运维制度及流程.docx》由会员分享,可在线阅读,更多相关《运维制度及流程.docx(11页珍藏版)》请在冰豆网上搜索。

运维制度及流程.docx

运维制度及流程

 

IT系统运维工作

实施细则

 

2014年07月

 

1、总则

第一条

为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。

第二条

运维工作总体目标:

在企业发展壮大时期,通过对网络、服务器、中间件、电脑终端等的运维,保证企业的正常运营,促进企业稳定可持续性发展。

第三条

运维管理制度的适用范围:

运维部全体人员。

2、编制方法

本实施细则包括IT运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。

本实施细则以ISO20000为基础,以保障公司软硬件正常运行为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,体现了对IT运维服务全过程的体系化管理。

3、工作范围

3.1、数据库开发和运维

完成公司产品的数据库维护和数据合并、同步等处理工作。

如果数据库有更改或升级,则必须在一定的流程以后,选择恰当时机完成数据库升级工作。

3.2、建立监控体系

建立软件监控体系,完成重要信息预警,包括如数据库软件、ERP软件、网站访问量等信息。

监控服务器运行情况,包括服务器版本补丁升级情况和重要帐户变动信息,磁盘存储情况(如碎片程度和剩余)等。

监控网络信息,以及网络流量监控和可疑请求访问(防止黑客攻击)等。

3.3、应用中间件运维

排查和解决日常使用过程中,公司产品相关软件包括数据库出现的各种问题,如IIS和Tomcat停止响应等问题。

如果是公司产品,则会和研发部一起分析原因并解决问题,例如数据库死锁和查询缓慢等问题。

3.4、新老产品升级和上线

通过一定的交互流程,完成公司新老产品升级或上线到正式环境中,并保障上线软件的正常运行。

3.5、桌面系统的运维

保障公司所有员工使用的终端设备的正常运行和故障排除,包括打印机、电话机等办公外围设备。

4、运维工作内容

运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。

同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。

用户信息系统的组成主要可分为两类:

硬件设备和软件系统。

硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:

数据库软件、中间件软件等)、业务应用软件等。

服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:

Ø运行状态、故障情况

Ø配置信息

Ø可用性情况及健康状况性能指标

具体内容如下:

4.1、知识库管理(FAQ)

知识库是提供给IT运维人员重要的技术资料内容,他汇集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料手册。

在本系统中,知识库管理提供便于使用的人机接口、快速查询的技术手段和维护手段。

4.2、IT资产统计服务

服务内容包括:

Ø硬件设备型号、数量、版本等信息统计记录

Ø软件产品型号、版本和补丁等信息统计记录

Ø网络结构、网络路由、网络IP地址统计记录

Ø综合布线系统结构图的绘制

Ø其它附属设备的统计记录

4.3主机、存储系统运维服务

提供的主机、存储系统的运维服务包括:

主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。

进行监控管理的内容包括:

ØCPU性能管理;

Ø内存使用情况管理;

Ø硬盘利用情况管理;

Ø系统进程管理;

Ø主机性能管理;

Ø实时监控主机电源、风扇的使用情况及主机机箱内部温度;

Ø监控主机硬盘运行状态;

Ø监控主机网卡、阵列卡等硬件状态;

Ø监控主机HA运行状况;

Ø主机系统文件系统管理;

Ø监控存储交换机设备状态、端口状态、传输速度;

Ø监控备份服务进程、备份情况(起止时间、是否成功、出错告警);

Ø监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;

Ø对存储的性能(如高速缓存、光纤通道等)进行监控。

4.4网络、安全系统运维服务

从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。

Ø设备基础性能检测:

cpu、内存使用情况监测;

Ø设备日志查看;

Ø设备snmp状态;

Ø测试Ping,tracert等工具的连通性;

Ø网络安全策略应用是否正常;

ØInternet带宽流量的实时监测;

Ø网络拓扑链路状态监测;

Ø异常网络数据包流量;

ØDos、ddos等网络攻击情况监测;

ØInternet线路的误码率、丢包率监测;

4.5数据库系统运维服务

提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。

通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。

同时,密切注意数据库系统的变化,主动地预防可能发生的问题。

进行监控管理的内容包括:

Ø数据库基本信息:

文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句。

Ø表空间使用信息监测;

Ø数据库文件I/0读写情况;

ØSession连接数量监控;

Ø数据库监听运行状态监测;

Ø查看每日数据备份、数据同步是否正常;

Ø报警日志监测;

Ø对表和索引进行Analyze,检查表空间碎片;

Ø检测数据库后台进程;

Ø数据库对象的空间扩展情况监测;

4.6中间件运维服务

中间件管理是指对BEAWeblogic、tomcat、MSSQL等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。

中间件监控指标包括配置信息管理、故障监控、性能监控。

Ø执行线程:

监控中间件配置执行线程的空闲数量。

ØJVM内存:

JVM内存曲线正常,能够及时的进行内存空间回收。

ØJDBC连接池:

连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。

Ø检查中间件日志文件是否有异常报错

Ø如果有中间件集群配置,需要检查集群的配置是否正常。

4.7终端、外设运维服务

负责对终端PC、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设的故障处理工作。

4.8、新老产品升级和发布

完成公司新老产品正式环境的升级和发布上线,并提出平台的实施、运行报告,配合研发部找出数据库软件和应用软件瓶颈和提出优化方法。

4.9、配合搭建测试环境

根据研发部提供的环境搭建手册,为测试部搭建测试软件运行所依赖的软硬件平台。

5、运维服务流程

IT运维服务管理流程目前主要是产品发布流程和故障解决流程,随着运维活动的不断深入和持续改进,可以建立其它管理流程,包括:

工单管理和知识库管理,完善统计及工作报告。

5.1产品发布流程图

5.2故障解决流程图

6、运维管理组织结构

本运维项目的运维管理结构位两层模式:

运维负责人:

负责管理公司整体软件、硬件及数据库运维。

运维工程师:

服务台、网络及终端管理员、数据库管理员

运维经理负责项目的整体运维工作,包括各种制度的制定和实施。

运维工程师则在项目经理的指导下开展维护工作。

6.1、运维负责人

职责:

规划、执行、完善信息化项目的运维工作,指导网络、数据库维护工程师开展工作。

职位描述:

1)根据公司战略目标,整体制定公司运维项目的整体计划,并指导运维工程师完成具体维护工作,每周听取运维工程师的工作汇报,负责考核运维工程师工作完成情况。

2)建立和持续完善运维管理体系,优化运维流程流程,解决运维服务中出现的特殊问题。

3)制定和持续完善绩效考核体系。

4)制定整理运维项目的应急预案系统,并指导运维工程师实施。

5)利用自身专业技能,从业务方面给予网络管理员和数据库管理员指导。

6.2、服务台

职责:

故障电话受理,文档管理,解决简单的软件、硬件问题,如应用软件重启,数据库重启。

职位描述

1、负责IT业务的救助电话的受理工作;

2、故障处理的发起人,同时进行维护工程师指派,跟踪事件处理状态;

3、进行维护故障统计、用户满意度统计、工作报表输出等工作;

4、协助项目经理,进行文档整理、归类、保存等工作。

6.3、网络及终端管理员

职责:

维护建设单位网络系统正常,解决网络相关故障。

职位描述:

1、对现有服务器、局域网络及机房、配线间的日常管理维护;

2、对信息安全建设提出相关建议,确保网络的安全;

3、保证外网光纤线路正常,保证局域网运行正常;

4、对网络系统和网络设备的运行状态进行监控;

5、熟练掌握域策略设置、DHCP、DNS、FTP服务器、NTFS权限设置等;

6、编写网络部分的应用处理预案并实施。

7、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神.

6.4、数据库管理员

职责:

维护建设单位业务系统运行正常,解决应用和数据库故障。

职位描述:

1、负责数据库性能分析与调优,数据库运行状态监控,及时发现异常并迅速汇报和处理。

2、规划不同数据的生命周期,制订备份、恢复、迁移和灾备策略,根据业务的需要执行数据转换及迁移等操作。

3、保证应用和数据库系统的安全性、完整性和运行效率。

4、提出对数据库的规范化编程和访问方法。

5、具有良好的沟通能力及团队合作精神,配合研发部完成公司的数据同步和合并等工作。

6.5、终端管理员

职责:

维护建设单位桌面系统运行正常,解决终端、外设故障。

职位描述:

1、各部门电脑、打印机、传真机的维护;

2、对各部门职员进行电脑相关的技术支持及培训工作;

3、精通Windows各版本及办公软件的安装和使用,能够制作相应教程对其他部门员工进行培训。

 

7、服务管理制度规范

7.1服务时间

(1)在5*8小时工作时间内设置由专人职守的热线电话,接听内部的服务请求,并记录服务台事件处理结果。

(2)在非工作时间设置有专人7*24小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24小时机房监控人员的机房突发情况汇报。

(3)服务响应时间:

故障级别

响应时间

故障解决时间

I级:

属于紧急问题;其具体现象为:

系统崩溃导致业务停止、数据丢失。

10分钟,30分钟内提交故障处理方案

3小时以内

II级:

属于严重问题;其具体现象为:

出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。

10分钟,30分钟内提交故障处理方案

6小时以内

III级:

属于较严重问题;其具体现象为:

出现系统报错或警告,但业务系统能继续运行且性能不受影响。

10分钟,30分钟内提交故障处理方案

12小时以内

IV级:

属于普通问题;其具体现象为:

系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。

10分钟,2小时内提交故障处理方案

24小时以内

7.2行为规范

(1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。

(2)与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。

(3)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。

(4)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。

接听电话时要文明礼貌,语言清晰明了,语气和善。

(5)遵守保密原则。

对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 行政公文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1