1、运维工程师述职报告运维工程师述职报告篇一:运维工程师岗位报告运维工程师岗位报告运维工程师对一个公司来说是非常重要的岗位,它本身所覆盖的运维职责就很重要,所以,运维对其它关联工种必须非常了解熟悉:络、系统、系统开发、存储,安全,DB等。作为一个运维工程师我认为是集合络、系统、开发工作于一身的“复合型人才”,就如有些公司把一些合同采购都纳入了运维职责范围,还有如IDC络规划也纳入运维职责。一.运维工程师岗位职责1、参与设计、审核、优化公司IT系统以及各应用系统的体系架构;2、全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发需求,测试、调整运维平台;3、负责络以及服务器的络设置、维护和优
2、化、络的安全监控、系统性能管理和优化、络性能管理和优化;4、建立面向开发部门,业务部门的服务流程和服务标准;5、负责IT运维相关流程的规划、设计、推行、实施和持续改进;6、响应及解决客户的技术要求、疑问以及系统使用过程中遇到的各种问题;7、负责日常络及各子系统管理维护。8、负责设计并部署相关应用平台,并提出平台的实施、运行报告。9、负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。10、负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。11、负责络监控和应急反应,以确保络系统有7*24小时的持续运作能力。12、负责日常系统维护,及监控,提供IT软硬件方面的服务和
3、支持,保证系统的稳定。13、负责服务过程中问题现象和处理方案的收集撰写,形成知识库,并对知识库进行维护更 新;14、及时反馈技术处理过程中的异常情况,及时向部门负责人、服务开发PM、客户经理等相关人员报警;同时,主动协调资源推动问题解决;15、定期对所有服务问题进行分析,并对服务效率有影响的问题提供反馈意见,提升服务支持团队专业度;二. 怎样才算是一个合格的运维工程师1、保证服务达到要求的线上标准,如%;保证线上稳定,这是运维工程师的基本责职所在。2、不断的提升应用的可靠性与健壮性、性能优化、安全提升;这方面非常考验主动性和创新思维。3、站各层面监控、统计的覆盖度,软件、硬件、运行状态,能监控
4、的都需要监控统计,避免监控死角、并能实时了解应用的运转情况。4、通过创新思维解决运维效率问题;目前各公司大部份运维主要工作还是依赖人工操作干预,需要尽可能的解放双手。5、运维知识的积累与沉淀、文档的完备性,运维是一个经验性非常强的岗位,好的经验与陷阱都需积累下来,避免重复性范错。6、计划性和执行力;工作有计划,计划后想法设法达到目标,不找借口。7、自动化运维;能对日常机械化工作进行提炼、设计并开发成工具、系统,能让系统自动完成的尽量依靠系统;让大家更多的时间用于思考、创新思维、做自已喜欢的事情。 以上只是技术上的一些层面,当然个人意识也是很重要的。三.运维管理注意事项1、配置管理(1)it资产
5、配置管理:对it资产生命周期进行管理,包括分类统计、预购、选购审核、转移审核、报废审核,保证配置管理正确率达标;(2)建设案例库:累积和提炼工程师的事件处理经验制作成案例,并持续丰富运维案例库供查询,案例覆盖已知事件的比率达标,不断提高运维工程师工作效率;(3)it系统配置信息管理:定期更新络及应用系统描述信息及技术支持信息配置,保证最新;将配置文档上传至服务器端,方便团队其他运维人员进行查看和操作。 2、监控 主要包括故障监控和性能、流量、负载等状态监控,这些监控关系到集群的健康运行,及潜在问题的及时发现与干预;(1)、服务故障、状态监控:主要是对服务器自身、上层应用、关联服务数据交互监控;
6、例如针对前端web server,我们就可以有很多种类型的监控,像zabbix,nagios,cacti等监控程序。(2)、其它就是集群状态类的监控或统计,为我们合理管理调优集群提供数据参考、包括服务瓶颈、性能问题、异常流量、攻击等问题。 3、故障管理 (1)、硬件故障问题;对于成百上千或上万机器的N多集群,服务器死机、硬件故障概率是非常大的,几乎每时每刻都有服务硬件问题,死机、硬盘损坏、电源、内存、交换机。针对这种情况,我们在设计站架构时需要充分考虑到这些问题,并将其视为常态;更多的依靠应用的冗余机制来规避这种风险,给系统工程师足够宽裕的处理时间。(如google不是号称同时死800台机器,
7、服务不会受到任何影响吗);这就是考验运维工程师及站架构师功能的地方了,好的设计能达到google所描述自恢复能力,如gfs,糟糕的设计那就是一台服务器的死机可能会造成大面积服务的连锁故障反映,直接对用户拒绝响应。(2)、应用故障问题;可能是某一bug被触发、或某一性能阀值被超越、攻击等情况不一而定,但重要的一点,是要有对这些问题的预防性措施,不能想当然,它不会出问题,如真出问题了,如何应对?这需要运维工程师平时做足功夫,包括应急响应速度、故障处理的科学性、备用方案的有效等。 4、问题管理 对事件进行统计分析,找出疑难、重复发生的事件,纳入问题管理流程,分析问题产生的根本原因,确定可能解决的方案
8、,需要修改络或应用系统配置时提交变更申请触发变更管理流程。 5、安全管理 (1)、操作人员随时监控中心设备运行状况,发现异常情况应立即按照应急预案规程进行操作,并及时上报和详细记录。(2)、未经批准,不得在机房设备上随意编写、修改、更换各类软件系统及更改设备参数配置;(3)、服务器系统的维护、增删、配置的更改,必须按规定详细记入相关记录,并对各类记录和档案整理存档。(4)、机房工作人员应恪守保密制度,不得擅自泄露信息资料与数据。(5)、严禁在机房计算机设备上做与工作无关的事情(如聊天、玩游戏),对外来存储设备(如U盘、移动硬盘等),做到先杀病毒后使用。(6)、机房严禁乱拉接电源,应不定期对机房
9、内设置的消防器材、烟雾报警、恒温设备进行检查,保障机房安全。 6、自动化运维 自动化:简而言之,就是将我们日常手动进行的一些工作通过工具,系统自动来完成,解放我们的双手及枯燥的重复性劳动,例如:没有工具前,我们安装系统需要一台一台裸机安装,如XX台,可能需要10人/10天,搞烂N张光盘,人力成本更大,而现在通过自动化工具,只需几个简单命令就能搞定、还有如机器人类程序,自动完成以往每天人工干预的工作,使其自动完成、汇报结果,并具备一定的专家系统能力,能做一些简单的是/非判断、优化选择等,这些好处非常明显不再多说。应该说,自动化运维是运维工程师职业化的一个追求,利已利公,虽然这是一个异常艰巨的任务
10、:不断变更的业务、不规范化的应用设计、开发模式、络架构变更、IDC变更、规范变动等因素,都可能会对现有自动化系统产生影响,所以需要模块化、接口化、变因参数化等因此,自动化相关工作,是运维工程师的核心重点工作之一,也是价值的体现。 四、总结 综上所述,做一个好的运维工程师,除了具备良好的综合技能水平,还要有一个负责任的工作态度,这也是优秀运维工程师具备的素质。因为对于运维工程师而言,每一次故障的发生都不是小事,很可能会影响公司线上业务的稳定性,甚至直接导致公司的经济损失,所以我认为对待工作中发生的故障以及事件要秉着一个“小事件,大处理”的原则,将发生的故障扼杀到摇篮里,慢慢地积累故障处理经验,这
11、样当真正的大事件来临时,我们可以采取有效的措施及时应对。除了处理好发生的故障事件,我觉得运维工程师还应具备可预见性,故障随时可能发生,如何防患于未然,这将是对我们做好运维工作的一个考验。古人云:“不积跬步无以至千里,不积小流无以成江海”运维之路就是由一次次故障事件中拼接出来的,作为其中的一份子,任重而道远!篇二:系统运维工程师年终个人工作总结及下年工作计划*公司系统运维工程师年终个人工作总结及下年工作计划时间一晃而过,弹指之间,XX年悄然而至,自从XX年3月份刚进入公司,我是第一次接触公司、接触通信行业、接触公司络管理及维护。虽然跟我的专业和技能都一致,但所有的实际经验都是第一次,让我没有任何
12、准备,同样也打消了任何顾虑,人生就是这样,所有的一切都是要从第一次开始,没有接触过、干过并不可怕,领导给了我机会,让我有了一次尝试、一次展现自己的平台,那么我一定会更加倍的努力做好工作才是最大的回报。并且也是对自己的一次肯定。经过一段时间的工作及陌生环境的磨合,专心钻研业务知识,努力提高理论知识和业务工作水平。遵纪守法,踏实工作认真完成领导交办的各项工作任务,使自己渐渐的融入和适应到新的工作环境中。过去的大半年里在领导和同事们的悉心关怀和支持帮助下,通过自身的不懈努力,在思想、学习和工作等方面取得了新的进步。现总结如下:一、公司电脑日常维护工作刚一开始接手工作的时候,发现公司大部分工作电脑都没
13、有安装安全防护软件和升级系统补丁;员工随意安装系统及应用软件,致使公司局域内病毒隐患严重、工作不稳定和系统崩溃,工作秩序被打乱,员工不严格要求自己,上班时间聊QQ、玩农场、看娱乐站等;为此公司和个人工作经常受到影响,工作效率降低。针对这种情况,我采取了以下措施: 1、先对公司员工进行一次基本知识培训,让员工了解到计算机的正确使用方法,病毒防范,重要文件的备份等。从而大大提高了员工对电脑使用的熟练程度。 2、先恢复良好的秩序。电脑使用时如发现故障和需更改设置,必须先报告公司运维人员,由专门人员来进行专业及针对化的操作,个人不能私自进行改动,进行这样做的目的避免由于人为的盲目操作使某一台电脑的故障
14、影响整个局域内的其它工作,使故障扩大化,并延长了解决问题的周期。 3、使员工使用统一的、经过安全测试的系统及应用软件,安装、设置统一的杀毒软件、防火墙等安全防护软件,且经过努力实践,并在每台机器上设定了自动系统补丁升级及定期查杀规则。 4、对于个人的关键性数据资料、邮件进行路径转移备份,使这些数据远离危险故障点,避免意外丢失所带来的严重后果。操作系统进行常规定期备份,便于事后的还 原。 5、对于络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率逐步提高,自觉性得到明显改进,从而净化了公司络办公环境。 经过一段时间的贯彻和工作,先前的混乱现象得到有效控制,现公司的十余台电脑,工
15、作状态稳定,没有出现大面积的系统崩溃和故障。 二、络的日常维护 路由器及交换机的维护管理,确保公司络运行正常,员工正常利用络资源。加强路由器的规则设置,优化外接口,内部员工合理地分配带宽流量,使公司的络能稳定有效地工作。 三、公司络制度管理和完善 公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上的失控和资产流失。 四、公司服务器平台管理与
16、维护工作 公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本年度我司服务器相应出现几次重大故障,分别如下:1、络故障七次,重大一次,因服务器遭DDOS攻击,导致我司服务器无法正常工作。事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、络升级、电信与联通DNS解析故障影响到我司服务器平台络连接不正常。2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术部采用紧急预案措施在两小时内得以恢复系统。3、其它故障共计5次,因联通关溢出,无法与我司IVR服务器数据库关同步,导致用户无法正常订购与使用我司亲情相伴业务。经过出现几次重大故障后,技术部多次研究与
17、讨论,制定出一套完善的应急措施与日常维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解决并恢复正常运营。 4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。 5、公司针对员工的工作岗位与职位重新部署了FTP服务器的访问权限与互联访问,使每个员工都能把重要的文件放到服务器上相关部门的文件夹里作备份,且通过内外均可实现访问FTP服务器,大大方便了员工在外出差或在家里随时提取相关资料,且员工的访问权限不一样,故某些与自己无关或公司重要资料进行了保密设置,从而大大提高了公司重要
18、资料的完整性与保密性。 总结本年度的工作,尽管有了一点点的进步和成绩,但在一些方面还存在着很多的不足。比如:工作经验不足,对公司的络与办公环境未得到很大的改善;遇到困难的时候与领导沟通不够等等,这都有待于在今后的工作中加以改进。 在新的一年里,将百尺竿头,更进一步,XX年的大致工作计划为: 1、在公司内部使用一种简便、有效的软件工作平台,使之便于公司所有员工的工作、交流、探讨,发布公共信息等(如OA软件)。 2、利用投影仪设备资源制作会议幻灯片为员工培训计算机操作及工作常用软件知识的小窍门,争取进一步提高全公司工作人员的专业化及工作效率。 3、解决企业站制作等专业性知识问题,业余时间强化学习并
19、能胜任站管理工作。 4、进一步增强IT系统和络系统的稳定性和管理,使用更为高效的域控制系统来代替目前的工作组局域,使内、外连接任意,在任何地方工作都能连接本公司服务器资源。5、重新改建机房机柜络布线,使机柜走线更加美观,同时方便以后维护时线路排除更加明了,直观。 6、在资金允许的情况下对公司办公电脑、络、会议系统布署方案升级优化,进一步提高员工工作效率,为公司节约成本开支。 7、学习更多的络知识,充分的将一些新的技术应用到公司当中来。为公司提供更优质、更便捷、更效率、更节能的办公方式。 XX年,是全新的一年,也是自我挑战的一年,我将努力改正过去一年工作中的不足,强化理论和业务学习,不断提高自身
20、综合素质,把新一年的工作做好,为公司更好的发展尽一份力! 篇三:运维工程师年终工作总结篇一:系统运维工程师年终个人工作总结及下年工作计划*公司系统运维工程师年终个人工作总结及下年工作计划时间一晃而过,弹指之间,XX年悄然而至,自从XX年3月份刚进入公司,我是第一次接触公司、接触通信行业、接触公司络管理及维护。虽然跟我的专业和技能都一致,但所有的实际经验都是第一次,让我没有任何准备,同样也打消了任何顾虑,人生就是这样,所有的一切都是要从第一次开始,没有接触过、干过并不可怕,领导给了我机会,让我有了一次尝试、一次展现自己的平台,那么我一定会更加倍的努力做好工作才是最大的回报。并且也是对自己的一次肯
21、定。经过一段时间的工作及陌生环境的磨合,专心钻研业务知识,努力提高理论知识和业务工作水平。遵纪守法,踏实工作认真完成领导交办的各项工作任务,使自己渐渐的融入和适应到新的工作环境中。过去的大半年里在领导和同事们的悉心关怀和支持帮助下,通过自身的不懈努力,在思想、学习和工作等方面取得了新的进步。现总结如下:一、公司电脑日常维护工作1、先对公司员工进行一次基本知识培训,让员工了解到计算机的正确使用方法,病毒防范,重要文件的备份等。从而大大提高了员工对电脑使用的熟练程度。2、先恢复良好的秩序。电脑使用时如发现故障和需更改设置,必须先报告公司运维人员,由专门人员来进行专业及针对化的操作,个人不能私自进行
22、改动,进行这样做的目的避免由于人为的盲目操作使某一台电脑的故障影响整个局域内的其它工作,使故障扩大化,并延长了解决问题的周期。3、使员工使用统一的、经过安全测试的系统及应用软件,安装、设置统一的杀毒软件、防火墙等安全防护软件,且经过努力实践,并在每台机器上设定了自动系统补丁升级及定期查杀规则。4、对于个人的关键性数据资料、邮件进行路径转移备份,使这些数据远离危险故障点,避免意外丢失所带来的严重后果。操作系统进行常规定期备份,便于事后的还原。5、对于络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率逐步提高,自觉性得到明显改进,从而净化了公司络办公环境。经过一段时间的贯彻和工作
23、,先前的混乱现象得到有效控制,现公司的十余台电脑,工作状态稳定,没有出现大面积的系统崩溃和故障。二、络的日常维护路由器及交换机的维护管理,确保公司络运行正常,员工正常利用络资源。加强路由器的规则设置,优化外接口,内部员工合理地分配带宽流量,使公司的络能稳定有效地工作。三、公司络制度管理和完善公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上
24、的失控和资产流失。四、公司服务器平台管理与维护工作公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本年度我司服务器相应出现几次重大故障,分别如下:1、络故障七次,重大一次,因服务器遭ddos攻击,导致我司服务器无法正常工作。事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、络升级、电信与联通dns解析故障影响到我司服务器平台络连接不正常。2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术部采用紧急预案措施在两小时内得以恢复系统。3、其它故障共计5次,因联通关溢出,无法与我司ivr服务器数据库关同步,导致用户无法正常订购与使用我司亲情相伴业务。
25、经过出现几次重大故障后,技术部多次研究与讨论,制定出一套完善的应急措施与日常维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解决并恢复正常运营。4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。5、公司针对员工的工作岗位与职位重新部署了ftp服务器的访问权限与互联访问,使每个员工都能把重要的文件放到服务器上相关部门的文件夹里作备份,且通过内外均可实现访问ftp服务器,大大方便了员工在外出差或在家里随时提取相关资料,且员工的访问权限不一样,故某些与自己无关或公司重要资料进
26、行了保密设置,从而大大提高了公司重要资料的完整性与保密性。总结本年度的工作,尽管有了一点点的进步和成绩,但在一些方面还存在着很多的不足。比如:工作经验不足,对公司的络与办公环境未得到很大的改善;遇到困难的时候与领导沟通不够等等,这都有待于在今后的工作中加以改进。在新的一年里,将百尺竿头,更进一步,XX年的大致工作计划为:1、在公司内部使用一种简便、有效的软件工作平台,使之便于公司所有员工的工作、交流、探讨,发布公共信息等(如oa软件)。2、利用投影仪设备资源制作会议幻灯片为员工培训计算机操作及工作常用软件知识的小窍门,争取进一步提高全公司工作人员的专业化及工作效率。3、解决企业站制作等专业性知
27、识问题,业余时间强化学习并能胜任站管理工作。4、进一步增强it系统和络系统的稳定性和管理,使用更为高效的域控制系统来代替目前的工作组局域,使内、外连接任意,在任何地方工作都能连接本公司服务器资源。5、重新改建机房机柜络布线,使机柜走线更加美观,同时方便以后维护时线路排除更加明了,直观。6、在资金允许的情况下对公司办公电脑、络、会议系统布署方案升级优化,进一步提高员工工作效率,为公司节约成本开支。7、学习更多的络知识,充分的将一些新的技术应用到公司当中来。为公司提供更优质、更便捷、更效率、更节能的办公方式。XX年,是全新的一年,也是自我挑战的一年,我将努力改正过去一年工作中的不足,强化理论和业务
28、学习,不断提高自身综合素质,把新一年的工作做好,为公司更好的发展尽一份力!篇二:年终总结 (运维部)XX年运维部工作总结XX年业已尾声,我部门在公司的正确领导下,认真执行公司制定的各项制度及部门制度,努力改进工作中存在的不足,并取得了一定进步,XX年我部门总体工作特点是:运维任务基本饱和且多个项目同时进行,工作分散、繁琐,现就部门的各项工作进行一下简要总结。 .一年工作概况1、上半年运维任务相对轻松,根据公司和部门要求集中进行内部优化,以及对以前工作进行总结,各负责人在现有条件基础上,统筹安排,有条不紊的完成公司规定的任务指标,没有因运维任务繁多而出现混乱。2、下半年各主要项目陆续接手,同时部
29、门内部各人员职责基本清晰,各负其责,整个部门运行基本踏入正轨,方案、合同、资料、服务流程运行良好,同时现场服务人员能认真负责的执行公司及部门的各项规定,掌握、收集、记录现场第一手资料,完成公司交办的各项任务。3、本年度中部门与部门间、员工与员工间,都在工作中不断的磨合,发现问题、解决问题,各项工作并没有因此而停滞不前,经过一年时间的不断改进,对内公司各项工作渐渐运转自如,对外也赢得了相关客户的认可,一切正朝着令人欣喜的方向前进。4、本年度人员安排如下:5、本年度服务数据如下:6、本年度部门收费回款如下:7、运维和参与项目实施情况.全年部门完成运维任务:.解决招行成都分行监控中心大屏和两河公园停
30、车场故障与项目尾款回款两个难题;.完成招行密押系统升级更新和其他系统运维任务;.完成安县交通卡口及金牛公安分局等其他客户监控系统运维任务;.全年部门完成参与项目实施任务:金牛公安分局视频资源管理系统.但是总结本年度的工作,还有一些问题存在,有些工作亟待改进:一、 备件管理1、备件管理在XX年做得并不好,由于项目运维还处于成熟过程中,对运维备件要求未按照实际使用作计划,导致在运维过程中,无法对备件进行有效控制,在今后工作中要着重加强管理调度,坚持每月执行备件计划制度。针对备件需求和备件使用制定相应的领用制度,做到“谁提备件,谁负责”, 坚持限额领用制度。2、加强备件现场使用的管理力度,对送达现场
31、的备件,及时准确地进行核实,发现问题及时上报,对备件使用量大的、有特殊要求的须经过部门负责人或分管领导审核同意。二、服务流程管理1、服务流程是否合理决定服务的效率,在保证质量和安全的前提下,尽可能地提高服务及时性。原则:对同时发生的运维任务,合理调配人力、物力资源,统筹安排,因地制宜,在尽可能短的时间内完成更多的工作,做到人员效应最大化。优化运维方案,通过集体讨论,优先采用能够保证服务质量要求,方案可行而成本支出较小的运维方案,目的是成本控制,同时加强现场管理,合理调配有限资源,减少浪费。2、现场服务人员和主管负责人、后勤人员要勤于沟通,有变化及时通报,做到信息畅通,避免因沟通不及时而出现重复派工、二次报修等问题。三、人员培训1、技能培训:公司目前项目主要分环保、交通卡口和安防系统3大块,而运维部人员对所有项目的都还未做到详细熟悉细致了解和掌握的程度。2、制度意识培训:运维部人员平时处理故障的情况较为繁重,在一定
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1