推荐下载word新浪网资深运维工程师总结的linux运维笔记word版本 19页Word文档格式.docx
《推荐下载word新浪网资深运维工程师总结的linux运维笔记word版本 19页Word文档格式.docx》由会员分享,可在线阅读,更多相关《推荐下载word新浪网资深运维工程师总结的linux运维笔记word版本 19页Word文档格式.docx(18页珍藏版)》请在冰豆网上搜索。
运维对其它关联工种必须非常了解熟悉:
网络、系统、系统开发、存储,安全,DB等;
我在这里所讲的运维工程师就是指专职运维工程师。
我们再来说说一般产品的“出生”流程:
1、首先公司管理层给出指导思想,PM定位市场需求(或copy成熟应用)进行调研、分析、最终给出详细设计。
2、架构师根据产品设计的需求,如pv大小预估、服务器规模、应用架构等因素完成网络规划,架构设计等(基本上对网络变动不大,除非大项目)
3、开发工程师将设计code实现出来、测试工程师对应用进行测试。
4、好,到运维工程师出马了,首先明确一点不是说前三步就与运维工作无关了,恰恰相反,前三步与运维关系很大:
应用的前期架构设计、软/硬件资源评
估申请采购、应用设计性能隐患及评估、IDC、服务性能安全调优、服务器系统级优化(与
特定应用有关)等都需运维全程参与,并主导整个应用上线项目;
运维工程师负责产品服务器上架准备工作,服务器系统安装、网络、IP、通用工具集安装。
运维工程师还需要对上线的应用系统架构是否合理、是否具备可扩展性、及安全隐患等因素负责,并负责最后将产品(程序)、网络、系统三者进行拼接并最优化的组合在一起,最终完成产品上线提供用户使用,并周而复使:
需求->
开发(升级)->
测试->
上线(性能、安全问题等之前预估外的问题随之慢慢就全出来了)在这里提一点:
网站开发模式与传统软件开发
完全不一样,网站一天开发上线1~5个升级版本是家常便饭,用户体验为王嘛,如果某个线上问题像M$需要1年解决,用户早跑光了;
应用上线后,运维工作才刚开始,具体工作可能包括:
升级版本上线工作、服务监控、应用状态统计、日常服务状态巡检、突发故障处理、服务日常变更调整、集群管理、服务性能评估优化、数据库管理优化、随着应用PV增减进行应用架构的伸缩、安全、运维开发工作:
a、尽量将日常机械性手工工作通过工具实现(如服务监控、应用状态统计、服务上线等等),提高效率。
b、解决现实中服务存在的问题,如高可靠性、可扩展性问题等。
c、大规模集群管理工具的开发,如1万台机器如何在1分钟内完成密码修改、或运行指定任务?
201X台服务器如何快速安装操作系统?
各分布式IDC、存储集群中数PT级的数据如何快速的存储、共享、分析?
等一系列挑战都需运维工程师的努力。
在此说明一下其它配合工种情况,在整个项目中,前端应用对于网络/系统工程师来说是黑匣子,同时开发工程师职责只是负责完成应用的功能性开发,并对
应用本身性能、安全性等应用本身负责,它不负责或关心网络/系统架构方面事宜,当然软/硬件采购人员等事业部其它同事也不会关心这些问题,各司其职,但项
目的核心是运维工程师~!
所有其它部门的桥梁。
上面说了很多,我想大家应该对运维有一些概念了,在此打个比方吧,如果我们是一辆高速行驶在高速公路上的汽车,那运维工程师就是司机兼维修工,这个司机不简单,有时需要在高速行驶过程中换轮胎、并根据道路情况换档位、当汽车速度越来越快,汽车本身不能满足高速度时对汽车性能调优或零件升级、高速行进中解决汽
车故障及性能问题、时刻关注前方安全问题,并先知先觉的采取规避手段。
这就是运维工作!
最后说一下运维工程师的职责:
”确保线上稳定“,看似简单,但实属不容易,运维工程师必须在诸多不利因素中进行权衡:
新产品模式对现有架构及技术的
冲击、产品高频度的升级带来的线上BUG隐患、运维自动化管理承度不高导致的人为失误、IT行业追求的高效率导致流程执行上的缺失、用户增涨带来的性能及
架构上的压力、IT行业宽松的技术管理文化、创新风险、互联网安全性问题等因素,都会是网站稳定的大敌,运维工程师必须把控好这最后一关,需具体高度的责
任感、原则性及协调能力,如果能做到各因素的最佳平衡,那就是一名优秀的运维工程师了。
二、运维工作师需要什么样的技能及素质
做为一名运维工程师需要什么样的技能及素质呢,首先说说技能吧,如大家上面所看到,运维是一个集多IT工种技能与一身的岗位,对系统->
网络
->
存储->
协议->
开发->
安全等各环节都需要了解一些,但对于某些环节需熟悉甚至精通,如系统
(基本操作系统的熟悉使用,*nix,windows
..)、协议、系统开发(日常很重要的工作是自动运维化相关开发、大规模集群工具开发、管理)、通用应用(如lvs、ha、webserver
、db、中间件、存储等)、网络,IDC拓朴架构;
技能方面总结以下几点:
1、通用应用方面需要熟悉:
操作系统(目前国内主要是linux)、数据库(mysql,oralce)。
2、开发能力,这点非常重要,开发语言:
perl、python、php(其中之一)、shell(awk,sed,expect….等).所以有开发底子对学运维是个优势。
3、系统、网络、安全,存储,CDN,DB等需要相当了解,知道其相关原理。
个人素质方面:
1、沟通能力、团队协作:
运维工作跨部门、跨工种工作很多,需善于沟通、并且团队协作能力要强;
这应该是现代企业的基本素质要求了,不多说。
2、工作中需胆大心细:
胆大才能创新、不走寻常路,特别对于运维这种新的工种,更需创新才能促进发展;
心细,运维工程师是网站admin,最高线上权限者,一不小心就会遗憾终生或打入十八层地狱。
3、主动性、执行力、精力旺盛、抗压能力强:
由于IT行业的特性,变化快;
往往计划赶不上变化,运维工作就更突出了,比如国内各大公司服务器进行搬迁的时候,时间紧迫,如限1周内完成,这种情况下,运维工程师的主动性及执行力就有很高的要求了:
计划、方案、服务无缝迁移、机器搬迁上架、环境准备、安全评估、性能评估、基建、各关联部门扯皮,7X24小紧急事故响应等。
4、其它就是一些基本素质了:
头脑要灵光、逻辑思维能力强、为人谦虚稳重、亲和力、乐于助人、有大局观。
5、最后一点,做网站运维需要有探索创新精神,通过创新型思维解决现实中的问题,因为这是一个处于发展中的职业(国外起步比国内早)。
三、怎样才算是一个合格的运维工程师
1、保证服务达到要求的线上标准,如99.9%;
保证线上稳定,这是运维工程师的基本责职所在。
2、不断的提升应用的可靠性与健壮性、性能优化、安全提升;
这方面非常考验主动性和创新思维。
3、网站各层面监控、统计的覆盖度,软件、硬件、运行状态,能监控的都需要监控统计,避免监控死角、并能实时了解应用的运转情况。
4、通过创新思维解决运维效率问题;
目前各公司大部份运维主要工作还是依赖人工操作干预,需要尽可能的解放双手。
5、运维知识的积累与沉淀、文档的完备性,运维是一个经验性非常强的岗位,好的经验与陷阱都需积累下来,避免重复性范错。
6、计划性和执行力;
工作有计划,计划后想法设法达到目标,不找借口。
7、自动化运维;
能对日常机械化工作进行提炼、设计并开发成工具、系统,能让系统自动完成的尽量依靠系统;
让大家更多的时间用于思考、创新思维、做自已喜欢的事情。
以上只是技术上的一些层面,当然个人意识也是很重要的。
四、运维现状和发展前景
运维现状:
优秀运维人才的极度缺乏:
目前各大公司基本上都靠自已培养,这个现状导致行业内运维人才的流动性非常低,非常多好的技术都局限在各大公司内部,如google50万台机器科学
篇二:
上海Linux运维工程师面试题个人总结)
这下面的是一个企业发的面试题
1你常上的相关技术站有哪些?
2简述你所理解运维工程师的主要职责?
3你管理过的服务器数量级?
1台
2台
2-5台
5-10台
10台以上
4描述一次你印象深刻的服务器运维经历。
5有一台服务器出现安全问题,你会采取什么样的方法处理?
说出你的诊断处理思路。
6有多台服务器需部署相同应用文件,文件会持续更新,你用什么方式实现不同服务器间的文件同步。
7某一台服务器部署多个Web站点,其中有一个w3wp的CPU占用达到100%,如何找出有问题的Web站点?
8你眼中的沪江是怎样的?
谈谈你对沪江的理解。
9是否有以下相关经验?
如有请简要说明掌握情况。
a、Squid相关经验
b、Nginx、Lighttpd等
c、Memcached
d、负载均衡
e、分布式文件处理
f、EmailServer
上午-10点雷傲普文化传播有限公司
1.DNS使用的端口号和协议,简单描述一下DNS正向解析和反向解析的工作原理和作用还
有应用场景?
2.编写IPTABLES使用内网某台机器的80端口可以在公网访问,假设公网IP为10.10.1.1,实现192.168.1.0/32段的NAT.
3.举出三个以上的主流WEB服务器,并简述他们的特性和优缺点不限操作系统?
Apache源代码开放可以欲行在unix,windowns,linux平台上,可移植性,而且模块很是丰富缺点:
性能,速度上不及其他轻量级的web服务器,但是也是重量级产品,所消耗的内存,cpu也比其他的要高
Nginx源代码开放发高性能的http和反向代理服务器,在高并发的情况下,nginx是apache不错的替代品,他能够支持高达50000个并发连接响应,内存,cpu等系统资源消耗也是很低的。
缺点,支持模块比较少吧,相对没有apache稳定,支持动态页面
不是很强。
Tomcat对高并发跟静态页面处理还不是很强
MicrosoftIIS配置很简单,只能运行在windows。
Linux上,如果要使用还购买商业windowsserver操作系统。
4,举出两个主流代理服务器,简述工作模式和优缺点?
5,举出两个负载均衡的软件,并简述工作模式和优缺点?
6,IE,FF,chrome游览器最大并发请求数是多少?
,
7,简单举例一下linux和windows系统今年都有哪些漏洞?
8,mysql数据库备份都有哪一些,部署一个高可用mysql应用环境,并说明他的高可用性?
9,什么是裸设备,他的好处是什么?
,mysql支持裸设备吗?
10,如果给你一个100g的INNODB类型数据库,你会用什么备份方案来做备份。
11,写一个简单的shell脚本,脚本运行时让CTRL+C无法中断的该shell脚本?
12,如何快速编译单一的内核模块?
13,如何动态增加apache和PHP模块?
14、说出linux开机流程?
15、具体说说cacti的安装过程?
16、cacti与nagios的区别?
cacti如何监控mysql?
17、mysql主从复制如何实现?
18、raid0与raid的区别?
19、DNS解析详细过程?
从主机访问域名(三家公司都问这个问题)让写出来?
20、脚本会多少?
掌握程度?
seda