商091于庆友数据中心的运维与管理.docx
《商091于庆友数据中心的运维与管理.docx》由会员分享,可在线阅读,更多相关《商091于庆友数据中心的运维与管理.docx(9页珍藏版)》请在冰豆网上搜索。
商091于庆友数据中心的运维与管理
中共中央党校函授学院2007级本科班
毕业论文
论文题目数据中心的运维与管理
学员姓名于庆友专业工商管理
学号361001072500091
指导老师郭丽
中共中央党校函授学院中央国家机关分院
论文提要
数据中心是企业的信息业务系统与数据资源进行集中、集成、共享、分析的场地、工具、流程等的有机组合。
从应用层面看,包括信息业务系统、基于数据仓库的分析系统;从数据层面看,包括操作型数据和分析型数据以及数据与数据的集成/整合流程;从基础设施层面看,包括机房的物理结构、服务器、网络、存储、供配电系统、制冷系统、环境
监控和整体IT运行维护服务。
随着信息产业的深入开展,投资建设的大量数据中心步入应用维护阶段,持续可靠提供应用服务的风险已经凸显,数据中心运维日益成为主管信息化部门关注的重点。
结合理论研究,立足实践,从数据中心运维现状、面临的挑战、企业内外的最佳实践、数据中心运维发展趋势和应重点考虑的因素等角度进行了观点阐述。
数据中心的运维和管理
20世纪90年代以来,中国石油集团公司投入了近千亿元的巨资进行信息化建设。
通过近20年来的持续建设,特别是“洲际大厦、东直门大厦、石油勘探院”等较大型数据中心机房的阶段化建设,中国石油集团公司信息化建设已经取得了初步成效。
集团内部公文流转、行政审批、费税征缴、信息公开、信息统计与分析等大量集团核心业务越来越依赖信息化。
各级领导部门对信息化的依存度大幅增加,业务部门对信息服务的需求日趋迫切。
到目前为止,投资建设的大量信息系统已进入应用维护阶段,持续可靠提供应用服务的风险已经凸显。
长期以来,中国石油集团公司各级数据中心的投入,主要用于解决从无到有的基础设施和系统的建设,忽视了系统建设完成以后的运行维护。
数据中心工作沿用建设方式的管理思路与目前发展阶段已不相适应,粗放型的外包管理与中国石油集团公司业务风险防范要求不相适应。
这
将对集团公司业务构成严峻挑战。
结合对多家企业数据中心运维管理体系的研究和咨询实践经验,就中国石油集团公司各级数据中心运维的现状和发展趋势总结如下。
一、中国石油集团公司数据中心运维现状
中国石油集团公司信息化建设的历史可以追溯到20世纪90年代初期,至今大体上经历了3个重要的发展阶段,即20世纪90年代的起步阶段、进入21世纪后的重点推进阶段和现在的加速发展阶段。
近年来,集团公司十分重视信息化建设,把加快信息化建设作为实施资源、市场和国际化战略,提高生产经营管理水平、促进业务流程优化、加强内部控制、提高决策质量和效率的重要手段。
2006年初,集团公司总经理办公会议专题研究信息化工作,审定“十一五”计划,9月份召开了集团公司信息化工作会议,全面部署了“十一五”信息化建设的主要任务。
“十一五”期间集团公司信息化建设的总体目标是:
基本建成支持中国石油业务发展的网络畅通、安全可靠、统一集成、先进实用的信息系统平台,信息化建设整体水平继续保持国内领先、逐步接近国际先进水平,初步实现中国石油从传统企业向数字化、网络化企业的转变。
到目前为止,投资建设的大量信息系统已进入应用维护阶段,信息化的发展正处在由建设向运维转型的时期。
下面,我们从信息化工作管理体系、信息系统基础架构、以及运维系统三个层面分析中国石油信息化运维现状。
1.管理体系
中国石油已经建立了统一的信息管理机构,在总部设立了统一的信息管理部和信息技术服务中心,分别负责全集团的信息管理和总部的信息技术服务工作,以加强统一管理和协调。
中国石油信息管理机构总体架构如图1-1所示:
图11:
中国石油信息管理机构总体框架
中国石油建立了覆盖各级组织的信息管理与技术服务组织体系,有的单位设立了专门的信息管理与服务部门,有的单位将信息管理职能归属在其他职能部门下,少数有条件的单位还把信息管理与服务职能分离。
集团总部信息部门与所属单位信息部门是业务归口管理的关系。
中国石油已经建立起一支具有一定规模的信息化建设队伍,拥有了一批技术人才,能基本满足现有系统和网络的运行维护等工作。
2.管理制度
中国石油确立了“统一、成熟、实用、兼容、高效”的十字方针来统筹集团公司的信息化建设,其中“统一”又进一步细化为“统一规划、统一标准、统一设计、统一投资、统一建设、统一管理”。
3.基础架构
中国石油信息建设和完善了覆盖集团公司总部、地区公司及其所属单位的三级网络架构,分别是中国石油广域网、地区公司/专业公司企业主干网以及局域网,并实现了因特网接入,为集团公司信息化建设打下了坚实的基础。
二.数据中心领域发展趋势
1.国际上数据中心发展趋势
目前国际上数据中心的建设和运营总体来说呈现出以下趋势:
(1).数据中心整合
出于IT成本过高、复杂性过大、资源利用率过低等原因,目前几乎所有类型的公司都在尝试将IT资源进行整合和集中,这其中就包括数据中心的整合。
因为集中化的IT环境更便于管理和控制,也更符合法规要求。
具体来讲,将分散的IT资源整合到少数几个IT数据中心,然后重点在网络、冗余、计算、存储和管理等几个方面加强这些集中式数据中心的能力。
这一趋势对很多IT技术和应用产生巨大影响。
如数据和应用将越来越多地通过广域网传递给远程用户,由此对广域网架构和管理产生了影响。
并且,通过Web、客户机-服务器协议来提供集中化的应用将成为一种标准,因为这样更加便于管理及更新,或通过安装补丁来防御安全隐患。
(2).采用新技术应对高增长
虽然多数公司都在尝试将资源整合到更少的数据中心中,但对数据中心资源的要求致使服务器和存储的数量大幅增长。
据美国《网络世界》杂志的一项研究,美国公司服务器的年平均增长率为11%,存储的平均增长率高达22%。
存储的增长远远超过服务器的增长,并且对IT部门造成更大的压力。
同时,由于IT预算常常得不到相应的增加,结果是预算往往仅用来购买服务器、存储,及用于管理服务器的工具和系统,公司的服务器数量在增加,但维护和管理运营费用却没有增加。
快速的增长给数据中心在环境控制、电源与致冷、空间管理等方面造成了巨大的压力。
此外,在多数情况下,不动产成本上的因素限制了IT占地面积的扩展(服务器机柜占用的地面空间)。
因此,各公司都力求在低密度机架和发热量及功耗极高的高密度机架之间寻求一种平衡。
为了应付未来的需求和业务扩展,多数公司将现有的服务器整合到虚拟机中(运行在单个物理服务器上的多个虚拟服务器),从而提高物理资源的利用率,解决应用增长所带来的需求。
在不需要大幅增长预算和人力的情况下,管理好这种快速的增长,是目前面临的严峻挑战。
虚拟化可在一定程度上控制这种增长,但虚拟化还会增加管理和自动化工具的要求。
只有借助于自动化和更高的效率,来实现以较少的资源管理更多的设施的目标。
(3).提高可用性
各种业务在提高可用性这一方面不断提出新的要求。
大部分企业通过改善现有数据中心,或构建新设施整合现有数据中心的方式,来建立互为备份的数据中心架构,保证业务连续性。
例如,在美国,鉴于卡特里娜飓风所造成的巨大影响,人们重新审视了潜在灾害可能波及的范围,所以这些数据中心通常相互距离在200英里以上,这样能确保企业灾难恢复的能力,保证业务连续运营。
(4).提高运作效率
多数公司均致力于数据中心的管理和运作,以削减成本、提高效率,使IT支出与业务需求和服务要求更加协调一致。
在“IT作为一种服务”的新文化中,数据中心将作为业务服务交付中心重新展现在IT用户的面前。
业务服务在更大的范围内采用治理和服务交付标准(例如ITIL)。
只有少数企业在整体上正式实施了这些标准,但即使是部分的实施也可为企业带来益处,如改变管理实践,最终提高数据中心的可用性并降低运作成本。
案例分析
HP公司实施数据中心整合
HP公司在实施数据中心整合前,在全球有85个数据中心,经过整合,在奥斯汀、亚特兰大和休斯敦3个区域,每个区域内建立2个同城数据中心。
2个数据中心之间相距10-25英里,并具备高可用性、灾难恢复和保障业务连续性的能力。
整合后的数据中心使用了水冷机柜、刀片服务器、新一代SAN存储等新技术;降低了大量的运维成本。
国际石油公司实施数据中心整合
加拿大石油公司由17个数据中心整合为4个。
皇家壳牌石油公司也通过不断地整合集中IT资源,来降低IT运营成本。
到2006年,总共通过整合减少超过2000台服务器和7750个应用系统,仅基础设施的成本降低就达到3亿5千万美金。
并且在降低成本的同时,IT的可靠性和可管理性大大增强。
三、国内外的数据中心运维管理的最佳实践
⒈国外最佳实践
从20世纪80年代开始,国外部分政府便开始探寻数据中心运维中的最佳实践,逐渐形成了成体系的一系列方法论。
下面重点介绍IT运维(服务)管理全球最佳实践ITIL和国际标准ISO20000。
⑴.ITIL
IT运维(服务)管理全球最佳实践ITIL(InformationTechnologyInfrastructureLibrary,IT基础设施库),是20世纪80年代由英国政府为提升政府IT运维管理水平和解决“IT服务质量不佳”总结各政府单位和先进企业IT运维管理的最佳实践而形成的。
ITIL为政府单位和企业提供了一个客观、严谨、可量化的标准和规范,组织的IT部门和最终用户可以根据自己的能力、需求定义以及所要求的不同服务水平,参考ITIL来规划和制定其IT基础架构及服务管理,从而确保IT运维管理能为组织的业务运作提供更好的支持。
ITIL是管理科学在信息技术中的应用,是一种基于流程的方法。
它把英国各个行业在IT管理方面的最佳实践归纳起来变成规范,旨在提高IT资源的利用率和服务质量。
它的开发并不是基于理论,而是根据“最佳实践”,即“被用户广泛认可的、有效的做事方式”。
ITIL从复杂的IT管理活动中梳理出各组织所共有的最佳实践(如事件管理、问题管理、变更管理、配置管理、服务水平管理、可用性管理等),然后将这些流程规范化、标准化;明确定义各个流程的目标、范围、职能和责任、成本和效益、规划和实施过程、主要活动、主要角色、关键成功因素、绩效评价指标以及其他流程的相互关系等。
ITIL描述了创建相关规范所需考虑的事项、计划和措施。
⑵.ISO20000
ISO20000由国际标准化组织(ISO)和国际电工委员会(IEC)于2005年12月共同发布,成为第一个IT运维(服务)管理领域的国际标准体系。
它源自英国国家标准BS15000。
2001年,英国标准协会(BSI)在国际IT服务管理论坛(itSMF)年会上正式发布了以ITIL为基础的IT服务管理英国国家标准BS15000。
BS15000是世界上第一个针对IT服务管理的国家标准。
它提出了一系列相对独立又彼此相互关联的服务管理所需要的管理流程。
2.中国石油集团内部最佳实践
中国石油集团信息服务中心在运维工作中通过借鉴ITIL和ISO20000,结合自身实际,构建了具有中国石油集团特色的IT运维管理体系,取得了不错的成效。
以下为中国石油集团内部的实践案例。
(1).中国石油集团信息服务中心
集团公司、股份公司信息技术服务中心(以下简称中心)作为集团公司、股份公司信息技术服务单位,主要负责集团公司、股份公司信息系统建设、运行维护等信息技术支持服务工作。
为了适应业务发展对信息技术支撑手段提出的要求,确保IT基础设施和业务应用系统的安全、可靠运行,中心于2008年开始引入IT服务管理(ITSM)理念和IT运维(服务)管理国际最佳实践(ITIL),开展IT运维管理体系的建设工作。
中石油IT运维管理体系建设具有以下特点:
高标准,严要求,以IT运维(服务)管理国际标准ISO20000为指导,实现了事业单位企业化管理的IT运维管理创新模式。
通过IT运维管理体系的建设,中心在IT运