某IT运维监控管理平台项目设计方案文档格式.docx
《某IT运维监控管理平台项目设计方案文档格式.docx》由会员分享,可在线阅读,更多相关《某IT运维监控管理平台项目设计方案文档格式.docx(35页珍藏版)》请在冰豆网上搜索。
依据对IT运维管理体系的建设经验,以及对用户信息系统现状、需求的分析,我们提出三位一体综合运维管理平台框架图如下:
IT运维管理平台包括:
“IT运行集中监控、IT运维流程服务、统一运维门户”三个部分。
底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统提供基础数据;
IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;
IT运维流程服务主
要根据IT服务管理的国际标准ISO200O,并结合ITIL最佳实践,梳理出了事件管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规划范管理,提升IT服务的质量。
统一门户主要实现对监控信息、运维流程信息进行集中展示。
平■台三个子系统关系如下:
(1)以IT运行监控为“基础”
这部分的功能主要是对被管对象运行的状态以及其配置资产信息进行统一监控、管理、分析,实现对各种故障和性能异常的及时报警,对系统运行性能进行实时监控,对系统运行的各种状态信息进行汇总、分析以及预测。
另外,还包括对IT系统的全部配置资产情况进行统一管理,对配置信息的异动提供检查及
口点。
IT监控管理除了实现网管的告警、性能、配置几大基本功能以外,还从运
维的角度提供丰富的数据综合分析和运维工具,例如综合报表、综合监控、信息
点管理等。
(2)以IT服务管理为“导向”
这部分功能主要依据ITIL架构进行建设,为IT系统的维护服务提供电子化的控制手段。
系统通过事件管理、问题管理、变更管理、配置管理等功能,为IT维护人员提供以流程为基础的服务管理方式,规范管理模式,达到快速消除IT系统故障、解决潜在问题,减少不规范的系统变更引发的系统故障率和故障隐患等目的,实现对IT系统的主动式服务,提高服务水平。
(3)以统一运维门户为“体现”
即是整个系统的对外界面,通过统一的权限管理和统一风格的B/S展现,为系统的操作使用人员提供统一的系统接口,做到一点接入,通观全局,能够以灵
活的组织数据的展现方式,定义用户、角色、组织机构,并为每个不同角色提供不同的功能模块,为每个用户分配不同的展现内容,方便用户进行企业整体的运行维护管理。
2.2设计原则
IT运维平台作为信息中心未来运维工作的核心支撑系统,需要系统本身具有高可靠、易扩展、易维护等特点,并且在系统功能应用上要具备一定的技术先进性和实用性。
所以,本次项目的方案设计遵循以下设计原则:
(1)先进实用
平台注重先进性和实用性的统一,以实用为目的,合理选用各类成熟、先进技术。
在体系结构、功能算法等诸多方面都采用先进计算机技术和理论,应用功能体现实用性。
(2)可靠性
在系统结构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能够7*24安全无故障运行,系统有很好的容错功能;
对IT资源的监测应保证不影响相关设备和系统的正常良好运行,并实现最好的响应效率及最小的资源占用。
(3)安全性
注重安全方面的设计,确保IT运维监控管理平台的稳定、安全运行。
系统要保证数据的安全,不会增加现有应用系统的复杂性,更不会降低现有应用系统的稳定性。
(4)开放性
采用符合国际国内标准的通用协议,为实现与其他系统监控软硬件互联或接入本系统进行监控提供接口,支持各种主流计算机平台、操作系统以及数据库厂商的各类软硬件产品。
(5)可扩展、易集成
系统需具备很好的扩展性,能适应不断发展的业务需求。
随着IT资源种类
和数量的扩大,系统也应能适应新的系统的对IT运维管理的需求。
系统具备高
度集成性,可以和第三方产品进行集成,进行功能扩展。
系统提供开发工具和接口,方便其他监控系统集成和统一管理。
2.3运维管理体系架构设计
与运维综合监控相关的运维管理体系架构主要包括以下内容:
1)资源监控与操作管理体系:
面向资源,以统一资源配置库(资产与配置、监控数据库)为基础,建设面向被管理资源的监控管理与操作自动化管理体系。
2)数据综合分析体系:
面向管理者,以统一资源配置库为基础,对资源监控与操作管理体系数据进行分析挖掘,建设辅助运营决策的数据综合分析体系。
运维管理体系架构是一个完整的IT系统运维管理架构,是IT综合运维管理的较高目标。
2.3.1系统总体架构设计
系统由监控采集层、数据处理层、服务管理层、运行展现层组成。
2.3.2监控采集层
监控采集层主要由网络监控模块(NCG、应用监控模块(BCC组成,实现对IT基础支撑系统的监控,包括:
网络设备、业务服务器、存储设备、数据库系统、中问件系统、安全设备、业务应用系统、网络流量等。
同时,从第三方系统(如机房环境监控和视频监控系统等)抽取数据(包括资产配置数据、故障告警数据),实现对IT资源的全面监控。
2.3.3数据处理层
数据处理层由统一事件平■台(Arbiter)、数据指标抽取模块(Bridge)、监控指标库(RDB、可视化展现视图(Live)等模块组成。
监控指标库(RDB存放了所有监控对象的当前运行状况、重要告警、重要KPI性能指标等数据,实现性能基线管理,并为监控对象的可视化展现提供数据支持。
CMD由RD吸据库的记录通过资源唯一标识ID(UUID实现一一对应,并能够自动维护其相互关联关系。
数据指标抽取(Bridge)负责从底层监控工具和第三方系统抽取各类管理数据,如资产配置数据、性能数据、监控对象运行状态数据、故障告警数据等。
其中故障告警数据送到统一事件平台进行处理,性能和状态数据进过处理后存放到RD吸据库中,资产配置数据经过数据活洗、调和处理后送到CMD敏据库中。
统一事件平台负责对来源不同的告警信息进行过滤、压缩和关联,以及对不同来源的性能数据进行规范、汇聚、分析等,并通过根源问题发现等功能,实现快速的故障定位,保证业务系统的监控运行。
灵动展现平台是一个个性化监控视图开发工具,可以根据管理需求,对各类
资源进行灵活组合,生成各类资源展现监控视图。
2.3.4运行展现层
运行展现层有运维门户(Portal)、用户管理(ACM、报表开发工具(Report)组成。
运维门户(portal):
向用户提供基丁WEB勺统一运维管理访问入口,使用户能够在统一登录、统一认证的情况下,实现对故障告警台、服务台、服务流程管理、监控视图、统计报表的访问。
报表开发工具能够根据管理需要抽取监控、操作、资产、流程等各管理层面的数据,并生成各类统计报表,为运行分析和管理提升提供支持。
用户管理实现组织架构管理、帐户管理、角色管理、授权管理等功能,实现整个运维平■台的统一帐户和授权管理。
2.4系统技术路线
2.4.1米用Java语言开发
系统采用JAV碍日XMB目结合的技术进行网站设计开发,由丁Java的平■台无关等特性,而在数据表示和传输方面,XML有着得天独厚的优势。
Java与XML勺组合提供了建立三层应用程序的最佳手段,开发的系统具有跨平台运行的能力,无论在windows环境下还是在其他主流操作系统环境下都能运行。
主要特点:
平■台独立性
这是Java最吸引人的地方。
由丁它采用先编译成中问码(字节码),然后装载与校验,再解释成不同的机器码来执行,即“Java虚拟机”的思想,“屏蔽”了具体的“平台环境”特性要求,使得只要能支持Java虚拟机,就可运行
各种Java程序。
面向对象的技术
面向对象的技术是近年来软件开发中用得最为普遍的程序设计方法,它通过
把客观事物进行分类组合、参数封装、用成员变量来描述对象的性质、状态,而用方法(成员函数)来实现其行为和功能。
面向对象技术具有继承性、封装性、多态性等众多特点,Java在保留这些优点的基础上,乂具有动态联编的特性,更能发挥出面向对象的优势。
多线程
多线程机制使应用程序能并行执行,Java有一套成熟的同步原语,保证了对共享数据的正确操作。
通过使用多线程,程序设计者可以分别用不同的线程完成特定的行为,而不需要采用全局的事件循环机制,这样就很容易实现网络上实时的交互行为。
动态性
Java的设计使它适合丁一个不断发展的环境。
在类库中可以自由地加入新的方法和实例变量而不会影响用户程序的执行。
并且Java通过接口来支持多重继承,使之比严格的类继承具有更灵活的方式和扩展性。
安全性
Java有建立在公共密钥技术基础上的确认技术,指示器语义的改变将使应用程序不能再去访问以前的数据结构或是私有数据,大多数病蠹也就无法破坏数据。
因而用Java可以构造出无病蠹、安全的系统。
2.4.2采用J2EE框架
考虑到系统的跨平台性和将来良好的移植性,并且考虑到系统能够将来很好
地与其他业务子系统的集成,本系统采用J2EE平台,并且根据J2EE的中间件规范进行产品开发,本系统采用J2EE平台集成的标准中问件,并在数据交换和数据导出上支持XMLB准。
平■台比较
目前,可作为开放式数据应用集成的规范和平台的技术主流有两种,一种是
微软公司的WindowsDN时台,另一种是SUN^司的J2EE平台。
虽然这两种集成平台和分布式计算技术都能满足实施开放式的数据应用集成的需求,但是从规范
的开放性、支持异构性、可移植性、支持的广泛性、对现有系统数据的继承性和技术优势等方面比较,J2EE比WindowsDNAft有优势。
平■台优势
J2EE是一种利用Java2平■台来简化诸多与多级企业解决方案的开发、部署和管理相关的复杂I可题的体系结构。
J2EE技术的基础就是核心Java平台或Java2平台的标准版,J2EE不仅巩固了标准版中的许多优点,例如“编写一次、到处运行”的特性、方便存取数据库的JDBCAPI、CORB及术以及能够在Internet应用中保护数据的安全模式等等,同时还提供了对EJB(Enterprise
JavaBeans)、JavaServletsAPI、JSP(JavaServerPages)以及XMLM术的全面支持,可以更好地与其他的分布式应用系统集成。
因此J2EE是一种更理想的集成平■台和规范。
2.4.3采用WebService进行数据互连互通
Wet®
务是一个或者一组应用程序,向外界提供一个能够通过We破行调用的API。
务的主要目标是在现有的各种异构平■台的基础上构筑一个通用的与平台无关、语言无关的技术层,多种不同平■台上的应用依靠这个技术层来实施彼此的连接和集成。
1.Wet®
务模型
务体系结构是基丁三种角色之间的交互,分别是服务提供者、服务注册中心和服务请求者。
其中:
(1)服务提供者:
创建WetiK务实体,为能实现一组特定任务的软件提供服务接口;
(2)服务请求者:
发现和调用软件服务,请求者一般会调用服务提供者发布的远程方法,把参数数据发送给提供者并接收相应结果;
(3)服务注册表:
管理和发布服务。
当服务请求者需要调用服务时,它首先到UDDI注册中心搜索该服务,得到如何调用该服务的信息,然后根据这些信息去调用服务提供者发布的服务。
在WebService服务体系中,使用WSDL来描述服务,UDDI来发布、查找服务,而SOAFffl来执行服务调用。
下图显示了这些操作、提供这些操作的组件及它们之间的交互。
2.WebK务的相关标准
在WebK务协议栈中,涉及了数据、消息、服务和注册库的描述定义,这些要用到具体的标准技术,包括XMLSOAPWSDLUDDI等。
其中XMLffl来描述不同层次的数据,它使得不同平台、不同环境中的数据和消息得以互通;
SOAP*
议用来交换XME肖息;
WSD®
来统一描述服务;
UDDI提供了统一的框架和编程接口,与WSDLSOA仟目互结合来管理Wet®
务,提供服务发布和服务发现能力。
(1)扩展标记语言(XML)
(2)简单对象访问协议(SOAP)
(3)Wet®
务描述语言(WSDL)
(4)统一描述、发现和集成协议(UDDI)
3.Wet®
务的协议栈
为了实现上述We囹艮务模型中的发布、查找、绑定等操作,需要定义一系列分层的协议规范。
服务发现:
这一层用来发现We囹艮务,来满足自己的需求。
由UDDI来处理的。
服务描述:
对Wet®
务进行自我描述。
它使用WSD床进行服务描述。
服务调用:
这一层的实质是基丁XMU勺消息传递。
当前基丁XM冒肖息传递的行业标准是SOAPSOA况一种简单的、轻量级的基丁XMLB机制,用丁应用程序之间进行结构化数据交换。
SOAPT以和各种网络协议相结合使用。
当然我们可以使用其他的基丁XMU勺消息如XM『RPd?
o
传输层:
用来传送客户端和服务器之间的消息。
这一层使用的协议通常是HTTFfe议。
理论上,我们可以使用任何网络协议,如FTP,SMTPIIOP等,但目前使用最广泛的是HTTPft、议
2.4.4数据库技术
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生丁距今五十年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。
数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。
在选择数据库时,成本因素是主要要考虑的问题。
采用J2EE作为系统的开发平台,在开发上使用ORM(Object/RelationMapping)技术和JDBCft术,尽力去缩小数据的差异性,实现跨数据库平台。
系统数据库初步采用Oracle11g。
2.4.5性能控制
采用Jmeter做web系统压力测试,通过优化程序、优化数据库等方法实现系统性能要求。
2.4.6开发、运行环境
操作系统支持:
Linux、WindowServer2003/2008
浏览器支持:
IE6、IE7、IE8、Firefox3.5
开发平台及语言:
J2EE平台、采用JAVA语言
设计工具:
ProwerDesigner15.0
开发工具:
Eclipse3.1、Maven3.0
版本控制:
SVN1.5
项目管理:
MicrosoftProject2007
缺陷管理工具:
Bugzilla3.2
web测试工具:
Jmeter2.3、IETester2.1
务器支持:
Weblogic10.3、Tomcat6.0
2.5应用接口总体设计
IT系统监控管理平■台在实现IT运维监控管理等信息的采集、存储、处理、加工、传输、统计分析、应用、系统管理的同时,与相关外部系统有着密切的联系,包括:
基础运维管理工具、机房动力环境监控系统、ITSM系统、短信平■台
等系统有着紧密的联系。
2.5.1系统内部集成接口
(1)接口功能设计
本接口实现分级情况下支撑系统之间的告警、性能等数据交互。
(2)接口实现设计
1)接口服务:
利用应用支撑层的数据交换接口服务来实现接口功能。
2)接口技术:
WebService、SOAP文件、码流等。
2.5.2与基础运维管理工具的集成接口
(1)接口功能设计
该接口对基础运维管理工具的网管、安管、主机管理、存储管理、机房动力环境监控等系统之间的事件、性能、告警等关键数据进行抽取、汇聚,以支持对监控数据的预警、统一展现。
(2)接口实现设计
1)接口服务:
2)接口技术:
2.5.3与ITSM系统的集成接口
本接口实现IT系统监控管理平■台与原有ITSM(运维服务管理)系统之间的数据交互,满足监控数据的实时抽取、汇总、预警、统一展现的需求。
1)运维监控数据抽取、汇聚、展示
该接口对IT系统监控管理平■台的网络监测与管理、业务系统监测的告警、性能等关键数据进行抽取、汇总、预警、统一展现。
2)生成基丁故障告警事件信息的故障工单信息
ITSM系统根据IT系统监控管理平■台所产生的故障告警事件信息自动生成相应的故障工单信息。
3)故障工单数据和处理状态同步
该接口辅助两边系统保持故障工单数据和处理状态的同步。
2.5.4与相关外部系统的统一身份认证与单点登录接口
本系统将对IT系统监控管理平台与基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统进行门户集成,从而在统一运维管理门户中实现
这些系统的统一身份认证和单点登录,形成统一的运维管理运行机制,从而有效
集成并利用各类运维管理资源。
1)统一身份认证:
对IT系统监控管理平台与基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统的用户进行管理集成,纳入到统一运维管理门户访问控制体系中,实现对IT系统监控管理平台用户的统一身份认证。
2)单点登录:
对IT系统监控管理平台的各模块,以及该系统与基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统在统一运维管理门户中的单点登录控制,使用户登录一次便可访问全部授权应用资源。
2.6系统安全设计及部署
采用We股术实现,在具有方便实用优点的同时,存在一些安全威胁和隐患,在系统平台上构建应用时应充分考虑以下的安全问题。
在系统平■台设计时充分考虑下歹0安全问题:
脚本语言的安全性问题,特别是用SQ*询时所书写的语句。
访问文件、数据库或其他网络连接时不应该接受未经检验的用户输入。
2.6.1输入检验
输入检验包括对来自外部数据源(非置信数据源)的数据进行语法检查,有时还要进行语义检查。
根据应用的关键程度和其他因素,对输入检验结果采取的安全过滤处理。
2.6.2GET请求和Cookie中的敏感数据
就像CGI协议所定义的,把请求数据从客户端传输到服务器端最简单的方法是GEW求方法。
如果要在客户请求中传输敏感数据,我们应该使用POSTJ法,再加上一种合适的加密机制(例如,通过SSL连接)。
2.6.3防通过嵌入标记实现的攻击
这种攻击通常包含一个由用户提交的病态脚本,或者包含恶意的HTML(或
XML标记,JSP引擎会把这些内容引入到动态生成的页面。
这种攻击可能针对其他用户进行,也可能针对服务器。
要防止出现这种问题要靠输入检查和输出过滤。
2.6.4防口令猜测功能
当用户试图多次猜测时,系统会不断增加响应的时延,并最终拒绝为用户提供服务。
另外,建议对系统口令长度加以限制,并且不能取特别熟悉的单词,进一步提高猜中的难度。
2.6.5页面和字段级的权限控制
在建议的系统中,我们将在每一个页面中包含权限检查代码,检查用户是否有权限访问该页面。
如果没有权限(如一般用户访问系统管理页面),则转到错误信息页面。
如果没有登录,则转到系统登录界面,请求用户登录。
另外,还可以结合平台的安全控制能力,使系统的安全性进一步增强。
对丁某些复杂的页面,需施加字段级的安全控制,使得某些字段只有具有权限的人才能察看或修改,为应用程序提供更加细粒度的安全控制。
2.6.6系统安全架构
从安全方针策略、信息安全管理、用户行为安全、数据信息安全、应用系统安全、系统平■台安全、网络平■台安全、物理环境安全等几个方面予以规划考虑,并与行业关丁信息系统安全体系建设的要求密切结合。
以完整的安全体系结构模型为依据,确保整个安全体系的完备性、合理性和适应性,为提供全面的、多方位的和合理的安全服务,切实满足各方面各层次的安全需求,在合理的代价下将各种安全风险降低到可以接受的水平,最终达到保证正常可靠运行和使用的目的。
第3章系统功能设计
3.1动环监控
3.1.1配电柜监测
3.1.1.1监控对象
各楼层市电输入柜、其他配电柜。
3.1.1.2监控实现
每一个申口总线回路的配电柜电量采集设备采用手拉手的接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。
监控主机通过实时不问断的轮询采集将信息传送给监控平台进行显示、报警。
3.1.1.3监控性能
实时监测配电柜输出相电压、电流、频率、最大千伏安、输出功率(有功、无功、视在)、谐波率、功率因