ImageVerifierCode 换一换
格式:DOCX , 页数:24 ,大小:359.11KB ,
资源ID:12624247      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12624247.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(IT集中运行监控系统解决方案白皮书.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

IT集中运行监控系统解决方案白皮书.docx

1、IT集中运行监控系统解决方案白皮书广州中软信息技术有限公司1概述 32解决方案 32.1技术架构 32.1.1总体逻辑架构 32.1.2系统部署架构 52.2功能设计 62.2.1数据采集及处理中心 62.2.2集中展现平台 112.2.3统一管理数据库 202.2.4系统外部接口 243运行环境 243.1硬件 243.2软件 254应用案例 261 概述广州中软 IT 集中运行监控管理系统 (BHM )是一个能够促进企业的 IT 运维 管理与业务管理相融合的 IT 运维综合性管理平台。 它通过透明化企业 IT 基础架 构和透明化企业 IT 运维过程来满足 IT 运维工作在操作层、管理层、决

2、策层等不 同层次的需求,达到延长企业服务的在线时间以及提高客户对业务服务的满意度 的目的。广州中软 IT 集中运行监控管理系统( BHM )不仅仅是工具,结合了广州中 软公司多年在各行业的运维经验,其主要特点是:订制能力强、扩展性好、覆盖 范围广、可复用企业已有资源、跨平台,面向服务、支持多级部署集中展现、安 全可靠、稳定高效。广州中软 IT 集中运行监控管理系统( BHM )经历过大型项目的洗礼,在各 行业应用的口碑,完善的售后服务保障, 高效、诚信且实力雄厚的实施服务团队, 较之市场上类似产品的功能堆砌(简单的数据接入)模式,广州中软 IT 集中运 行监控管理系统( BHM )更强调的是对

3、各领域监控数据的集中关联分析模式。2 解决方案2.1技术架构2.1.1总体逻辑架构对系统逻辑架构的设计,广州中软建议采用多层设计,依据对 IT 基础设施 集中监控平台的建设需求, 将系统分成监控对象层、 数据采集及处理中心、 集中展现平台以及统一管理数据库。如下图所示:(1)数据采集及处理中心数据采集及处理中心包含了数据采集器、统一数据处理引擎、统一事件处理引擎三个逻辑组件。其中,数据采集器根据采集策略对所有 IT资源对象的资源配置数据、性能指标数据、日志数据、状态数据等进行采集,并将采集到的数据 推送给统一数据处理引擎进行处理。统一数据处理引擎进行数据分类、资产关联、 业务关联以及阈值比对后

4、转发给统一管理数据库存储或交由统一事件处理引擎 做进一步的处理。统一事件处理引擎对接收到原始告警数据将根据告警策略对告 警信息进行过滤、去重、关联、归并以及执行相应的处理动作(如:自动确认、 短信通知等)。IT资源对象主要包括网络设备、安全设备、主机、数据库、中间 件等。(2)集中展现平台集中展现平台作为IT监控系统的统一人机交互界面,由业务和配置两种视图以及为这些视图提供服务的一系列组件构成,该应用支持 LADP系统安全认(3)统一管理数据库统一管理数据库是IT监控系统的数据核心,保存IT监控系统的各类数据信 息。统一管理数据库主要保存六大类数据,它们分别是资源数据(操作相关的配 置信息)、

5、资产数据(设备配置信息)、告警数据(异常状况相关的信息)、性能 数据(表明设备运行状态的信息)、元数据(对统一管理数据库中存放的系统相 关数据的描述)、调和规则(系统在进行数据调和时的规则)。2.1.2系统部署架构IT监控系统的部署架构如下图所示:系统部署架构图( 1) 部署数据采集及处理中心通常情况下, IT 监控系统内置一个信息处理中心服务器即可,但在大数据 量的情况下, 可线性复制多个信息处理中心样本。 应确保部署数据采集及处理中 心的服务器与被监控对象之间的协议通信畅通。( 2) 部署集中展现平台应确保部署集中展现平台的服务器与统一管理数据库服务器 JDBC 通讯畅 通以及与数据采集及

6、处理中心服务器的 SOCKET以及HTTP通讯畅通。( 3) 部署统一管理数据库应确保部署统一管理数据库的服务器与集中展现平台服务器 JDBC 通讯畅 通以及与数据采集及处理中心服务器的 SOCKET以及HTTP通讯畅通。2.2功能设计2.2.1数据采集及处理中心数据采集及处理中心主要负责采集并处理监控对象的数据, 并根据业务需求 将数据分发到集中展现平台和统一管理数据库, 它是由多个数据采集器、 一个数 据缓存池以及一系列数据处理引擎组合而成。2.2.1.1数据采集器数据采集器持续采集监控对象相关的配置、 运行、性能、告警等数据,为 IT监控系统对设备实施监控和管理提供了基础。221.1.1

7、数据采集内容管理对象配置数据性能数据日志数据网络设备安全设备主机数据库中间件221.1.2采集器功能要求(1) 支持动态采集策略定义根据使用情况自动或者手动调整数据获取的周期、范围和方式等策略。(2) 采集器支持汇聚采集具有灵活的分布式部署机制,可以实现汇聚采集也可以进行单独采集。(3) 高效的采集设计尽可能少的占用被管对象资源进行数据采集。(4) 数据预处理采集器经过预加工实现数据的过滤加工。(5) 支持自定义采集脚本开发不修改代码的前提,实现非标数据的自定义采集2.2.1.1.3 数据采集器实现无代理系统管理解决方案无需安装任何程序, 通过标准的接口或者协议方式 获取监测数据。(1 ) S

8、NMP 采集器支持 SNMPv1 、v2、v3 标准,采集器通过查询 (Polling )和自陷( Trap) 相结合的方式获取被管设备的性能数据、事件数据、配置数据。采集的范围:主机的性能、配置和日志数据。网络设备的性能、配置、日志数据。安全设备的性能、配置、日志数据。(2 ) JDBC 采集器 通过对被监控数据库基表的查询采集数据库的运行状况信息。 采集的范围:数据库的配置、性能、日志信息。(3 ) JMX 采集器通过 JMX 的方式采集中间件的运行状况信息。 采集的范围:中间件的配置、性能、日志信息。(4 ) 其他采集器支持 Telnet 、SSH 和 WMI 等无代理方式的数据采集。通

9、过脚本开发实现 可配置的数据采集。采集的范围: Windows 、各种 Unix/Linux 操作系统的配置、性能数据。2.2.1.2统一数据处理引擎2.2.1.2.1性能数据处理当收集到的性能数据值超越定义的门限时, 会向指定人员发出相应的越限告警,告警参数包括:告警源、告警时间、告警级别、告警原因、阈值信息。性能数据存储在系统中, 系统应能对定期收集到的数据进行统计、 分析和处 理,结合资源的构成情况, 将收集到的性能数据通过一定的算法进行分析和处理, 以此来反映被监控对象的性能质量。2.2.1.2.2配置数据处理对采集到的配置数据与配置库进行比对, 系统能够自动判断其是否出现变更, 并在

10、发现异常时生成配置变更告警。2.2.1.2.3事件数据处理事件处理是集中监控管理中一个重要的组成部分, IT 监控系统应提供统一 的事件处理机制,实现对 IT 设备事件的集中处理。统一事件管理要求遵循以下步骤:1.事件信息分类事件信息类别: 系统平台事件,包括:主机事件、数据库事件、中间件事件、 应用系统事件等。事件信息内容:事件的序列、事件标识、事件初次发生时间、事件最后发生 时间、事件次数、事件类型、事件级别、事件源、事件负责人、事件标题、事件 内容、被管对象联系人等。事件的结构可进行增加和修改, 可以灵活定制事件的显示格式, 增加的扩展 属性都可以定义到事件的显示内容中,不同类别的事件支

11、持不同的显示模板。2.事件信息的汇总信息汇总过程中支持信息的过滤, 过滤条件可以灵活制定, 如按照事件的类 型、对象、级别、描述、位置、发生时间等条件以及多种条件的组合,可以根据 用户的事件管理需要进行过滤规则的定义。提供信息格式统一化规则,将不同来源的管理信息,如网络、系统、应用的 事件信息标准化,为后期的处理和分析提供方便。3.重复事件压缩4.事件关联分析5.事件自动化处理6.事件信息丰富 将事件信息与相关资源信息(如该设备的位置,负责人等)进行关联,使管 理人员在收到报警的同时, 直接就可以查看到相关的内容, 不用进行额外的手工 查询工作。7.事件报警通知及任务分配提供基础的告警通知流程

12、功能, 如哪些事件应该由什么人处理, 故障在一定 时间内没有解决应该如何进行升级和通知等, 统一事件管理平台要能够根据策略 驱动不同的报警程序。告警事件在产生后, 可自动分配给负责的支持人员, 或者由值班人员手工转 发给相应支持人员事件数据处理需支持多种方式报警,包括电子邮件、声音、页面提示、手机 短信等多种方式通知。告警事件的内容包含告警来源、告警标题、告警级别、发 生时间等,信息可以灵活定制。222集中展现平台集中展现平台位于IT集中运行监控系统的最上层,是系统和用户之间的接口,提供给用户监控、浏览、操作整个系统的唯一通道。集中展现平台通过对监控对象的异常情况、 事件进行告警通知、处理,最

13、终形成一个集发现、展示、告警、处理为一体的综合监控平台。2.2.2.1资产管理资产管理视图满足用户对监控对象的配置信息维护要求, 支持网络设备、安全设备、服务器、数据库、中间件,业务系统等监控对象的配置以及地理位置等 信息维护;可维护对象之间的关联关系,如网络连接的对端设备、应用软件所处 宿主服务器;监控对象资源树视图维护,可按照设备类型、业务系统或自定义分 组来组织监控对象资源树,建立更加合理的管理视图。资产管理视图具体由以下 基本视图构成:序号视图名功能描述1监控对象统计视图主要按不同的业务系统进行监控对象数量的统计,同一 业务系统下还可按设备类型,资产状态,资产入库方式 及按厂商四种分类

14、方式进行统计。2综合查询视图1、通过不同的过滤条件,检索出满足过滤条件的监控设备列表,点击某一资产,可进入查看资产详细信息。2、查询结果可导出为 XLS、PDF、TXT文本等格式进行 保存。3单个对象的详细配置信结合监控对象所属的设备类型,确定该对象的扩展属性息管理及展示视图并显示所有配置属性的值。可对单个监控对象进行新增、 修改、删除、停用、启用等维护操作。4类型维护视图新增、修改、删除设备类型信息,并实现类型与扩展属 性的映射关系。5业务系统管理视图新增、修改、删除业务系统信息。6行政分区管理视图新增、修改、删除行政分区信息。7厂商及产品型号管理视 图新增、修改、删除厂商及产品型号的信息。

15、8位置信息(机房、机柜)管理视图新增、修改、删除机房以及机柜的信息。9资源树维护视图可按照设备类型、业务系统或自定义分组来组织监控对 象资源树,建立更加合理的管理视图。222.2性能分析视图性能分析视图满足用户查看各种监控设备的性能信息要求,包括网络设备、主机设备、中间件、数据库等性能信息。性能分析视图由以下基本视图组成:序号视图名功能描述1、性能总览视图1、 可按照设备类型查看各种监控对象的设备总量、正常状态设备数量、告警设备数量;2、 可查看各种类型设备的性能指标阀值告警 T0P5的设备信息;2、性能列表视图列出当前用户权限内的所有监控设备的性能信息列表,展示的内容包括:设备名称、设备IP

16、、典型监控指标(如CPU使用率、内存使用率)、状态信息、采集时间等。3、单设备性能分析视图在性能列表视图中选择单个设备,可进入单设备的性能 分析视图。不冋类型的设备,根据其监控指标的不冋, 采用不冋的展示页面。(如网络设备可查看 cpu/内存当 前值、cpu/内存历史变化趋势、网络端口指标值等)4、性能信息查询视图1、 可根据设备类型、设备名称、设备 IP、业务系统、 责任人、资产状态等过滤条件,查询获取用户关注的设 备性能信息。2、 查询结果可导出为 XLS、PDF、TXT文本等格式进行 保存。222.3业务系统分析视图通过业务系统分析视图可对已有的各个业务应用系统的软、硬件的组成情况以及它

17、们的运行状况一目了然。同时,从业务的视角对业务应用系统的关键交易 进行响应情况的实时展现,从而更加直观的反映该业务系统的可用性。业务系统分析视图具体由以下基本视图构成:序号视图名功能描述1、总览视图查看各个业务系统的系统状态、告警览视图中某个业务系统发生告警时,个业务系统页面,查看具体信息。;数量等信息。在总可以点击进入到单2、单个业务系统的监控视图查看单个业务系统包含的网络设备、服务器、数据库和 中间件等监控对象的关联关系以及它们的运行状况。2.224告警管理视图告警管理模块汇聚了安全告警、性能告警、故障告警、状态告警等所有 IT设备的告警并进行集中展现。通过告警管理视图可方便的进行故障定位

18、、 查看告警的详细信息、快捷的找到类似告警的处理意见、并可实现告警的确认、取消确认、短信通知、邮件通知、 告警升级等告警处理操作。告警管理功能模块通过与IT服务管理系统等系统进行结合,可实现问题的 闭环管理。告警分析视图具体由以下基本视图构成:序号视图名功能描述1、告警总览视图告警总览显示告警的总体信息,包括多种告警统计、业务系统当天告警趋势图、 一周内告警数量对比图等信息。2、综合查询视图1、查询的告警信息包括当前告警和历史告警信息。查询可按照告警所包含的任意字段,如告警编号、告警级另告警状态、类型、告警发生时间、告警标题、告警 内容、告警确认时间、告警处理人、告警源、处理意见 等条件进行组

19、合,对告警内容进行综合查询。2、查询结果可导出为 XLS、PDF、TXT文本等格式进行 保存。3、单条告警的详细视图告警详细页面展现的信息可根据告警类型进行定义,不 冋类型的告警可根据实际情况展现不冋的属性。用户可 在告警详细页面对告警进行处理。 包括确认、取消确认。冋时可查看告警累积次数信息、设置告警阈值规则、查 询知识库和设置告警规则引擎信息等。4、告警通知管理视图告警通知的方式,可包括短信告警、邮件告警、看板告 警、桌面告警等方式。1、 短信告警:通过调用统一的短信平台接口,使用短 信猫分业务系统、为指定的用户类型发送告警信息。2、 邮件告警:通过调用邮件系统接口,实现分业务系 统、为指

20、定的用户类型发送告警信息。3、 可灵活配置事件下发模式。接收事件的用户类型包 括:资产负责人、值班人员以及规则引擎指定的用户。 可根据用户需求,设置不冋的事件下发时间段,如:上 班时间、非休息时间和用户自定义时间,不同的时间段 可配置事件下发给不冋类型的管理员。 口:上班时间发 送短信给管理员,下班时间下发给值班人员。5告警规则引擎系统通过统一规则引擎,对数据进行了过滤、归并和审 计动作,在海量的数据中提取有价值的数据。如系统故 障数据、性能瓶颈数据、安全数据等。冋时用户可对数 据进行个性化动作订制,包括发短信、发邮件、升级、 自动确认等。告警总览视图告警总览主要通过告警类型、告警级别、告警状

21、态以及业务系统等几个维度, 对告警状况进行图形化展现,通过直观的方式为用户展现告警的各方面状况信息。综合查询视图告警综合查询视图提供了一个全面的告警搜索查询列表,用户可根据设定各 方面的条件对告警进行查询以及处理。告警的处理方式包括:确认、取消确认等。2.225统计分析报表222.5.1资产统计报表能够反映资源资产情况,按照生产厂商、业务系统、设备型号、设备类型、联系部门、地理位置等多种维度组合查询功能,使维护人员能够清晰地了解 IT系统中各种设备、软件、应用的资源配置情况。报表查询可以按照整体统计或设 备明细进行,通过统计报表的向下钻取也可得到明细报表。 资源资产报表为用户提供了详实的数据,

22、为维护人员、管理人员掌控系统资源信息,充分了解系统资 源配置情况提供非常便利的工具。2.2.2.5.2性能报表性能报表即可以按条件进行查询统计的性能视图。各类性能报表指标如下:1、 网络设备报表1)CPU 利用率、内存利用率、设备各接口流量等。2、 Linux/unix 主机报表1)CPU:CPU 利用率、 CPU 用户时间利用率、 CPU 系统时间利用 率等。2)内存:内存利用率、可用内存量、内存页交换进量、内存页交换 出量等。3)文件系统:文件系统利用率、已用空间量、总空间量。3、 Windows 报表1)CPU:CPU 利用率、 CPU 用户时间利用率、 CPU 系统时间利用 率等。2)

23、内存:内存利用率、内存换页率、内存页交换进量、内存页交换 出量。3)逻辑磁盘: 逻辑磁盘可用率、 逻辑磁盘可用空间、 逻辑磁盘已用 空间。4、 数据库报表1) 缓冲区命中率:数据块在数据缓冲区中的命中率。2)内存排序率:排序操作在内存中进行的比率。3)共享区命中率: sql 语句在共享区的命中率。4)表空间使用率:表空间已使用空间与总空间的比率。5、 中间件报表1 ) Weblogic 报表打开的端口数、打开的连接数、 JDBC 当前连接数、 JDBC 可用的连接 数、等待连接数等。2 ) Websphere 报表 数据库池平均等待时长、数据库池平均利用率、数据库 Cache 平均等 待时长、

24、数据库 Cache 平均利用率、活动 Bean 数。2.2.2.5.3告警报表提供对当前告警和历史告警的查询、统计和分析功能,提供按照日、周、月 等不同时间粒度的告警明细和统计报表。主要细分为:告警汇总统计、解决率统计、告警趋势统计、告警 topN 、告 警综合查询:1、告警汇总统计根据时间段对所有告警统计,可分为告警级别和告警状态来统计时间 从 xxxxx-xx-xx 到 xxxx-xx-xx 告警级别(提示、一般、重大和紧急)告警状态(消除和未消除)2、解决率统计根据用户选择的时间,来统计每天、每时的告警解决率,解决率 = 消除告3、告警趋势统计针对具体某个资产或者几个资产的告警趋势统计。

25、4、告警 topN 报表根据用户选择的时间段,统计在时间段内出现告警最多的 N 台资产。5、告警综合查询根据用户输入的时间段、部门、告警级别、告警状态等查询条件查询。2.2.2.6 平台配置管理平台配置主要包含采集策略配置、告警策略配置、权限配置等。2.2.2.6.1采集策略配置采集策略配置主要对监控对象的采集指标项、采集频率、性能阀值能配置项 进行配置。2.2.2.6.2告警策略配置告警策略配置主要对告警规则进行配置, 对告警规则条件及告警动作进行配2.2.2.6.3权限配置权限管理又分为人员管理、角色管理以及权限资源管理。(1) 权限的管理可实现对系统菜单、页面资源、设备资产、系统视图的权

26、限划分 ;2) 通过为角色分配权限,使角色拥有对系统菜单、页面资源、设备资 产、资产关联数据权限等资源的访问、 管理权限(可配置不同行政级别用户角色, 使各级用户分别管理各自范围内的设备) ,根据需要将不同的角色赋予不同的用 户,实现用户权限的分配。 可以为某些特定用户定制专门的权限, 例如可以通过 绑定 IP 和 MAC 地址,使部分用户不用登录直接访问系统,但只能让该类型用 户查看信息展示页面。对于业务领导用户,可以设定“链接导航”的层级,屏蔽 部分底层数据(如事件信息等) ,只展示领导关心的统计数据。2.2.2.7 日志查看视图为保证网络和系统的安全、可靠和稳定运行,集中展示平台具备自身

27、日志管 理功能。系统记录的日志包括系统运行日志和用户操作日志。(1) 系统运行日志包括:系统运行情况中产生的故障信息,主要系统模 块的运行情况、系统定时任务的运行情况等;(2) 用户操作日志包括:系统必须记录每个操作员进入、退出系统的时 间以及在系统中的一些重要操作的操作内容;(3) 当具备日志管理权限的管理员进入日志管理功能后,可以看到日志 记录的列表显示;(4) 输入一定条件(比如时间段)可以查询统计相关的日志记录;(5) 超级管理员可以删除一条或多条日志记录;2.2.3统一管理数据库2.2.3.1统一管理数据库中的数据统一管理数据库中主要保存六大类数据:(1) 资源数据:操作相关的配置信

28、息。(2) 资产数据:财务角度相关的设备信息。(3) 告警数据:IT基础架构中异常状况相关的信息。(4) 性能数据:表明IT基础架构运行状态的信息。(5) 元数据:元数据是对统一管理数据库中存放的系统相关数据的描述。(6) 调和规则:记录了系统在进行数据调和时的规则。2.2.3.2功能描述(1)数据访问服务考虑到统一管理数据库事实上已经成为 IT监控系统的核心,需要支撑上层的集中展现平台,甚至为IT监控系统以外的应用程序提供以资源为中心的数据共享功能,因此需要对统一管理数据库的外部调用接口进行设计。接口框架设计如下:接口名称接口描述资源维护接口提供资源本身的维护和查询功能。资源属性维护接口提供

29、资源属性的维护和查询功能。资源关系维护接口提供资源关系的维护和查询功能。资源展现接口提供指定资源的信息展现功能。资源告警数据查询接口提供指定资源的告警数据查询功能。资源告警信息入库接口提供标准化之后的资源告警信息批量入 库功能。资源性能数据查询接口提供指定资源的性能数据查询功能。资源性能数据入库接口提供标准化之后的资源告警信息批量入 库功能。资源工单数据查询接口提供指定资源的工单数据查询功能。资源资产数据查询接口提供指定资源的资产数据查询功能。资源变更历史查询接口提供指定资源的变更历史数据查询功 能。资源权限维护接口提供资源权限的维护和查询功能。(2)数据维护功能统一管理数据库的数据准确性、实

30、时性、可用性要求很高,否则将导致整个管理平台的服务质量下降。 首先需要考虑的是制定严格数据维护的规范、制度和流程,其次要考虑提供如下的数据维护功能:数据来源维护:包括自动化和手工的数据来源进行管理 ;数据属性维护:对指定的资源属性进行维护;数据访问权限设置:实现操作功能、数据范围和岗位的对应关系,对数据访问权限进行合理设置;数据维护请求管理:包括请求的发起、核查、审批 ;数据审计:包括对资源变更信息的核查,差异数据的修正,资源数据的统计等等;(3)版本管理功能统一管理数据库的资源数据不仅是整个 IT环境的一个快照,同时还应该反映整个IT环境的历史变更信息和版本比较。要求提供如下的版本管理功能: 版本差异的发现:包括资源数据变更的自动发现和审核、资源数据的人工修正,在资源数据的变化确认之后需要对历史数据进行保留; 版本信息的记录:要求记录版本变更时间、相关人员、关联资源、变更 内容;版本信息比对:要求提供对不同版本的资源信息进行比对的功能 ; 历史版本恢复功能:考虑到该功能的安全性、可行性,可

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1