Blueware APM 20白皮书v3.docx
《Blueware APM 20白皮书v3.docx》由会员分享,可在线阅读,更多相关《Blueware APM 20白皮书v3.docx(17页珍藏版)》请在冰豆网上搜索。
BluewareAPM20白皮书v3
BluewareAPMv2.0
——白皮书
Vision:
2.0
文件编号:
20130614-1
编制:
售前支持部门
审核:
售前支持部门
审批:
售前支持部门
版本:
V2.0
修改状态:
05
受控状态:
00
目录
1.引言3
1.1白皮书使用范围3
1.2版权说明4
2.产品背景5
3.产品概述7
3.1架构概述7
3.2运行环境8
3.2.1SERVER端8
3.2.2AGENT端8
4功能描述10
4.1监控功能10
4.1.1监控产品描述10
4.1.2Blueware能自动发现可以监控的软件和硬件资源11
4.1.3灵活的自定义管理服务11
4.1.4主要监控指标简介(详见附件-监控资源列表)12
4.2警报中心和事件中心14
4.2.1警报中心-报警介绍14
4.2.2事件中心17
4.3IT资产管理及统一接口平台18
4.4配置变更管理19
4.5日志文件跟踪19
4.6用户级别实现IT资源权限管理20
4.7按照业务的拓扑展现20
4.8智能机房22
5.产品实施运维方式说明23
5.1产品交付物23
5.2标准服务23
1.引言
BluewareAPMv2.0是一款IT资产管理及应用系统性能监控软件。
BluewareAPMv2.0软件,可以帮助客户在自己错综复杂的应用系统环境中,对基础组件(数据库、应用服务器等)、服务(目录服务、邮件服务等)、操作系统、网络系统、虚拟化设备和相关硬件设备进行实时监测。
以直观的可视化图表来显示当前监测设备的运行状态、资源占用情况及故障报警通知服务。
帮助客户降低系统运维的人力成本,提高监测的实时性与可靠性,降低对人为经验的依赖。
本白皮书包括BluewareAPMv2.0软件的研发背景、软件概述、体系架构、运行环境、功能描述、主要监控内容和监控指标、产品特性和优势、典型案例。
本白皮书主要是帮助读者详细了解BluewareAPMv2.0软件的各样特性、指标、性能等。
使读者可以在BluewareAPMv2.0使用前对产品有一个详细的了解,在使用中也可以使用本书作为使用工具帮助读者更好的使用BluewareAPMv2.0。
1.1白皮书使用范围
本白皮书适用任何对BluewareAPMv2.0软件感兴趣并期望进行了解该软件的人。
1.2版权说明
“BluewareAPMv2.0——白皮书”版权属于北京蓝海讯通科技有限公司所有。
“BluewareAPMv2.0——白皮书”版权受到《中华人民共和国著作权法》保护。
任何组织、单位和个人在未经北京蓝海讯通科技有限公司书面授权的情况下,不得以营利为目地的转载、引用和改编本书的全部或是部分内容。
任何组织、单位和个人在以非营利为目地的转载和引用本书的全部或是部分内容时,必须同时说明转载和引用部分的出处,以及版权属于北京蓝海讯通科技有限公司。
2.产品背景
随着客户应用系统日益庞大,IT设备日益多样化。
客户机房设备逐渐增多的同时,从机房服务器端到用户终端的应用也更加的繁杂。
客户的系统运维现在已经是一件非常复杂的工作,再加上系统、数据库等应用软件的管理,更是加大对运维人员水平的要求,IT系统运维成本的上升。
BluewareAPM软件能够帮助客户实时监测自己的应用设备和应用软件,提供IT资产及应用组件的实时整体视角。
在问题发生前,就能为客户提出预警,并通知客户。
在问题发生后,又能通过对系统整体的监测,提供翔实的监测数据,分析IT资产性能趋势,帮助运维人员准确的定位问题所在点,从而提供提高IT管理效率。
2008年Bluewarev1.0诞生。
Bluewarev1.0支持Oracle、WebLogic等主流数据库中间件的监控,能够深度发掘应用组件性能信息,并与次年签约黑龙江移动,重庆公积金等客户。
2010年,Blueware升级为2.0版本,更新应用组件自动发现与建模,应用组件的深入监控,端到端的关联分析,配置及日志跟踪,智能机房监控等新特性,同时BluewareAPM2.0的通用产品支持列表扩展至9大类,75种产品。
产品架构也更加易于扩展,支持XML插件更新功能,迅速为用户定制专用产品的支持。
Blueware2.0产品具备IT资产管理,配置变更管理,统一控制平台等企业功能。
2012年,Blueware软件家族中的BluewareTPM问世。
BluewareTPM主要实现对用户交易业务的监控管理,是国内唯一一个实现gartener五个维度指标的产品。
BluewareTPM能够实时监控用户业务交易的流转及效率,实时展示性能瓶颈和业务逻辑。
是用户管理高压力,高性能业务系统的利器。
3.产品概述
3.1架构概述
BluewareAPMv2.0是一个基于Java的应用软件性能监控系统和IT资源管理平台。
系统由server和agent组成。
Bluewareserver提供数据分析展示,存储的功能,BluewareServer已经嵌入到官方一体机中。
BluewareAgent端安装在被监控端上,单一agent实现所有bluewareAPM支持产品的扫描及信息传输。
3.2运行环境
3.2.1SERVER端
服务器端:
BluewareAPM2.0server软硬件一体机。
配置服务器端需要一个固态IP且该IP与被监控端的连接。
3.2.2AGENT端
3.2.2.1代理系统资源要求
500MHzCelero或更高
256MB内存
500MB磁盘空间
3.2.2.2代理操作系统支持
Linux
WindowsXP(Pro),Windows2003/2008,Windows7
Solaris8或更高
MacOSX
HP-UX11.11或更高
AIX5.2或更高
FreeBSD
3.2.2.3代理JRE要求
BluewareAPMv2.0代理能运行在JRE1.4,1.5或1.6。
我们推荐使用JRE1.5,包括在与具体平台相关的代理安装软件中。
针对一些无法安装agent的设备(如交换机,路由器等),BluewareAPM2.0也支持noagent模式。
4功能描述
4.1监控功能
4.1.1监控产品描述
BluewareAPMv2.0的监控功能都是与性能指标的采集相关的,Blueware从Web、应用和数据库环境收集性能数据。
数据被存储在Blueware服务器中的数据库中,并根据在Blueware中定义的资源层次(作为资源库模型的一部分)相关联。
使用这些性能指标,你可以监控并管理整个企业的资源,查看运行的变化,在它出现问题之前停止那些可能造成危险的的动作,从而提高资源可用性。
Blueware的监控可以帮助你回答像这样的问题,“Tomcat服务器有多忙?
”,“哪些资源已停止”,和“对我的企业级应用来说,JBoss的线程数是不是太多?
”等等。
Blueware从一个目标系统平台,服务器或服务收集到性能指标,收集的数据取决于被监控的服务器或服务的类型。
例如,监控一个Linux平台,可以查看有关全部,已用的和可用的物理内存和交换内存,全部,空闲的和用户CPU;还有更多。
而对于一个Tomcat实例,可以查看像JVM的总内存,活跃线程和线程组数量,正常运行时间,处理共享内存时间等这样的性能指标。
4.1.2Blueware能自动发现可以监控的软件和硬件资源
Blueware能自动侦测到硬件和软件的任何一个侧面,包括内存,CPU,磁盘,网络设备,版本信息和配置信息等。
对于目标设备,在安装完智能探针后,无需特别的设置,智能探针会根据自身可监测的资源数据库中的数据来自动探测目标设备中的可监测资源。
并将可监测资源在BluewareAPM的管理面板中统一显示出来。
智能探针在目标设备启动后,会自动在目标系统中探测自己可识别的可被监控的资源,例如可监控的系统、可监控数据库、可监控的中间件等。
智能探针会将自己探测到,可监控的资源,上传到服务器端。
在管理面板仪表板中,可以看到自动识别到的监测资源。
这样Blueware管理员只要从目标设备可监测资源列表中选择自己需要监测的资源配置管理、警报等一系列策略即可进行管理。
Blueware自动识别可管理资源,能大大减少管理员的工作量,减少手工配置可能造成的失误。
同时也不再要求管理员对各类资源都需要掌握。
4.1.3灵活的自定义管理服务
管理员可以根据自身的需要,灵活的定义需要监测的资源。
管理员可以添加自己感兴趣的资源进入控制面板,同时也可以将不需要监测的资源从控制面板中移除。
管理员可以通过设置组来批量管理目标资源。
使用拖拽portlets设置你的操作仪表板和拓扑图,并很容易使用配置控制创建组,帮助管理和测量大环境的健康度。
Blueware通过定义应用的方式进行管理,可以将特定应用所涉及到的特定硬件,软件和服务等设置成一个组,作为一个整体进行管理。
管理员可以通过组的管理,将自己感兴趣的资源,按照设定轮流、循环展示在自己的面板上。
4.1.4主要监控指标简介(详见附件-监控资源列表)
1.操作系统
∙AIX
∙FreeBSD
∙HPUX
∙Linux
∙MacOSX
∙NetBSD
∙Solaris
∙Unix
∙Win32
2.中间件
∙ApacheActiveMQ
∙GemFireDistributedSystemplatform
∙Hadoop
∙HornetQ
∙memcached
∙MSMQ
∙MuleESB
∙RabbitMQ
∙RabbitMQserver
∙Samba
∙SonicMQ
∙WebSphereMQ
∙WSO2ESBJMX
3.数据库
∙ApacheCassandra
∙CouchDB
∙DB2JDBC
∙iAnywhere
∙IBMDB2
∙Informix
∙MicrosoftSQLServer
∙MongoDB
∙MySQL
∙Oracle
∙PostgreSQL
∙Sybase
4.虚拟机
∙MicrosoftTerminalServices
∙VMwareInfrastructure
∙VMwareInfrastructureManager
∙VMwarevSphere
∙VMwarevCenter
∙VMwareServer
∙XenServer
4.2警报中心和事件中心
4.2.1警报中心-报警介绍
IT团队可以通过Blueware的警报系统,自动管理IT的监控和响应过程。
BluewareAPMv2.0的警报作用如下:
●为指定资源的运行情况设定报警条件(也叫设定报警水线)
●当满足你为资源指定的报警水线时,触发该资源警报
●按照事先设定,通知指定的人员或与警报事件相关者
●当警报发生时,自动执行资源的控制操作(功能)
●跟踪,解决警报问题的状态
●分析警报及警报的历史操作
一个资源警报包括:
对于一个指定的资源,如何检测到问题并作出响应。
需要你为该资源设置一个警报规则:
1、一个性能指标或一个事件信号
2、当指定的测量或事件报告时,该如何去做;当警报发生时,Blueware会记录该事件信息,并在Blueware的用户界面执行您定义的动作,包括发送电子邮件和手机短信通知,产生OpenNMS陷阱,或开始一个升级。
额外的警报条件和操作的功能说明了在Blueware中更高级的警报功能。
警报定义的一般过程:
您创建一个资源警报,你需要定义一个警报定义。
警报定义指定的条件应该采取主动的警报模式。
警报条件涉及到Blueware收集该资源的度量和事件跟踪。
指定一个特定的度量条件和警报发生时应该采取的行动,例如:
“可用性小于100%”。
指定一个事件跟踪的条件:
发生警报时得到的事件日志,配置文件的变化及应该采取的行动。
当一个警报发生时,警报定义也指定了Blueware应该进行如何操作。
你可以在Blueware用户界面设置警报定义,根据警报提示选择指定的条件和操作。
警报发生时,必须设置一个最低警报定义,而动作是可选的。
同时,Blueware提供警报问题的最优化管理,防止同样的问题发送多个警报,禁用所有的警报通知等功能。
警报升级:
升级是警报操作的一种类型,它是预定义警报发生时,通知的步骤。
升级可以通过定义一些列的步骤来执行你选择的任何时间。
当警报被标记为“修复”状态时,Blueware停止升级。
你可以在Blueware管理模块创建一个升级,并可以在警报定义页面为警报定义指定一个升级策略。
使用升级的优点:
防止重复警报:
当一个警报使用一个升级策略,Blueware能有效地禁用相关的警报定义(即防止因同一原因引起的警报)。
警报的定义直到升级结束才有效。
为警报配置一个升级策略,可以阻止重复的警报信息。
自动化管理问题进程:
一个升级策略可以自动的监控和管理问题的进程。
可以注意到长期未解决的进程。
减少管理警报的响应规则:
例如:
警报发生时如果需要增加修改BLUEWARE通知的用户时,只需要对升级策略进行升级即可。
不需要再重新定义一个警报。
升级可自动被确认:
一个升级有一个“确认”状态,使得警报的响应更加灵活。
并可以考虑到是否有人注意到引起警报的问题。
你能指定一个警报是否确认或一段时间后自动处于确认状态。
警报中心:
显示了BLUEWARE中所有的警报及警报定义。
用户能看到单一资源、资源类型、组的警报和警报定义。
该页面每三分钟自动刷新一次,同时用户也可手动刷新。
4.2.2事件中心
在事件中心记录了被管理的资源所产生的日志事件的实时和历史的详细信息。
事件中心按照事先的规划,详细将被管理组员的每一步操作都记录下来,并保存在Blueware服务器自带的数据库中。
事件中心保存着目标资源所以的操作记录,可以根据情况被查询。
保存的事件日志可以帮助分析、判断问题的,为解决问题提供重要数据支持。
根据事件中心的记录,可以跟踪主机或应用的配置,帮助分析影响和控制变化。
在环境中的任何地方,可以定义警报用来跟踪详细的日志消息
、
4.3IT资产管理及统一接口平台
Blueware通过自动探测技术,自动发现目标端内的可监控资源,然后将资产列表传递到服务器端。
Blueware管理面板将会将各类资源列表显示出来并通过定制的界面实现IT资产的清晰展现。
通过Blueware的管理平台实现启动,停止,脚本动作等反向控制功能。
用户可以执行这些管理操作从单个统一位置——BLUEWAREPortal——避免需要登录到每台机器或使用多个入口。
管理操作仅对服务器和服务是可用。
可用的管理操作依赖于资源类型。
通常是服务器支持启动,停止,和重新启动;服务支持启动,停止,和重新加载。
4.4配置变更管理
BluewareAPMv2.0可以监控系统的,软件应用的配置文件。
对于客户的生产应用系统来说,各应用软件的配置是当前系统应用的最佳配置。
任何对配置文件的改变,都有可能造成系统应用效率降低甚至可能造成系统宕机。
BluewareAPMv2.0对于系统、数据库、中间件、或是客户指定应用的配置文件进行监控,对配置文件的变更进行全程监测,把对配置文件的操作都记录到数据库中。
当应为配置文件变更造成对整体系统产生影响时,可以根据追朔配置文件的变化过程找到问题产生的原因。
也可以根据记录将配置文件的改回最佳状态。
4.5日志文件跟踪
Blueware可以跟踪系统和应用软件所记录的日志。
可以根据提前定义的关键字跟踪所记录的日志。
将日志中所有符合提前定义条件的日志提取出来。
这样的日志跟踪可以帮助管理员了解系统和应用软件的操作过程,并可以根据经验设置警报或是跟踪错误。
●报告由被管理的资源所产生的日志事件的实时和历史的详细信息
●在环境中的任何地方,可以定义警报用来跟踪详细的日志消息
例如:
你可以通过监听server.log或“BLUEWAREHealth”页面来监控BLUEWARE内部缓存。
日志信息类似于下面内容
CacheSizeHitsMisses
==================
Agent.findByAgentToken1671
AlertDefinition.getNumActiveDefs000
Application.findByServiceId_orderName4910491
AuthzSubject.findByAuth000
AuthzSubject.findByName11461
AvailabilityCache51715311551
AvailabilityDownAlertDefinitionCache000
4.6用户级别实现IT资源权限管理
BluewareAPMv2.0可以设置多个用户,为每个用户分配不同的权限。
管理员可以为每个用户配置资源,设定目标,为每个用户指定策略和当前面板。
使得每个用户登陆进来以后总是会看到自己所最需要的资源管理面板。
不同的用户管理不同的IT资源,符合企业职能管理需求。
4.7按照业务的拓扑展现
数据图表化:
Blueware可以按照设定,把所监控的数据设置成图表的格式显示出来。
使管理者更加清晰的看到数据的变化,以及变化趋势等。
总体拓扑图:
根据监控目标,由管理员按照逻辑关系可以设置出系统的总体拓扑图。
将整体系统逻辑性的呈现在管理员面前,使得人们对系统的了解更加容易,并且更直观和透彻。
实时拓扑图:
可以将某些需监测的资源实时的展示在面板的最前面。
按照设置的时间间隔刷新监控结果。
这样对于重点监测目标能更直观看到其当前状态。
而且是实时显示,只要监测数据发生变化,就可以通过面板显示出来。
而且这种显示可以是将很多台服务器定义成一个组,让这个组中服务器按照顺序自动循环显示。
4.8智能机房
可以监测当前的机房环境。
包括温度、湿度、电源使用情况等。
Blueware可以收集机房中环境监控的各类设备的数据。
按照警报设定原则,设定环境警报水线等。
一旦达到警报条件,即按照报警设置发送警报,或是进行自动调整。
例如:
可以监测APCUPS当电池存量低于预设的水线时,就会发邮件来通知管理员。
5.产品实施运维方式说明
产品方案的实施方式,以及实施运营需要注意问题的说明。
5.1产品交付物
1.BluewareServer2.0软硬一体机
2.软件授权书
5.2标准服务
1.软件产品初装及实施交付。
2.7*24全年10人天现场服务。
3.软件产品升级及补丁修复服务。
4.软件咨询服务。