BroadviewBCCV60R2产品白皮书.docx
《BroadviewBCCV60R2产品白皮书.docx》由会员分享,可在线阅读,更多相关《BroadviewBCCV60R2产品白皮书.docx(36页珍藏版)》请在冰豆网上搜索。
BroadviewBCCV60R2产品白皮书
BroadviewBCCV6.0R2
业务监控中心-产品白皮书
2013.1
北京广通信达科技有限公司
声明
本资料著作权属北京广通信达科技有限公司所有。
未经本公司书面许可,任何单位或个人不得以任何方式摘录、复制或翻译,并不得以任何形式传播。
、
是北京广通信达科技有限公司的注册商标。
在本手册中出现的其他公司的商标、产品标识及商品名称,由各自权利人拥有。
本手册仅作为使用指导,本手册中的所有陈述、信息和建议不构成任何明示或暗示的担保。
技术支持
热线电话:
400-810-6677
邮箱:
******************
公司网址:
前言
北京广通信达科技有限公司自主研发的业务监控系统(BroadviewBCC)定位于对网络中的应用服务、网络设备、安全设备以及基础支撑系统的运行状况的监测、性能的管理以及故障的监控。
它通过持续对各项资源运行状况的监控,建立性能基线,发现系统中的异常并且及时告警;有效提高了各类资源运行维护的工作效率和服务质量,保障企业的综合信息平台健康有序运行。
《BroadviewBCCV6.0R2产品白皮书》主要针对BCC的产品架构、产品功能与产品特点进行介绍,是公司对外宣传与技术人员了解BroadviewBCCV6.0R2产品的最佳技术参考资料。
内容说明
《BroadviewBCCV6.0R2技术白皮书》全书共分为6章。
章节
概要
第1章市场背景
产品推出的市场背景说明。
第2章产品介绍
产品总体介绍。
第3章产品架构
产品的系统、技术、部署架构说明。
第4章产品功能
产品的主要功能、技术优势总结。
第5章产品特点
产品主要特点
第6章运行环境与要求
产品的运行要求
本书约定
介绍符号的约定、键盘操作约定、鼠标操作约定。
符号约定
带尖括号“<>”表示键名、按钮及操作员从终端输入的信息;带方括号“[]”表示人机界面、菜单项、数据表和字段名等,多级菜单用“→”隔开。
如[开始→程序→Word2003]表示[开始]菜单栏下的[程序]子菜单下的[Word2003]菜单项。
键盘操作约定
格式
意义
加尖括号的字符
表示键名、按钮名。
如<Enter>、<Tab>、<a>等分别表示回车、制表、小写字母a。
<键1+键2>
表示在键盘上同时按下几个键。
如<Ctrl+Alt+A>表示同时按下<Ctrl>、<Alt>、<A>这三个键。
<键1,键2>
表示先按第一键,释放,再按第二键。
如<Alt,F>表示先按<Alt>键,释放后,紧接着再按<F>键。
鼠标操作约定
格式
意义
单击
快速按下并释放鼠标左键。
双击
连续两次快速按下并释放鼠标左键。
右击
快速按下并释放鼠标右键。
拖动
按住鼠标左键不放,移动鼠标。
1.市场背景
企业IT系统越来越多,网络、设备和产品越来越复杂,企业的各项经营活动越来越依赖于稳定可靠的业务应用系统的支撑。
面对着复杂多样的IT网络和业务支撑系统,信息部门面临着诸多挑战:
Ø如何最大程度的提前发现和改善IT系统中的不稳定因素?
Ø如何满足信息部门复杂的IT资源不同层面的监控和管理需求?
Ø如何从业务角度提高质量,保证业务使用部门的满足度?
Ø如何实现IT资产和运行情况的统一管理分析,为IT系统建设提供量化的决策依据?
Ø......
作为北京广通信达Broadview产品系列中的业务管理产品,BroadviewBCC应运而生。
2.产品介绍
广通信达凭借多年的相关软件开发和实施经验,结合国内管理实际情况,并在充分吸收国外先进网络管理理论的基础上,研制开发出了BroadviewIT运维管理平台。
部署该平台将帮助用户及时的发现IT系统运行中所存在的问题,做到异常事件早发现、早解决,既提高了信息系统的运行效率,又增强了企业的故障应急处理能力。
面对用户日益复杂的IT环境,BroadviewIT运维管理平台将以往对网络、服务器与业务应用、安全设备、客户端PC和机房基础环境等的分割管理进行了有效的整合,实现了全面监控与集中统一管理;并融入了基于ITIL理念的IT服务管理,实现了技术、功能、服务三方面的有机结合,从而提高了企业IT系统的运行管理水平和服务能力,为企业生产和日常办公提供高效、贴身的保障。
2.1.BroadviewV6.0系列产品
BroadviewV6.0系列产品由网络管理NCC、业务应用管理BCC、操作审计OCC及IT运维管理平台COSS几款产品组成。
系统架构如下图所示:
图1Broadview6.0系统架构
❒IT运维管理平台(COSS)
◆多层模块化、可持续拓展的IT运维平台,无缝集成底层NCC、BCC等监控工具;
◆实时运行监控展现,实现IT运行的可视化;
◆通过统一事件平台,智能驱动故障预警机制;
◆基于ITIL规范的运维流程化管理;
◆资产和配置管理库,帮助用户直观建立IT资源台帐和相互关系;
◆运维统计分析、量化考核、提供可持续的优化依据。
❒网络监控(NCC)
◆自动、准确、及时地发现各类异构复杂网络的拓扑结构;
◆可持续地监视、报告网络的运行情况;
◆提供网络运行状态和性能的多角度分析与统计;
◆拦截非法接入,保障网络系统安全;
◆监控异常流量及端到端的流量分析统计等。
❒业务监控(BCC)
◆深度监测业务应用及其支持平台的运行状况;
◆从应用可用性、系统资源占用和性能指标三个层面建立性能基线及故障预警机制;
◆提供应用总控视图、应用关联视图、部件详细视图的展现方式,实现从全局到局部的故障定位。
❒操作审计(OCC)
◆统一设备管理,集中操作网关;
◆用户认证授权管理、细颗粒度操作命令控制;
◆外部工具支持,不改变用户现有运维习惯;
◆精确、完整的操作过程回溯。
◆审计报表、日志管理。
2.2.什么是BroadviewBCC
BroadviewBCC作为Broadview产品系列中的业务管理产品,全称BusinessControlCenter(业务监控中心),是广通信达在多年系统管理和服务经验积累之上,推出的第三代业务系统监控解决方案,定位于对应用服务、安全设备、网管系统、基础支撑系统等一系列资源的不间断监控,是一套能够对网络基础平台和业务支撑系统进行统一监控的业务监控管理平台。
BroadviewBCC面向国内客户的业务环境和管理模式,加入了客户和市场迫切要求的重要特性,融合了国内外的监测技术发展趋势,可满足在复杂的IT环境下实施面向业务服务的监控需求。
系统为客户提供直观、全面、多角度的视图,动态预测业务应用的发展,对影响正常运转的事件快速响应,帮助信息部门建立主动化管理模式,实现对IT资源和运维资源的高效管理,提升业务服务质量,从而保障IT信息系统的可持续性发展。
图2BCC产品概念示意图
3.产品架构
3.1.产品系统架构
图3BroadviewBCC系统架构图
BroadviewBCC系统架构分为四层:
Ø数据采集层
数据采集层包含监测采集器、采集探针和监测数据接收几部分:
⏹监测采集器利用HTTP、SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX、CORBA等标准协议和各种业务系统专有协议实现远程监控和数据采集,同时也支持BroadviewUniAgent代理式监测采集被管资源的监测数据。
⏹监测采集器运行在采集探针(Probe)内,采集探针可以分布式部署,满足多个隔离子网和多级大规模IT环境监测的要求。
⏹监测数据接收模块接收各个采集探针上报的数据,并交由数据处理层统一处理。
Ø数据处理层
性能数据经过整理、归并与挖掘处理,为上层提供可靠参考;同时故障数据经过过滤、压缩、归并与关联分析之后,产生告警信息与事件记录。
Ø业务模块层
提供全面业务功能支撑,展现监测分析结果。
⏹监测配置:
各类监测任务配置,监测调度和阈值管理。
⏹资源管理:
面向资源监测与数据汇总。
⏹业务管理:
业务应用与业务影响模型建模。
⏹告警管理:
智能告警处理与展现。
⏹统计分析:
各类数据的统计和分析报表支撑。
Ø功能展现层
用户接入方式与WEB客户端功能展现。
3.2.产品关键技术
BroadviewBCC的产品关键技术有:
Ø基于J2EE平台,B/S展现模式,采用先进的业务框架,良好的互操作性和扩展性,轻松实现跨平台部署。
Ø默认数据库为Oracle10g。
Ø内嵌WEB应用服务器,简化配置、优化性能、加固安全。
Ø支持监测配置集中管理,分布式探针(Probe)监测采集部署,满足多个隔离子网和多级大规模IT环境的统一监测管理要求。
Ø主机监测提供远程无代理和UniAgent代理两种模式。
Ø强大的监测插件体系,确保监测功能和指标的可扩展性。
Ø遵循各类标准化协议与规范
⏹ICMP
⏹SNMP
⏹JMX
⏹Corba
⏹CLI(Telnet、SSH)
⏹WBEM/WMI
⏹HTTP、HTTPS
⏹LDAP
⏹DNS
⏹FTP/POP3/SMTP
⏹…
3.3.产品部署模式
图4BroadviewBCC产品部署示意图
BroadviewBCC产品支持分布式监测采集部署与集中配置管理模式,通过在服务端集中配置采集策略下发到采集探针(Probe)执行周期采集任务,完全可以满足在大规模网络环境下的对IT基础设施的监测要求。
客户端无需任何安装,直接通过浏览器查看各类IT资源的即时性能指标,方便快捷。
BCC系统采集探针(Probe)具有以下几大特性:
Ø探针自带监测数据存储功能:
在网络临时中断或服务端临时关闭的情况下,Probe端会临时存储监测数据(Probe关闭后也不会丢),待网络和服务端恢复后再向服务端传输数据,保证监测数据的完整性。
Ø探针支持自我管理和故障自恢复:
当采集探针由于某些原因无法正确运行时,探针会自动重启并迅速执行监测任务,保证监测数据的连续性。
Ø探针支持自动升级功能:
当探针有新版本发布时,只需要把探针升级程序发布到服务端固定的目录,探针会自行判断并升级到新版本,减少手工升级带来的成本和出错几率。
Ø探针提供自动注册功能:
采集探针在启动时会自动根据配置信息连接到服务端进行自动注册,增加了管理的方便性。
Ø探针支持多种常见平台部署:
采集探针可在Windows和常见类Unix操作系统下部署,并能以服务模式运行(默认提供Windows操作系统下的安装程序)。
4.产品功能
4.1.深度全面的资源监测
BroadviewBCC集网络安全设备、应用服务和基础支撑系统等监测管理于一体,支持SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX、CORBA等远程监控手段和BroadviewUniAgent代理监测,各类标准应用协议仿真,拥有了500多种监测器,提供对整个业务网络的7X24不间断监控。
Ø强大监测插件体系
无需二次开发,通过监测插件,不断增加监测器数量,扩展监测范围与内容。
众多监测器工作独立,互不影响,保证整个监测体系的稳定运行。
Ø灵活的监测时间调度机制和智能化的监测阈值模型
自定义监测时间与监测阈值,形成多样化、组合型监测策略,满足复杂环境下不同的监测任务要求。
Ø主机代理Agent监测和远程无代理监测两种监测模式
多方式、多手段的自由组合,兼顾业务网络各部分性能影响,适应不同监测条件。
4.1.1.网络安全设备管理
全面支持CISCO、华为、中兴、北电、Foundry、Extreme、Avaya、H3C、DLink等各种不同厂商、不同型号的网络与安全设备,提供各类设备的基本信息、CPU/MEM负载状况,设备可用状态、连续运行时间、响应延时、端口速率、ICMP连通性等设备属性与监测信息,亦可自定义SNMP监测内容。
图5.CISCO路由器监控详细视图
网络设备监测项包括:
Ø设备CPU利用率:
监测网络设备的CPU使用率。
Ø设备内存利用率:
监测网络设备的内存使用量、内存使用率。
Ø端口速率监测:
监测网络设备中指定端口的入速率、出速率、入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速。
Ø端口上下线监测:
监测网络设备指定的端口的上下线状态。
Ø自定义SNMP监测:
可监测多个SNMP表达式(支持四则运算、时间差值运算等)对应的采集结果。
ØICMP连通性监测:
监测与网络设备的连通性。
Ø……
4.1.2.服务器系统管理
管理和监测Windows、Linux、IBMAIX、AS/400、HP-UX、SUNSolaris、SCOUnix、SGI、Tru64等不同操作系统的服务器或集群的运行状态和性能数据,包括服务器的基本信息、CPU负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错误日志等信息的分析与监视。
帮助用户及早发现服务器系统的性能瓶颈与故障隐患。
图6.Solaris监控详细视图
服务器监测项包括:
Ø主机基本信息采集:
主机的基本信息,包括:
CPU数目、机器型号、系统名称、系统版本、IP地址、内存大小、总线程数目、磁盘名称等。
Ø主机CPU使用率:
监测主机系统的CPU使用率。
Ø主机内存使用率:
监测主机系统的内存使用量、内存使用率。
Ø主机磁盘使用率:
监测主机系统的指定磁盘使用率。
Ø主机磁盘IO监测:
监测主机系统的磁盘TPS数、磁盘写操作速率等、每秒完成IO读写次数、每秒读写扇区数、每秒读K字节数、平均I/O队列长度等。
Ø应用进程监测:
监测主机系统中指定应用进程的内存使用量、内存使用率、CPU使用率。
Ø系统服务监测:
监测主机系统中指定服务的运行状态
Ø主机当前登陆用户信息:
当前登录用户登陆的时间、终端IP、终端名称
Ø主机端口速率监测:
监测主机系统中指定端口的入速率、出速率、入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速等。
Ø主机重要文件监测:
监测主机系统中指定的文件大小。
ØJob基本信息采集(AS/400):
监测Job的名称、CPU使用率、类型、状态、所属用户等。
ØICMP连通性监测:
监测与主机的连通性。
ØHACMP集群状态监测:
监测集群的可用状态及子节点的状态。
Ø自定义指标监测:
系统提供了通用监测器,用户可以通过编写shell或者groovy脚本自定义监测指标
Ø……
4.1.3.数据库及中间件管理
根据预定义的监测项目对Oracle、SQLServer、Sybase、DB2、Informix、MySQL等多种数据库,按照属性相关性分为数据库工作状态、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性监测组,分组监测数据库系统的性能、事务、连接等性能数据。
图7.Oracle监控详细视图
ØDB2数据库监测
⏹基础监测:
最后一次备份时间、数据库状态、数据库激活时间、当前连接数、连接总次数
⏹缓冲池信息监测:
各缓冲读写次数、命中率
⏹锁监测:
死锁数、锁等待率、锁升级率
⏹锁表信息:
锁状态、锁模式、表空间、Schema
⏹排序信息监测:
应用排序数、排序溢出百分比
⏹表空间监测:
已使用页、表空间类型、页长、总页数、表空间状态、空闲率、空闲页、使用率、预取大小、扩展数据块大小
⏹表空间容器监测:
使用率、总页数、已使用页、容器类型、表空间名称
ØOracle数据库监测
⏹基础监测:
表空间使用率、连接会话数
⏹高级队列监测:
ready消息数、错误的消息数、消息平均访问时间、消息总数
⏹归档目的地监测:
归档目的地类型、归档目的地状态、归档目的地可用空间、归档目的地可用空间百分比、归档目的地位置
⏹基本信息采集:
使用spfile启动、只读模式、归档路径、例程开始时间、限制模式、归档模式、例程名、并行状态、位长、DB版本、DB名称、主机名、实例状态
⏹检查点监测:
发生检查点数、完成检查点数
⏹数据文件监测:
文件大小、读次数、写次数、读时间、写文件块数、读文件块数、读写文件块数、写时间
⏹全表扫描配置:
RSRATIO值、LTSCANRATIO值
⏹资源锁定监测:
锁定时长
⏹碎片监测:
FSFI值
⏹PGA配置:
PGA内存及各区域大小、实例处理性能等
⏹进程资源消耗监测:
可用PGA百分比、可用PGA、已分配PGA、已使用PGA
⏹命中率监测:
共享区字典缓存区命中率、多次解析(重装)的条目比率、高速缓存区命中率、共享区库缓存区命中率、磁盘排序与内存排序比率、回退段等待次数与获取次数比率
⏹递归调用信息监测:
递归调用百分比、时间间隔的递归调用百分比、用户调用数、递归调用数、递归-用户调用比率、递归调用速率
⏹Redo日志配置:
重做条目的平台大小、多种请求成功/失败比率、错误次数等
⏹回滚段:
大小、命中率、等待率、等待次数、活动事务数、翻转次数、扩展次数、一致更改率、收缩次数、用户回滚率
⏹会话监测:
会话ID、用户名、CPU时间、排序次数、缓冲区命中率、读次数、写次数、提交次数、占用游标数、扫描次数
⏹SGA配置:
共享库缓存大小、SQL缓存大小、数据字典缓存大小、共享池大小、重做日志缓冲区大小、高速缓冲区大小
⏹SQL监测:
使用内存、执行时间、SQL语句、用户
⏹转存空间监测:
转储空间使用率
⏹表空间监测:
未使用Extent数量读时间、最大Extent数量、已使用率、已使用量、未使用量、未使用百分率、允许最大空间、是否自动扩展、写时间、Segment管理方式、表空间类型、当前Extent数量、下一个Extent大小
⏹表状态监测:
增长速度、索引大小、数据大小、表空间、用户
⏹撤销空间监测状态监测:
快照太旧错误计数、无空间计数
⏹作业队列监测:
破损作业数量、过期作业数量、失败作业数量
ØMySQL数据库监测
⏹基础监测:
缓存查询数、连接数
⏹数据库大小监测:
数据库大小
ØSQLServe
⏹基础监测:
连接会话数、CPU使用率、数据文件大小、日志文件大小
⏹基本信息:
阻塞进程数、处理器名称、Windows版本、处理器数目、主机名、内存(MB)、数据库数目、会话数目、启动时间、数据库版本
⏹数据库大小:
数据大小、数据库大小、未分配大小、未使用大小、索引大小、保留大小
⏹文件监测:
路径、增长方式、容量、文件组、数据库、大小
⏹会话监测:
最后处理时间、命令、数据库、CPU时间(ms)、内存(KB)、程序、建立时间、用户、状态、主机
ØInformix数据库监测
⏹基础监测:
回滚数、死锁数、写缓存命中率、读缓存命中率、数据库连接数
⏹检查点监测:
检查点速率、检查点等待速率
⏹DbSpace监测:
数据空间使用率
⏹磁盘读写监测:
页写速率、页读速率、物理磁盘写速率、物理磁盘读速率
⏹锁监测:
锁请求速率、锁超时率、锁等待率、死锁率
⏹日志读写监测:
物理日志页面写速率、物理日志写速率、逻辑日志页面写速率、逻辑日志写速率、逻辑日志记录写速率
⏹共享内存监测:
块写速率、缓冲区写命中率、缓冲刷新到磁盘速率、Foreground写速、缓冲区等待速率、LRU写速率、顺序扫描速率、Latch等待速率、缓冲区读命中率
⏹排序监测:
内存排序速率、磁盘排序速率
⏹事务监测:
事务提交速率、事务回滚速率
ØSybase数据库监测
⏹基本信息采集:
DBMS名称、DBMS版本、系统信息、产品版本、主版本号、产品名称、次版本号
⏹数据库监测:
使用百分比、已使用大小、数据大小、空间大小、索引大小、未使用段大小、数据段大小、段总大小、索引段大小
⏹会话监测:
数据库、命令、已用内存、CPU时间、IO读写次数、程序、主机、用户、状态
⏹事务监测:
系统事务交易总数、每秒回滚事务数、每秒事务数
⏹数据库:
CPU使用率、数据库空闲表空间、数据库表空间、连接会话数
⏹数据段监测:
索引段大小、段总大小、数据段大小、未使用段大小
产品还支持对Websphere、WebLogic、MQSeries、Tomcat、Tuxedo、Tibco、Resin、TongWeb等各类不同中间件,提供包括配置信息、连接池、线程队列、负载监测、通道情况监测等多类监测组,分析与监测中间件的各项运行状态参数。
图8.WebLogic监控详细视图
中间件监测项包括:
Ø系统信息采集:
监测中间件基本信息,包括:
操作系统、操作系统版本、当前可用堆栈及大小、当前目录、重启次数、开启线程数。
ØJVM使用监测:
监测JVM的堆栈大小和使用率。
ØJDBC链接池监测:
监测指定JDBC连接池资源连接情况。
ØJTA事务监测:
监测中间件中数据处理事务的活动情况。
Ø线程池监测:
监测指定线程类的线程平均数、空闲线程平均数以及线程吞吐量。
ØServlet监测:
监测指定Servlet执行和调用情况。
ØEJB监测:
监测指定EJB激活次数、钝化次数、缓存个数、事务提交次数、事务回滚次数、事务超时次数、访问次数。
ØWEB应用监测:
监测指定Web应用中Session的当前个数、最大值以及累积个数。
ØJMS队列深度监测:
监测中间件中JMS消息队列活动情况。
ØMQ通道情况监测:
监测MQ的通道情况,包括:
每秒接收字节、每秒发送字节、通道状态、发送间隔、事务数。
ØMQ队列深度监测:
监测MQ服务的消息队列的队列深度。
ØTuxedo负荷监测:
监测Tuxedo的机器状态是否被激活、每秒处理的队列服务数每秒入队的队列服务数、当前客户端数、当前WorkStation客户端数。
ØTongWeb数据连接池监控:
监测国产中间件Tongweb数据库连接信息,如最大、最小连接数,可用、创建、关闭、等待连接数等
ØTongWeb应用性能监控:
主要监测系统线程情况、请求队列情况、吞吐量、发送接收字节数等信息;
Ø……
4.1.4.基础应用平台及通用服务管理
提供对IIS、Apache、Domino等基础应用平台的基础信息、连接测试、基本负载等重要信息的监测。
有效实时地分析HTTP/HTTPS、DNS、FTP、DHCP、LDAP等常见通用服务的运行状态和参数,深入分析服务响应速度变化的技术原因和规律,从根本上解决服务响应性能的问题。
图9.Web应用详细监控视图
ØDomino服务器监测
⏹性能负载监测:
版本、剩余率、文件路径、服务器CPU类型、服务器CPU个数、MAIL路由速率、MAIL传递速率、死信率、空闲空间、总的处理数、每分钟交易数、失败复制次数、成功复制次数、删除文档总数、修改文档总数、增加文档总数、交易总数、每分钟最大交易数、当前用户数、当前任务数、最大用户数、NSF最大值、路由邮件数、死邮件数、待路由邮件数、缓冲池最大值、缓冲池使用值、扩展管理池使用值、NSF使用值、扩展管理池最大值、待投递邮件数、已投递邮件数、平均邮件大小、缓冲池大小、最大邮件大小
⏹常用性能和告警事件监测:
Domino邮件服务所有代发送邮件数目、指定的数据库的使用空间占用率、Domino邮件服务所有僵死邮件数目、服务器内存使用数、指定的数据库的使用空间占用率、Domino邮件服务所有代发送邮件数目、服务器内存使用数、Domino邮件服务所有僵死邮件数目
ØApache负载监测:
监测服务器是否连接,采集CPU负载、正常运行时间、响应时间、累计访问数、累计访问数据处理、每秒请求数、每秒处理字节数、每请求处理字节、忙作业数、空闲作业数等指标。
ØIIS