ESM企业IT系统集中管理平台.docx
《ESM企业IT系统集中管理平台.docx》由会员分享,可在线阅读,更多相关《ESM企业IT系统集中管理平台.docx(17页珍藏版)》请在冰豆网上搜索。
ESM企业IT系统集中管理平台
万联企业IT系统集中管理服务平台
EnterpriseSystemManage
万联ESM(EnterpriseSystemManage)系统突破传统IT网管概念,高效集成了传统的网络管理、系统管理、软件应用管理、职能和业务监控。
这里的集成不是传统意义的多个模块的后期组合,而是将网络、主机系统、应用等,统一作为系统管理对象。
ESM统一提供覆盖各种网络设备、主机服务器、数据库、中间件、通用软件、专有设备及专有业务系统的各种监测器。
监测器的种类和覆盖范围还在不断增长和升级。
用户可以为每一个网元同时创建上述各个层面的多个监测器和采集器,并能够在不同的监控之间、从不同管理角度建立任意的相关性和依赖关系。
这一点在传统IT管理方案中是不可想象的。
ESM通过引入SLA规则和业务视图定义,将不同类型的监测器和采集器获得的管理数据进行多角度多层面的综合分析,汇总出企业关心的整体运行状况;众多单体监测器监控到的各种微观管理信息将被汇总,映射为对服务和业务造成的影响和损失;主动制定各种监控和管理的规则和指标,并最终落实到不同的监测器和采集器规则上。
ESM为用户提供了连接关键IT部件和业务目标的动态方法,是面向业务的解决方案,能使您全面了解和预测自己的IT环境;了解IT技术如何影响业务;业务如何影响IT基础架构;帮助客户围绕SLA建立工作标准和优化效率。
1、产品定位和特点
●ESM是定位于“IT架构集成管理”的“运行维护管理”的管理产品,注重分析运维的特点,注重分析使用者的特点,是一套“事前”管理系统,基于网络平台,面向应用。
●如同所有的网络管理产品,设备本身的管理是ESM的重要组成部分,但ESM除关注设备本身状况外,更关注的是流经设备的数据流,关注的是应用对设备造成的压力,关注的是网络应用的压力分布、变化情况,ESM将设备视为网络这张大“蛛网”上的诸多Agent,通过这些关键节点上的Agent在为整个应用系统“诊脉”。
●在设备数据的表现上ESM有所取舍,关心用户为什么要看,想看些什么,根据运行维护的需要进行数据裁减,加工,注重主动告诉用户些什么,而非被动地等待用户刚好查到某数据。
●ESM网络节点拓扑结构图集中体现了运行维护管理特色。
2、系统特点
全面深广、无所不能的监测
ESM监控手段主要基于SNMP协议,同时提供SSH、Agent、SQL、JMX、SNMPTrap及Syslog等多种监控方式。
强大的拓扑展示
提供自动和手动拓扑两种方式,可根据用户的真实网络环境生成个性化拓扑图,能展现网络中各个资源的运行状态和流量分布状况,一旦发生故障,物理拓扑上便能即时产生告警提示,使您迅速查看问题所在。
独具特色的业务视图
ESM为用户提供了连接关键IT部件和业务目标的动态方法,根据业务划分的角度进行IT资源管理的视图,即以业务为主线,实现面向业务的监测和管理。
智能高效的事件处理
告警控制台提供映射规则、过滤规则、事件相关性规则、合并压缩规则,一旦发生告警事件,及时通知管理员,快速定位故障源。
丰富灵活的性能报告统计
能根据用户需求生成各种报表和图形化的性能统计和分析报告,帮助IT部门分析网络的运行趋势,找到隐藏的性能瓶颈。
高度的可扩展性,完全满足用户需求
面向对象的监测模式,插件式的监测器,灵活的定制化开发,更好更方便的满足用户个性化需求。
标准的第三方集成接口
符合行业标准协议,支持标准XML数据接口、SNMPTrap接口、数据库接口、标准API等,非常方便的能与第三方管理工具无缝集成。
独创的软硬一体化
国内首创的软硬一体化网管设备,无需安装任何软件,即插即用,快速完成实施部署,无须专业培训,维护升级简便易行。
软硬一体化架构,方便部署
3、ESM的部署步骤
4、ESM监测范围
5、ESM操作流程
6、ESM体系架构
7、软件展示
独特的业务管理视图
简单直观的展现方式
主机详细的节点信息
主机监控(AGENT)
交换机(Cisco)监测情况
Oracle数据库监测情况
丰富的数据性能报表
8、特点分析
竞争分析-费用
9、ESM系统基础平台监控参数
CPU监测器
监测服务器CPU
IO状态监测器
监测服务器IO状态
NT服务监测器
监测NTService
WinRegistry监测器
监测WindowsRegistry
Windows窗口监测器
监测Windows窗口是否存在
磁盘空间监测器
监测服务器磁盘空间
内存使用监测器
监测服务器内存使用
平均负载监测器
监测服务器平均负载
日志文件监测器
监测服务器日志文件
文件监测器
监测服务器文件
文件目录监测器
监测服务器文件目录
系统进程监测器
监测服务器系统进程
虚拟内存监测器
监测服务器虚拟内存
Swapspace监测器
监测服务器交换空间
远程PING监测器
监测服务器远程PING
脚本监测监测器
监测服务器脚本监测
可选的监测器
可选功能模块
ESM-NETFLOW
NetFlow流量信息采集和分析
NetFlow流量信息采集和分析
ESM-SMS
短信告警模块
短信告警发送
可选监测器(数据库)
MON-ORACLE
ORACLE监测器
MON-DB2
DB2监测器
MON-MSSQL
MS-SQL监测器
MON-SYBASE
SYBASE监测器
MON-INFORMIX
INFORMIX监测器
MON-MYSQL
MYSQL监测器
可选监测器(应用)
MON-WEBSPHERE
WEBSPHERE服务监测器
监测WEBSPHERE服务的性能参数和事件
MON-WEBLOGIC
WEBLOGIC服务监测器
监测WEBLOGIC服务的性能参数和事件
MON-IBM-CICS
CICS服务监测器
监测IBMCICS服务的性能参数和事件
MON-TUXEDO
TUXEDO服务监测器
监测TUXEDO服务的性能参数和事件
MON-MT
MT服务监测器
监测MT服务的性能参数和事件
MON-MQ
MQ服务监测器
监测MQ服务的性能参数和事件
MON-LOTUS-NOTES
LOTUSNOTES服务监测器
监测LOTUSNOTES服务的性能参数和事件
MON-MSEXCHANGE
MSEXCHANGE监测器
监测MS-EXCHANGE的性能参数和事件
MON-LDAP
LDAP监测器
监测LDAP可用性和响应时间
MON-MS-IIS
MS-IIS监测器
监测MS-IIS的性能参数和事件
MON-TOMCAT
TOMCAT监测器
监测TOMCAT的性能参数和事件
MON-APACHE
APACHE监测器
监测APACHE服务可用性和性能参数
MON-IBM-HACMP
HACMP服务监测器
监测IBMHACMP服务的性能参数和事件
MON-IBM-GMD
GMD服务监测器
监测IBMGMD服务的性能参数和事件
MON-JBOSS
JBOSS服务监测器
监测JBOSS服务的性能参数和事件
MON-RESIN
RESIN服务监测器
监测RESIN服务的性能参数和事件
10、设备监测指标:
1).主机系统
监控范围:
Windows(2K\XP\2003\Vista)
LINUX(RedHat\SUSE\红旗\UbuntuLinux\FreeBSD\Turbo)
UNIX(Solaris8、9、10)\AIX(4.X、5.1、5.2、5.3)\HP-UX(11i)
AS400
监控方式:
SNMP\AGENT
监控说明:
SNMP方式监控,被管机器上仅需要启动SNMP服务,采集的指标为一些通用指标,AGENT方式监控,需要在被管机器上安装AGENT程序,采集的指标丰富,而且可以根据具体需要进行定制,AGENT监测方式支持对主机的简要操作。
注:
AGENT程序是经过严格测试,对目标机器的资源占用很少,也可限定对内存的占用大小,不会影响目标机器的正常运行。
ESM系统支持对物理磁盘监测(主机磁盘做了冗余后,往往单个物理磁盘故障后,不影响系统运行,如不及时更换,再有磁盘损坏将会导致数据丢失甚至系统宕机。
通过ESM物理磁盘监测功能可实时了解物理磁盘运行状态,当有异常发生时实时消息通知,及时处理避免不必要损失。
指标分析:
UNIX\LINUX
监控项
指标名
描述
报警范围
CPU
CPUCpuUtil
显示的是CPU使用率
一般报警:
90%~95%
严重报警:
95%~100%
CPULoad
在采样间隔内,内核中运行队列中排队的进程的平均值
需要了解系统的实际情况后而定
CPUUserTime
用户模式下的命令使用的CPU的时间
需要了解系统的实际情况后而定
CPUSysTime
系统模式下的系统命令使用的CPU的时间
一般报警:
90%~95%
严重报警:
95%~100%
文件系统
FSCapacity
反映了文件系统使用空间的百分比
一般报警:
96%---98%
严重报警:
98%~100%
FSMountState
文件系统挂载状态
一般告警:
1(unmounted)
严重告警:
2(unknown)
内存
MEMFreeMem
反映了操作系统中空闲的内存
一般报警:
100---200K
严重报警:
0---100K
MEMRCache
缓冲区逻辑读的百分比
一般报警:
1-10%
严重报警:
10-20%
进程
PROCTopProcs
显示最占用系统资源的前10个进程
文本输出
PROCExec
每秒钟系统调用次数
图形显示
交换区
SWPTotSwapUsedPercent
反映的是系统中所有的交换区的使用的空间的数量
一般报警:
90%~95%
严重报警:
95%~100%
用户
USRNoUser
在系统登陆的用户数
图形显示
UsrNoSession
用户session数量
图形显示
WINDOWS
监控项
指标名
描述
报警范围
磁盘
LogicalDiskSpace
显示逻辑硬盘剩余空间的百分比
一般报警:
5%~10%
严重报警:
0~5%
CPU
CPU
在采样间隔内,系统使用CPU的时间
一般报警:
90%~95%
严重报警:
95%~100%
内存
MemoryAvailable
显示内存的可用空间
一般报警:
4MB~10M
严重报警:
<4MB
MemoryPageFaults
显示每分钟MemoryPageFaults的次数
一般报警:
10~20
严重报警:
<10PageFile
PageFile
PageFile
Page文件使用的百分比
一般报警:
80%~90%
严重报警:
90%~100%
进程
ProcTopProcs
消耗资源最大的Top10的进程
文本显示
安全
SECsvrErrorsLogon
检查从系统启动开始的所有失败的登陆次数
图形显示
SECsvrErrorsLogonDelta
上一轮询周期内的登陆失败次数
图形显示
服务
ServiceStatus
监控自动启动的服务启动情况
严重报警:
notrunning
2).网络设备
监控范围:
交换机\路由器\防火墙\(思科、北电、华为、锐捷、JUNIPER、港湾)
监控方式:
SNMP\SNMPtrap
监控说明:
SNMP方式监控为ESM系统定期主动轮训方式,SNMPtrap是被管设备主动发送消息到ESM系统,在赋予SNMP读写权限后,可以对设备进行简单操作,如端口的关闭。
指标分析:
监控项
指标名
描述
报警范围
CPU
CPUCpuUtil
显示的是CPU使用率
一般报警:
50%~80%
严重报警:
80%~100%
内存
MemoryAvailable
显示内存的可用空间
一般报警:
4MB~10M
严重报警:
<4MB
端口
端口流出速率
端口流入速率
端口流出带宽利用率
一般告警:
80%~90%
严重告警:
90%~100%
端口流出量
端口流入带宽利用率
一般告警:
80%~90%
严重告警:
90%~100%
端口流入量
端口丢包数
端口丢包率
一般告警:
1%~5%
一般告警:
5%~10%
端口误码数
端口误码率
一般告警:
1%~5%
一般告警:
5%~100%
等等