NMS开源软件选型研究评估报告.docx
《NMS开源软件选型研究评估报告.docx》由会员分享,可在线阅读,更多相关《NMS开源软件选型研究评估报告.docx(19页珍藏版)》请在冰豆网上搜索。
NMS开源软件选型研究评估报告
NMS开源软件选型分析评估报告
1标准和目标
1.1前言
目前开源的网管软件众多,时间关系只能通过网络上的资料介绍和其他用户的体验进行评估。
对于重点调查的开源软件通过运行环境搭建、开发环境搭建的方法进行实践。
如果只是对通用网络设备的管理,被调研的软件只要经过适当的配置就可以满足要求。
对于我们的需求,这些软件不能满足我们100%的需求,必须进行二次开发,对软件二次研发的接口的调研就成为我们考察软件的一个重要的组成部分。
部门对网管软件的定位应该不会投入过多的资金,商用软件价格高昂应该不在考虑范围之内,也尽量不选用开源软件商用版本,重点放在纯开源软件上。
选择了一种开源软件也就选择了一种架构,所以架构的选择也要适合我们部门的开发能力。
1.2目标
选择一款适合的开源软件,在此基础上进行整合和二次开发,构建部门设备网管平台。
1.3标准
选型标准:
✧License
不仅仅是免费,无license限制是首选;
✧市场占有率
广泛的市场占有率,说明软件得到过足够多的验证;针对于成功的开源软件,可以找到一些第三方的扩展资源,我们只要遵循拿来主义就好;
✧功能
一些功能可以直接拿来使用,或者简单的改造,可以节约成本;
✧完备的扩展开发接口
被选择的开源软件是否已经提供完备的二次开发接口,满足二次开发的要求;
✧开发技术
选择开源软件的另外一个层面考虑是尽量考虑使用部门成员最熟悉的开发技术,尽量避免涉及相对部门来说的新技术、开发语言,这样可以进一步研发降低成本;
✧开源架构
就我们目前的需求,开源网管软件的功能,我们能用到的部分并不多。
选择了开源其实主要就是选择它的架构。
架构的开放性,易扩展性将直接决定我们的研发成本。
2评估
开源网管软件的市场占有情况
上图是网络监控软件的占有率。
其中以Nagios和Opennms占有率最高。
2.1筛选
2.1.1候选软件
✧Nagios
✧Opennms
✧Cacti
✧Zenoss
✧Zabbix
✧SugarNMS
2.1.2License评估
开源软件
License
使用限制
Nagios
GPL
GPL( GNUGeneralPublicLicense)
Opennms
Free
Free,也可以购买相应服务
Cacti
GPL
GPL
Zenoss
GPL
GPL2
Zenoss提供开源版和企业版两种版本
Zabbix
GPL
GPL2
SugarNMS
免费版、标准版、企业版
免费开源和商业开源两个版本
不是sourceforge下的产品
2.1.3软件功能评估
TheNRPEaddonisdesignedtoallowyoutoexecuteNagiospluginsonremoteLinux/Unixmachines
开源软件
功能
Nagios
网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)
主机资源监控(CPUload、diskusage、systemlogs),也包括Windows主机(使用NSClient++plugin)
可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……)
可以通过配置Nagios远程执行插件远程执行脚本
远程监控支持SSH或SSL加通道方式进行监控
简单的plugin设计允许用户很容易的开发自己需要的检查服务,支持很多开发语言(shellscripts、C++、Perl、ruby、Python、PHP、C#等)
包含很多图形化数据Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)
可并行服务检查
能够定义网络主机的层次,允许逐级检查,就是从父主机开始向下检查
当服务或主机出现问题时发出通告,可通过email,pager,sms或任意用户自定义的plugin进行通知
能够自定义事件处理机制重新激活出问题的服务或主机
自动日志循环
支持冗余监控
包括Web界面可以查看当前网络状态,通知,问题历史,日志文件等
-可以通过手机查看系统监控信息
Opennms
网络节点自动发现
图形用户管理界面
故障监控
故障事件管理
操作系统监控
网络节点配置信息管理
全面的节点监控
Zenoss
ZenossCore是开源企业级IT管理软件-是智能监控软件,他允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。
ZenossCore同时也是开源的网络与系统管理软件。
ZenossCore的强大能力来自于深入的列表与配置管理数据库,以发现和管理公司IT环境的各类资产(包括服务器、网络、和其他结构设备)。
Zenoss可以创建关键资产清单和对应的组件级别(接口、服务、进程,已安装的软件等)。
建立好模型后,就可以监控与报告IT架构中各种资源的状态和性能容限了。
Zenoss同时提供与CMDB关联的事件和错误管理系统,以协助提高各类事件和提醒的管理效率。
以此提高IT管理人员的效率。
Zabbix
-CPU负荷
-内存使用
-磁盘使用
-网络状况
-端口监视
-日志监视
SugarNMS
1.安全功能
支持多用户访问系统,每个用户可以管理不同的设备。
系统记录用户操作日志和设备运行日志。
2.网络拓扑图
采用zhTelecomiTopoview技术,生动的展示网络结构图和拓扑图。
对于大量的管理对象,可以通过划分组、网络、域进行分级管理。
大部分管理操作可以在拓扑图上直接进行。
设备运行状况在拓扑图上可以直接显示。
3.故障管理
系统利用多种手段包括主动轮询、设备通报、性能超标诊断等监控故障的发生,并能实时将故障通知到管理员。
在拓扑图上通过不同颜色来提示不同级别的故障。
可以查看故障的原因、发生时间、发生地等。
支持故障智能分析,帮助管理员找到根本原因。
4.性能监控
系统可按预先定义的策略,定期的对被管设备进行性能监视,采集包括负载、容量、质量、连通性、错误率、工作状态、可靠度、服务状态等多种性能指标,提供实时和历史的性能数据报表。
5.性能分析
综合比较分析性能数据,发现网络瓶颈和潜在问题,为优化网络提供依据。
预先对性能指标定义不同的警告阀值,在指标超过阀值的时候,提前通知管理员,能有效的预防故障发生。
6.设备配置管理
控制设备启动、恢复出厂设置,对设备固件升级备份,配置各种运行参数、服务参数等。
7.管理工具集
在界面上集成各种外部管理工具,如Ping、Telnet、Web连接、各种专用工具等。
8.扩展支持
系统提供配置文件、数据库、程序3个级别的修改扩展,实现对新功能的支持。
2.1.4开发语言评估
开源软件
语言
其他细节
Nagios
C
Webphp+cgi
Opennms
Java,jsp/Servlet,springMVC
Maven工程,支持eclipse开发
Cacti
PHP
Zenoss
Python
Zabbix
C(backend )PHP(WEB)
SugarNMS
Java
J2SE、XML、HTTP、JDBC、Swing、RMI、O-MMapping、O-RMapping等
2.1.5小结
软件\选项
License(free得分2,GPL得分1,商用得分0)
市场占有率,以市场占有率高低依次计分
功能(全面得分3,基本全面2,其他1)
管理界面(FULLCONTRL2,其他1)
开发语言(Java得分3,C/C++得分2,其他1)
得分
Nagios
1
6
3
1
2
14
Opennms
2
5
3
2
3
16
Cacti
1
2
2
2
1
8
Zenoss
1
4
3
2
1
11
Zabbix
1
3
3
2
2
11
SugarNMS
0
1
3
2
3
9
关于license,Opennms的license网站描述如下
其他软件基本上都是在GPL限制下进行。
如果我们选用了,在不付费的情况下就是涉及开放源码的问题。
但也可以打擦边球“一个关于GPL重要的争议是,非GPL软件是否可以动态链接到GPL库”。
从市场占有率来讲,Nagios和opennms应用的比较广,也意味着更多的资料可以获取,更多的经验可以借鉴。
从开发语言来说,Nagios使用c开发,界面PHP,cgi也是由c来开发的,由于c的复杂性,扩展开发上存在一定的难度,但是c对我们部门来说还是比较熟悉的。
Opennms是基于java的,Web管理界面是基于JSP/Servlet,SpringMVC。
但是Nagios没有配置界面,配置需要直接修改配置文件。
如果选用建议推翻所有目前的cgi方式的管理界面,全部重新开发,或者再结合其他的管理软件。
Cacti基于PHP,zenoss基于python,zabbix基于c和php,SugarNMS开源程度不够,所以不做过多调研。
从以上分析,倾向选择Nagios和opennms中的一种。
调研过程中分别搭建了Nagios和Opennms的运行环境。
搭建了Opennms的开发环境,(Nagios的编译环境,源码包解压缩就是开发环境,无所谓搭建了)。
在搭建Opennms的过程中遇到一点点麻烦。
Opennms的安装和编译环境搭建都比较费力,Opennms的编译环境依赖于Maven,eclipse的开发环境也需要花上一定的时间,尤其是公司的网络有诸多限制。
Nagios编译和部署非常的顺畅,可以下载源码包直接编译安装。
2.2开发接口调查
基于上文中的调查,对于开发接口的调查只针对于Nagios和Opennms。
2.2.1Nagios
Nagios支持插件开发。
支持C/C++,JAVA,脚本,并且有大量开发好的Plugins。
插件是编译的可执行文件或脚本(Perl脚本,shell脚本等),可以从命令行运行检查状态或一个主机或服务。
Nagios的插件的使用结果来确定网络上的主机和服务的当前状态。
Nagios在需要时执行Plugin检查服务或主机状态。
NRPE方式:
NRPE是一个插件,允许执行远程Linux/Unix主机上的插件。
如果需要监控远程主机上的资源和属性,如磁盘使用情况,CPU负载,内存使用等,需要使用这种方式。
通过使用check_by_ssh插件可以实现类似的功能。
NSCA方式:
NSCA是一个插件,允许你发送被动检查结果从远程Linux/Unix主机到Nagios监控服务器上运行的守护进程。
在分布式和冗余/故障监测设置,这是非常有用的。
NDOUtils方式:
NDOUtils是一个插件,允许把所有状态信息存储在MySQL数据库中的Nagios。
Nagios的多个实例都可以存储在一个集中的报告的中央数据库的信息。
这可能会作为一个新的基于PHP的未来的Nagios的Web界面的基础上。
Nagios提供了NagiosPluginAPI。
但是并没有提供除Nagios提供的功能外的其他功能的开发。
添加新的服务需要阅读c代码,难度上相对比较大。
基于这一点,Nagios并不能满足我们的要求。
2.2.2Opennms
Opennms是装配式的,支持根据配置装载服务和插件,扩展性很强。
上图为opennms的架构图,其中一些部分在最新版中有所变化。
下表是opennms并发的进程
并发任务
守护程序名称
英文
描述
操作守护程序
actiond
Actiondaemon-automatedaction(workflow)
自动操作执行工具,用于根据入站事件自动操作(工作流)。
采集守护程序
collectd
collectsdata
从受管节点采集数据。
功能守护程序
capsd
capabilitycheckonnodes
对所发现的节点执行功能检查。
它通常检查某个接口的端口,看它是否支持已知的服务协议。
DHCP 守护程序
dhcpd
DHCPclientforOpenNMS
为 OpenNMS 提供 DHCP 客户机功能。
发现守护程序
discovery
initialandongoingdiscovery互联网控制消息协议(InternetControlMessageProtocol或简写ICMP)
对受管网络节点进行初始的发现以及持续进行定期发现。
事件管理器守护程序
eventd
manages/storesevents
管理来自其它并发任务的事件,并将它们存储到 RDBMS
通知守护程序
notifd
externalnotificationofusers
向用户执行外部通知。
故障管理器守护程序
outaged
Outagemanagerdaemon-consolidatesevents
合并事件,以为每个受管节点/服务提供持续的历史故障视图。
轮询器守护程序
pollerd
Pollerdaemon-pollsmanagednodes/services
定期轮询受管节点/服务,以决定操作状态。
RTC 管理器守护程序
rtcd
RTCmanagerdaemon-realtimeavailabilityinformation
实时收集数据,为用户定义的各类受管节点/服务提供可用性信息。
SNMP 陷阱守护程序
trapd
SNMPtrapdaemon–handlesSNMPtraps
处理 SNMP 陷阱(事件)。
阈值服务守护程序
threshd
Thresholddaemon–monitorforthresholdvalues
根据属性值是否达到指定的阈值来监控受管节点/服务。
支持总控/调度,发现,配置采集,性能采集,事件(告警)收集,轮询服务。
通过在 service-configuration.xml配置需要的服务。
OpenNMS系统配置信息通过XML数据存储,基于linux系统和Postgres数据库的网络管理系统。
网络数据通过JDBC对数据进行持久化,Web采用JSP/Servlet。
OpenNMS是一个OpenSourceFramework,它采用了诸多的开源组件与框架,使用了各种协议的开源实现。
每一个层面服务、功能都有自己的配置文件。
OpenNMS采用了xml数据绑定技术(opennms采用的是castor)。
根据xml文件的schema定义文件(xsd文件)生成对xml文件到java对象的映射,这样就不需要写解读xml文件的代码而是针对java对象进行操作。
因此这些类都是在系统编译过程中由castor包根据xsd文件生成的。
(Castor是一个Java开源数据绑定框架,它主要目标是提供Java对象与XML 的绑定,Java到SQL的持久化等.)
Cleanimports是对java文件中的无用的imports作清理,并通过配置文件提供的格式对imports代码段进行格式整理。
各种单元测试手段,HttpUnit,jWebUnit,Junit。
nekohtml解读HTML,Html Tidy对html 字符串进行修正,并做标准化的处理。
Avalon主要是一种Server的架构,可以满足配置、日志等服务器程序的需要。
Jdhcp,javaDHCP的实现。
Xerces解读XML,API与实现有:
xmlParserAPIs,xml-apis,xercesImpl。
jCIFS,用Java开发的SMB客户端库。
ldap-impl,LDAPjava实现。
smtp.jarpop3.jar,SMTP,POP3协议Java实现。
JRobin基于LGPL授权的网络性能监控系统,是RRDTool的一个纯Java实现。
joeSNMP,JavaSNMP类库。
WebUI:
OpenNMS框架逻辑上采用了MVC架构,准确来说是JSPMVCModel1,采用此架构的主要理念是尽量把逻辑与表示分离,这有利于系统健壮性,代码重用和结构清晰,便于重新设计,并长期维持。
在OpenNMS中MVC各部分主要代表如下:
✧视图(JSP)
OpenNMS的页面通过Model请求回来的内容以HTML,XML/XSL,图表等形式呈现给客户端。
✧控制器(Servlet)
OpenNMS的控制器采用Servlet方式的,配置在web.xml文件中,用来接受用户的输入并调用模型和视图去完成用户的需求。
所以当单击Web页面中的超链接和发送HTML表单时,控制器本身不输出任何东西和做任何处理。
它只是接收请求并决定调用哪个模型构件去处理请求,然后用确定用哪个视图来显示模型处理返回的数据。
✧模型(BussinessObject/JavaBean)
模型表示企业数据和业务规则。
模型允许重用相同的代码跨数个不同的用户界面组件。
由于应用于模型的代码只需写一次就可以被多个视图重用,所以减少了代码的重复性。
开发接口:
OpenNMS提供了一个简单快速的框架用来扩展设置缺省服务与协议,为了扩展OpenNMS管理一个可定制的服务或协议需满足如下要求:
以Caspdplugin为例
✧编写代码capsdplugin(插件)测试网络接口是否有支持期望的协议或服务
✧添加一个元素,在$OPENNMS_HOME的/etc/capsd-configuration.xmlconfig定义新的服务。
✧编写代码poller插件,在某一特定的网络接口,监测当前期望的协议或服务的状态。
✧在$OPENNMS_HOME的/etc/capsd-configuration.xmlconfig配置文件中添加和元素定义新的调用服务。
1.编写Plugin
Capsd使用plugin执行设备的性能检测,一个Plugin是一个实现mgt.capsd.Plugin接口的Java类。
下列接口中的方法必须实现:
public interface Plugin {
public StringgetProtocolName()。
public boolean isProtocolSupported(InetAddressaddress)。
public boolean isProtocolSupported(InetAddressaddress,Mapqualifiers)。
}
在配置文件capsd-configuration.xml添加,比如FtpPlugin
class-name="mgt.capsd.plugins.FtpPlugin"scan="on">
在运行时,性能daemon调用isProtocolSupported()方法。
此方法是每一加载的plugin通过它.InetAddress对象的每一个被发现的守护daemon,发现任何支持此接口的服务将通过接结点标识符与IP地址增加到ifservices数据表中。
创建PollerPlugin
Pollerdaemon使用PollerPlugin轮询受管制接口所支持的服务当前状态。
一个PollerPlugin是一个实现mgt.poller.monitors.ServiceMonitor接口的Java类。
实现下面的pollerplugin接口。
public void initialize(java.util.Mapparameters)。
public void release()。
public void initialize(mgt.poller.NetworkInterfaceiface)。
public void release(.NetworkInterfaceiface)。
public int poll(.NetworkInterfaceiface,
mgt.utils.EventProxyeproxy,
java.util.Mapparameters)。
在poller-configuration.xml中添加一个新的服务,元素定义服务名称,多少时间间隔与预定时间,参数列表需定义在元素中。
配置参数将通过poll()方法中的java.util.Map传递给plugin
在poller-configuration.xml文件中添加一个新的元素,在这个元素中说明服务名称与类名:
每一种服务都有自身plugin的开发接口,方便扩展。
2.开发daemon
开发plugin只能在现有服务的基础上进行扩展,但要增加基础服务,就必须开发daemon一级的服务。
由于opennms是基于配置动态加载,我们可以模仿已有的daemon开发服务需要的服务进程。
当然这需要相关代码比较熟悉。
3结论
基于这段时间调研,感觉opennms比较适合我们的需要。
Opennms前期需要投入一定的时间和人力进行调研,把相关层面的问题弄清楚。
由于开始选型时设定了一个范围,会遗漏重要的软件,只盯在网管开源软件这个领域,也可能会错过其他一些更加符合我们的需要的开源架构软件。
个人知识面的局限和偏执也会造成偏差。
4MISC
如果部门决定选用opennms,那么下一步工作就是对opennms进行较为细致的实验。
搭建实验环境。
规划功能和制定开发计划。
对开发接口进行实验。
调研数据存储,数据库部分。
然后就是功能裁剪。