1、大成网络运维综合管理系统 技术白皮书2013深圳安络大成科技有限公司大成网络运维综合管理系统技术白皮书声 明版权所有 深圳安络大成科技有限公司 2004。 保留一切权利。本资料著作权属深圳安洛大成科技有限公司所有。未经本公司书面许可,任何单位或个人不得以任何方式摘录、复制或翻译,并不得以任何形式传播。、是深圳安洛大成科技有限公司的注册商标。在本手册中出现的其他公司的商标、产品标识及商品名称,由各自权利人拥有。注意由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。版本控制版本号日期状态变更说明修订
2、人审核人V1.0.02013.03.18C创建技术白皮书。黄志文状态标识:C 创建 A 添加 M 修改 D 删除第 1 章概述1.1传统网络管理存在的主要问题随着计算机网络技术的广泛应用,计算机网络为电子政务、电子商务和业务管理提供了现代化的运营平台,已成为政府和企事业单位工作必需的技术手段,并促进了工作效率和生产力的提高。然而,计算机网络也是一把“双刃”剑,在为用户带来效益的同时,也带来了管理上的困难,因管理不好而使工作瘫痪的事时有发生。为解决管理上的问题,传统管理思路是从独立的网络设备或网络安全等不同的切面出发而构建产品。这样的产品在网络设备较少、网络结构和应用系统简单的情况下,可以有针对
3、性的解决部分问题,但随着网络结构和应用系统愈来愈复杂,且向大型化、超大型化发展,这种管理思路已经不能满足其管理上的要求。综合来看,传统网络管理产品存在的主要问题:一是管理理念不清。传统网络管理只考虑了网络管理人员的职责,所有的任务都由网络管理人员负责,在网络规模小、结构简单、无重要信息流动等情况下,这种“平面化”的管理是勉强可行的。随着网络应用越来越广,业务承载越来越多,信息越来越重要,网络管理的重要性更加突出,这种平面化管理已经无法满足管理上的要求。二是管理对象单一。传统网络管理产品均以网络设备的管理为主,虽然出现了偏重网络安全设备管理或网络应用系统管理的产品,但都是从网络管理的一个切面出发
4、,解决局部问题,没有从整体上彻底解决问题。三是管理流程混乱。传统网络管理偏重故障的查找,没有一套从事件的发生到分析、再到处理、记录与入库等整个流程。四是管理效率不高。由于没有从整体上架构管理平台,每一个网络中需要安装网管软件、安全管理软件、审计管理软件等,占用网络资源、并且数据互不相通,管理效率低,有时甚至相互影响,造成网络运行不稳定。针对这些问题,我们通过研究分析认为,传统网络管理理念存在着“重产品轻服务、重技术轻管理、重局部轻整体、重应急轻预警、重事件轻分析”,因而,只注重解决单个、局部和孤立的网络管理问题,无法为网络提供一体化的管理手段。1.2网络管理新的理念为解决传统网络管理中存在的问
5、题,我们提出了网络管理“三层次”、“多维度”的理念。从层次上讲分为决策层、管理层和执行层。从维度上来讲,分为管理、手段、技术和对象。如下图所示:图中所示为政府、军队和大型企事业单位典型网络管理层次划分,决策层对应行业信息安全最高层机构,负责网络管理法规和制度的制定、网络体系的建设以及日常监控检查等职能。管理层对应单位网络管理机构,其职能是按照决策层的意图,通过运维综合管理系统收集网络运行状态数据,进行综合分析,并做出处理决策,下达网络管理人员执行。执行层对应单位网络管理人员,主要负责网络设备的检查使用,接受管理层下达的任务(工单),遇有事件及时处置。该理念较好的解决了网络管理体系建设中存在层次
6、不清,目标不明的问题,并具有实际操作的可行性。1.3网络运维综合管理系统提出 根据网络管理三层次理念,我们研制了网络运维综合管理系统,该系统是针对管理层的职能和任务而设计的,是网络管理层面上的重要层次,是确保决策层管理意图下达、信息反馈,以及监督管理执行层落实上层意图的重要环节。设计思想是:坚持技术与管理相结合,以网络中各要素(网络设备、安全设备、终端及应用系统等)为对象,以策略为基础,以事件为主线,统一数据接口,实现一体化集中管理,使管理规范化和流程化。第 2 章系统简介2.1系统结构总体设计采用C/S架构,移动管理控制台方式进行管理产品形态:管理控制中心+管理控制台+监控代理数据库:MyS
7、QL代理限制:通过license文件或硬件加密狗方式控制代理数量 2.2系统部署大成网络运维综合管理系统安装部署非常简单方便,系统使用旁路式部署,可以在不影响原本网络的前提下对全网进行监控。终端代理可以根据需要通过域分发、网络共享、光盘、网站下载等方式灵活安装。在内部网络所有终端设备以及移动设备上安装终端安全代理软件,通过服务器下发安全管理策略对整个网络进行统一高效管理。 在需要监控的服务器或网络设备需要打开SNMP协议。在每台需要桌面管理的终端上安装代理软件。服务器安装在内网中与各设备相连通的位置。控制台可安装在内网中任意可以访问到后台服务器的终端上。 系统支持分级部署,上级节点可以集中控制
8、下级节点,使系统具备良好的扩展性。如下图所示:2.3产品优势1) 统一管理平台,资源监控与运维服务一体化系统监控层所采集到的各类设备(对象层)的故障、性能、配置事件通过标准接口汇总到系统统一事件分析引擎,借助规则策略库(rules)和服务依赖模型(iBDM),对事件进行过滤、压缩、关联、归并,定位根源告警,集中展现于告警台。系统通过事件紧急故障流程,以声光、短信等方式进行通知督办,并通过服务台及时反馈处理进展,实现事件的“统一接入、统一展现、及时通知、统一处理”。2) 应需而动、随需而变的动态业务平台只有将网络运维综合管理系统和用户实际情况相结合,才能真正贯彻和执行,才能发挥网络运维管理的最大
9、效力。系统内置灵活的动态表单和工作流引擎,为系统的服务流程管理提供了应需而动、随需而变的特性。同时系统通过动态模型编辑器为用户随需建设自己关注的业务视图,为管理员提供快速掌握的业务运行的管理通道。同时,避免了大量机械枯燥的代码修改和重新编译工作,使得流程和表单的修改更加容易,真正实现运维管理的“应需而动、随需而变”,保证本运维管理系统能够不断适应用户IT 服务管理水平的持续改进与优化。3) 全方位、灵活的IT 资源管理紧扣用户需求、整合IT 资源本运维管理系统提供的IT 资源管理基于CMDB 配置管理技术,充分吸收业界其他资源管理理念,建立面向IT 资源和非IT 资源的统一管理和监控体系,提供
10、了多种资源配置数据的录入和导入功能,并同步其他管理流程对资源管理库的改动数据,实现资源管理数据的整个生命周期的管理。模板化的定义能力,具备联动底层监控系统实现资源同步和检查机制,发现和防止配置的随意修改。4) 可视化、仪表化、智能化导航管理的运维模式本运维管理系统提供可视化、仪表化、智能化导航管理的新型运维模式,大大降低运维管理的技术难度,从整体到细节帮助用户全面掌控网内IT 运行情况,帮助用户熟悉服务与流程的自动化管理,提升IT 服务管理能力,从而最终帮助用户提升服务质量、降低运营成本。提供简单化、人性化的、美观化的资源拓扑监控界面以及运维管理界面,让用户快捷、方便了解网络中各种资源运行状态
11、、业务系统运行状态;提供可视化的流程定制工具,实现流程定义、流程相关角色权限和流程跟踪控制、审计与统计等功能;提供配置项(CIs)的端对端及层次化视图。5) 丰富的行业经验、专业的服务管理安络大成科技已经成功地为公安、武警、军队有关部委单位开发与实施了IT 运维管理系统,在系统平稳运行的同时,公司积累了丰富的IT服务管理咨询、培训、规划、实施等方面的经验,为今后类似项目的顺利开展和实施打下了坚实的基础。第 3 章系统特性3.1直观反映当前网络状态系统在起始页面集成了网络中常用的状态信息,实时更新全网的健康状态。用户在日常维护工作时,仅需要打开起始页即可监测到网络及设备的健康状态、设备告警信息、
12、各设备的性能信息等,而不需要一一检查各设备的状态即可了解当前网络是否正常运营。当网络产生异常时,系统即可提示引起异常的设备,方便管理员进一步的检修。网络健康状态:可监测当前网络链路的健康情况,以决定链路是否需要检修;设备健康状态:可监测当前网络内部所有设备的健康情况,以决定网络中的设备是否需要检修;告警设备排名:反映当前网络中的主要告警设备,可通过详情定位设备的发生的告警详情;告警事件排名:可定位网络中频繁发生的告警信息,方便用户制定下一步的工作计划;CPU利用率、内存利用率、连通性能排名:可通过该排名了解到网络中影响传输速度的瓶颈所在,并在网络负载较高的情况下定位是由哪些设备造成的;磁盘利用
13、率排名:可了解各服务器的磁盘空间状况,防止因为磁盘空间问题造成服务器无法提供正常服务;3.2报表统计系统结合我司多年的行业经验,定制了多套实用的统计报表模板,并为模板设计了最简参数,用户不再需要为了生成一个报表而输入大量专业的参数,真正实现了一键式统计,为用户省却了大量的工作。而系统在高度集成化的同时也为用户提供了动态自由的统计模板设置,用户可以根据自身环境的特殊需要制定自己所需要的统计模板,实现便捷与灵活的完美结合。网络运行状态报表:反映网络中设备的离线情况,用户可通过该报表发现网络中不稳定的设备信息;网络流量统计报表:反映网络中设备间的流量分布情况,用户可通过该报表发现主要的流量流向以及流
14、量瓶颈;设备运行状态报表:反映网络中设备的运行状态情况,用户可通过该报表发现不稳定的设备并制定设备维修计划;设备运行性能报表:反映网络中设备的运行性能情况,用户可通过该报表发现网络中的设备瓶颈信息,为日后的扩容提供参考;设备流量统计报表:反映网络中设备接口的流量情况,用户可通过该报表精确定位到网络中的影响网络性能的流量来源;设备磁盘使用报表:反映网络中各服务器的磁盘利用率情况及趋势,用户可通过该报表决策需要为哪个服务进行扩容以防止因为磁盘空间问题导致无法提供服务的情况;业务运行状态报表:反映网络中各业务的异常情况,用户可通过该报表了解到内部各业务是否正常提供服务,并决定是否需要对业务进行维护;
15、业务运行性能报表:反映网络中各业务提供服务的性能情况,用户可通过该报表了解到各业务的服务质量,为业务的扩容和优化提供参考;设备告警事件报表:反映各设备的故障情况,用户可通过该报表了解到各设备主要发生的故障类型以及严重程度,为设备的维护和更新提供参考;终端违规事件报表:反映各终端的安全及网络违规情况,用户可通过该报表了解到各终端的安全情况,保证了网络中的边界安全,并通过其精确定位导致网络中出现的问题的原因;业务告警事件报表:反映各业务的故障情况,用户可通过该报表决策是否需要对业务进行维护和优化;系统在提供了便捷的报表查询功能的同时,还为用户提供了报表自动发送功能。用户可以自定义定时生成需要的报表
16、,并将报表发送至指定的邮箱或者指定的运维客户端,省略了每次都需要登陆控制台进行查询的麻烦。用户仅仅需要在日常工作中使用自己常用的邮箱或者通过微型的运维客户端的通知即可获取到所关心的报表信息,在保障及时获取到网络内部情况的同时,不为管理员增加任何负担,达到了轻松工作,便捷维护的效果。3.3台账表单管理用户在网络的日常维护中通常会生成大量的表单以及数据记录,如设备资产表单、设备维护表单、终端地址记录表单等等。在一次日常的问题维护中,用户可能需要翻阅几个甚至10几个文件记录才能完成自己所需要的工作。同时在多人工作的环境中,传统的表单维护工作会使用文件服务器进行数据交换,很容易造成文件混乱或者内容丢失
17、,导致不必要的损失。为此系统在结合自身已有的数据的前提下,提供了台账表单管理功能,让用户从纷繁冗杂的文件堆中解放出来,而仅仅需要点击几个按钮即可调出自己所需要的资料。同时系统提供了传统表单维护中无法提供的各项功能,如历史记录的查询、恢复,记录的添加、修改权限设定等等,在方便用户查询自己所需要的数据的同时也为用户提供了一个稳定、可靠、安全的表单管理解决方案。3.4应用业务监控系统从业务视角出发,提供图形化的业务建模工具,根据实际环境,定义个性化的业务运行评估模型。它从业务视角、用户类型视角对被监测资源进行关联、重组,建立真实表达业务内部关系的影响模型图,帮助用户快速搭建业务卡片视图,准确判断业务
18、健康度、繁忙度、业务层级视图和业务告警等内容,客观评估业务运行水平,让IT投入的效益最大化,真正实现IT管理与业务管理的无缝融合。系统提供了市面上常见的业务系统监控功能,并采用探针、代理等多种方式进行分布式监控,在保证不影响业务系统的正常服务的前提下,为用户提供真实、及时的业务系统监控数据。数据库系统:支持监控主流的Oracle、Mysql、SQLServer、DB2、Sybase数据库,监控参数有表空间信息、会话信息、读写次数、命中率以及各数据库特有的信息;应用服务器:支持监控JBoss、Tomcat、WebLogic、WebSphere服务器。监控参数有连接信息、会话信息、线程信息、CPU
19、/内存占用率以及各应用服务器特有的信息;操作系统:支持监控各版本Windows、Linux、Unix、Soralis操作系统,监控参数有CPU、内存、磁盘利用率,带宽等;Web服务器:支持监控Apache、IIS、DNS、FTP服务器,监控参数有访问延时、访问次数、每秒请求数等;网站URL监控:支持监控URL的请求响应时间并生成监控图表;邮件服务器:支持监控各主流的POP、SMTP的响应延时并生成监控图表;3.5链路质量监控 系统针对现有业务的发展不断给网络提出更多的挑战,定义了链路的性能评估模型,真实的反映当前业务的流量、网络的负载、链路的带宽占用等。为测评现有网络性能对业务的支撑情况提供了
20、参考。系统在使用原有的数据的基础上对其进行重新组织,在不影响现有网络承载性能状况的前提下对实时业务的支撑情况进行测评、分析和管理。带宽占用率图曲线图:用户可以通过该图表知道当前整条链路的带宽占用情况,以判断当前链路是否繁忙;数据丢包/错误包率曲线图:用户可以通过该图标知道当前整条链路的丢包情况,以判断当前链路的的服务质量;链路拓扑:直观反映当前链路模型的各节点信息,并使用不同的设备、连线颜色反映当前链路的负载以及告警情况;链路支链:反映链路模型内每条链路的出入速率、带宽占用等;链路节点:反映链路模型内每个设备节点的CPU、内存、延时等性能信息;告警事件:反映该链路上发生的故障信息;3.6维护记
21、录与知识库管理知识库是支持系统实现监控管理和安全服务管理的各类支持库的集合,它包括故障事件库、安全漏洞库、管理经验库、规章制度库、等级保护库等。系统提供了对知识库中各类数据的建立、维护、版本管理等的功能支持,并支持以标题、问题、关键字的多种查询方式进行检索。系统把维护记录与知识库分成了两个模块,更加贴切用户的实际使用要求。维护记录可作为日常网络维护的备忘录,用户在维护一个故障时,可通过查询维护记录得知以前或者其他管理员对同一个故障的修复过程,提高工作效率。同时支持在添加维护记录的同时,把维护记录生成至知识库中,作为用户专属的知识库使用,缩短用户新进员工的培训时间。3.7故障管理故障管理系统是管
22、理骨干网和子网络的设备、网络和业务所出现的故障;帮助网管人员采集、统计和分析来自网络各方面的报警信息和故障信息,准确预警、定位和解决网络中的故障。告警自动通知:故障发生时系统将视告警严重等级的不同,分别以红、橙、黄、粉红、绿五种颜色及不同的图标代表,并提供以消息、邮件等多种通知方式;告警分析与统计: 系统能实现故障根源性分析,从众多的告警噪声中剥离出真正的告警源。同时提供当前和历史的告警统计,可以针对不同的过滤条件进行统计(如:发生的时间段,严重等级,告警消息,IP地址等),并提供相应的统计报表;故障告警源:系统能够通过多种方式实时采集和监测以下几大类型的告警或事件信息: 设备的告警:直接来自
23、设备本身的告警;如:CPU过负荷,内存不足、交换机端口断开等等;业务系统的告警:监视的业务系统发生故障时所产生的告警,如:Apache服务状态、响应时间等等不正常;性能的告警:当设备某个性能指标超出预先设定的门限时,系统触发性能告警。如:设备主机资源参数、端口流量、端口丢包率等等超过预先设置的门限值等;通信连接告警:当某一设备持续一定时间不响应系统请求时,系统自动生成的该设备的通信连接告警等;安全管理类告警:违反系统对于安全管理的设置规则后的告警,如:系统本身在与用户网络中网络安全设备或系统做过信息管理集成配置后,网络安全设备或系统产生的事件和告警;3.8拓扑发现管理系统采用多种算法、迅速搜索
24、整个网络内的所有节点、支持多厂商的设备组成的“混合”网络,智能分析网络拓扑结构,自动勾画出整个网络的真实物理拓扑图,真实反映整个网络的运行状态。拓扑图直观地反映设备的分布情况、负载状况和设备属性,以及线路的实时流量;通过颜色显示负载和流量的压力,主动告诉用户关注点应在哪里,动态告诉用户可能的故障隐患。用户可以通过拓扑图上的设备/连线的不同颜色直观的监测设备及链路情况,并可以根据网络实际情况对阈值进行设置;用户可以根据需要对拓扑图上的设备分布进行调整和标识,并可根据需要导入/导出拓扑图;3.9设备管理系统不仅能够通过多种方式自动收集网络中所有的网络设备,包括无线网络产品、防火墙、安全产品、打印机
25、、主机系统等,能自动辨识各生产厂商,收集到这些设备的各类运行信息,对设备进行全面的监测和管理,同时也从设备图标、设备快照、设备管理提示信息、设备面板、设备类型拓展、设备性能参数监视拓展等方面做了更为用户化的设计与增强,以满足用户对于管理操作直观、简便、全面、灵活和具有可拓展性等方面的要求。监测网络设备及服务器的CPU、内存、响应延时等; 监测网络设备及服务器的端口流量:流量大小、出入流量、数据帧的个数、广播包的数量、丢包情况等; 提供路由表、IP地址表等数据查询; 提供设备面板信息,并实时设备接口的出入速率、带宽占用等,同时支持在面板中对接口进行开启/关闭操作;自动发现并记录连接到设备上的终端
26、,并显示的终端的IP地址、主机名、MAC地址、占用的流量以及所连接的设备接口;3.10桌面管理系统通过自动修复系统安全漏洞,安全策略和安全设置自动优化等方式进行安全的主动防御。对不符合安全要求的设备,通过网络隔离,锁定设备和发送警告消息等网络手段来确保所制定的安全策略有效地被执行。为防止信息泄露,对所有可能的信息泄露途径进行功能上的限制和审计,以便于日后的跟踪和取证。可在终端管理页面上便捷的对终端进行锁定、远程控制、关闭终端等操作;可在终端详情中获取终端的操作系统、磁盘利用率、CPU利用率、内存利用率、硬件信息、软件信息等;可以终端进行安全策略、简单口令、系统补丁、启动服务、开放端口、运行进程
27、、共享资源、自启动项进行安全扫描,并查看详细的安全评估,保证终端的安全;可对终端进行统一的安装操作系统或软件补丁、分发软件、获取终端的系统事件信息;系统对内网终端和安全管理相关的用户行为进行记录,包括终端运行时间、网页访问记录、文件操作记录、文件打印记录、移动设备文件操作记录、软件运行记录、窗口打开记录、屏幕快照,为安全事件的事后取证提供线索,定位相关的责任人;可根据用户需求对终端进行分组,并对相应的组进行管理策略配置;3.11设备连接管理系统记录了每个终端与设备的连接信息,方便管理员定位终端及服务器的连接。同时系统会自动发现终端的连接变更并及时通知用户,方便用户检查网内是否增加了新的终端以及
28、终端的接入位置变化。记录终端的IP地址、MAC地址、主机名、在线状态、连接设备的IP地址及端口;支持导入原有的数据记录,提高工作效率;及时发现终端的连接位置变更,方便用户管理终端接入;可查询终端的接入位置变更历史记录,追踪终端的接入位置变化;第 4 章技术参数及环境要求4.1技术参数网络带宽占用率:上传数据时平均网络占用率 5%;CPU资源占用率:执行任务时平均CPU资源占用率 5%;并发连接数:最大可支持5000个并发连接;GUI友好性:用户界面结构清晰,易于操作,符合一般操作习惯。4.2环境要求控制台1. 硬件要求处理器:Pentium 600 MHz以上主频内存:256 MB或以上(推荐
29、)硬盘:要求在400 MB以上显存:推荐显存32 MB或以上(安装显卡驱动程序)2. 软件要求操作系统要求: Microsoft Windows XP (SP2或以上)Microsoft Windows Server 2003 (SP1或以上)Microsoft Windows Vista 系列Microsoft Windows Server 2008 系列Microsoft Windows 7系列其他软件要求:Microsoft .NetFramework 3.5 SP1服务器端:(后台服务器部分)1. 硬件要求处理器:Xeon 2.0 GHz以上主频内存:2 GB或以上(推荐)硬盘:要求在
30、40 GB以上2. 软件要求Windows操作系统要求: Microsoft Windows Server 2003 (SP1或以上)Microsoft Windows Server 2008 32位系列其他软件要求:WinPcap 4.1.2Microsoft .NetFramework 3.5 SP1Linux操作系统要求:Redhat Fedora Core 9其他软件要求:ACE 5.6.8MySQL 5.0.21终端代理软件Agent:1. 硬件要求处理器:Pentium 600 MHz以上主频内存:256 MB或以上(推荐)硬盘:要求在100 MB以上2. 软件要求操作系统要求: Microsoft Windows XP (SP2或以上)Microsoft Windows Vista 系列Microsoft Windows 7系列
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1