ImageVerifierCode 换一换
格式:DOCX , 页数:19 ,大小:25.18KB ,
资源ID:4016251      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4016251.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(网络管理告警系统.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

网络管理告警系统.docx

1、网络管理告警系统网络管理警告系统的设计1 设计目标1 数据采集:通过采集计算网络中的配置信息,告警信息,性能信息,反馈给告警中心。2 数据分析:分析告警信息(原始告警信息,性能数据,配置信息) ,推理处理并存储记录告警,且实现告警的可确认消除(自动回复 /手动恢复)。3 数据应用:实时监控重要的告警信息,解决并消除告警信息。根据告警信息记录生成报表统计,向上层 提供决策的数据依据。2 概要设计系统分三层 : 数据的采集 数据处理 数据应用 数据采集:从系统的网元上采集数据包括:性能数据信息,网元告警信息,拓扑结构的配置信息,向数据处理层 的制定临时数据库中传送。数据处理:从指定的数据库中获得原

2、始数据信息,判断处理。根据估值(及性能阀值)判断生成警告信息,存储 分析并上报告警信息。实现告警的匹配确认清除,重复告警的归并处理。数据应用:及时监控重要的告警信息,并处理此告警,反馈告警的确认信息。根据不同的用户需求展现告警统计 信息报表,为决策提供数据支持。3数据采集层3.1内容3.1.1配置数据采集的内容及获得该网络中的网元设备,基本信息,与实体形成对应的映射。用于网络的拓扑信息管理。 网管系统管理采集以下配置数据:3.1.2告警数据采集的内容告警源需要采集的告警报告分为:网元告警路由器:交换机:配线板:服务器:cpu ,内存,硬盘,电源,风扇(散热),网卡,光驱,端口,运行的软件服务1

3、.环境告警:暂保留。2. 通信连接告警(拓扑管理):当某一网元设备持续一定时间不响应网管系统时,网管系统应能自动生成 该网元设备的通信连接警。3 性能告警:当性能指标超出预先设定的范围时,系统触发的告警称为性能告警。4.设备告警: 来自设备红端的告警信息。原始告警数据内容原始告警数据是从告警源采集到的未经任何处理的原始告警信息, 格式和内容与网元类型相关, 原始告警信息将在告警管理应用层进行处理,采集层采集到的告警原始数据至少应包括以下内容:中文名称名称说明类型告警的序列号Alar md告警的序列号字符串网元的识别名Dn网元的识别名字符串告警发生时间Occur_tim e告警发生时间时间告警清

4、除时间Clear_time告警清除时间时间告警原始类型org_type告警类型字符串告警原始级别org_severit y告警级别字符串活动状态activestatus活动状态整数告警标题Title告警标题字符串告警内容alarm_text告警内容字符串3.1.3 性能数据采集的内容针对不同的网元,采集其对应的性能信息。格式和内容与网元的类型相关。 在采用阀值过滤器,判断产生原始的警告信息。3.2方式采集方式分两种:1直连网元 及直接连接到网元设备,进行数据采集。 (使用于小的系统)2系统采集 及上一级的网管通过下一级的网管来获取数据。 (使用于多个小系统集成的大型系统)3.3要求配置、性能、

5、告警原始数据至少要保留一周以上。对配置数据、告警数据和性能数据采集的要求不尽相同, 下面分别进行说明。3.3.1配置数据采集的要求为了在用户层展现的网络结构与实际的网络结果相对应, 需要周期性的检测当前网络的连接情况, 设备的运 行情况等实时信息: 在系统相对稳定的情况下,网管系统能够按照用户预定的时间表定时的、周期性地自动采集配置数据 , 时间表中的采集开始时间和采集周期可由用户设置;如果由于网络或者其他原因, 网管系统没有正确采集到网元的配置数据, 网管系统能够让用户在必要时 手工启动配置数据采集程序进行重采或补采,并可按网元组、地区进行分别采集刷新配置数据; 网管系统以报告等方式方便地检

6、查每个网元的配置数据采集情况,即该网元的配置数据的更新情况。3.3.2告警数据采集的要求实时地采集所有网元 (NE) 生成的各种设备故障告警报告、 网络事件报告以及与网络、 业务相关的故障报警 报告。为保证数据采集的完整性,告警数据采集层必须提供手工采集手段,并应具备以下主要功能: 能够自动采集告警数据,采集时间和采集周期可设置; 能够实时接收由厂家 OMC 或网元设备实时上报的告警信息; 需要时能够即时手工启动告警数据采集程序,保证数据采集的完整性; 可根据需要,按告警网元、告警级别、告警类别等条目或按一定地区进行设置,实现过滤采集。3.3.3性能数据采集的要求性能数据采集应具有以下四个主要

7、功能:能够周期性地 24 小时自动采集性能数据,采集周期和采集时间可选择,最小的数据采集时间周期为 15 分钟,采集的时间粒度可以基于网元或地区进行选择; 能够即时手工启动性能数据采集程序 (分地区、分时段 ); 当报表数据不全时,能够提供简单的手段确认所采集的网元数据的齐全;采集和补采的数据能够自动入库。4数据处理层原始数据通过数据采集层进入系统后, 数据处理层对这些 原始数据进行归纳整理, 实现数据结构规范化, 为 数据应用层实现具体功能提供支持,便于系统的二次开发和新的应用功能的提供 。处理层数据至少需要保存 6个月。以下从配置、告警和性能三方面对数据处理层进行说明。4.1配置数据处理层

8、本节从信息归一化、配置数据的存储、刷新和备份等四方面进行说明。4.1.1配置信息归一化配置数据采集到网管系统之后, 必须进行归一化、 数据结构规范化,使数据应用层的相关应用能够方便地使用这些数据。配置信息按照交换机,路由器,服务器,等六个方面进行归一化, 具体内容参见附录。4.1.2配置数据的存储网管系统应能够将不同种配置数据转换成以上描述的归一化标准数据格式并存储到数据库中, 为性能、告警等应用提供数据支持,为二次开发或其他的后处理提供标准的存储接口。4.1.3配置数据的刷新网管系统发现新的配置数据采集结果与网管数据库中的配置数据不同时, 如网元的增加、删除、网元属性改变(何种属性),需要用

9、户确认,并生成变更记录,作为采集日志的一部分,供用户后期查询,同时更新网络拓 扑图等相关的上层应用程序的配置数据,使上层应用能够呈现网络的最新配置信息。4.1.4配置数据的备份网管应提供对配置数据的快照功能 (即备份功能),用户通过此功能可将当前网络的配置信息存储下来,供其他应用所调用。快照可以由网管系统按照时间表的设置自动进行或由用户手动启动。快照后的配置信息可用于:网络配置信息的历史对比配合性能,告警数据做网络多维分析4.2告警数据处理层以下对告警数据的处理进行说明。 421告警信息格式标准化采集层采集到的原始告警数据要经过告警数据处理层的处理 ,处理后提供的标准化数据应包括以下内容:中文

10、名称名称说明类型告警的序列号Alarmd告警的序列号字符串网元的识别名Dn网元的识别名字符串告警发生时间Occur_time告警发生时间时间告警确认时间ack_time告警确认时间时间告警清除时间clear_time告警清除时间时间告警类型type告警类型整数告警级别Grade告警级别整数告警原始类型org_type告警类型字符串告警原始级别org_severity告警级别字符串活动状态activestatus活动状态整数告警源source_type字符串确认操作员ack_optr确认操作员用户名字符串清除操作员clr_optr清除操作员用户名字符串告警标题Title告警标题字符串告警内容al

11、arm_text告警内容字符串告警的原始信息中文名称名称说明类型告警的序列号Alar md告警的序列号字符串网元的识别名Dn网元的识别名字符串告警发生时间Occur_tim e告警发生时间时间告警清除时间Clear_time告警清除时间时间告警原始类型org_type告警类型字符串告警原始级别org_severit y告警级别字符串活动状态activestatus活动状态整数告警标题Title告警标题字符串告警内容alarm_text告警内容字符串421告警的重定义应允许用户根据管理工作重心的变化,按照可能原因、网元类别、网元识别码、原告警类型、告警级别、时 间类型等条件及各种条件的组合对 告

12、警类型和级别进行重定义 。告警级别分为严重告警、主要告警、次要告警、警告告警;告警类别分为通讯告警、环境告警、设备告警、 处理错误告警、服务质量告警;4.2.2告警过滤(通过推理机的知识库来过滤,且知识库是对管理员可维护。 )对单位时间内发生的大量告警, 能按用户要求和管理部门的考评要求及实际管理情况, 对告警网元、告警级别、告警类别或告警标题等条目进行过滤。告警数据过滤用于过滤掉从底层提取的告警信息中监控人员认为不重要的信息,从而减少轻微告警的干扰, 以提高监控与处理的效率。应能对告警数据过滤的开启状态进行手工设定。1、过滤后的告警信息的处理经过过滤后的告警信息最后应插入当前告警数据表。 对

13、系统数据库中的告警信息要加过滤标志。2、告警数据的过滤条件对象:选择过滤掉哪些对象的告警信息。 监控人员可通过三种方式选择对象: 单个或多个对象 (必须是同一网元类型 ); 同一网元类型的所有对象; 某一地区内同一网元类型的所有对象;告警级别:选择过滤掉选定对象的哪一级别的告警。过滤模式:定义派生的告警信息是否写入系统数据库。 确认模式:定义符合条件的告警信息的确认模式。由监控人员手工确认。告警信息采集上来后自动确认。 告警信息取消时自动确认。4.2.3告警传递为了保证底层对象 (有可能在拓扑图或导航器中当前不可见 ) 的告警信息也能及时地显示,监控界面对底层 对象的告警应逐层传递给其父对象,

14、即改变其父对象子告警状态及子告警次数,引起其父对象状态图标的变化, 从而达到实时监控的目的。在展现层进行逐层的展现。告警传递的方式在网元逻辑关系树中, 树的底层节点网元发生告警时, 应上传到上层的一级或多级网元节点, 告警传递层数 应可由用户根据需要设置,系统默认为一层。传递的告警信息的显示当父对象有由子对象传递上来的告警时,要显示出有子对象告警的状态 当父对象有子对象告警时,设置该父对象的状态为有子对象告警,并将子对象告警数目加一 (在设备状态表中提供相应字段,子对象告警状态与次数 )当取消子对象告警时,父对象的子对象告警数目减一。当减为零时,设置该父对象的状态为无子对象告警。4.2.4告警

15、相关性分析及处理 (可选)首先定义告警相关及处理的具体规则, 对每条将要入库的告警信息按规则进行相应的告警相关性分析, 然后 根据分析结果进行相应的处理。告警相关分为两类,一类产生新的告警,涉及告警的自定义,另一类并不产生新的告警。例如: 对单位时间内频次过高或历时过长的告警 (门限可设 ) 能派生新的告警报告 (告警派生 )。消除重复发送的同一告警; 去除已有告警引起的其他告警; 推测出一组告警中的决定性告警,并清除其他次要告警; 对频繁发生的告警自动提高告警级别,从而保证网管中心告警信息的有效性、重要性。4.2.5 告警故障定位(可选)告警故障定位到网元级,要求进行板卡级的故障定位; 如果

16、厂家的告警报告不包含了如果厂家的告警报告包含了板卡级的定位信息, 板卡级的定位信息,则不做要求。4.2.6 告警取消告警自动取消当从底层告警数据源采集到告警取消信息时进行告警的自动取消; 告警自动取消时,当前告警数据表删除对应记录,历史告警数据表增加对应记录; 告警自动取消时,根据相关性分析的设置,决定是否将相关的低级别告警同时自动取消; 告警自动取消时,应适时地通知由该告警产生的工作流; 若该告警仍未取消,则根据告警的确认模式决定是否自动确认;告警手动取消 当维修人员修复故障后,提供手动取消相应告警的功能,在日志中应能记录手动取消者的身份。4.2.7 告警存储故障管理系统能自动存储所有告警记

17、录; 原始告警信息在系统中至少保留一周以上, 分类后的告警信息在数 据库中按照告警类别、告警级别、业务种类、网元类别作不同期限的保存,逾期信息能够用磁带或光盘等介质备 份。按告警类别按告警级别业务种类按网元类别4.2.8 告警数据的备份和删除能够对告警数据进行备份或删除。 系统提供界面, 能够按照用户的要求或时间表的设置对所采集的告警数据 进行归档或删除;4.3 性能数据处理层4.3.1 性能数据归一化(对同一种类型的网元设备设置一个统一的性能数据表格) 性能数据采集到网管系统之后, 必须进行归一化、 数据结构规范化, 使数据应用层的相关应用能够方便地使 用这些数据。交换子系统的性能数据基站子

18、系统的性能数据性能处理数据的属性集 性能处理数据的属性详见本规范第二册。4.3.2性能告警数据当性能指标超出预先设定的范围时, 系统触发的告警称为 性能告警 。系统需提供对性能告警信息的显示、 询和统计的功能。用于性能告警的主要指标有:Cpu 的使用效率 交换机,路由器的丢包率 网卡的的流量4.3.3数据字典 (可选)数据描述部分 (数据字典 ) 是数据处理层的核心,它位于数据处理层,将性能处理数据和上层应用程序相隔 离。数据字典的控制对象是处理层数据。处理层数据是原始性能测量经过处理、映射后在网元维、时间维、地域 维上汇总之后的全集。依据数据字典建立起来的模板从其中并且只能从其中获取数据。4

19、.3.4性能数据的存储性能处理数据采用三维和多粒度方式存储。 时间维按粒度由小至大为:小时,日,周,月,年。 地域维按粒度由小至大为:地区 (包括各地区会城市计划单列市 ),全国。类别维它的粒度可以对应于网元的类别,如:小区,基站,基站控制器,交换机。 对应于每一类性能数据,每一维都规定了最小粒度,网管系统必须存储最小粒度的数据;此外,网管系 统还应根据用户的需要,兼顾效率,提供较大粒度上的汇总。对采集到的原始测量信息分类入库至少一周, 新业务至少二周。 性能处理层数据可以由管理人员根据时间粒 度、业务种类决定存储的时间。4.3.5 性能数据的备份、删除和恢复能够按照用户的要求或时间表的设置网

20、管系统应该能够对性能数据进行备份、 删除和恢复。 系统提供界面, 对所采集的性能数据进行归档、删除和恢复。5 数据应用处理告警上报,统计,以及展现统计数据。告警监视器应能显示所有活动告警和已确认但未清除的告警。 此处略。6 详细设计61 概要设计模型6.1.1 告警的过滤模型6.1.2 告警数据处理层设计模型7基本数据格式定义:7.1告警信息的归一化7.1.1原始告警信息内容中文名称名称说明类型告警的序列号Alarmd告警的序列号字符串网元编码eleme ntCode网元的识别名字符串网兀类型eleme ntType网兀的类型整数告警发生时间Occur_time告警发生时间时间告警原始类型or

21、gType告警类型整数告警原始级别orgGrade告警级别整数活动状态activestatus活动状态整数告警标准名称Alarm_Name告警名称字符串告警内容alarm_text告警内容字符串7.1.1.2处理后的告警信息统一格式内容中文名称名称说明类型告警的序列号Sequenee告警的序列号字符串告警类型alarmType告警类型整数告警级别alarmGrade告警级别整数网元编码eleme ntCode网元的识别名字符串网兀类型eleme ntType网兀的类型整数告警内容alarm_text告警内容字符串告警状态Status告警的当前状态整数告警次数Cou nt该告警的累计次数整数确认

22、操作员ack_User确认操作员用户名字符串清除操作员clr_User清除操作员用户名字符串告警发生时间Occur_time告警发生时间时间告警确认时间ack_time告警确认时间时间告警清除时间clr_time告警清除时间时间告警的最近一 次上报时间Last_time告警的最近一次上报时间,用 于判断告警是否过期.时间告警原始类型orgType告警类型整数告警原始级别orgGrade告警级别整数告警标准名称告警处理方法关联告警名称7.1.2告警的级别告警级别告警级别定义告警说明Int2可能引起系统不能正常工作的严重警告。需要上报警告。主要警 口Int1可能引起严重警告的警告,必须上报。提示警

23、告Int0轻微级别的告警,可以直接忽略,属于提示性的信息。每条告警通过告警条目的颜色标识相应的告警级别,由数据应用层来完成和定义。原始的告警级别原始告警级别告警级别定义告警说明7.1.3告警的级别重定义网元告警:把网元告警的级别划分为四个区间,进行告警级别的重定义。性能告警:有知识库的设定阀值来判断告警的区间,对性能信息实现过滤。需要对多个告警信息进行归并处理, 找出主要的告警信息,屏蔽次要的信息,减小信息量。配置告警:监测网络的配置是否有更新,设备是否有增减。配置更新属于主要告警,设备增减属严重警告。必须 通知管理员,可能是设备停止运行,或链接掉线等严重故障。7.1.4告警的类型告警类型告警

24、类型定义告警类型的说明设备告警Int 0与设备有关的告警,如电源,电压,服务异常等。性能告警Int 1与网络的性能质量有关的告警, 网元在运行时的动态参数超出指定的预设阀值产生的警告。通信连接告警Int 2与网络的传输状态有关的告警,如:断线,无连接响应。环境告警Int 3与环境有关的告警,如机房湿度,温度,火警,风度,噪 音等。7.2配置信息的归一化7.3性能属性的归一化8.各层的通信标准8.1数据处理层和数据展现层的数据交互8 . 1.1通信方式采用ActiveMQ的jms机制通信,使用 Publish的方式通信。使用客户端服务器模式交互数据。注:此处数据处理层为服务器端,数据展现层为客户

25、端。8.1.2通信模型服务器端告警上报告警同步(考虑多服务器的并行时信息同步问题 )告警确认通知告警清除通知客户端告警确认告警清除数据格式JMSHeader消息头Properties 属性Body消息体在Header中的Msgld中放入消息的命令类型(命令列表) 在Body中放入命令的所需的参数。命令列表消息通信的数据结构(此处把告警处理中心为服务器端 server,web服务器端为客户端 client)命令类型命令编码消息方向消息参数(详细信息见表)功能说明告警上报10001Server clientPerformanceAlarm通过告警对象的序列化之后传输到客户端。超时告警上报10001

26、1Server-clientPerformanceAlarm系统检测岀的超时告警,需要手动来清除和确 认的告警,则再次上报.告警确认回复100022Server clientPerformanceAlarm(手动/自动)响应客户端的告警确认命令告警清除回复100033Server clientPerformanceAlarm(手动/自动)响应客户端的告警清除命令阀值修改回复100044Server clientProperties告警确认10002Client-serverPerformanceAlarm发送给告警中心的确认告警信息告警清除10003Client-serverPerforman

27、ceAlarm发送给告警中心的清除告警信息阀值修改10004Client-serverProperties以properties的格式来设置性能阀值参数详解1 .告警上报:PerformanceAlarm序列化对象 命令编码:10001主要内容:参数名称类型参数含义参数取值备注SequenceString告警的序列号NOT NULL告警序列号,作为告警的唯一身份告警标准名NOT NULLalarmTypeInt告警类型NOT NULL设备告警/性能告警/环境告警/拓扑告警alarmGradeInt告警的级别NOT NULL严重告警/主要告警/提示告警argTypeInt原始告警类型NOT NU

28、LL待定(处理层对其初步处理)argGradeInt原始告警级别NOT NULL待定(处理层对其初步处理)elementTypeInt网元类型NOT NULL路由/交换机/服务器/elementCodeString网兀编码NOT NULL网元的唯一识别码alarm_textString告警原因NOT NULL产生告警的原因告警的解决办法关联告警名statusInt告警的状态NOT NULL产生/确认/消亡countInt告警的次数NOT NULL告警累计次数ack_UserString确认告警的用户名当系统自动确认时值为:Systemclr UserString清除告警的用户名当系统自动清除时值为:SystemOccur_timeDate告警岀现的时间NOT NULLack_timeDate告警确认的时间clear timeDate清除告警的时间last timeDate最近一次告警时间NOT NULL做给告警超时的依据2 .告警确认回复 (自动/手动)信息载体:PerformanceAlarm序列化对象命令编码:100022主要内容:参数:类型说明参数取值备注

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1