基于SLA服务的传输网监控管理系统.docx

上传人:b****5 文档编号:26409358 上传时间:2023-06-19 格式:DOCX 页数:26 大小:167.18KB
下载 相关 举报
基于SLA服务的传输网监控管理系统.docx_第1页
第1页 / 共26页
基于SLA服务的传输网监控管理系统.docx_第2页
第2页 / 共26页
基于SLA服务的传输网监控管理系统.docx_第3页
第3页 / 共26页
基于SLA服务的传输网监控管理系统.docx_第4页
第4页 / 共26页
基于SLA服务的传输网监控管理系统.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

基于SLA服务的传输网监控管理系统.docx

《基于SLA服务的传输网监控管理系统.docx》由会员分享,可在线阅读,更多相关《基于SLA服务的传输网监控管理系统.docx(26页珍藏版)》请在冰豆网上搜索。

基于SLA服务的传输网监控管理系统.docx

基于SLA服务的传输网监控管理系统

基于SLA服务的传输网监控管理系统

整体解决方案

 

大唐软件技术有限责任公司

2003年10月16日

目录

1.引言3

1.1编写目的3

1.2项目背景及网管现状3

2.总体结构4

2.1系统设计原则4

2.2系统总体设计思路4

2.3硬件及系统平台6

2.4应用软件平台7

2.5系统接口技术8

3.系统功能10

3.1配置管理10

3.2故障管理12

3.3性能管理14

3.4安全管理16

4.面向大客户SLA服务的2M端到端测试系统18

4.12M端到端测试系统构成19

4.22M端到端测试系统用户端设备CT4019

4.32M端到端测试系统中央监测设备CT100-1及探针CT100P21

5.参考资料24

缩写表24

引言

1.1编写目的

该文档是针对江苏省基于SLA电信服务质量管理系统试点项目,为能够提供在SLA生命周期中所需的大量的2M电路的性能、故障以及资源数据而提出的解决方案。

该方案阐明了传输监控系统对于江苏省SLA管理系统的重要性以及实施的可行性,并详细说明了该监控系统的功能实现。

1.2项目背景及网管现状

江苏省SLA电信服务质量管理系统必须对SLA性能和违例信息进行实时监视。

对电路性能趋势进行分析,对故障进行定位,并发布SLA性能预警和性能告警信息,及时发现问题并尽快处理。

因此对数字电路的监控,提供实时准确的传输性能、故障以及资源数据是SLA管理系统实施的基础。

南京电信公司目前已经建立了SDH、PDH技术为基础的覆盖全市大部分地区的传输网络,主要的传输设备厂家包括华为、富士通、武邮(烽火)、NEC和少量清华华环的传输设备,各厂家提供自己的网管系统管理自己的网元设备,各厂家之间的网管系统互不兼容。

这种局面造成了各个技术支持、管理部门无法提供及时有力的支援和配合,无法为SLA质量管理系统提供准确、统一的实时数据。

总体结构

1.3系统设计原则

南京省传输网SDH业务运营支撑系统以实现传输网中的各项管理功能为基本要求,在设计上力求做到既要采用国际上先进的技术,又要保证系统的可靠性和实用性。

具体来讲,其设计遵循以下原则:

●开放性

采用标准化的UNIX操作系统,标准的图形用户界面,标准的数据库查询语言(SQL)以及标准的网络通信协议(TCP/IP),使系统具有良好的开放性,可以很方便地移植到不同的硬件平台和不同的数据库系统上。

●可扩展性

网络系统和服务器系统都具有良好的可扩展能力。

以多层结构替代Client/Server结构,形成真正的分布式处理系统,能够很容易地增加新的硬件产品;同时,软件的模块化结构,具有良好的可维护性,可以根据需要修改模块,增加新功能。

●可靠性

本系统是24小时连续运行系统,从硬件和软件两方面来保证系统的高可靠性。

●软件可靠性

充分考虑异常情况的处理,在出现异常情况时,给用户以提示;并具有进程监控管理功能,保证各进程的可靠运行。

●网络结构稳定性

当增加应用子系统时,应不影响系统的整体结构。

●安全性

除了操作系统提供的用户安全机制外,本系统提供自己的用户管理机制。

只有本系统的合法用户,才能够进入本系统,且不同级别的用户所拥有的操作权限不同。

同时,通过网络安全控制,防止非法访问。

1.4系统总体设计思路

在系统的软件结构设计时,我们在横向上采用软件总线支持分布式计算及数据交互,纵向上采用了如下的分层模型,以保证系统的可扩展性。

其中,应用层包括了TMN体系结构中商务管理层功能、业务管理层功能和网络层管理功能;而协议转换层和数据接口层主要完成了TMN体系结构中网络管理层与网元管理层之间的交互(包括信息的采集和控制命令的下发)。

保证系统的平滑过渡。

我们将ITU-T建议的功能模型与系统的软件结构模型有机的结合,具体设计思路如下:

系统软件结构层次

TMN中各层功能的分布

应用层

商务管理层功能

业务管理层功能

网络管理层功能

协议转换层

完成本系统与厂商网元管理系统的双向交互,包括信息采集和控制命令的下发。

处理网元管理层与网络管理层之间的协议转换

数据接口层

厂商网元管理系统

网元管理层

在具体实现中,由于横向采用软件总线方式支持分布式计算以及数据交互,纵向上采用层次化的体系结构,充分保证了系统功能的完善性、可扩展性以及负载的扩展性:

(1)当本系统对厂商网元管理系统的接口发生变化时(如厂商版本升级,或厂商数据库接口发生变化,或厂商提供了双向专用接口等),我们只需改动数据接口层的部分软件,便可以完成适配工作,而不会影响到系统的其他部分。

(2)当我们制定出标准接口后,可在协议转换层进行协议及信息的转换,然后对数据接口层做一定的修改,就可以支持统一的接口了,不需要改动系统中的其他部分。

(3)当本系统所管理的传输网络规模扩大后,信息采集的负担将大大加重,此时,可通过增加服务器数量将现有负载进行分担,就可以增强系统的吞吐量,保证对全网高效的管理。

1.5硬件及系统平台

硬件结构图如下所示,具体的硬件配置要求说明如下:

系统硬件图

1.5.1操作台配置

彩色显示器(图形总览采用大屏幕显示器,其它一般操作采用一般显示器)、键盘、鼠标、光驱、P42G以上CPU、256M内存、20G以上硬盘、带以太网接口、WIN2000或WINXP以上操作系统的PC机。

1.5.2数据库服务器

基于标准的服务器系列产品,配有单色显示器、键盘、鼠标、硬盘、光驱、磁带驱动器、以太网接口和双CPU。

1.5.3通信服务器

基于标准的服务器系列产品,配有单色显示器、键盘、鼠标、硬盘、光驱、磁带驱动器、以太网接口和单CPU。

1.5.4数据通信网(DCN)

该集中监控系统和传输设备网元管理系统之间通过本地DCN(本地九七网)互联或其它的通信模式。

1.5.5打印机

打印机连接到以太网上,为网上所有用户使用。

1.6应用软件平台

该集中监控系统的软件体系结构如下:

软件结构图

整个软件包括三部分:

接口模块、数据库应用模块、GUI应用模块。

接口模块:

在UNIX操作系统下,采用TMN开发平台;主要通过与厂家网元管理系统的互联,在第一阶段可采用数据库接口,在今后可升级为标准接口,从而实现对多厂家设备的监视和控制。

数据库应用模块:

在UNIX操作系统下,采用大型数据库,主要实现该集中监控系统各种数据的存贮和查询。

业务管理接口模块:

为业务管理功能的实现,提供相应的功能接口。

GUI应用模块:

基于PC的中文图形界面,实现对该传输网集中监控系统的特定功能,如配置管理功能,性能管理功能,故障管理功能,安全管理功能,图形网络总览

1.7系统接口技术

南京电信公司经过不断的发展建设,目前已经建立了SDH、PDH技术为基础的覆盖全市大部分地区的传输网络,主要的传输设备厂家包括华为、富士通、武邮(烽火)、NEC和少量清华华环的传输,具体的设备厂家和网管类型如下表所列:

南京传输网络资料列表

设备厂家

网管版本

操作平台

数据库

管理范围

网元数量

告警采集

性能采集

华为SDH

T2000V100R002

SUN

Sybase

中继、接入

184

可以

可以

富士通SDH

R5.21.01

SUN

Infomix

中继

586

可以

可以

武汉八型机

OTNM2000R1

SUN

接入

363

可以

可以

武汉SDH

OTNM2000R1.1

Win2000

接入

47

可以

可以

武汉五型机

OTNM2000R1.1

Win2000

接入

1950

可以

可以

富士通PDH

V1.0

Win98

Sybase

中继

320

NEC

2000V1.0

Win98

Sybase

中继

108

清华华环

V7.3

Win98

接入

34

对于传输设备厂家网管在第一阶段采用数据库采集接口的方案,其主要目的是减少在系统建设初期就和厂家之间对于接口问题的反复沟通,增加系统建设难度和成本,在条件成熟后,厂家能够承诺提供网管接口,则本系统应能够平滑过渡到厂家接口方式。

数据采集接口方案实现告警数据的实时采集,以及其它网管数据(如:

性能数据、事件记录、配置数据等)的采集。

根据厂家网管系统的区别,本系统与厂商网管系统之间的数据采集接口采用不同方式,对于朗讯、爱立信、NEC、阿尔卡特、富士通等厂家的网元管理器的告警数据采集采用数据库接口方式,从厂商网管系统的数据库中直接采集相关信息;配置数据也是采用数据库接口方式分析厂家数据库得到;性能数据采集则是通过采集进程读取厂商网管系统性能数据文件实现。

采用该方式进行采集时,厂商网管系统本身与采集机仅仅是单向的采集(厂商网管系统采集机),采集机不会影响其正常的工作。

目前针对南京电信的实际情况,大部分SDH传输设备基本可以接入,进行集中的告警和性能的监控管理,对于PDH和少量其他设备由于目前对其系统的具体情况不清楚,不能确定是否能够接入,不过如果这些系统目前已经有网管系统应用,则可通过进一步具体分析,以数据库接口方式进行集中的告警和性能管理。

系统功能

南京传输网集中监控系统的网络管理功能包括:

图形网络总览,配置管理功能、故障管理功能、性能管理功能、安全管理功能。

1.8配置管理

配置管理是通过厂家EMS收集、存储传输网中相关网络资源及其使用、分布、配置等数据,来以分层观点清晰明了地显示传输网中传输媒质层和通道层的网络拓扑结构,分级显示网络资源分布机器配置情况;基于物理设备端口的占用情况,提供调度的依据。

1.8.1配置数据的收集

SDH终端复用设备(TM)、ADM相关数据,如设备类型,设备容量和已占用状况。

DXC设备的相关数据,如设备类型,设备容量和已占用状况。

通道相关数据,如通道中电路分配情况。

对于DASCⅡ,本系统将实现终端可以通过命令获取DACSII设备的配置信息(包括交叉联接信息等),实现配置数据的采集和更新。

配线架数据,包括ODF、DDF、IDF的相关数据,如设备类型,设备容量和已占用状况。

其它相关重要数据。

1.8.2网络资源管理功能

集中监控系统对网络资源管理应至少包括以下几个方面:

网络设备的分类统计和查询;

网元配置参数的查询和显示;

通道的管理。

1.8.3关于网络资源、设备配置信息的统计和查询

网络资源的管理具体可以提供如下的报表:

光路ODF数字配线、光路配置查询表;

群路DDF数字配线、电路配置查询表;

电路路由模型表;

网络配置和子网配置报表;

系统提供对设备配置信息的查询功能,用户可以设定设备名称、设备类型、设备位置等条件,系统根据查询条件,对设备配置信息进行查询。

系统可生成报表,并可打印输出。

1.8.4通道资源控制

集中监控系统将能提供DWDM在光通道等级上通道配置预案。

集中监控系统将能提供SDH在VC12、VC3、VC4等级上通道配置预案。

集中监控系统支持在各种各样的电路结构上开通电路,如环形、链形、环到环、点到点及环到链等拓扑结构。

1.8.5状态控制

集中监控系统将记录建立的通道所承载业务类型及电路编号,还允许用户根据业务类型或电路编号查询所使用的通道情况。

集中监控系统状态控制功能是根据用户需求,对网络管理资源状态进行查询和设置、修改等控制。

集中监控系统状态控制功能包括以下几个方面:

能查询网络资源状态。

能按指定状态查询网络资源。

能修改相关网络资源状态。

当网络资源状态发生变化时,EMS在检测到网络通道和设备使用状态变化后,集中监控系统提供同步功能。

对于传输设备,一期采用以远程登录的方式从本系统登录至厂商网管系统,完成对设备的配置操作。

以后应逐步过渡到分析厂商网管接口协议及格式,通过上行接口实现对设备的控制操作。

对于DASCⅡ,本系统实现终端的信息收集功能,可以完成电路的交叉配置数据的收集,针对指定的DACSII设备,将显示其时隙的交叉情况及资源使用状态,显示操作指令及参数列表,根据用户选择,形成相应的命令,对DACSII设备进行操作,并将返回信息按格式输出。

1.9故障管理

故障管理功能以对网络设备和电路的监视为核心,包括对告警数据的采集、存储,对不同厂商告警格式的统一,在图形界面上显示告警,对告警进行相关性处理,确定告警发生地的管理范畴归属等功能;故障管理功能,要受到用户权限的约束。

1.9.1告警信息的收集

综合系统应能够收集如下方面的告警信息:

SDH传输物理接口

再生段

复用段

高阶通道虚容器

低阶虚容器

目前对传输网元设备,采用由采集机读取厂商网管系统数据库或网管系统对外信息完成数据采集;在基本实现管理维护需要的基础上,应逐步过渡到分析厂商网管接口协议及格式,通过上行接口实现告警实时上报。

对附属设备DACSII告警,由采集机通过串口接收附属设备的数据流,提取告警信息,并由集中维护管理系统进行统一处理。

告警信息的存储、处理

集中监控系统将接收到的所有告警,统一成X.733格式(包括告警名称如干线名称等、告警类型、告警原因、告警级别等),存入相应数据库,以备查询、统计。

告警信息在集中监控系统告警中的存储时间可按用户要求进行设置,集中监控系统可允许用户修改存储时间门限,当所存储的告警信息超出门限值时系统将进行数据备份和清理。

系统对于历史告警信息应能够保存三个月,并可做外部系统备份。

收集各类传输设备和线路的告警信息,以便对全网故障进行综合分析和判断。

对不必要的、重复的告警进行过滤,以保证告警的有效性、准确性。

对正在维修的设备和电路进行告警屏蔽设置,以过滤大量无意义的告警。

用户可以根据日常维护的需要,以发生告警的电路群次高低、电路的重要等级、告警的类型等因素重新设定电路告警级别。

集中监控系统的告警存储可按下述几种情况指定告警过滤条件:

按告警类别指定

按告警级别指定

符合过滤条件才向集中监控系统上报。

1.9.2告警关联和故障定位

当某网元产生告警时,会引起相关网元产生大量的告警,而这些告警之间存在着必然的联系,此时应对这些告警进行告警关联,判断哪些是主要告警、哪些是由此引起的次要告警,并将主要告警上报,而屏蔽掉次要告警,使用户不需要面对大量无意义的告警,使告警的管理工作效率提高。

根据网元告警及网元与电路的对应关系,进行跨干线电路告警映射,判断产生故障的设备或电路,实现故障分析和定位,为故障处理和调度提供依据。

集中监控系统能结合管理资源库中的管理资源信息,对从EMS收集到的告警信息进行相关性分析处理后,将网络故障尽可能地定位到网络节点或链路上,并能提示集中监控系统用户该网络故障会影响哪些传输通道。

故障定位后,集中监控系统能在网络拓扑图上显示故障具体位置,并能以文本方式显示故障详细信息。

对STM1、STM4、STM16、VC11、VC12、VC3、VC4之间的告警故障能够准确定位。

1.9.3告警确认

集中监控系统要求用户在界面上对所有从EMS接收到但未确认的告警进行确认,产生告警确认的时间。

1.9.4当前历史告警查询和统计

提供告警查询功能,可根据用户设置的条件对当前告警、历史告警进行查询。

根据查询结果对告警进行统计,并将结果以表格方式显示或打印。

对网元告警查询的条件如下,分别按网元名、局站名、干线名、网元类型、告警类型、告警级别、告警状态、告警产生/结束时间等。

对电路告警查询的条件如下,分别按电路名、电路起止点、电路速率、承载业务类型、告警类型、告警级别、告警状态、告警产生/结束时间等。

集中监控系统能按要求进行告警电路列表统计、全网重大故障列表统计等。

1.9.5其它功能

提供一个可互联的接口,可与其它专业类型网管系统如交换网管系统互连,实现对相关2M等电路的告警相关性管理。

1.10性能管理

性能管理功能提供对全网运行状况的评估,可以判定全网的运行质量和运行效率,也可以判定特定电路的运营情况,并且可以根据一段时间内的性能数据作出趋势分析,使运维工作更加高效的进行。

1.10.1性能数据的收集

集中监控系统能收集和监视如下通道层性能参数的性能数据:

误块秒(ES)

严重误码秒(SES)

不可用秒(UAS)

背景误码块(BBE)

码违例(CV)

指针调整计数(AUPJE)

线路保护倒换持续时间(PSD)

集中监控系统将按以下两种方式来收集传输网中的性能数据:

定期上报或请求上报。

15分钟的性能数据、或24小时的性能数据、七天或自定义的数据。

1.10.2性能数据的存储

对15分钟和24小时性能数据进行存储,要求15分钟性能数据保存至少七天,24小时性能数据保存至少三个月。

集中监控系统从EMS收集到的性能数据可在性能数据库中保留特定长时间后,可备份到外围设备中。

1.10.3性能查询

用户可以设置时间段、被监测的网元、性能监测点、性能数据类型和性能参数类型等查询条件,查询历史性能数据,产生的性能统计报告。

系统可以文字或图形方式显示此性能统计报告。

用户可以将所选定的历史性能统计报告打印输出。

1.10.4性能分析

集中监控系统可根据收集到的性能数据按一定算法进行分析和处理,以此来反映传输网中有关通道、复用段或再生段的性能质量。

具体的性能质量描述应采用恰当的形式,如表格方式或直方图方式。

还可对网络运行的性能质量或性能趋势进行分析。

综合考虑电路告警和电路传输性能数据,以评估电路质量、减少电路的故障时间。

性能分析统计可提供下面的报表功能:

数字电路合格率统计表

电路可用率统计表

集中监控系统将通过长期的网络性能质量评估结果,进行综合分析,来推断某个通道、复用段或再生段的性能发展趋势。

监测设备的实时故障,对设备的障碍进行统计,实现对设备故障突发性的预测。

为了网络的优化及对网络优化工作的评估,可提供如下的功能:

跨多节点电路统计列表

跨其它类型设备电路统计列表

跨多节点电路门限设置

1.10.5性能管理控制

集中监控系统将能通过EMS设置、修改或删除某一个监视实体或多个监视实体向集中监控系统上报性能数据的上报周期。

EMS依据集中监控系统设置的上报周期,定期地将集中监控系统指定的性能数据上报给集中监控系统。

集中监控系统将能通过EMS查询某一个监视实体或多个监视实体向集中监控系统上报性能数据的上报周期。

集中监控系统将能通过EMS查询、设置、修改、删除某一个监视实体或多个监视实体性能参数门限值的当前设置情况。

1.11安全管理

安全管理功能提供网管系统能够正常、安全、可靠运行的保障手段。

本系统应提供用户分级和管理范围分区两种权限限制机制,可以灵活、合理的对系统的使用者进行管理。

1.11.1用户权限的划分

设置四个等级的分级管理,相应的操作管理员也分为四个等级,高级别的操作管理员可拥有低级别的功能和控制权限。

对访问集中监控系统的用户进行安全性检查,防止未授权用户进入集中监控系统。

系统管理员级:

负责对传输设备的全面管理。

可进行网络控制调度,各级用户口令设置,增减、修改或删除用户及日志管理和进行安全管理等操作。

系统维护员级:

负责传输系统的日常维护工作。

可进行告警等级的修改或设置,可访问备份管理信息库中的数据等。

设备维护员级:

负责通道和电路的维护。

可以新建或拆除通道及电路的配置和日常维护操作以及可进行告警处理和故障查找定位等。

系统监视员级(只读用户):

负责监视系统的告警,只有观察浏览权限。

当操作员进入某一层菜单时,系统应根据操作员的权限级别检查本层菜单相关的功能操作权限,允许操作员进入的菜单以正常方式显示,没有操作权限的菜单项以减低灰度的方式显示。

1.11.2管理域的划分

系统应提供灵活的分区管理的机制,系统管理员可以以电路或地理位置为单位,灵活的划分管理区域,每一个管理区域内包含若干电路以及这些电路所占用的物理设备。

当用户被指定管理某一个区域时,此用户所有的管理操作功能都被限制在此范围内进行,即使是实时监视告警,也只能接收到此管理域范围内发生的告警(但对于管理域范围外的告警,可以根据权限选择查询,以便分析故障原因和位置)。

建立管理域。

系统管理员可以以电路为单位,灵活地划分管理域,并为管理域命名;这些电路所占用的物理设备自动地归入此管理域中,不同管理域的管理范围可以重叠;也可按网元(如某一机房内的所有网元)划分管理域,该管理域内的所有网元均由拥有该管理域的用户维护。

修改管理域。

系统管理员可以对某一个管理域的管理范围进行修改,增加或减少一些电路,被这些电路占用的网元也随之增加或减少,拥有此管理域的用户的权限也随之改变。

删除管理域。

系统管理员可以将某一个管理域删除,拥有此管理域的用户的权限也随之改变。

查看管理域。

系统管理员可以查看某个管理域的管理范围及其描述信息。

1.11.3用户管理

建立用户。

系统管理员可以增加操作员并赋予相应的权限,用户基本信息包括:

用户标识、用户名、用户时效、用户口令、口令时效、用户级别、管理域名称、用户状态、描述。

用户状态分为有效用户、当前用户和挂起用户。

查看用户信息。

系统管理员可以查看其他用户的信息;普通用户只能查看自己的信息,不能查看口令。

修改用户信息。

系统管理员可以修改所有用户除用户标识之外的信息。

删除用户。

系统管理员可以根据需要减少进入系统操作的用户数。

1.11.4系统日志的管理

用户的登录和所有操作将写入系统日志,由系统自动维护;任何用户不得对系统日志执行删除和修改操作。

对重要命令,网元仿真终端命令、远程登录命令和操作系统仿真命令将记录。

一般操作命令,记录。

系统管理员可以查看系统日志中的信息,包括各个用户的登录和操作信息。

系统日志以列表的方式显示给用户。

根据用户的查询条件,可将符合条件的信息打印输出。

1.11.5防止非法进入和操作

通过口令核查防止一切XX的人进入系统;通过权限核查防止未授权的操作。

口令核查:

在用户登陆时,检查其用户名和口令是否匹配、有效。

当一定次数的用户登录失败时,随即将此用户状态置为挂起用户,需由系统管理员恢复其用户状态。

权限核查:

在用户进行管理操作以及对数据库访问时,检查其是否拥有此种操作的权限。

1.11.6其它功能

对集中监控系统网络自身的状态进行监视,对系统的资源、人员和例常操作进行管理。

不安全因素的检测功能用于发现网管系统中安全性方面的漏洞,包括用户无授权访问、用户误操作、数据毁坏等方面。

集中监控系统具有一定保护和恢复措施用来修复由于用户非法入侵、用户误操作或病毒造成安全性方面的破坏。

2.面向大客户SLA服务的2M端到端测试系统

此系统是中国电信北京研究院推出的一套面向大客户SLA服务的2M端到端测试系统,与上述监控系统并无直接联系,是一套独立的系统。

它可以作为解决SLA管理系统数据支持的后备方案,或作为前面所述方案的一个补充。

此系统的优点是不依赖现有的传输网元管理系统,而是在客户端和中央网络内分别安装测试仪器,构成2M端到端数字电路测试系统,生成符合SLA的测试电路运行分析报告。

2.12M端到端测试系统构成

面向大客户SLA服务的2M端到端测试系统由三部分构成:

1.连接在用户机房ODF/DDF架外侧的用户端测试系列设备CT40;

2.布放在网络内的中央监测设备CT100和探针CT100P;

3.测试管理系统MCMS。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 调查报告

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1