电信IDC业务网管系统规范.docx
《电信IDC业务网管系统规范.docx》由会员分享,可在线阅读,更多相关《电信IDC业务网管系统规范.docx(59页珍藏版)》请在冰豆网上搜索。
电信IDC业务网管系统规范
电信集团IDC业务网管系统规范
1前言
互联网数据中心(InternetDataCenter,IDC)(以下简称IDC)是中国电信依托电信级机房设
备、高质量的网络资源、系统化的监控手段、专业化的技术支撑,为客户提供标准机房环境、持
续安全供电、高速网络接入、优质运行指标的设备托管以及相关增值服务,并向客户收取相应费
用的一项业务。
目前,中国电信全网拥有数十万IDC用户,且存在大量的潜在客户,还有代理商,批发商
等多种合作伙伴,但落后的维护管理手段已经成为IDC业务发展的瓶颈,不利于IDC平台运行
维护的规范化管理。
因此,中国电信急需实现全网IDC维护管理手段的规范化,确保IDC网络
设备、主机系统、应用平台等安全可靠的运行,从而为客户提供更加优质的IDC增值服务,以
及针对VIP用户的个性化运维订制服务。
实现中国电信全网IDC网络维护管理工作的规范化,不但能改善目前全网IDC业务网管系
统、本地安防和动环监控系统等能力上的差异性,而且能增强集团公司对全网IDC业务系统整
体运行情况的管控能力,从而全面提高中国电信整体IDC业务维护管理工作的信息化水平,使
中国电信IDC业务具有更强的市场竞争力。
本规范在此背景下提出,并在中国电信集团公司各相关单位、部门的积极指导配合下,重点
结合了部分省、市现有IDC综合网管系统功能,提出了中国电信省级IDC业务网管系统、本地
安防和动环监控等系统建设的相关技术要求,以期指导全国各省级IDC业务网管系统、本地安
防与动环监控等系统开发和工程建设工作。
-9-
2适用范围
省级IDC业务网管系统,本地安防及动环监控系统主要用于中国电信各省级IDC维护管理
人员对省内所有星级IDC机房的网元设备、基础设施及业务(产品)运行质量等情况的监控与
管理。
本规范所述内容适用于对中国电信省级星级IDC机房业务网管系统,本地安防与动环监控
等系统的工程建设要求。
本规范所述面向客户的各类维护管理服务要求,适用于集团IDC资源管理系统管辖范围内
的客户群。
本规范可作为省级IDC业务网管系统,本地安防与动环监控等系统工程的招标、建设及验
收等工作的规范性指导文件。
3名词与术语
名词英文全称中文全称
APNICAsia-PacificNetworkInformationCenter亚太互联网络信息中心
ASAutonomousSystem自治域
B/SBrowser/Server浏览器/服务器结构
C/SClient/Server客户机/服务器结构
DdoSDistributedDenialofService分布式拒绝服务
DNSDomainNameSystem域名管理系统
IDCInternetDataCenter互联网数据中心
KVMKeyboardVideoMouse键盘、显示器、鼠标
RADIUSRemoteAuthenticationDialInUserService远程用户拨号认证系统
SNMPSimpleNetworkManagementProtocol简单网络管理协议
SOCSecurityOperationCenter网络安全平台
SPServiceProvider服务供应商
TACACSTerminalAccessControllerAccess-ControlSystem终端访问控制器访问控制系统
4参考资料
[1]中国电信IDC产品规范(中国电信【2005】658号),2005
[2]中国电信IDC综合运营支撑系统需求规格说明书,2011
[3]中国电信能耗管理平台(省级)业务规范(暂行稿);中国电信能耗监测管理系统(省
级)建设指导意见(暂行稿)(中国电信【2011】434号),2011
[4]企业资源管理平台功能需要(试行)(工信电管函【2010】589)
[5]电信信息系统机房设计规范,GB50174-2008
[6]中国电信网络安全管理平台推广和建设指导意见,2009
[7]中国电信2010年IDC星级机房评定标准,2010
[8]中国电信IDC机房设计规范(送审稿),2010
[9]中国电信数据中心机房电源、空调环境设计规范(暂行),DXJS1006-2005
[10]中国电信集团IP地址管理系统WebService实时接口规范,2010
5总体要求
5.1整体架构
中国电信IDC业务网管系统采用集团-省两级架构。
第一级为省级IDC业务网管系统;第二
级为集团级IDC综合网管。
省级IDC业务网管系统位于省层面,以省为单位集中建设,主要负责省内所有星级IDC机
房的IP网络流量流向、业务/产品质量管理,以及IDC机房内主机设备(含自有和托管)、网络
设备及IT配套系统等运行情况的监控与分析,重点监控省内星级IDC机房的上联路由器,汇聚
层/接入层交换机等网络设备的IP流量、流向等关键参数;集团级IDC综合网管系统,位于集团
层面,全网统一建设。
本地IDC机房安防和动环监控系统位于本地网层面,以本地网为单位建设。
本地安防系统主
要提供省内星级IDC机房的门禁控制、关键位臵、VIP空间、机架、机位等的视频监控,以及
网络攻击和机房违约进入的告警等;动环监控主要提供省内星级IDC机房内的电源动力系统、
温湿度环境和系统能耗情况的监控与管理等。
另外,集团IDC网管系统定期向中国电信集团IP地址管理系统更新所有星级IDC机房管辖
范围内的所属设备IP地址分配及使用情况。
接口应满足《中国电信集团IP地址管理系统
WebService实时接口规范》要求。
5.2与外部系统的关系
省级IDC业务网管系统、本地安防系统及动环监控系统在网络中的位臵及与外部系统的关
系如下图所示。
省级IDC业务网管系统针对集团级IDC综合网管系统主要提供以下三类接口:
1)向集团级
IDC综合网管系统提供省级大客户IP网络流量流向采集数据接口;2)与集团IDC综合系统的
资源数据自动核对接口(集团IDC资源管理系统发起);3)与集团IDC综合网管系统的服务自
动激活接口(集团服务开通系统发起)。
另外,省级IDC网管系统与省级故障管控系统提供数据告警接口,将省内IDC机房的故障
告警纳入省及集团综合故障管控体系。
5.2.1与省IP城域网网管系统的关系
省级IDC业务网管系统主要提供面向客户级的IP网络流量流向统计与分析,负责省内IDC
星级机房内汇聚层/接入层交换机、汇聚层路由器等网络设备的IP流量流向监控与分析;IP城域
网网管系统主要负责IDC汇聚层核心路由器上联城域网的端口流量和设备性能监控与分析,其
新增的IDC流量流向分析能力主要面向大网,以大网的流量流向预测、分析和优化为目的。
如图3所示,IP城域网网管系统的流量流向管理以IDC机房核心/汇聚路由器上联端口为界,
IDC机房内部网络设备与客户网络管理的IP流量流向统计与分析,及直挂IP骨干网的五、四星
级IDC机房IP网络流量流向分析需求由IDC综合网管实现。
系统建设过程中要求,若省内IDC机房已有IP流量流向采集分析系统,则相关功能建议在
现有系统中升级实现。
同时,要求省级IDC业务网管系统预留北向数据接口,以便向集团级IDC
综合网管系统提供IDC大客户面向业务的IP流量流向分析数据。
5.2.2与省级SOC系统的关系
关于省内IDC星级机房的异常流量、异常端口的监控要求,建议已完成省级SOC系统建设
的省份,优先考虑在本省SOC系统中以新增软件模块方式实现。
5.2.3与省级综合故障管控系统的关系
对于省级IDC业务网管系统检测到的重大故障(具体定义见6.2.3节),要求在向省级故障管
控系统申告的同时,需同步向集团级IDC综合网管系统进行告警。
5.2.4与集团IDC资源管理系统的关系
为保持全网IDC系统资源数据的一致性,要求省级IDC业务网管系统应具备执行集团IDC
资源管理系统发起的,并经由集团级IDC网管系统下发的IDC资源数据自动核对的接口指令,
省级IDC业务网管系统应将资源数据核对结果经集团级IDC网管系统自动反馈回集团级IDC资
源管理系统进行校对。
5.3建设目标
5.3.1远期目标
省级IDC业务网管系统应能实现对省内星级IDC机房的IP网络流量流向管理与分析、业务/
产品质量管理与分析,以及省内星级IDC机房内主机设备(含电信自有、用户托管或代维等)、
网络设备及配套IT设备的故障监控与告警、设备信息管理、以及动态网络拓扑管理和用户权限
管理等能力。
同时,省级IDC业务网管系统应具备面向大客户的电信IDC基础及增值业务的演示能力,并
-16-
具备向集团级IDC综合网管系统提供IDC大客户面向业务的IP网络流量流向分析数据的能力,
能与集团级IDC资源管理系统的数据进行同步,并最终与集团综合服务开通系统和自动激活等
系统完成端到端业务流程的贯通,实现跨省IDC业务的自动开通与激活。
本地安防系统、动环监控系统在满足对省内所有星级IDC机房的日常维护管理需求基础上,
能以“业务为导向”,提供面向客户需求的安防、动环监控订制服务。
针对五星级机房,能实现
分区门禁权限设臵,并与视频监控、入侵告警等进行联网,提供可听、可视的实时综合安全防范
服务。
本地动环监控系统能针对VIP客户需求,向其提供面向VIP空间、机架、机位等以用户
为单位的动力、能耗监控服务。
5.3.2近期目标
中国电信省级IDC业务网管系统建设可按IDC星级机房标准分阶段逐步完善。
现阶段,为配
合2011年中国电信IDC专项整改工作,要求2011年9月底前,系统将省内三星级以上IDC机
房的IP网络流量流向分析与管理能力纳入系统管理范畴。
关于高宽带用户的非常规接入中国电
信Chinanet的行为监测由其它相关IP网络分析系统实现,不在本系统中考虑。
在完成省内三星级以上IDC机房的IP流量流向管理功能基础上,各省应逐步完成IDC运营
支撑管理、IDC设备故障管理、设备信息管理、性能管理、网络拓扑管理、业务/产品质量管理
等要求,并将省级IDC业务网管系统的管辖范围从三星级以上IDC机房逐步延伸至省内所有星
级IDC机房。
对于本地安防系统、动环监控系统应能以本地网为单位,实现对本地网内所有IDC星级机房
的门禁、动力、环境与能耗等集中监控与服务。
在满足IDC机房日常维护管理的基本需求基础
上,逐步完成面向客户的运维服务能力改造,支持以“用户为单位”的安防、动环监控等个性化
服务订制。
-17-
5.4建设原则
5.4.1省级IDC业务网管系统的建设原则
5.4.1.1客户为导向
省级IDC业务网管系统,一方面,应以提升中国电信内部IDC维护管理水平为目标,另一方
面,更应侧重以“客户为导向”的维护支撑系统建设思路,系统应能以客户为粒度,提供面向客
户的维护管理支撑手段,满足VIP客户的个性化IDC运营维护管理需求,其中VIP客户仅限于
集团IDC资源管理系统管辖范围内的客户。
根据客户需求,提供用户网内的流量流向统计,监控用户被访问设备的业务流量流向数据。
通过在有需求的用户设备侧部署流量流向采集探针,打开流量流向统计功能等方式,实现面向用
户设备的流量流向统计监控,包括P2P流量、Mail、Web以及特殊端口的流量流向监控等服务。
5.4.1.2充分利旧
1)“IP网络流量流向分析模块”的建设原则
a)IDC机房IP网络流量流向分析能力为省级IDC业务网管系统的必选能力。
要求各地根
据业务需求,以省为单位部署网络层流量流向分析功能软件,以本地网为单位部署流量流向探针。
b)对四、五星级IDC机房,要求应能根据客户需求部署网络层流量流向分析系统,对三
星级及以下IDC机房不做强制要求。
c)对四、五星级IDC机房,要求应能根据客户需求部署探针系统,对三星级及以下IDC
机房不做强制要求。
d)若各省已经采购了可提供网络层流量流向数据的相关采集系统,且在采集性能有足够
余量的情况下,请各省充分利旧,将其用于实现省级IDC机房的IP网络流量流向分析功能。
对
于尚不具备部署网络层流量流向专业分析软件功能的省公司,建议整改期内,可以SNMP方式
进行过渡,实现流量流向统计分析的基本要求。
-18-
e)要求省级IDC业务网管系统为集团级IDC综合网管系统预留北向数据接口,配合2012
年集团级IDC综合网管的系统建设工作。
2)“异常流量和异常端口检测模块”的建设原则
已经完成省级SOC系统建设的省公司,优先考虑基于省SOC系统提供省内IDC机房异常
端口、异常流量的检测功能。
5.4.1.3分省接入
要求省级IDC业务网管系统在检测到的四星、五星级IDC机房重大告警在向省综合故障申告
系统申诉的同时,需同步向集团级IDC综合网管系统发送故障告警信息(具体要求参见本文6.2.3
节)。
5.4.2本地IDC机房安防系统、动环监控系统建设原则
1)建设模式
智能门禁、视频监控等安防系统以本地网为单位建设。
新建IDC星级机房的动环监控系统
以本地网为单位建设,能耗监控系统原则上以省为单位集中建设,已有相关系统的老机房维持现
状。
2)规范与标准
IDC机房基础设施监控系统(安防系统、动环监控系统等)建设,建议参考行业规范进行建
设,能耗监控系统建设参考《中国电信能耗监测管理系统(省级)建设指导意见(暂行稿)》,《中
国电信能耗管理平台(省级)业务规范(暂行稿)》及集团相关发文。
6IDC业务网管系统功能要求
6.1运营支撑管理
系统应提供对IDC机房各项业务的运营支撑能力,实现日常运营的自动化集中管理。
6.1.1作业计划管理
作业计划是按事先所定的维护检查项目、周期,结合各类设备的实际情况,提前作好的周期
性维护工作安排。
作业计划的管理主要面向作业计划的制定、发布与监控。
1)系统应提供作业计划的模板工具:
例如“业务类型”、“作业项目”、“执行周期”、“执行单位
级别”、“记录模板”、“适用说明”、“执行人”等信息;
2)系统中的作业计划分类应包括“周期性作业计划”和“非周期性作业计划”,其中“周期性作业
计划”又可按其周期长短进一步分类;
3)系统应提供作业计划的制定功能:
包括作业计划模板填写,确认作业计划的具体内容、流
水号、作业时间、操作人员等;
4)系统应支持作业计划的分发功能:
将制订的作业计划通知相关的维护或管理人员。
为确保
计划的及时到达,系统应具有短信或MAIL通知方式和作业计划收到确认机制;
5)系统应支持对作业计划的执行记录:
执行人员对分发给自己的作业计划按时执行。
同时,
系统应能对计划执行的每个流程记录在案,完成相关的作业日志,实现对作业计划的跟
踪和实时监督;
6)系统应支持作业计划的查询:
运维人员可以查询最近与自己相关的作业计划,如已提交的
任务、正在执行的任务、等待审批的任务、已完成的任务,以及每月、周、日要执行的
周期性任务,并查看任务的具体完成状态、结果和详细执行日志;
7)系统应支持作业计划的评价和审批:
系统可自动对按期执行的作业任务标记为“合格”,对
未能按期完成的任务,由执行人说明原因,报请领导审核,由领导对该作业计划的执行
进行最终评定,标记为“合格”或“不合格”;
8)系统应支持作业计划的导出:
系统应支持将某时间段内的所有作业计划以EXCEL文件形
式导出,以供查询与打印。
6.1.2自动巡检
自动巡检主要实现巡检数据的自动采集、处理、展示、报警等功能,是系统自
动执行的一种周期性作业计划,实现IDC机房运营的自动化支撑管理。
1)自动巡检作业计划制定功能:
系统能根据用户要求制定相应的巡检作业计
划,并按要求执行自动巡检任务。
自动巡检定时反馈的结果,由系统进行
相应汇总、分析后在查询界面内呈现;
2)自动巡检任务配臵与管理功能:
系统需提供对于巡检任务的配臵和管理功
能,只有对自动巡检任务涉及的各模块进行配臵后才能供作业计划调度使
用;
3)系统提供的自动巡检功能模块,至少应包括资源管理、模板管理、元任务管
理、采集任务管理、采集调度管理、采集探针管理、统计报表等;
6.1.3自动故障告警
系统应能针对客户等级及业务需求,向用户发出的自动故障告警。
在发生故障时,可根据告警级别及对业务的影响程度,分别为用户提供不同手段的通知,如:
短信、Email、页面提示等。
自动故障告警应提供以下功能:
1)根据用户的告警归并:
系统提供以用户视角出发进行的自动故障告警归并,便于IDC机房
在用户维度上实现对故障告警的管理;
2)告警的级别设臵:
系统能按客户要求或根据告警对业务的影响程度,对告警级别进行分类,
并根据告警级别分别为用户提供短信、Email、页面提示等多种告警进行通知;
3)告警的查询与管理:
系统应能面向客户,提供对各类故障告警的查看功能,并可根据故障
的不同状态、不同设备、不同业务应用进行分类展示。
4)报警应急响应:
可预先定义报警联动策略。
当某种类型的故障产生时,自动的触发策略以
相应动作,包括启动或停止进程、服务或应用程序及用户指定的脚本程序,对计算机操
作系统进行关闭、重启等操作。
6.2设备故障管理要求
系统应对所有星级IDC机房被管理的网络设备、电路和主机等各种资源提供统一的故障管理
功能。
系统应能通过使用分类的数据采集、高效的告警压缩、关联分析和分级数据展现等技术,
最终将精简、有效的故障信息以多种方式及时地呈现给用户。
当发生故障时,系统应通过使用分类的数据采集、统一的处理规则和分级的数据展现最终将
实时更新的故障信息以多种方式及时呈现给用户,并可按不同方式进行通知。
系统集中存储告警
事件,根据告警状态提供活动告警库和历史告警库,并支持对历史告警进行查询和统计分析。
对于五星级IDC机房,要求系统能将故障管理子系统与网络拓扑管理子系统相互结合,实现
告警事件的根源故障分析与定位,而且应能与资源、客户信息结合,分析故障所影响的客户和服
务信息。
五星级以下IDC机房综合网管系统不做强制要求。
6.2.1端口异常监控
省级IDC业务网管系统(或省级SOC系统),应能对所有星级IDC机房接入交换机设备支持
以下几种方式的自动端口状态监控能力:
1)对交换机的端口进行定期扫描,获取端口的当前状态。
系统把获取的状态与交换机登记
的端口状态进行对比,如状态不匹配则发出告警,通知管理员端口使用异常;
2)监控交换机接入端口的流量信息。
当登记未使用的端口有流量发生时则发出告警,也可
对使用中的端口设臵流量告警阈值,当流量超过阈值时发出告警;
3)能通过对监控设备的syslog或SNMPtrap上报的端口变化信息,获得接入设备的数据和
端口状态,与系统数据进行比对,发现不一致后能在系统中产生告警。
-22-
6.2.2故障信息集成
要求系统具备与第三方系统(例如,省级SOC系统、网站内容拨测系统、ICP备案系统或业
务检测等系统)的故障信息集成能力,能根据外部系统中检测并传递过来异常IP地址或URL等
信息,进行准确的业务故障定位,并产生相关告警。
6.2.3故障上报
系统检测到省内四星、五星级IDC机房因主机设备、网络设备和IT设备失效或电路中断等
原因造成的IDC机房服务中断的以下三类故障,在向省故障管控系统进行告警的同时,必须通
过北向数据接口,向集团级IDC综合网管系统报告故障。
四星级以下IDC机房综合网管系统不
做强制要求。
1)一级故障
a)五星级机房发生全部服务器阻断10分钟以上的。
b)四星机房发生全部服务器阻断30分钟以上的。
2)二级故障
a)五星级机房发生50%以上服务器阻断10分钟以上的。
b)四星级机房发生50%以上服务器阻断30分钟以上的。
3)三级故障
a)五星级机房发生10%以上服务器阻断10分钟以上的。
b)四星级机房发生10%以上服务器阻断30分钟以上的。
6.2.4异常及告警的展现
系统应对具备所有星级IDC机房被监控设备的异常告警展现能力,要求告警信息能与客户信
息相关联,并在通过短信、邮件等方式告警时,能直接显示企业名称等主要客户信息。
1)界面展现
在资源拓扑中应能以不同颜色展现不同级别的告警;
2)声音提醒
-23-
通过管理员配臵,系统应能根据故障级别发出不同声音的告警提醒;
3)Email提醒
系统应能通过Email方式将异常及告警发送给事先设臵的联系人,并在Email中
给出详细故障信息;
4)短信提醒
系统能通过手机短信方式将异常及告警信息发给事先设臵的联系人,并给出异常
及告警的简要信息。
5)故障关联分析
系统应具备故障相关的关联分析能力。
6.2.5异常及告警的处理
有条件的省公司,可将省级IDC业务网管系统与省级综合故障工单系统相结合,将异常及告
警的处理交由省综合故障工单处理流程来完成,同时省级IDC业务网管系统应能对工单状态进
行跟踪查询,要求工单的处理结果能反馈到本综合网管系统中。
6.3设备信息管理要求
系统应支持从集团级IDC资源管理系统等外部系统中批量导入被管设备基础信息数据的能
力,包括主机/小型机、防火墙、交换机/HUB、磁盘阵列等设备的IP地址、端口编码、在用状态
和网络设备的端口类型、配臵速率、端口状态、MAC地址等基础信息,并能支持通过手动或按
照设定的间隔自动轮询方式自动获取主机设备、网络设备等资源的当前详细信息。
系统应能根据用户配臵的星级IDC机房设备访问信息(如IP地址、snmpcommunity等),按
定义的采集周期,以SNMPPolling等多种方式自动获取网络上不同厂家、不同类型设备(如路
由器,交换机,主机等)的详细配臵信息,并与上次采集的信息进行自动比较,提供比较信息的
手动与自动更新功能。
同时,还应提供设备信息的手动触发即时采集功能。
-24-
6.3.1网络设备管理
系统应能对所有星级IDC机房的路由器、L3/L2交换机、防火墙等网络设备基本信息,提供
自动获取、手工辅助录入两种信息录入方式。
需要采集的网络设备信息包括:
OS、机架/机框/
机槽信息、板卡、端口和所在机房、历史连接时长等详细信息,并提供查询、统计功能。
同时,
能应能对选定的目标网络设备进行PING和SNMP测试,以了解该设备的可达性和可管性。
设备管理获取的主要网络设备信息包括:
1)基本信息:
设备名称、设备类型、OS版本、机架类型、机架版本、RAM等;
2)机架/机框/机槽信息:
编号、类型、是否占用、所插板卡等;
3)板卡信息:
板卡索引号、硬件版本号、板卡序列号、槽位数、板卡类型、操作状态、板卡
描述等;
4)物理/逻辑端口信息:
端口索引号、板卡索引号、端口名称、端口描述、端口带宽、IP地址、
子网掩码、管理状态、协议状态等。
6.3.2主机管理
系统应能对