IT网络运维实施方案.docx

上传人:b****1 文档编号:1843063 上传时间:2022-10-24 格式:DOCX 页数:26 大小:1.62MB
下载 相关 举报
IT网络运维实施方案.docx_第1页
第1页 / 共26页
IT网络运维实施方案.docx_第2页
第2页 / 共26页
IT网络运维实施方案.docx_第3页
第3页 / 共26页
IT网络运维实施方案.docx_第4页
第4页 / 共26页
IT网络运维实施方案.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

IT网络运维实施方案.docx

《IT网络运维实施方案.docx》由会员分享,可在线阅读,更多相关《IT网络运维实施方案.docx(26页珍藏版)》请在冰豆网上搜索。

IT网络运维实施方案.docx

IT网络运维实施方案

IT网络运维实施方案

 

(此文档为word格式,下载后您可任意修改编辑!

 

某某IT运维系统技术要求

1软件系统技术要求

软件要求采用组件化、平台化的开发与集成模式,充分考虑系统的稳定性、安全性、开放性及可扩展性。

系统要求采用业界先进、成熟的软件开发技术,采用等开发语言,系统采用B/S(C/S)架构。

软件设计严格执行国家有关软件工程的标准,基于ITIL,符合ISO20000体系要求,提供完整、准确、详细的开发文档资料。

应用系统授权方便、数据库登录用户权限、有完善备份功能、有完备的恢复功能、提供数据修改全程监控、提供错误日志、提供系统运行日志。

所有系统能够在同一界面,设备管理,设备运行监控、环境监控及运维管理

在线运行设备管理一般包括在用管理、质量管理、计量管理、效率分析、档案管理、维修记录、保养记录等动态管理,基本功能应支持设备基本信息维护,故障受理和维修单可通过多种方式(网络、短信、电话等方式),设备维修情况录入,设备购置分类检索查询、统计、汇总打印功能

2.网络监控系统要求及主要功能

2.1要求:

名称

要求

功能

电信级的应用系统监控、业务运维管理系统

服务器及应用监控

厂家需提供开放平台(透明的库数据及开放的接口),定制时采取联合开发方式,由厂家根据用户需求指导和协助用户进行二次开发直到实现用户需求。

操作系统管理:

提供对常见操作系统的监控管理,包括Windows、AIX、IBMAS400/iSeries、FreeBSD/OpenBSD、HP-UX/Tru64、Linux、MacOS、SunSolaris

数据库管理:

提供对常见数据库服务器的监控管理,包括MySQL、Oracle、MSSQL、IBMDB2、Sybase

应用管理:

提供对常见应用服务器的监控管理,包括微软.NET、GlassFish、Jboss、OracleAS、SilverStream、Tomcat、WebLogic、WebSphere、Domino系统

中间件管理:

提供对常见中间件服务器的监控管理,包括OfficeSharePoint、WebLogicIntegration、WebSphereMQ、Tuxedo

Web管理:

提供对常见Web服务器和HTTPURL的监控管理,包括Apache、IIS、PHP和Web服务,支持URL/多个URL的监视和录制

其他业务管理:

提供对其他应用的监控管理,包括SAP、AD/LDAP、Ping、Telnet、SNMP、DNS、FTP/SFTP、文件服务、网络接口等

无监控代理:

除特殊指标外,一般不需要在被管理应用所在的服务器上安装监控代理,避免对业务系统造成影响

报表管理:

具备报表功能,可以生成多种基于业务的分组报表,提供日报、周报、月报、年报等周期性报表,并自动发送到指定信箱。

报表可以保存为各种格式,如PDF、Excel、CSV;还可以E-mail报表或打印报表

数量

150套(服务器、数据库、中间件、应用管理、其他业务管理等)

2.2主要功能模块

2.2.1网络管理

网络拓扑管理模块发现

系统自动迅速搜索整个网络内的所有节点、自动勾画出整个网络的准确物理拓扑图,包括设备间的冗余连接、备份连接、均衡负载连接,网络用户可以为每条设备间连接加以注释,为每台设备设置中文设备名称,监测网络中每台设备的名称、IP地址、类型、厂商等,并能够自动辨别线路连接类型。

通过颜色或标记刷新拓扑图来表明当前网络运行情况;提供拓扑图的编辑功能,可以在已发现的拓扑图上进行编辑修改连接关系。

同时,根据拓扑所反应的对象,系统呈现给用户的拓扑分为网络拓扑、物理拓扑和子网拓扑。

网络拓扑是根据网络层的角度来分析和展现的,表达了被管网络各个子网之间的连接关系

图上为:

系统网络拓扑图示例(仅参考)

物理拓扑是反映被管网络的实际连接的二层网络拓扑图。

图上为系统物理拓扑图示例(仅参考)

子网拓扑是从网络链路层角度进行分析并给出的逻辑拓扑结构。

图为系统子网拓扑图示例

动态背板管理模块

模块一:

设备机架板,系统为用户提供了国内外网络设备厂商不同型号的产品设备机架面板,并提供用户基于面板的管理操作功能,包括对于交换机运行状态、端口流量、端口丢包率等性能参数的监视与管理外,同时也提供对于交换机端口的操作,比如交换机端口的管理与取消管理以及对于端口的开启和关闭等。

图设备通用机架面板示例

模块二:

网络设备端口分布管理情况:

对于网络设备(路由器、交换机等),用户可以通过图片展示,获悉该网络设备端口分布管理的详细情况,如下图所示:

模块三:

交换机端口详细信息查询:

系统的交换机端口详细信息查询是针对用户在日常管理维护工作中,需要实时查看某一台交换机的所有端口或者某几台交换机的所有端口的进出流量等信息而提供的一个参考分析的功能,比如用户感觉网络堵塞,想快捷明了地获悉究竟是哪台交换机哪个端口所连的设备流量较大,就可以通过此功能把所有交换机的所有端口进出流量进行排序,从而及时准确地得到一个结果。

链路状态显示

系统在网络拓扑发现结束后,会自动地画出设备间的连接关系,即链路,同时对链路的连接状态进行监视和管理,可对指定链路设定告警阈值,如链路带宽占用率阈值、链路速率阈值等,在链路连接发生故障或达到告警阈值时时,链路以颜色的改变提醒网络管理人员,并产生相关告警。

用户可直观的从链路提示信息中获取到该链路的基本信息,包括:

该链路的源设备IP地址、源端口、目的设备的IP地址、目的端口以及该链路实时的进出流量、错误率、丢包率等。

故障显示

拓扑图上所显示的各被管对象的颜色可以直接反映出其内部被监控对象的状态。

如绿色表示用户所关心的对象正常运行,黄色表示警告信息,红色表示严重错误。

如下图

跨地域的多层网络监控

通过采用多层网络管理机制,可以在总部网络管理中心直接调阅各下属单位的网络实时物理网络拓扑结构,各个层次相对独立,上级部门在需要时可以对下级部门进行管理,保证了整个网络管理的统一性和完整性。

2.2.2性能监测管理

性能监测管理能够帮助网络管理员监测网络及设备的性能,分析和确定网络及设备的性能瓶颈,为网络及设备的性能优化提供可行的参考。

例如可以对指定的端口进行流量监视,从而判断出网络流量瓶颈等问题。

系统能够监视的性能参数包含:

●网络设备性能参数:

包括路由器、交换机、防火墙等网络设备的CPU、内存使用率,各端口进出流量、丢包率、错包率、带宽使用率、设备响应时间等信息;

●服务器性能参数:

包括各类应用服务器设备的CPU、内存、硬盘空间使用率等运行信息,以及其上运行的应用程序和相关服务性能信息,如应用和服务的响应时间、系统资源使用情况、自身性能指标、服务可用性等;

●数据库性能参数:

包括对各种主流数据库(如ORACLE、SQLserver、DOMINO等)的基本参数、文件系统、表空间、碎片、死锁、消耗大cpu的SQL、占用长时间的SQL等状态信息。

网络设备监测管理

从各个方面对网络设备进行监测和管理,包括网络设备的可用性、设备性能、流量管理和业务分析等。

网络设备包括各种类型的交换机、路由器、防火墙、VoIP网关设备和其他启用了SNMP协议的网络设备。

(1)设备基本信息

设备的基本信息包括设备名称、设备类型、设备厂商、设备节点合法性(是否登记为合法设备)、IP状态(是否在线)、是否支持SNMP及设备OID等信息不可修改;允许用户修改的基本信息有:

设备别名、主标识IP、设备等级(是否重要设备)、只读Community、可写Community、设备描述等。

图为设备基本信息图示

(2)设备流量监测

监测设备端口的数据流量情况,及时发现异常的网络流量。

监视对象包括端口入速率、端口出速率、端口入单播帧速、端口出单播帧速、端口入广播帧速、端口出广播帧速等。

图为监测设备端口的数据流量情况

图为设备端口的实时流量图示

(3)端口丢包率监测

可通过检测端口通讯链路的稳定性、抖动率,及时发现系统隐患,保证业务正常。

图为端口丢包率监测情况

服务器监测管理

为确保企业关键主机、服务器设备的高速、稳定运转,系统可从多个方面对主机服务器的硬件设备及操作系统进行监控管理和性能管理。

系统通过高度集成的服务器管理模块对服务器的CPU、内存、硬盘、网卡等硬件的关键运行参数,以及软件和应用程序的进程、服务、端口等的运行状况,对系统日志进行分类扫描查询。

通过数据采集和分析,系统能够及时对影响服务器运行性能的故障事件发送报警,并采取相应的故障处理措施,保证服务器的正常安全运行。

(1)基础性能监测

CPU性能监测

通过线性指标能够了解到服务器系统CPU资源占用情况。

图为服务器CPU资源占用情况

内存使用情况监测

通过线性指标能够了解到服务器系统内存资源占用情况。

图为服务器内存使用情况

磁盘使用情况监测

通过柱状图能够了解到服务器系统磁盘空间占用情况。

图为服务器磁盘使用情况

(2)服务进程监测

服务监测

监控服务的运行及变化情况,用来判断服务是否正常

图为服务运行状态监测图示

进程监控

监控进程中线程的性质,CPU、内存的使用情况,分析进程的安全状态。

图为进程运行状态监测图示

数据库监测管理

全面智能的监测各种与数据库应用相关的服务。

对Oracle、SQLServer、Mysql等数据库从应用可用性、系统资源占用和数据库性能指标三个方面提供全面的监测管理策略,确保数据库的运行正常。

可监测数据库的关键参数,如数据库系统设计的文件存储空间、系统资源的使用率、配置情况、数据库当前的各种资源情况、监控数据库进程的状态、进程所占内存空间、可用性等。

(1)数据库基本信息

包括文件系统、碎片、死锁、消耗大cpu的SQL、占用长时间的SQL等。

图为数据库基本信息监测图示

(2)数据库表空间

数据库表空间的使用信息。

图为数据库表空间监测图示

(3)数据库文件I/O

数据库的文件读写信息。

图为数据库文件I/O监测图示

性能实时和历史图表

系统对于所监视设备性能参数,均提供两种性能图表(历史性能图表和实时性能图表)供用户查看及分析。

图为历史CPU利用率统计示意图

图为实时CPU利用率示意图

图为历史端口接收流量示意图

图为实时端口接收流量示意图

系统同时为用户提供了多种性能参数的统计报表,便于网络管理员获悉网络及设备的各种性能情况,以便更有效地评估和优化网络及设备的性能。

性能预警

对于网络及设备的性能监视是网络管理的一个重要的功能,同时如何做好故障发生前的性能预警,在故障发生前通知网管人员及时予以处理,也是网管性能管理的一个关键环节。

系统的性能管理功能和故障管理功能的结合,可以为网络及设备的性能做相应的预警,在监视某性能参数超过预置的门限时,产生告警,及时地通知网络管理人员。

●系统可以针对主机资源参数,如CPU使用率,内存使用率等设定合理的门限值,在性能越界的时候给出性能预警。

图主机资源预警示意图

●系统可以针对网络性能参数,如进出流量,错误率、丢包率等设定合理的门限值,在性能越界的时候给出性能预警。

对于网络性能参数的性能预警,不仅仅只是针对整个设备,同时对于设备上的端口也可以做更为细化的门限和性能预警设置,比如交换机,既可以对交换机总流量进行性能预警,同时也可以对其相应的端口做门限设置后性能预警。

图22网络性能预警设置示意图

●系统可以针对所监视的应用程序和相关服务,如响应时间等设定合理的门限值,在性能越界的时候给出性能预警。

图23网络服务预警事件示意图

性能监视参数的拓展

系统除了提供对于设备常用相关性能参数的监

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 天文地理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1