IT设备综合管理系统Word格式.docx
《IT设备综合管理系统Word格式.docx》由会员分享,可在线阅读,更多相关《IT设备综合管理系统Word格式.docx(11页珍藏版)》请在冰豆网上搜索。
北塔IT设备综合监控系统管理系统具备以下功能:
a)对网络环境(包括网络设备、线路、流量、相关边缘设备)进行管理;
b)对各类网络、线路故障进行管理;
c)对网络系统的运维报告进行管理;
d)对网络故障进行管理;
e)应允许第三方软件通过标准接口插入本系统,同样享有共享数据采集、共享数据记录、共享故障处理的系统功能
f)提供机房管理与UPS设备管理;
g)对业务系统的服务器、数据库、中间件、应用服务进行管理;
具体来说,为了确保业务系统安全、高效、稳定地运行,提高管理水平,满足客户日益增长的服务需要,提供最安全最周到的服务保障,树立自己的行业形象,需要结合现今行业发展水平,利用先进技术,采用安全可靠的设计方案,将监控系统集成化,网络化。
所以要求新一代监控系统建立一个安全、高效、先进的远程网络监控体系。
新的平台应能够很好的满足成都燃气信息网络系统管理的实际需求,具备良好的实用性,能够提供强大的故障监测和故障信息处理平台。
平台能够实现目前成都燃气对全公司网络系统的属地化管理原则,能够根据各级管理运行管理范围和责任划分实际情况,灵活定义和界定检测管理的边界,根据实际需求选择和定义对相关检测信息的显示形式和统计方法。
对重要的应用系统和网络核心环节能够实现全面的检测和状态管理。
对网络系统的各种设备和应用进行跨厂家、跨平台的统一管理;
要求提供网络产品管理、故障管理等进行监控,以及运行值班管理等功能;
提供较快速的故障告警信息;
能针对各厂家产品提供统一的管理界面;
提供比较丰富和实用的管理工具;
提供被监视设备的的故障日志;
操作方便,能够提供大量的网络设备和应用系统的性能和状态的真实数据、方便实用的事件统计功能;
能对这些系统提供的数据进行整理和分析,结合运行考核办法,达到优化管理的效果。
建设完成之后,网络系统的统一监控的展现,相关运维人员可以直观的从管理平台看到所有应用系统的当前运行状态和服务状态。
三、环境说明
测试产品:
IT综合管理系统;
测试单位:
XX单位;
管理环境:
XX单位华为、CISCO等网络设备、
ORACLE数据库,Weblogic中间件、AIX小型机、WINDOWS服务器等;
各种业务系统、数据流分析
部署模式:
核心层部署,在内网PC服务器上安装IT设备综合监控系统进行监控;
上线预计时间:
2011年9月
四上线功能展示内容
为保证IT设备综合监控系统平台的稳定性、易用性、好用性和易管理性,功能包括:
·
BS多点登录测试拓扑管理
服务器性能监测测试KPI参数浏览
服务器应用监测测试关键监控点
数据库监测测试中间件监控
添加监测设备
智能告警功能测试多种告警方式
报表功能资产管理
系统配置权限管理
五运行要求
运行环境配置
IT设备综合监控系统对服务器的配置建议如下:
标准PC服务器(彩色显示器分辨率1024*768)
不低于双核CPU3.0G*2
不低于4G内存
高速硬盘并且C盘空间不低于30G
二块1000M以太网卡并配置正确的IP地址、网关地址
配有光驱
2003SP企业版,包含IIS和SNMP组件。
建议XX单位根据自己的需求,选择合适的网络管理服务器硬件平台。
数据库服务器
用于对网络中各种参数进行记录和存储,为形成统计报表提供基础。
IT设备综合监控系统支持MS-SQL、MS-SQL、Oracle等数据库,数据库要求:
采用主流的数据库;
支持ANSI/ISOSQL-89、ANSI/ISOSQL-92标准;
支持中文汉字内码,符合双字节编码;
数据库系统应具有良好的扩展能力;
支持联机存储和备份功能;
应具有强的容错能力、错误恢复能力、错误记录及预警能力;
数据库、表大小等技术参数可灵活设置;
开发工具易使用、开发效率高、维护方便。
在XX单位的项目中,我们建议使用SQLSERVER2000+SP4数据库。
Web服务器
提供网络管理功能的用户展现,用户通过该Web服务器,可以方便的使用IT设备综合监控系统网络管理系统中的各项功能。
用户端
用户端为管理系统的客户端,它负责上层用户界面的呈现。
IT设备综合监控系统采用Web方式进行访问,支持IE6.0、7.0
IT设备综合监控系统的硬件架构中,上述各个硬件平台在逻辑上是相互独立的,但是,在物理上可以是相互独立的,也可以是同一个平台。
1.保证从网管机出发到各可管设备IP可达。
2.各可管设备配有管理IP且开启SNMP,并配置好CommunityRead-Only参数。
防火墙开启端口如下:
服务
对应端口
SNMP
UDP161、162
SYSLOG
UDP514
SQLServer数据库
默认TCP1433
Oracle数据库
默认TCP1521
IT设备综合监控系统的NMS服务
TCP7070
IT设备综合监控系统的TOP服务
TCP7071
IT设备综合监控系统的SMS服务
TCP7072
BTSM服务
TCP7073
IT设备综合监控系统的SNMP服务
TCP7074
IT设备综合监控系统的PCAGENT服务
TCP7075
IT设备综合监控系统的CMDSERVER数据采集服务
TCP9001
IT设备综合监控系统的命名服务
TCP7081
IT设备综合监控系统的SYSLOG服务
TCP7082
3.对于CISCO设备开启CDP协议。
特定功能实施准备
1、任何涉及关闭设备端口的功能需要该设备设置CommunityWrite参数;
2、CiscoIPAccounting数据流分析功能需要在Cisco路由器或三层交换模块中支持并打开IPAccounting功能,需要该设备设置CommunityWrite参数;
3、互联网IP域名反解析功能需要网管机设置域名服务器地址,并能访问互联网;
4.网管机ODBC服务监视告警功能需要在网管机上安装需要监视的数据库特定Client端软件(数据库厂商提供)(MicrosoftAccess数据库Client端软件缺省有);
5.网管机多媒体语音告警功能需要网管机配置多媒体声卡及音箱;
6.网管机手机短信告警需要网管机配置GSM或CDMAModem,并需要相应的SIM卡,网管机打印告警需要网管机配置打印机,并完成相应安装;
7.服务在线监视功能需要网管机能访问相应服务器相应功能。
8.应用服务监控:
HTTP需要客户提供要监控网页的URL,DNS需要开启网管机SNMP,DHCP需要网管机开启SNNP,FTP需要提供登陆用户名和密码。
六上线后预计情况及综合网管功能展现
通过在IT设备综合监控系统上设置搜索范围,将XX单位需要管理的网段包含进去,IT设备综合监控系统就会自动搜索该范围内所有支持SNMP协议可管理的设备,包括交换机、路由器、服务器、防火墙等,并自动生成相应的网络拓扑图。
通过IT设备综合监控系统,可以实现跨地域、跨厂商的网络产品管理、服务器管理、应用系统管理、告警事件管理、日志管理、用户管理、流量分析管理、报表分析管理、机房监控管理等。
对于各种事件和日志,有收集、统计、告警、处理、分析等功能,管理数据采用安全的协议和方式在统一平台上实现共享。
如下图所示:
所有功能实现均非互不相关的对立功能软件的堆砌。
1、真实的物理拓扑图:
IT设备综合监控系统能够迅速搜索整个网络内的所有节点,一次性获得网络中所有路由器、交换机、服务器、PC等管理单元的数据。
并且能够自动判断并勾画出设备间的冗余连接、备份连接、均衡负载连接等关系,完成网络拓扑发现,且拓扑图准确率很高。
一目了然的颜色反映设备参数:
网络拓扑图完全真实的反应了网络的实际连接情况,鼠标点击某一个网络节点都能够通过下标的方式显示该节点的详细信息,包括设备IP地址,设备名称,设备各种负载,设备端口流量等信息。
拓扑图上的网络节点能够提供多种组合显示方式,比如:
IP地址,主机名称,设备类型,设备OID号等,可以任意组合,并且能够隐藏不同属性及网元。
网络拓扑图完全真实的反应了网络的实际连接情况,鼠标点击某一个网络节点都能够通过下标的方式显示该节点的详细信息,包括设备IP地址,设备名称,设备各种负载,设备端口流量等信息,鼠标点击连接线路则展现线路连接相关信息,包括:
线路连接设备IP地址,网络设备连接接口信息,线路流量信息,线路广播包,带宽占用率等
3、提供真实的设备面板图:
下图为F5负载均衡器真实面板图,以及CISCO7609交换机的真实面板图,可以直接在面板上进度端口操作,查看端口下连设备。
随着XX单位IT设施的更新或增加,我们可以不断的提供各种设备的真实面板图,方便用户进行所见即所得的维护。
北塔的知识库不断的在更新,提供最有效的数据采集和真实面板。
4、网络设备状态图:
下图华为交换机运行状态图,CPU/MEM/端口使用率一目了然,设备流量数据在线实时显示,对端设备清晰可见。
直观的设备状态图
5、便捷的网络设备数据查询:
直接右键点就能查询到路由表端口信息表MAC表ARP表等
相关MIB信息,并支持自动排序,更方便的信息浏览快速定位故障
6、设备负载运行一览,提供TOPN排序和历史负载信息,各种参数的历史变化趋势均可以通过网管进行查询,并对全网数据进行排序,方便客户抓住维护重点。
每选择一设备可以查看最近两小时最近一天最近一周的数据曲线图一目了然设备负载情况。
7、线路流量查询:
可以对全网所有线路流量进行排序,直观的显示每天每周每小时的峰值流量。
8、精准的全网IP地址定位:
并在拓扑图上显示,可以方便的查询到任意IP地址所
在交换机端口。
9、按照类型进行服务总览:
如图所示,HP_Unix服务器、Sybase、Weblogic
集群、SQLServer均已经添加到网管中,直接点击即可显示每种类型的状态图。
10、MS-SQLSERVER状态图:
会话信息、进程信息、存储信息均可以直观的在网管
界面中得到展现。
11、SYBASE状态图:
会话信息、内存信息、存储信息均可以直观的在网管界面中得到展现。
12、Sybase段信息:
13、Weblogic集群的监控制状态图:
Weblogic集群的各个端口信息,如基本信息、JVM使用情况、JDBC池使用情况、JTA使用情况、各WEB应用情况、Servlet和EJB运行情况、线程池使用情况等。
对WebLogic中间件服务提供监控,主要监控的有:
基本配置信息:
服务器名称、服务器版本、服务器监听端口、当前服务器是否激活;
JVM堆栈监测:
JVM堆栈大小、JVM堆栈利用率门限监测,超过门限定义产生告警事件;
JDBC连接监测:
总连接数、活动连接数、等待连接数、等待最大时间、连接池最大容量;
JTA事务状况监测:
全部回滚事务比率、资源错误事务回滚数目/比率,应用程序事务回滚的数量/比率、系统错误回滚事务的数目/比率;
WEB应用监测指标:
当前激活会话数、最大会话数、会话总数,监控对象请求代理程序(ORB)和Web容器线程池利用率。
如果不从池中释放线程,或线程池负载过大,监控系统将产生报警事件;
Servlet监测指标:
Servlet名称、Servlet平均/最大执行时间、Servlet执行次数,超过门限定义产生告警事件;
EJB监测指标:
EJB名称、类型、激活(Activation)次数、钝化(Passivation)次数、缓存EJB的个数、正在使用/空闲/超时/等待的EJB个数、提交/回滚/超时的事务总数;
服务线程池指标:
服务器线程池大小、用于提供Socket访问的线程比率;
服务器各类告警:
包括服务器启动和关闭、服务器配置属性修改、日志告警等
14、HPUNIX监控状态图:
CPU/MEM/IO文件系统、流量、进程等信息均可图形化显示。
文件系统使用信息
15、WINDOWS服务器状态图:
windows系统的重要维护信息均能直观显示。
对Windows操作系统主要可以监控如下内容:
服务器的配置信息:
自动获取服务器名称、IP地址、系统版本、CPU个数、磁盘大小、内存大小等;
服务器的运行状态:
服务器运行状态、服务器磁盘状态、网卡状态、进程总数
服务器CPU运行情况:
CPU用户时间百分比、CPU系统时间百分比、CPU运行队列进程个数
服务器内存使用情况:
内存利用率、虚拟内存(交换区)的使用率、交换SWAP分区页数量(换入/换出);
服务器磁盘运行指标:
磁盘空间利用率、磁盘读/写速率、磁盘TPS指标。
服务器文件管理指标:
各文件系统分区的使用率和空闲空间、指定的关键文件是否存在和当前大小;
服务器关键进程运行指标:
包括进程ID、进程名、进程状态、占用CPU时间、内存占用大小等;
服务器日志告警:
检查服务器的关键日志文件,提取相关的错误日志信息(Warning/error/fail)并生成告警;
实时监控操作系统,数据库和应用系统中制定的日志文件,并可根据其中的特定信息,执行用户预定义的操作;
对系统服务进行监控,对重要服务的运行故障进行实时告警。
16、丰富的参数浏览功能:
重要参数图形展现,详细参数亦可查询,各种参数详细
信息可以通过点击相应图形界面后列出,满足深入维护的需求。
(以UNIX为例)
对AIX、Solaris、Linux等类Unix系统主要可以监控如下内容:
获取服务器名称、IP地址、系统版本、CPU个数、磁盘大小、内存大小等;
17、强大的资产管理功能:
对网络中的资产可进行统一管理,设备维修、更换,软件
升级维护均可记录,做到维护记录可追溯、资产变更心中有数。
18、告警管理功能:
全网告警可进行统计,告警输出多样化,可支持语音、弹出窗口、EMAIL、短信等方式告警,确保告警及时送达维护人员。
IT设备综合监控系统网络管理系统可以对信息网中的告警(包括标准告警和厂商自定义告警)进行实时监视,并能在网络拓扑图上对相应的告警信息清晰直观地显示出来,能够在拓扑图上清晰地显示告警发生的位置和告警的级别等信息,并提示用户对告警进行确认。
同时,IT设备综合监控系统网络管理系统还支持将告警信息发送到用户的E-mail信箱或手机短信的功能。
同时支持如下的告警时间汇总,明确统计出告警时长。
19.告警参数任意设置:
各种参数均可以直接设置参数告警,超出预设的阀值后
系统自动向维护人员发出告警,确保系统初问题后第一时间得到响应和处理。
20、历史数据查询,丰富的报表输出:
只要在网管中简单设定后,各种参数的历史数据均可在网管中进行查询,数据变化趋势一目了然。
相关报表可根据客户维护需求进行定制开发,下图为系统默认输出的标准报表。
全网运行率
六、预计目标:
通过系统上线,我们认为IT设备综合监控系统管理平台能够帮助XX单位达到如下目标:
实现对XX单位所辖多种类型主机设备的监控管理;
实现对XX单位所辖的多种数据库、中间件的监控管理;
实现对信息网上告警信息的定制、获取、处理和统计功能;
实现对信息网上所有主机设备、中间件、数据库的性能数据的采集和统计功能;
今后可以灵活扩展,根据性能数据对信息系统运行状况、运行趋势等进行分析,提供灵活的报表定制功能、针对用户行业特点定制开发报表
为下一步实现IT流程管理,建立统一的IT资源信息库做准备;
七预计效益
经过项目上线,会带来诸多方面的效益,包括经济上运维费用的节省、管理上管理水平的提高,并且因为我们服务质量提高,为社保系统运行提供了稳固、优质的支撑环境,也会在很大程度上获得社会效益。
简列如下:
1.管理效益
通过IT设备综合监控系统_IT运维管理系统的实施,可以实现公司信息系统运行状态的统一监测和分级管理思路。
提升公司信息化运维管理水平:
对一体化信息系统建设的提供有力支撑,确保业务系统特别是关键应用的全可靠运行。
保证运行数据统计的真实性,推动公司KPI体系的实施。
重大事件的及时定位,能对全网的异常流量和异常事件进行追踪,实现全网全业务系统故障定位,及早隔离处理全网性异常事件,提高信息系统整体运行水平。
全局督促管理、督导管理,以流程。
考核推动管理制度,以指标统计验证管理效果
总体把握资源,提高效益,能及时判断全网各部分流量和带宽对各个业务的影响。
提高IT服务质量,提升信息系统运行管理部分的责任感和使命感。
另外,IT设备综合监控系统网络资源管理系统可以自动记录各类系统运行数据,生成网络运维分析报告,及时分析和发现各类系统运行的瓶颈。
为准确分析网络质量、网络投资扩容、网络优化调整提供决策依据,提高网络投资的准确性和有效性。
间接节省了网络投资,提高了网络投资效益;
,提高整个网络宏观管理调控能力。
2.经济效益
通过项目实施,公司可以实现人力成本的节省:
IT设备综合监控系统网络资源管理系统可以实现本地和异地网络设备、服务器设备、数据库、中间件、应用等系统运行情况的7*24小时不间断自动监控,代替以往人工检查的方法。
假定某单位目前有约150个管理对象,每对象运行情况检查大约需要10分钟;
全部检查一遍需要约25工时。
以每天系统运行情况检查一遍,每工时/人按15元计算,每年可以节省人力成本136875元。
在实施运行监管与运维管理后,随着运维管理水平的提高,整个IT环境故障的解决时间会大大缩短,并且由于管理水平的提高,设备的非计划停机时间也会大大减少,为公司带来巨大的经济效益。
IT设备综合监控系统网络资源管理系统可以在故障发生之前提前预警,并通过手机短信、Email、语音等多种手段通知管理人员,为故障处理赢得时间,减少网络服务意外中断时间,提高网络运行率,根据国家电网提供的统计数据:
目前政府行业的网络运行率一般为99.5%,即每年网络意外中断时间为43.8小时/年,如果项目实施后提高网落运率0.4个百分点,即运行率达到99.9%的水平。
每年减少网络中断时间35.04小时。
网络中断将造成应用系统均无法运行,以每小时网络意外中断损失10万元计算。
每年可以减少损失350.4万元。
3.社会效益
IT设备综合监控系统_IT运维管理系统的实施后,随着服务质量的提高,我们能够为社保系统运行提供更稳固、优质的支撑环境,也会在很大程度上获得社会效益。