IT管理方案建议书0901.docx

上传人:b****8 文档编号:11345558 上传时间:2023-02-28 格式:DOCX 页数:56 大小:285.63KB
下载 相关 举报
IT管理方案建议书0901.docx_第1页
第1页 / 共56页
IT管理方案建议书0901.docx_第2页
第2页 / 共56页
IT管理方案建议书0901.docx_第3页
第3页 / 共56页
IT管理方案建议书0901.docx_第4页
第4页 / 共56页
IT管理方案建议书0901.docx_第5页
第5页 / 共56页
点击查看更多>>
下载资源
资源描述

IT管理方案建议书0901.docx

《IT管理方案建议书0901.docx》由会员分享,可在线阅读,更多相关《IT管理方案建议书0901.docx(56页珍藏版)》请在冰豆网上搜索。

IT管理方案建议书0901.docx

IT管理方案建议书0901

 

 

 

《用户》IT管理

规划方案建议书

 

 

 

 

 

 

中国惠普有限公司

二〇一八年九月

 

第一章管理需求分析与方案设计

1.1管理需求分析

《用户》的IT建设经过持续的投入,基础设施已经颇具规模,管理的需求日益迫切,现在的具体情况如下:

具体情况分析说明

 

我们通过《用户》的专家与技术人员的交流沟通,认为当前的IT管理需求突出在以下几方面:

网络管理

拓扑管理:

对各种类型的网络设备、网络链路进行必要的监控,实现对全国范围网络的有效管理,包括拓扑的自动发现,设备状态的监控,资源信息的汇总管理等。

故障管理:

收集网络设备、网络链路的故障,并可通过定制的过滤策略实现对故障的管理,同时,可形成历史记录供今后管理员参考故障再次发生时的解决方法。

如条件允许,可建立帮助台系统,对故障解决进行流程化管理。

性能管理:

实时监控网络设备的各性能状态,并采集网络设备性能数据、网络接口流量、网络链路延时等性能参数、并形成历史记录,供分析和上报使用。

2)系统管理

系统事件管理:

对服务器的运行状况进行监控,使系统管理人员及时了解服务器的重要资源和参数运行状况,出现故障时迅速报警,并可自动采取措施排除故障,保证关键服务器的可用性和可靠性。

系统性能管理:

能够实时连续的收集主机系统和网络系统运行的相关数据,以图形、图表等方式显示主机系统的运行状况,并可形成历史数据记录,供趋势分析使用。

数据库管理:

对数据库的资源使用进行监控,对资源的溢出提前报警,并对数据库的性能指标进行采集,并形成相应的统计图表,供性能监测和趋势分析使用,对数据库的日志进行有效监控,出现异常时及时报警。

提供数据库管理工具,可从管理工作站对数据库进行管理操作。

配置管理:

管理了软件和其它数字资产的整个生命周期,其中数字资产包括:

操作系统、补丁、应用、目录、个性化设置、用户权限(用户在PC、Server、无线设备、ATM、POS等设备上面的权限)。

报表管理:

对网络的资产信息,网络的故障信息,网络设备的性能信息按时间、设备、用户自动形成相应报表,提供各种统计方式,供分析报告使用。

互联网服务管理:

对提供的WWW、EMAIL、FTP、SMTP、POP3等相关协议进行监控管理,提供其可用性。

3)IT服务综合管理

事件管理(IncidentManagement):

对用户提请的、或者由网络系统管理软件发现而自动提请的事件进行有效的管理,使出现的网络故障能够快速的解决,并形成规范流程,为以后的出现的类似问题提供有力的参考。

同时,形成知识库,使其它用户可方便的进行查询,提高解决问题的效率。

配置管理(ConfigurationManagement):

对整个网络环境的资产进行统计,并对其更新变更进行记录,为处理问题,系统变更提供基础的支持。

变更管理(ChangeManagement):

当计算机环境需要相应的变化时,控制、监视、记录变化过程,将变化对本行业务的影响控制在最小。

通过网管工具及管理流程的使用,实现对系统变更的控制。

服务等级管理(ServiceLevelManagement):

网络系统对于其它部门而言,是提供的一种服务,服务等级管理可记录所有的服务水平协议,相应的维护合同以及支持的时间等等。

例如,在录入服务请求(ServiceCall)时,可自然地根据请求的相关信息,如用户号、请求时间、相关资产等,联系相应的服务水平协议,设置服务的优先等级;最后计算服务的完成时间,评价服务水平状况。

对于《用户》计算机网络系统的管理是一项复杂的系统工程,要根据当前的网络现状和今后发展的实际情况,对实现功能、实现步骤进行科学的规划,从而达到管理需求,满足《用户》计算机网络系统的正常运行。

1.2方案设计原则

网络及系统管理系统将成为《用户》信息系统企业级系统管理平台,为信息系统整个计算机系统及业务应用提供全面的和高效的管理和监控。

HP公司在进行设计时将充分考虑以下原则:

集成性:

提供的统一管理平台工具,可以对信息系统中所有的资源:

包括网络设备、服务器、客户机、数据库、应用软件等进行集中统一的管理。

这包括统一的管理界面,集中的数据分析、报表生成和事件处理等。

企业级的系统管理软件应该对系统内的被管理对象、管理功能提供一致的管理平台和管理规范。

管理员可通过系统管理软件提供的统一界面,在管理中心完成对分布式、跨平台、跨系统的网络、服务器/客户机、数据库、应用软件的集中和集成管理。

提供针对IT系统综合故障处理能力,包括整个计算机系统所发生的网络SNMP事件、系统事件、数据库事件、应用事件等的收集及自动响应能力,包括对整个信息系统中所发生故障类型的判断、故障处理人员的指定、故障处理过程的记录及解决方案知识库的生成,为信息系统提供一套完善的故障分析、处理及查询系统。

兼容性:

由于信息系统是一个环境复杂,多系统、多数据库和多应用平台,多厂商网络的复杂管理环境,而且信息系统的网络环境随业务发展不断扩大。

没有那一家供应商能够满足大型IT机构的所有管理需求,实际上,多数IT机构只能采用来自多家供应商的产品和服务,才能实现他们所需的灵活性和全部的功能性。

为此,具有集成已有的或将来的管理软件的能力是必需的。

管理软件能够提供标准的和开放的应用接口及开发工具,以便集成现有的管理软件和将来的管理软件。

系统管理软件需具有广泛的第三方硬件、软件厂商的合作及支持,随IT技术发展不断吸收新的管理技术。

企业级系统管理软件必须适合当今企业复杂的计算机系统,能够完整实现跨平台、跨系统地端对端节点管理;支持多种局域网、广域网协议(如TCP/IP、DDN、X.25、FrameRelay、ATM…),管理桌面机、工作站、NT、UNIX(HP-UX、Solaris、IBMAIX、SGIIRIX、WindowsNT、Linux等)等客户机/服务器平台,支持主流关系数据库系统(ORALCE、SYBASE、INFORMIX等)以及LotusDomino/Notes、MicrosoftIIS及Netscape等多种应用系统。

安全性:

企业级IT管理系统应建在相对安全、可靠的平台之上,确保其稳定和高效性。

由于增加了安全管理设置,必将一定程度上影响网络和系统的性能,包括对网络传输速率的影响,对系统本身资源的消耗等。

因此需要平衡利弊,提出最为适当的IT管理系统解决方案,建议尽量降低对原有网络、系统性能的影响。

要求增加的管理系统应不影响现有系统的正常运行,也不能对现有应用系统提出太多的限制,更不能对应用程序造成破坏,在项目设计和实施过程中,不能因为新增软件的存在而影响到整个网络和应用的正常运行。

企业级系统管理软件不仅要管理系统中的安全问题(和安全产品集成),更应保障管理信息本身的安全。

先进性:

在构建庞大的企业级IT管理体系时,不仅仅要注重解决用户在IT管理中实际存在的问题,而且解决问题的流程必须有完整而且标准的规范,这样才能面向未来,实施有针对性的按服务等级解决问题,提高对最终用户的服务质量,增加IT内部员工工作的满意度,并能降低个别“高手”的流失对整个IT管理的影响。

可扩性:

企业级系统管理软件应有很强的扩充性和扩展性,用户可根据当前系统状况灵活选取所需模块,当系统或管理任务增加时可通过选取新的功能模块简单完成管理功能的扩张,而无需更改放弃原来已有的系统管理软件,保护已有的投资。

另系统管理软件还需符合信息系统实际的管理结构及业务的运行规则,如实现系统内的分层次管理、分角色管理等。

简单易用、界面友好:

系统管理员可通过简单易用的图形界面,用鼠标拖拉对象就可完成各种系统资源的复杂管理工作,不必去记不同平台、不同系统上的复杂操作命令,降低管理难度和管理工作量。

同时简单易用的图形界面使用户易于掌握,能快速实施系统管理任务。

面向业务服务的IT资源管理

一方面IT系统对于核心业务起着决定性的作用,因此IT服务的可用性以及服务的质量越来越引起重视,基于服务等级协议SLA(ServiceLevelAgreement)的要求越来越迫切;另一方面,IT系统所面对的管理工作的范围也越来越大,从核心的网络、服务器、应用系统到桌面系统和移动终端。

从而IT服务部门的组织结构也随之扩大,明确的人员职责分配和标准流程的设置成为势在必行的要求。

企业级系统管理软件不仅要管理信息系统企业网中复杂的计算环境,更重要的帮助用户从业务管理的角度管理IT环境。

如在管理过程中,构造与业务相关的观察视图或报告,描述组成服务的各组件的关系,及其对服务的影响级别;帮助分析计算机资源的使用情况,及时反映影响业务正常运行的故障,提供真正的面向业务管理的解决方案。

第二章《用户》IT管理方案

2.1系统管理结构

2.1.1全《用户》网络管理结构

《用户》全局网络拓扑结构为树型结构。

其中广域网组成一级骨干网,总厂和分厂各有自己的局域网。

对于这样一个地域分布广的网络,单靠管理中心的单点管理是很难满足对全网进行有效监控的需求的。

因此,必须进行有效的划分,通过合理的配置,实现管理的要求。

根据以上实际情况,我们建议在《用户》通过HPOpenView的分布式管理实现其管理需求;同时,本着节省投资的原则建议如下:

1)总厂中心建立网络系统综合管理平台

总厂中心建立网络系统综合管理平台,实现对网络系统的综合管理,包括网络资源管理、网络故障管理、网络性能管理、系统事件管理、系统性能管理、数据库管理、报表管理等管理工作,实现对全国的骨干网络监控和总厂中心主机的监控。

考虑到其为全国的管理中心,配置为管理工作站或中端服务器,及相应Windows报表工作站。

2)各省建立分管理平台

建议主要在各分厂建立分管理平台,实现对各分厂的网络管理,监控各分厂的网络运行。

本着节省投资的原则,同时根据HP公司网络管理实施的经验,可作如下考虑:

为了节省投资,建议使用Windows工作站实现对各分厂的网络管理。

其管理结构如下图所示:

总厂综合网络管理平台

分厂网络管理平台

分厂网络管理平台

2.2分级管理、集中监控

中心的管理平台和各分厂的管理工作站分工协作,结构分明,其主要特点和实现的功能如下:

拓扑上传:

各分厂管理各分厂的网络结构、网络设备的状态设置为定期上传到中心管理平台,这样,中心管理工作站不必要对各分厂的网络设备进行轮询监测,而是通过分管理平台的管理,而获得汇总的网络设备状态。

这样可大大节省网络带宽的占用。

同时各地的管理工作主要由各地进行,中心进行集中监控,从而实现对全网网络拓扑、网络设备状态的监控。

事件上传:

各分厂的网络故障主要由各分厂本地进行管理,同时对于重要的网络故障,设置上报到总厂中心管理平台。

这样,一般的故障事件由本地人员处理,职责明确;重要事件汇报到总厂网管中心,重要故障和事件总厂网管中心可以监控到,从而可以协助本地网管人员进行管理。

同时,总厂管理中心对各分厂起到监控作用。

数据上传:

对于本地的网络性能数据和网络链路数据由各分厂进行采集,并可通过本地报表工具进行统计分析;同时可设置相应策略对各分厂的网络性能数据定期汇总到总管理中心,由管理中心生成所需要的全网范围的管理报表。

同时各分厂的资产信息,事件信息也可汇总到总管理中心,由管理中心汇总处理。

2.2.2分权管理,明确职责

对于各种管理工作和众多的管理设备,需要不同的管理员进行分工合作的管理。

为了满足不同的管理员操作需求,可设置多种权限(管理员、操作员、监控员),多种方式的客户端设置(仿真终端、JAVA终端、Web登录),HPOpenView支持多种客户端方式实现监控,主要如下所示:

UNIX管理站直接登录管理:

全面管理功能,实现各方面管理设置

XWINDOWS模拟登录:

实现全面管理,便于管理员操作

NT/2000客户端:

网络管理终端,程序运行于本地,读取管理站数据,保证效率,方便操作。

JAVAConsole:

全面事件监控,集中调用不同管理工具。

Web登录:

方便管理员远程登录监控。

同时,不同管理员可设置不同管理权限,不同管理员登录后,监测到的管理界面不同,实现的管理功能不同,使用的菜单不同。

其管理结构如下图所示:

2.3管理功能具体实现

从《用户》本期网管的具体需求出发,主要在网络拓扑管理、网络故障管理、网络性能管理、系统故障管理、系统性能管理、数据库管理、报表管理等几方面,HPOpenView在以上几方面均可出色的满足其需求,具体如下。

2.3.1网络拓扑管理

建议采用OpenViewOperation(包含NetworkNodeManager)完成拓扑管理功能。

《用户》网络是一个复杂的、分布式网络结构,单靠人工进行管理是很难了解整个网络系统配置及分布的,当前的网络系统中都有哪些节点,它们运行状态如何,有哪些是新增加的节点,是否有非法节点加入等都是难于解决的问题。

OpenViewNetworkNodeManager的自动发现和监控机制能够发现网络节点(包括路由器,交换机和第二层的交换设备如网桥等),检测网络网络连接,生成和保持TCP/IP网络图,通过色彩确定网络设备的运行状态,使用OpenViewWindows的Pan和Zoom的功能在保持总图象的同时将视点着重于大型子图的关键区域。

通过MIB浏览器了解外围设备的工作状况,对不能监视的外设,可通过在被管节点上扩展SNMP子代理,在管理站上装载其MIB的方式对其进行监视。

使用预定义的MIB应用或创建MIB查询应用监视网络连接的通信速率,信息流量等。

OpenViewNetworkNodeManager的这种特点使得具有多厂家系统平台、网络、计算机等复杂环境的管理变得更加真实、直观和简便。

通过相应客户化工作,可对网络拓扑视图进行规划处理,可形成和物理地区一致的网络拓扑节点结构。

可如图所示:

 

1)网络拓扑生成

OpenViewNetworkNodeManager可以发现网络上的TCP/IP、和Level2设备,支持DHCP(动态主机配置协议),并将这些信息以直观的图形格式表示出来(Level2发现功能包括支持Bridge、Repeater/802.3、或者MAUMIBs的设备)。

NetworkNodeManager持续地监控网络上新的设备和网络设备状态。

发现和监控功能还可以探测到位于广域网上的设备。

OpenViewNetworkNodeManager可以动态地自动更新网络拓扑图和事件信息。

网络拓扑是以图形或者表格的格式表现的,提供了最大程度的灵活性。

另外,SNMPDataPresenter令用户可以查询网络的SNMP数据,例如接口流量、CPU负荷或者通讯路由(trafficrouting)等,以帮助进行网络诊断和计划。

OpenViewNetworkNodeManager对于所搜集到的信息具有简化功能,提供发现过滤,拓扑过滤,图象过滤功能,使企业可以根据自己的需要,选择要发现监控的对象,定制MAP的显示内容,通过这些功能可以减少网络流量的负担,更能让管理人员集中注意力于重要和密切关心的网络部分。

OpenViewNetworkNodeManager支持CiscoDiscoveryProtocol(CDPView),可以形成针对Cisco设备的拓扑结构图。

并可方便的查询Cisco设备的配置信息,包括Cisco设备中的VLAN设置,以及和此设备连接的设备信息。

OpenViewNetworkNodeManager提供强大的过滤功能(NodeView),可根据节点的类型,设备的厂家,网段的划分以及当前节点的状态进行过滤显示,从而帮助管理员更好的了解所管理的网络,更快的发现问题。

同时,NNM的扩展功能提供更多的拓扑视图,对网络环境进行更为细化的拓扑管理。

主要包括:

物理连接视图:

真实表现网络设备物理连接

VLAN视图:

表现VLAN划分的详细信息

OSPF视图:

表现OSPF域及相关路由设备视图

动态过滤视图:

当前指定设备的动态视图

网络路径视图:

端到端网络设备路径视图

等等……

通过使用NNM,我们可以实现正确表示《用户》全国骨干网的以及各个分厂的网络拓扑图,真实反映网络的实际连接状况,实现全国和分厂骨干网的主副链路拓扑图和拨号网络拓扑图,建议将主要网络设备的Trap指向各个网管机,这样可以在第一时间获取网络设备的信息,实时监控这些网络设备的状态。

2)图形用户界面

OpenViewNetworkNodeManager的图形用户界面操作方便,易于配置和使用。

大多数的管理功能均可以通过鼠标的点击和拖放操作完成。

从OpenViewNetworkNodeManager主管理界面的菜单能够调用所有管理工具。

OpenViewNetworkNodeManager支持管理员根据自己的使用习惯对管理界面进行客户化,设置过滤器屏蔽不关心的网段和节点,将最常关心的网段和节点添加到特定文件夹,以及向拓扑图中加入背景地图等。

OpenViewNetworkNodeManager的Pan和Zoom的功能使用户在保持对网络拓扑结构的总体把握的同时也能够将视点着重于的关键区域。

OpenViewNetworkNodeManager支持Java界面,允许管理员通过Web浏览方式远程登录网络管理系统。

当通过Web方式执行管理任务时,采用SSL协议保证管理数据传输的安全性。

OpenViewNetworkNodeManager支持管理员根据自己的使用习惯对管理界面进行客户化,设置过滤器屏蔽不关心的网段和节点,将最常关心的网段和节点添加到特定文件夹,以及向拓扑图中加入背景地图等。

OpenViewNetworkNodeManager是事实上的网络管理平台标准。

目前有超过300种第三方管理软件支持与OpenViewNetworkNodeManager进行紧密集成。

OpenViewNetworkNodeManager可以与集成的第三方管理软件之间能够方便地进行管理界面的切换。

在NNM的网络拓扑结构图中能够直接进行管理对象的定位,并通过菜单等方式调用第三方管理软件,实现对特定网络设备或其它管理对象进行深入的监控和配置,扩展了OpenViewNetworkNodeManager的管理功能。

第三方管理软件所收集的信息均能够在OpenViewNetworkNodeManager中进行统一管理。

管理对象的状态变化能够在OpenViewNetworkNodeManager的网络拓扑结构图中通过颜色变化等方式表示。

第三方管理软件所收集的事件和消息能够集中到OpenViewNetworkNodeManager的警告浏览器(AlarmBrowser),并与OpenViewNetworkNodeManager自身所收集的事件一起通过事件分组、分级、自动处理及事件关联等机制进行统一管理。

OpenViewNetworkNodeManager也提供完整的应用开发接口(API),允许用户针对自己的特殊功能要求进行二次开发。

2.3.2网络故障管理

建议采用OpenViewOperations(包含NetworkNodeManager)实现其故障管理。

2.3.2.1网络设备故障监控

对网络故障的监控分为主动轮询和接收Trap方式,OpenView可通过相应设置实现所有基于SNMP的网络事件的监控。

同时,对于网络设备的故障及各种信息的变更都会记录在syslog中,所以对于syslog的监控也是保证网络正常运行的关键。

1)Trap事件和轮询事件

NNM可对所有SNMP的trap事件进行收集和显示,同时可设置相应的轮询时间对相应网络的连接进行监控和报警。

其中,对于主流的网络设备NNM已经提供了完备的MIB库和事件对照,对于特殊的网络设备,可加载相应的MIB库并设置相应报警。

主要基本报警举例如下:

线路故障的中断报警。

线路达到一定门限值的性能报警。

逻辑链路(PVC)的中断报警。

逻辑链路达到一定门限值的性能报警。

网络设备板卡、端口的硬件故障报警。

网络设备的CPU、内存、端口流量达到一定门限值的性能报警。

网络协议、应用端口(UCP、TCP)严重超出正常流量的报警。

 

2)报警的关联与方式

OpenViewOperation网络管理解决方案提供了强大的网络故障处理功能。

OpenViewOperation能对设备和链路运行状态进行监测,设置相应参数的阈值,当某个参数超过阈值时能自动报警;系统提供自动的事件关联功能,使用户可迅速定位产生故障的根本原因;当网络中路由器,交换机等主要网络设备的某一事件发生时,能根据预先定义的操作自动执行以排除故障或响应网络设置的变化,并以email或BB机等各种方式通知网络管理人员。

3)直观的事件发现和表示

OpenViewOperation运行后能自动对网络进行监测,自动轮询网络状态,搜集网络中的故障和报警信息。

网络中的故障和报警事件显示在统一的浏览器窗口中,并根据报警事件的重要级别分为五种颜色显示,用户可以很直观地了解报警事件的紧要性。

同时显示出事件的来源、时间和相关的信息,以帮助管理人员深入了解报警事件。

对于数值型的网络参数,用户可以自行设定相应的阈值及对应的报警级别。

用户设定的报警与Openview自行产生的报警同样显示在统一的报警窗口中。

另外用户可以设定报警过滤器和排列顺序,以集中精力于重要的网络报警事件。

4)事件关联功能使得问题得到更快的解决

事件关联技术使得当故障发生时,网管人员能够更快地定位原因、排除故障。

通过高级事件关联引擎,OpenView可以更快地识别故障。

这个引擎将把事件与高层次报警关联起来,并立即查找网络故障的根本原因。

深入分析(drill-down)功能令网络管理人员能够看到与每一个报警有关的所有事件。

事先定义好的关联逻辑已包含一些常见的网络故障管理,例如:

连接设备失效,定期的维护,重复的网络报警、成对的报警事件等关联逻辑。

预先定义的关联逻辑是基于最新的网络信息,使得网络轮巡效率更高。

2.3.2.2故障事件的统一处理

1)完整的事件管理

OpenViewOperation综合事件管理可以对网络设备发出的SNMPTrap,syslog的事件信息、主动轮询的事件进行全面的管理监控。

2)事件的集中管理

可以通过定义对事件传递进行重定向,把所有或某一类事件转发到特定的事件主控台,从而实现以统一界面集中管理事件。

用户可以在事件主控台上看到所收到得事件的发送源系统名,用户名等详细信息。

事件主控台的设置有很强的灵活性,可根据用户的不同要求而改变,以适应用户业务的需要。

3)事件的过滤与分类

可以通过定义对事件主控台所收到的事件进行过滤,只显示用户所关心的信息,同时可对所显示信息进一步分类,对不同级别的事件信息以不同的颜色表示。

通过这种方法可以提高系统操作员的工作效率,增强系统的可维护性。

4)事件的自动处理

OpenView事件管理可以定义事件触发器,当主控台收到某一条或一组特定事件信息时,系统自动执行一组动作(Action),这组动作可包括发送一条报警信息,执行一个命令,启动一个进程或一个批处理业等。

如监视用户的网络设备运行参数超标,可执行相应命令触发相应报警方式,通知管理员。

5)与第三方厂商的管理软件相集成

OpenView的事件管理支持标准的SNMP协议,可接收第三方厂商的管理软件所发送的符合SNMP标准的事件信息,从而实现与第三方厂商的管理软件相集成。

6)事件管理执行动作的多种通告方式

可以通

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1