zbixx运维监控管理平台使用手册.docx

上传人:b****7 文档编号:25298795 上传时间:2023-06-07 格式:DOCX 页数:17 大小:24.81KB
下载 相关 举报
zbixx运维监控管理平台使用手册.docx_第1页
第1页 / 共17页
zbixx运维监控管理平台使用手册.docx_第2页
第2页 / 共17页
zbixx运维监控管理平台使用手册.docx_第3页
第3页 / 共17页
zbixx运维监控管理平台使用手册.docx_第4页
第4页 / 共17页
zbixx运维监控管理平台使用手册.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

zbixx运维监控管理平台使用手册.docx

《zbixx运维监控管理平台使用手册.docx》由会员分享,可在线阅读,更多相关《zbixx运维监控管理平台使用手册.docx(17页珍藏版)》请在冰豆网上搜索。

zbixx运维监控管理平台使用手册.docx

zbixx运维监控管理平台使用手册

 

xxxx运维监控管理平台

操作手册

 

xxxx(天津)科技有限公司

变更记录

序号

版本

变更说明

修改人/日期

01

新建

张冠洲/2017年1月

 

1.平台简介

概述

xxxx运维监控管理平台根据自身业务需求进行开发以满足平台监控业务需要。

平台通过C/S模式采集数据,通过B/S模式在web端展示和配置。

被监控端:

主机通过安装agent方式采集数据,网络设备通过SNMP方式采集数据

Server端:

通过收集SNMP和agent发送的数据,写入MySQL数据库,再通过php+apache在web前端展示。

平台运行条件:

Server:

Server端需运行在LAMP(Linux+Apache+Mysql+PHP)环境下,对硬件要求低

Agent:

目前已有的agent基本支持市面常见的OS,包含Linux、HPUX、Solaris、Sun、windows

SNMP:

支持各类常见的网络设备

平台功能

具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图绘制)

支持自动发现网络设备和服务器

支持分布式,能集中展示、管理分布式的监控点

扩展性强,server提供通用接口,可以自己开发完善各类监控

2.安装部署

服务端环境准备

平台Server端需要运行在CentOS、RedHatLinux、Debain等Linux平台上,这里以RHELAS5作为部署环境。

Root用户安装必须的包,建议配置好yum,通过yum安装下列包,解决包的依赖关系。

LAMP环境

#yuminstallmysql-serverhttpdphp

其他需要用到的包:

#yuminstallmysql-develgccnet-snmp-develcurl-develperl-DBIphp-gdphp-mysqlphp-bcmathphp-mbstringphp-xml

解压

#tarzxvf增加用户和组

#groupaddethane

#useradd–gethane–methane

数据库准备

启动MySQL数据库:

#servicemysqldstart

修改MySQLroot用户密码(默认密码为空)

#mysqladmin–urootpasswordroot

测试能否正常登陆数据库

#mysql–uroot–proot

创建平台数据库

Mysql>createdatabaseethanecharactersetutf8;

Mysql>grantallonethane.*TOethane@'localhost'identifiedby'ethanepass';

Mysql>flushprivileges;

导入数据库sql脚本

#cdcat./create/schema/|mysql-uroot–prootethane

#cat./create/data/|mysql-uroot-prootethane

#cat./create/data/|mysql-uroot-prootethane

编译安装

配置编译,prefix是安装后程序目录

#./configure--with-mysql--with-net-snmp--with-libcurl--enable-server--enable-agent--enable-proxy--prefix=/usr/local/ethane

#./configure--with-mysql=/usr/local/mysql/bin/mysql_config--with-net-snmp--with-libcurl--enable-server--enable-agent--enable-proxy--prefix=/usr/local/ethanemisc/conf/*/etc/ethane

#chown-Rethane:

ethane/etc/ethane

修改Server配置文件

基本不用修改,用默认配置即可,只需修改一项DBPassword=密码

#vi/etc/ethane/

修改Agentd配置文件,更改HOSTNAME为本机的hostname就好了

#vi/etc/ethane/

添加web前端php文件

#cdfrontends/

#cp-rfphp/var/www/html/

#cd/var/www/html

#mvphpethane

#chown-Rethane:

ethaneethane

web前端安装配置

修改php相关参数

#vi/etc/找到如下几项,改成下面的值,前面有;号的要删掉

max_execution_time=300

max_input_time=300

memory_limit=128M

=Asia/Shanghai

post_max_size=32M

=2

重启apache

#servicehttpdrestart

在本地浏览器上访问Serve地址开始web前端配置,,其中Step3Checkofpre-requisites必须全部项目OK后才能继续配置,如有提示fail,去server上检查是否安装这个包或配置是否按上述更改。

图1

Step4填入Server登陆mysql的用户和密码

Step7按提示下载配置文件到Server的/var/www/html/ethane/conf下,名字一定要是配置完成后,出现登陆界面,默认的用户为:

admin,密码为:

ethane

启动Server

安装完成后的server程序在/usr/local/ethane/sbin/目录下,可以直接启动

#/usr/local/ethane/sbin/ethane_server

为了便于启停Server,我们做一些小配置

复制控制程序

#cp./misc/redhat/ethane_*/etc/

修改配置目录,将如下两个文件中的BASEDIR=改为/usr/local/ethane,下面两个配置中的bin改为sbin,ETHANE_AGENTD,ETHANE_SUCKERD

#vi/etc/ethane_server_ctl

#vi/etc/ethane_agentd_ctl

加入开机启动

#echo'/etc/ethane_server_ctlstart&'>>/etc/

#echo'/etc/ethane_agentd_ctlstart&'>>/etc/

创建快键方式

#ln-s/etc/ethane_server_ctl/usr/bin/ethane_server_ctl

#ln-s/etc/ethane_agentd_ctl/usr/bin/ethane_agentd_ctl

启动Server和Agentd(可以通过startstoprestart来操作)

#ethane_agentd_ctlstart

#ethane_server_ctlstart

检查启动是否正常,查看进程是否起来,分server和agentd

#ps–ef|grepethane

如果进程没起来,可以查看对应的日志错误,默认在/tmp/ethane-*.log

至此平台Server端的安装已完成

在hosts上配置agent

平台需要在被监控的host上安装agent,把相应平台的agent包部署到各被监控端,按如下方式在被监控上运行agent。

Linux、UX:

Linux、UX上的agent是编译好了的,不用安装

#useraddethane

#cd/usr/local/ethane

#tarzxvf取一份server上的到本地,然后按说明修改,一般我们只需修改如下5个参数:

Server=EthaneServerIP

Hostname=本机名

LogFile=本机agentd日志保存文件

SourceIP=本机IP

ListenPort=10050

修改完成后,运行agentd

#/usr/local/ethane/sbin/ethane_agentd-c/usr/local/ethane/&

#ps–ef|grepethane_agentd

如果进程没起来,可查看日志来排查问题。

(注:

启动时建议用全路径,否则可能会出错)

加入开机运行

#echo'/usr/local/ethane/sbin/ethane_agentd-c/usr/local/ethane/&'>>/etc/

Windows:

Windows下解压客户端包到c:

下载修改好的文件也放到c:

打开cmd命令行,执行

C:

>ethane_agentd–install

安装后会在平台服务里添加一个ethane_agentd服务,会自动开机运行

如果需要将客户端和配置文件放在其他目录,请执行

C:

>DIR/ethane_agentd–cDIR/–install

启动agentd服务

C:

>ethane_agentd–start

或是通过管理->服务找到ethane_agentd来启动

3.配置使用

通过本地浏览器访问来开始配置和使用平台。

使用平台进行监控之前,要理解监控的流程。

一次完整的监控流程可以简单描述为:

HostGroups(设备组)->Hosts(设备)->Applications(监控项组)->Items(监控项)->Triggers(触发器)->Actions(告警动作)->Medias(告警方式)->UserGroups(用户组)->Users(用户)

添加Hosts

Host是平台监控的基本载体,所有的监控项都是基于host的。

通过Configuration->Hosts->CreateHost来创建监控设备

图2

按提示填入Name、Groups、IP,其他选项默认即可,LinkTemplates处选择一个模板,save即可成功添加设备。

(注:

如果host上没安装agent,添加后的状态会是unmonitor,会采集不到值,平台自带大量的设备监控模板,我们添加主机时通过link到这些模板,就可以快速添加主机的监控项和告警触发条件)。

一类的hosts可以归属到同一个HostGroup,便于分类管理同一类设备,在Configuration->HostGroup->CreateHostGroup可以添加设备组。

添加Items

Item是监控项,是监控的基本元素,每一个监控项对应一个被监控端的采集值。

在Configuration->Hosts界面,我们能看到每个host所包含的items总数,点击对应主机的items项,可以看到具体的每个item信息,这些items可以引用自templates,也可以自己创建。

图3

通过点击具体item名字可以修改已有监控项的属性,点击Satus的链接可以禁用/启用这个监控项。

(注:

我们可以通过新建一个template,在template中禁用掉所有不需要用到的items,然后把同一类hostslinkto这个template,就不用一台台主机去更改items)

新增item可以通过点击右上角的createitem来创建

图4

按提示逐项填入相关信息即可,其中key是平台已经自带的取值方法,Application类似于hostgroups,是item的组。

(itemkey也可以自定义,后面会讲到如何自定义监控项)

平台自带非常多的监控采集项及方法,基本能满足当前所有的监控功能,这些都包含在item的itemkey中了。

添加Triggers

Trigger是触发器,当Items采集值满足triggers的触发条件时,就会产生actions。

每一个trigger必须对应一个item,但一个item可以对应多个trigger。

同样,通过点击Configuration->Hosts->Triggers中某个trigger的名字,可以修改trigger的属性。

(注意:

引用自template的trigger触发值是不能单独修改的,必须在template中修改,或是复制一个同样的trigger再修改,然后禁用掉之前的)

新增trigger可以通过点击右上角的createtrigger来创建

图5

Expression中选择对应的item、触发方式及触发值,Severity是告警级别,根据trigger的严重性来选择。

平台提供多种trigger触发方式供选择,常用的我们可以选择lastvalue/=/#/N(最近一次采集值),或是选择maximalvalueforperiodoftime(一段时间内的最大值),等等。

可以根据实际需要来设定触发方式。

添加Actions

Action是告警动作,当触发器条件被满足时,就会执行指定的action。

通过Configuration->Actions->CreateAction来创建Action

图6

Eventsource:

来源

triggers,即所有的triggers条件满足时都会执行这个action

Discovery:

自动发现模块

Autoregistration:

事件产生记录

Escalations:

告警是否升级,及升级时间

Subject、Message:

告警标题和内容,此处可引用平台的宏变量;例如{{HOSTNAME}:

{}.last(0)}表示最后一次采集值。

RecoveryMessage:

告警恢复信息,不勾选平台会用默认的,勾选后自定义

Conditions:

trigger产生的条件,条件可以多选

Operation:

选择media及user

添加Medias

Media,即告警方式,平台可以提供四类Media:

Email/SMS/Jabber/Script,通过Administrator->MediaType来修改或新增告警方式

Email方式最常用的,填入相关的SMTP信息,即可通过邮件方式发送告警。

图7

SMS方式要在server主机上接入短信modem。

Jabber方式是一种linux下的即时通讯工具,通过Jabber发送即时消息。

Script方式可以通过自己编写程序或脚本的方式发送告警信息。

添加Users

在Administrator->Users可以添加用户和用户组

通过UserGroup可以限制用户的权限,ethane自带的用户组的权限限制基本能满足我们的要求。

创建用户时可以根据用户的不同作用划分到不同的组,media中填入告警接受地址及告警接受时间等信息。

图8

添加WEBMonitorings

WebMonitoring是用来监控web程序的,可以监控到web程序的下载速度、返回码及响应时间,还支持把一组连续的web动作作为一个整体来监控。

下面我们以监控登陆平台的web程序为例,来展示如何使用webmonitoring。

Configuration->web->CreateScenario创建一个Scenario(注:

必须选择host后才能创建scenario,平台的所有items都必须创建在hosts上)

图9

Application:

选择这个scenario所在的application组

Name:

scenario的名字

Basicauthentication:

鉴权

Updateinterval:

监控频率,s为单位

Agent:

选择要使用的浏览器客户端,可能同样的web程序对不同的客户端展示的内容会不一样

Status:

默认为active

Variables:

变量定义,这里定义的变量可在后续的steps中使用,这里我们定义了用户和密码的变量

Steps:

web程序的各个步骤,选择add新增一个Login的step,来模拟用户登陆,传递用户和密码给页面

图10

URL:

监控的web页面(注:

必须是全路径带页面名)

Post:

传递给页面的参数,多个参数之间用&连接,此处可引用前面定义的变量

Timeout:

超时时间

Required:

页面中能匹配到字符,匹配不到即认为错误

Statuscodes:

页面返回码

添加完step后,我们在Monitoring->web页面即能看到监控的状态和图示

图11

创建完scenario后,平台server会自动创建相关的items,所以我们只需为这些items添加triggers即可让webscenario出错时产生告警

Configuration->hosts->点击scenario所在的host条目的trigger,直接createtrigger,在selectitems的时候就可以看到平台自动创建的items(注:

自动创建的items在host的items列表中直接是看不到的,需要在创建trigger时选择items时才能看到)

图12

可以在items列表中看到,平台为每个step创建了3个item,DownloadSpeed/ResponseCode/ResponseTime,为整个scenario创建了一个的item,可以分别为其创建trigger

下例我们创建一个Login页面返回码的trigger,大于等于400即为错误

图13

再创建一个整个scenario所有step运行是否成功的trigger,采集值为0表示整个scenario的所有step都执行成功了,第几步的step执行失败就返回数字几,且后续的step都不会继续执行下去。

图14

这样,一个完整的webmonitoring就配置完成了。

Webmonitoring还有更多强大的功能,未能一一研究了解,有待挖掘

添加Graphs

平台的Graphs功能很强大,可以为每一个item绘制图,也可以把多个items绘制在一张图内。

通过configuration->hosts选择要绘制图的host,点击graphs,creategraphs即可创建图。

图15

Graphtype:

图样式,有线状、柱状、饼状

还可以自定义图大小,及Y轴最大最小值

通过additems可以添加在同一个图中展示的多个items(注:

注意每个item的颜色及取值范围,范围相差太大图会显示不全)

配置好的graphs在monitoring->graphs中查看

在monitoring->lastdata下能快速查看每个host的每个item的graph

添加Screens

Screen将多种信息放在一起展示,便于集中展示某个host的多个信息,或是比较多个hosts的同一种信息,这些信息可以为graphs、maps、serverinfos等等,几乎涵盖平台所有的监控信息。

通过configuration->screen->creatscreen来创建,创建时定义screen的行数和列数,点击对应单元格内的change,添加相应的信息

图16

通过monitoring-screen,可以查看之前配置好的信息。

添加Maps

这里可以添加关于主机的拓扑图:

configration-maps,在右上角可以createmaps或者importmap

这里我们点击cratemaps点save保存。

图17

然后编辑保存好的maps

图18

上面加号和减号可以增加主机link说明主机的连接情况,可以进行自定义。

图20

添加SNMP监控

snmp的监控要在configration中hosts中添加相关主机的模板和snmp版本,一般用snmp监控网络设备就可以了。

平台对server的监控一般是用agent来做的,所以不提供snmp对server的监控,这一点和cacit有本质的区别,因为cacti主要是通过snmp对主机和网络设备进行监控的。

图21

添加自定义监控

对于平台功能上无法实现的监控,可以通过自己编写程序或脚本来辅助完成,并将脚本的结果通过agent递交给server统一管理,一样可以绘制graph报表等。

添加Templates

如果有大量的同一类设备,需要监控的信息也大致类似,一个个去修改相关参数比较麻烦,我们可以通过创建一个template来简化操作。

Configuration->HostGroups->Template->CreateTemplate

图22

创建template后,在configuration->host->template下找到刚创建的MyLinuxTemplate,修改相关的items、triggers、graphs等信息,使满足要求后link到相关的host即可。

添加Reports(定制报表)

平台中关于报表的功能有三项:

Statusofethane:

这是关于整个监控平台的

图23

Avaliabilityreport:

整个平台可用的平台报表提供过滤功能。

图24

Mostbusytriggerstop100:

提供最常用的triggers预览:

Barreport:

可定制报表可以报多个报表整合到一起。

如下图是对test1server的freememory和swapfree每小时报表:

图25

添加Macros

Macros指宏变量,定义的宏变量可以在trigger、actions等多种场景中引用。

Macros分平台自带全局宏的及自定义的宏。

引用macros的例子可参考上述action中添加{{Hostname}:

{}.last(0)}的例子。

平台还支持自定义macros,在添加host或是template时,我们可以在macros项中定义好后续要用到的宏变量,格式为:

{macroname}=macrovalue

自定义的宏变量及平台自带的宏变量都可以在场景中引用,在遇到引用的宏变量时,会先查找当前场景中定义的宏,接着查找当前host的自定义宏,接着查找link的template的宏,最后查找平台自带的全局宏。

所以在自定义宏时注意宏引用的顺序。

添加自动发现设备

通过平台的相关设置,可以自动添加设备,可以更友好的维护和添加相关设备。

添加Inventory

Inventory用来管理设备存档信息的。

在添加host时,勾选右侧的Useprofile,我们即可填入该台设备的型号、编码、MAC地址等详细信息,勾选Useextendedprofile则可以填入更详细的信息。

图26

填写的inventory信息在inventory->hosts下能看到.可以代替OCS一些功能。

Export/ImportXML

平台提供将所有配置导出为标准XML格式的文件,同样,也支持导入标准格式的XML配置文件。

通过configuration->Export/Import->Export,勾

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > IT认证

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1