Nagios监控软件安装和配置文档.docx
《Nagios监控软件安装和配置文档.docx》由会员分享,可在线阅读,更多相关《Nagios监控软件安装和配置文档.docx(32页珍藏版)》请在冰豆网上搜索。
Nagios监控软件安装和配置文档
监控软件安装和配置文档
监控软件安装和配置文档1
1初始安装1
1.1监控软件介质列表1
1.2服务端安装2
1.2.1软件包安装2
1.2.2创建系统业务用户2
1.2.3上传安装包3
1.2.4编译安装Nagios3
1.2.5配置web接口3
1.2.6编译和安装Nagiosplugins4
1.2.7安装NagiosChineseplugin4
1.2.8开启nagios4
1.2.9登陆web界面4
1.3Linux客户端安装5
1.3.1创建系统业务账户5
1.3.2上传安装包5
1.3.3安装NagiosPlugins5
1.3.4安装xinetd5
1.3.5安装NRPEdaemon6
1.3.6测试本地NRPEdaemon6
1.3.7配置NRPE命令7
1.3.8服务端配置(新添节点忽略)7
1.3.9定制监控服务(新添节点忽略)11
1.4Windows客户端安装12
1.4.1what’sAlreadyDoneForyou12
1.4.2Prerequisites13
1.4.3InstallingtheWindowsAgent13
1.4.4MonitoringMachine(服务端配置新添加节点则滤过)18
2事件处理22
2.1Linux事件处理22
2.2日志25
2.3测试方法25
1初始安装
1.1监控软件介质列表
软件包
操作系统平台
版本
用途
nagios-4.1.1.tar.gz
Linux
4.1.1
服务端
nagios-cn-3.2.3.tar.bz2
Linux
3.2.3
中文插件
nagios-plugins-2.1.1.tar.gz
Linux
2.1.1
插件
nrpe-2.15.tar.gz
Linux
2,150.4.4.15
客户端
NSCP-0.4.4.15-x64.msi
windowx86_64
客户端
1.2服务端安装
1.2.1软件包安装
安装中一部分需要有root权限。
需要以下安装包:
●Apache
●PHP
●GCCcompiler
●GD
可以利用yum安装
yuminstallhttpdphp
yuminstallgccglibcglibc‐common
yuminstallgdgd‐devel
1.2.2创建系统业务用户
以root用户登录
建立一个新的nagios用户账户并设置密码用于操作nagios
/usr/sbin/useradd‐mnagios
passwdnagios
建立一个新的nagcmd组添加nagios和apache用户到此组。
用于外部命令通过web接口提交。
/usr/sbin/groupaddnagcmd
/usr/sbin/usermod‐a‐Gnagcmdnagios
/usr/sbin/usermod‐a‐Gnagcmdapache
1.2.3上传安装包
nagios-4.1.1.tar.gznagios-cn-3.2.3.tar.bz2nagios-plugins-2.1.1.tar.gznrpe-2.15.tar.gz
1.2.4编译安装Nagios
解压nagios压缩包
cd/download
tarxzfnagios-4.1.1.tar.gz
cdnagios-4.1.1
运行Nagios配置脚本,并传递组名nagcmd
./configure‐‐with‐command‐group=nagcmd
编译Nagios源代码
makeall
安装二进制,安装脚本,示例配置文件和设置权限给外部命令目录
makeinstall
makeinstall‐init
makeinstall‐config
makeinstall‐commandmode
先不要开启Nagios,接下来还有很多配置需要做。
1.2.5配置web接口
继续运行make命令安装Nagios的web配置文件到Apache的conf.d目录
makeinstall‐webconf
建立一个nagiosadmin用户,用来登录到Nagiosweb接口。
记住这个分配的密码。
htpasswd‐c/usr/local/nagios/etc/htpasswd.usersnagiosadmin
重启Apache使配置生效
servicehttpdrestart
1.2.6编译和安装Nagiosplugins
解压NagiosPlugins压缩包
cd/downloads
tarxzfnagios-plugins-2.1.1.tar.gz
cdnagios-plugins-2.1.1
编译和安装Plugins
./configure‐‐with‐nagios‐user=nagios‐‐with‐nagios‐group=nagios
make
makeinstall
1.2.7安装NagiosChineseplugin
tarxvfznagios-cn-3.2.3.tar.bz2
cdnagios-cn-3.2.3
./configure–prefix=/usr/local/nagios#defaultinstallstation/usr/local/nagios
makeall
makeinstall
1.2.8开启nagios
添加Nagios为系统服务和开机自动启动
chkconfig‐‐addnagios
chkconfignagioson
校验Nagios示例配置文件
/usr/local/nagios/bin/nagios‐v/usr/local/nagios/etc/nagios.cfg
如果没有错误,则启动Nagios
servicenagiosstart
1.2.9登陆web界面
输入以下URL即可访问NagiosWeb管理界面,用户名(nagiosadmin)和密码(nagios)为先前设置。
http:
//localhost/nagios/
Nagios会花费一些时间去检查本机的需要检查的资源项。
1.3Linux客户端安装
1.3.1创建系统业务账户
以root用户登录:
/usr/sbin/useraddnagios
passwdnagios
1.3.2上传安装包
nagios-plugins-2.1.1.tar.gznrpe-2.15.tar.gz
1.3.3安装NagiosPlugins
yum准备软件包
yuminstallgcc
yuminstallopenssl*
解压
tarxzfnagios-plugins-2.1.1.tar.gz
cdnagios-plugins-2.1.1
编译和安装插件
./configure
make
makeinstall
设置安装目录权限
chownnagios.nagios/usr/local/nagios
chown-Rnagios.nagios/usr/local/nagios/libexec
1.3.4安装xinetd
xinetd是RedHatLinux9及其以上版本的网络进程,是一个linux中的守护进程。
yuminstallxinetd
1.3.5安装NRPEdaemon
解压文件
tarxzfnrpe-2.15.tar.gz
cdnrpe-2.15
编译
./configure--enable-command-args
makeall
安装NRPE插件,守护进程和守护进程示例配置文件
makeinstall-plugin
makeinstall-daemon
makeinstall-daemon-config
将NRPE守护进程作为一个服务注册到xinetd
makeinstall-xinetd
编辑/etc/xinetd.d/nrpe文件,添加monitoringserver的IP地址到only_from指令下
only_from=127.0.0.1
编辑/etc/services文件,添加NRPE守护进程的入口
nrpe5666/tcp#NRPE
重启xinedservice
servicexinetdrestart
1.3.6测试本地NRPEdaemon
确保NRPE守护进程在xinetd下运行
netstat-at|grepnrpe
命令输出应该如下:
tcp00*:
nrpe*:
*LISTEN
如果NRPE没有运行,则检查下面几项:
Ø是否添加NRPE入口到/etc/services
Ø/etc/xinetd.d/nrpe文件中的only_from的指向值里包含127.0.0.1
Øxinetd安装并开启
Ø检查systemlog中是否记录xinetd或nrpe有错误,并修正
下一步,检测NRPE守护进程的功能是正常的。
运行下面的命令:
localhost可以换成127.0.0.1
/usr/local/nagios/libexec/check_nrpe-Hlocalhost
会得到NRPE的版本号:
NRPEv2.15
1.3.7配置NRPE命令
配置文件,来控制监控哪些服务或资源
vi/usr/local/nagios/etc/nrpe.cfg
以下即为本地配置的检测命令:
1.3.8服务端配置(新添节点忽略)
在Monitoringmachine上,需要做以下一些工作:
Ø安装check_nrpe插件
Ø建立check_nrpe命令定义在Nagios命令定义配置中
Ø配置host和services对应remotelinux/unixmachine监控
1.3.8.1安装check_nrpeplugin
以root用户登入
解压文件
tarxzfnrpe-2.15.tar.gz
cdnrpe-2.15
编译
./configure--enable-command-args
makeall
安装NRPE插件
makeinstall-plugin
1.3.8.2测试与客户端通信
确保check_nrpe插件能够访问remotelinux/unixmachine的NRPE守护进程。
将192.168.0.1替换为remotelinux/unixmachine的IP地址:
/usr/local/nagios/libexec/check_nrpe-H192.168.0.1
输出NRPE的版本
NRPEv2.15
如果结果返回timeouterror,则检查以下几项:
Ø确认通信中没有防火墙阻塞访问
Ø确认NRPE守护进程已经注册到xinetd守护进程下
Ø确认remotelinux/unixmachine的本地iptables防火墙允许远程机器访问NRPE守护进程
1.3.8.3创建命令定义
编辑配置文件
vi/usr/local/nagios/etc/commands.cfg
添加check_nrpe的命令定义
definecommand{
command_namecheck_nrpe
command_line$USER1$/check_nrpe-H$HOSTADDRESS$-c$ARG1$
}
1.3.8.4创建主机和服务定义
需要以下步骤:
Ø建立远程host模板
Ø新建nrpe.cfg配置文件添加到nagios.cfg主配置文件
Ø建立远程host
Ø建立远程服务
编辑模板配置文件
vi/usr/local/nagios/etc/objects/templates.cfg
添加host模板
definehost{
namelinux-box;Nameofthistemplate
usegeneric-host;Inheritdefaultvalues
check_period24x7
check_interval5
retry_interval1
max_check_attempts10
check_commandcheck-host-alive
notification_period24x7
notification_interval30
notification_optionsd,r
contact_groupsadmins
register0;DONTREGISTERTHIS-ITSATEMPLATE
}
新建一个nrpe配置文件
touch/usr/local/nagios/etc/objects/nrpe.cfg
编辑nagios.cfg配置文件
vi/usr/local/nagios/etc/nagios.cfg
添加nrpe.cfg
#Definitionsformonitoringtheremotelinuxhost
cfg_file=/usr/local/nagios/etc/objects/nrpe.cfg
编辑nrpe.cfg文件
vi/usr/local/nagios/etc/objects/nrpe.cfg
添加host和服务
definehost{
uselinux-box;Inheritdefaultvaluesfromatemplate
host_nameremotehost;Thenamewe'regivingtothisserver
aliasredhatCore6;Alongernamefortheserver
address192.168.3.119;IPaddressoftheserver
}
#checkcpuload
defineservice{
usegeneric-service
host_nameremotehost
service_descriptionCPULoad
check_commandcheck_nrpe!
check_load
}
#checkuser
defineservice{
usegeneric-service
host_nameremotehost
service_descriptionCurrentUsers
check_commandcheck_nrpe!
check_users
}
#checkdiskspace
defineservice{
usegeneric-service
host_nameremotehost
service_description/dev/hda1FreeSpace
check_commandcheck_nrpe!
check_hda1
}
#checkthenumberofprocesses
defineservice{
usegeneric-service
host_nameremotehost
service_descriptionTotalProcesses
check_commandcheck_nrpe!
check_total_procs
}
#checkzombieprocesses
defineservice{
usegeneric-service
host_nameremotehost
service_descriptionZombieProcesses
check_commandcheck_nrpe!
check_zombie_procs
}
1.3.8.5重启nagios
校验Nagios示例配置文件(每次更新配置后都要verify一次配置文件)
/usr/local/nagios/bin/nagios‐v/usr/local/nagios/etc/nagios.cfg
如果没有错误,则启动Nagios
servicenagiosrestart
1.3.9定制监控服务(新添节点忽略)
如果想要监控remotelinux/unixmachine上更多的服务,是很容易实现的。
需要以下两个步骤:
Ø添加一个新的command定义在remotelinux/unixmachine上的nrpe.cfg配置文件中
Ø添加一个新的service定义在Monitoringmachine的nagios配置文件中
1.3.9.1RemoteHostconfiguration
以check_swap插件为例
以nagios用户登录到remotehost
验证check_swap插件是否可以使用,并调整warning和critical的比例值
/usr/local/nagios/libexec/check_swap-w20%-c10%
输出如下:
SWAPOK-100%free(3999MBoutof3999MB)|swap=3999MB;799;399;0;3999
将此命令定义到nrpe配置文件
vi/usr/local/nagios/etc/nrpe.cfg
添加check_swap命令定义
command[check_swap]=/usr/local/nagios/libexec/check_swap-w20%-c10%
如果nrpe作为独立的守护进程运行则重启,如附属在xinetd超级守护进程下则不用重启即可生效。
1.3.9.2MonitoringHostConfiguration
在Monitoringmachine上,你需要定义一个新的服务用来监控remotelinux/unixmachine上的swap使用情况。
添加如下
编辑nrpe.cfg
vi/usr/local/nagios/etc/objects/nrpe.cfg
添加service
defineservice{
usegeneric-service
host_nameremotehost
service_descriptionSwapUsage
check_commandcheck_nrpe!
check_swap
}
校验Nagios示例配置文件(每次更新配置后都要verify一次配置文件)
/usr/local/nagios/bin/nagios‐v/usr/local/nagios/etc/nagios.cfg
如果没有错误,则启动Nagios
servicenagiosrestart
1.4Windows客户端安装
安装步骤简述:
1、执行先决条件检查
2、在windowsmachine上安装监控代理软件
3、在MonitoringMachine配置一个新的host和service用于监控windowsmachine
4、重启Nagios进程
1.4.1what’sAlreadyDoneForyou
为了让配置更简单,有些配置工作已经提前预设置好了。
●check_nt的命令定义已经添加到commands.cfg文件。
用来使用check_nt插件监控windowservices.
●windowserverhost模板定义已经在templates.cfg中建立。
这样使得添加windowshost定义简单化。
1.4.2Prerequisites
此操作仅在第一次配置监控windowsmachine。
编辑Nagios主配置文件
vi/usr/local/nagios/etc/nagios.cfg
去除注释
#cfg_file=/usr/local/nagios/etc/objects/windows.cfg
保存并退出
此操作将使Nagios启动时读取/usr/local/nagios/etc/objects/windows.cfg配置文件加载其中的host和service。
此文件中已经配置好示例,如有新的需求可依照示例文件进行配置。
1.4.3InstallingtheWindowsAgent
想要监控windowsmachines的私有服务和属性,那么首先需要安装代理程序。
建议使用的代理插件为NSClient++。
官方下载地址为:
(
安装步骤如下:
1)安装
点击NSCP-0.4.4.15-x64.msi安装
2)安装成功后查看12489端口是否启用netstat–anbv|find“12489”
3)查看计算机服务NSClient++是否正常
4)客户端配置文件为查看安装目录下nsclient.ini注:
nsclient-sample.ini为示例文件,展示各个参数的用意
#Ifyouwanttofillthisfilewithallavalibleoptionsrunthefollowingcommand:
#nscpsettings--generate--add-defaults--load-all
#Ifyouwanttoactivateamoduleandbringinallitsoptionsuse:
#nscpsettings--activate-module--add-defaults
#Fordetailsrun:
nscpsettings--help
;Undocumentedsection
[/settings/default]
;Undocumentedkey
password=vcitest
;Undocumentedkey
allowedhosts=127.0.0.1,192.168.xx.xx
;Undocumentedsection
[/se