系统日常维护指导手册超详细.docx
《系统日常维护指导手册超详细.docx》由会员分享,可在线阅读,更多相关《系统日常维护指导手册超详细.docx(28页珍藏版)》请在冰豆网上搜索。
系统日常维护指导手册超详细
系统日常维护
指导手册
1、目的
网e通宽带网络运营支撑系统使用的服务器中,服务器均采用redhatlinuxas4操作系统,数据库版本为:
oracle10g,随着业务的开展,oracle数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。
本手册详细描述了程序模块,linux操作系统,DHCP双机热备、负载平衡及oracle数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。
2、适用范围
使用者为网e通宽带网络运营支撑系统维护工程师
3、服务器及数据库概述
3.1服务器概述
服务器数量:
4台,基本信息如下:
服务器
机器型号
操作系统
安装的模块
主机名
Ip地址
主服务器
DELLPC
RedHatlinuxAS4.0
Cm鉴权数据库
业务支撑数据库
主DHCP服务
oracle01
eth0:
192.168.20.60
从服务器
DELLPC
RedHatlinuxAS4.0
从DHCP服务
oracle02
eth0:
192.168.20.61
3.2数据库概述
数据库软件分别安装在主服务器上。
/dev/mapper/VolGroup00-LogVol00逻辑卷上
ORACLE_BASE=/opt/oracle
ORACLE_HOME=/opt/oracle/product/10.2.0
ORACLE_SID=oracmts
4、系统服务程序的详细说明
4.1系统服务程序的构成
DHCP主程序:
所在服务器
主服务器(ip:
192.168.20.60)
程序名称
Dhcpd
所在目录
/opt/dpcp
DHCP从程序:
所在服务器
从服务器(ip:
192.168.20.61)
程序名称
Dhcpd
所在目录
/opt/dpcp
4.2系统服务程序的启动、关闭及维护管理
4.2.1dhcp主服务
4.2.1.1dhcp主服务说明
所在目录
程序名称
程序简要说明
/opt/dpcp
Dhcpd
Dhcp主程序
/etc/dhcpd.conf
主程序的配置文件
/var/state/dhcp/dhcpd.leases
租约数据库
4.2.1.2dhcp启动、关闭及进程查看方法
1、启动方法:
输入:
cd/opt/dpcp
./dhcpd即可
注意:
请首先确认数据库服务正常,数据库监听正常。
输出:
[root@localhostdhcp]$./dhcpd
InternetSystemsConsortiumDHCPServerV3.0.4
Copyright2004-2006InternetSystemsConsortium.
Allrightsreserved.
Forinfo,pleasevisithttp:
//www.isc.org/sw/dhcp/
Wrote1leasestoleasesfile.
ListeningonLPF/eth0/00:
0c:
29:
fb:
d4:
32/192.168.50/24
SendingonLPF/eth0/00:
0c:
29:
fb:
d4:
32/192.168.50/24
SendingonSocket/fallback/fallback-net
说明:
dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。
2、关闭方法
输入:
killpid
说明:
pid为进程号,可使用进程查看获得。
如|-dhcpd(4665),则进程id为4665,则kill4665就可关闭dhcp。
3、进程查看
输入:
[root@localhostdhcp]#pstree-p|grepdhcp
输出:
|-dhcpd(4665)
4.2.1.3配置说明
启动配置文件:
etc/dhcpd.conf
可使用more或者tail命令查看
配置服务配置,更改后需要重新启动才能生效,该配置文件的设置需要与从服务器的配置文件吻合。
配置文件全文如下:
#
#DHCPServerConfigurationfile.
#see/usr/share/doc/dhcp*/dhcpd.conf.sample
#
ddns-update-stylenone;
failoverpeer"buptdhcp"
{
primary;
address192.168.20.60;
port519;
peeraddress192.168.20.61;
peerport520;
max-response-delay60;
max-unacked-updates10;
mclt600;
split128;
loadbalancemaxseconds3;
}
subnet192.168.20.0netmask255.255.255.0{
}
#---------------cisico1_cm---------------------------
subnet10.10.128.0netmask255.255.240.0{
optionrouters10.10.128.1;
filename"Disable.cm";
next-server192.168.20.60;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range10.10.128.210.10.143.254;
}
}
#---------------cisico1_iad---------------------------
shared-networkcisico1_iad{
subnet10.8.80.0netmask255.255.255.0{
optionrouters10.8.80.1;
optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range10.8.80.210.8.80.254;
}
}
}
#---------------cisico1_cpe---------------------------
shared-networkcisico1_cpe{
subnet219.234.16.0netmask255.255.248.0{
optionrouters219.234.16.1;
optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range219.234.16.2219.234.23.254;
}
}
}
租约数据库/var/state/dhcp/dhcpd.leases
可使用more或者tail命令查看
记录当前服务器与对方服务器的服务状态与分配的ip租约。
示例如下:
lease192.168.5.254{
starts22007/11/2713:
15:
22;
ends32007/11/2813:
15:
22;
tstp32007/11/2813:
15:
22;
bindingstateactive;
nextbindingstatefree;
hardwareethernet00:
11:
1a:
07:
2e:
8e;
uid"\001\000\021\032\007.\216";
optionagent.remote-id0:
11:
1a:
7:
2e:
8e;
}
Dhcp状态如下:
failoverpeer"name"state{
mystatenormalat2007/11/2713:
15:
22;
peerstatenormalat2007/11/2713:
15:
22;
}
4.2.2dhcp从服务
4.2.2.1dhcp从服务说明
所在目录
程序名称
程序简要说明
/opt/dpcp
Dhcpd
Dhcp主程序
/etc/dhcpd.conf
主程序的配置文件
/var/state/dhcp/dhcpd.leases
租约数据库
所在目录
程序名称
程序简要说明
/opt/dpcp
Dhcpd
Dhcp主程序
/etc/dhcpd.conf
主程序的配置文件
/var/state/dhcp/dhcpd.leases
租约数据库
4.2.2.2dhcp启动、关闭及进程查看方法
1、启动方法:
输入:
cd/opt/dpcp
./dhcpd即可
注意:
请首先确认数据库服务正常,数据库监听正常。
输出:
[root@localhostdhcp]$./dhcpd
InternetSystemsConsortiumDHCPServerV3.0.4
Copyright2004-2006InternetSystemsConsortium.
Allrightsreserved.
Forinfo,pleasevisithttp:
//www.isc.org/sw/dhcp/
Wrote1leasestoleasesfile.
ListeningonLPF/eth0/00:
0c:
29:
fb:
d4:
32/192.168.50/24
SendingonLPF/eth0/00:
0c:
29:
fb:
d4:
32/192.168.50/24
SendingonSocket/fallback/fallback-net
说明:
dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。
2、关闭方法
输入:
killpid
说明:
pid为进程号,可使用进程查看获得。
如|-dhcpd(4665),则进程id为4665,则kill4665就可关闭dhcp。
3、进程查看
输入:
[root@localhostdhcp]#pstree-p|grepdhcp
输出:
|-dhcpd(4665)
4.2.2.3配置说明
启动配置文件:
etc/dhcpd.conf
可使用more或者tail命令查看.
配置服务配置,更改后需要重新启动才能生效,该配置文件的设置需要与主服务器的配置文件吻合。
配置文件全文如下:
#
#DHCPServerConfigurationfile.
#see/usr/share/doc/dhcp*/dhcpd.conf.sample
#
ddns-update-stylenone;
failoverpeer"buptdhcp"
{
secondary;
address192.168.20.61;
port520;
peeraddress192.168.20.60;
peerport519;
max-response-delay60;
max-unacked-updates10;
mclt600;
#split128;
loadbalancemaxseconds3;
}
subnet192.168.20.0netmask255.255.255.0{
}
#---------------cisico1_cm---------------------------
subnet10.10.128.0netmask255.255.240.0{
optionrouters10.10.128.1;
filename"Disable.cm";
next-server192.168.20.60;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range10.10.128.210.10.143.254;
}
}
#---------------cisico1_iad---------------------------
shared-networkcisico1_iad{
subnet10.8.80.0netmask255.255.255.0{
optionrouters10.8.80.1;
optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range10.8.80.210.8.80.254;
}
}
}
#---------------cisico1_cpe---------------------------
shared-networkcisico1_cpe{
subnet219.234.16.0netmask255.255.248.0{
optionrouters219.234.16.1;
optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range219.234.16.2219.234.23.254;
}
}
}
租约数据库/var/state/dhcp/dhcpd.leases
记录当前服务器与对方服务器的服务状态与分配的ip租约。
示例如下:
lease192.168.5.254{
starts22007/11/2713:
15:
22;
ends32007/11/2813:
15:
22;
tstp32007/11/2813:
15:
22;
bindingstateactive;
nextbindingstatefree;
hardwareethernet00:
11:
1a:
07:
2e:
8e;
uid"\001\000\021\032\007.\216";
optionagent.remote-id0:
11:
1a:
7:
2e:
8e;
}
Dhcp状态如下:
failoverpeer"name"state{
mystatenormalat2007/11/2713:
15:
22;
peerstatenormalat2007/11/2713:
15:
22;
}
4.2.3web管理模块
4.2.3.1web管理模块中主要目录说明
/opt/apache-2.0.52为apache模块所在目录
/opt/taiyuan为web程序存储目录
4.2.5.2web管理模块中各程序说明
命令所在目录:
/opt/apache/bin
命令
命令说明
apachectl
ApacheHTTP服务器控制接口
httpd
Apache超文本传输协议服务器
ab
ApacheHTTP服务器性能测试工具
apxs
APache功能扩展工具
dbmmanage
建立和更新DBM形式的基本认证文件
htdigest
建立和更新摘要认证文件
htpasswd
建立和更新基本认证文件
logresolve
将Apache日志文件中的IP地址解析为主机名
rotatelogs
滚动Apache日志而无须终止服务器
4.2.5.3web站点启动、关闭及进程查看方法
命令所在目录
命令
命令说明
/opt/apache/bin
./apachectlstart
启动httpd
/opt/apache/bin
./apachectlstartssl
启动httpd并加载SSL服务
/opt/apache/bin
./apachectlstop
关闭apache
/opt/apache/bin
./apachectlstatus
查看apache的状态
4.2.5.4web日志说明
Log存放目录为:
/opt/apache/logs
/opt/apache/logs/access_log为所有访问网站的日志
/opt/apache/logs/error_log为错误信息日志
/opt/apache/logs/httpd.pid为主进程的pid号
/opt/apache/logs/ssl_engine_log为ssl引擎日志,即ssl的运行日志,可以通过查看此日志了解运行状态及错误。
/opt/apache/logs/ssl_request_log为ssl请求日志
即是哪个ip使用httpsssi协议登录web站点,请求的时间,内容,访问的页面等。
4.2.5.5日常维护
维护分为:
业务维护及系统维护
业务维护就是,利用系统管理员的身份,查看操作日志
系统维护是:
定期查看系统日志,apache日志等,看是否有运行错误,并定期备份日志。
5、服务器硬件维护(略)
6、linux系统的日常维护
6.1定期检查磁盘空间
使用df显示磁盘空间
输入:
[oracle@localhostserver]$df
输出:
Filesystem1K-blocksUsedAvailableUse%Mountedon
/dev/cciss/c0d0p21079383367612144948432088%/
/dev/cciss/c0d0p1101086123088355913%/boot
none2073908420739041%/dev/shm
/dev/cciss/c0d0p530976636185056292180161%/home
说明:
这里显示了/、/boot、/home分区挂载的系统分区使用的大小,磁盘空间以k为单位。
可以加参数-h
[oracle@localhostserver]$df-h
FilesystemSizeUsedAvailUse%Mountedon
/dev/cciss/c0d0p2103G7.3G91G8%/
/dev/cciss/c0d0p199M13M82M13%/boot
none2.0G4.0K2.0G1%/dev/shm
/dev/cciss/c0d0p530G181M28G1%/home
注意:
当某空间使用率超过85%时,通过du查看是哪些文件占用的空间比较大
例如/home使用了85%
cd/home
以root用户查看
su
输入root用户密码
[root@localhost/]#du-m--max-depth=1
-m是以M大小显示
--max-depth=1表示只是一级子目录的大小,如果想查看二级的就写为2
找出占用很大的文件,经判断后决定删除或转移。
6.2使用top工具监视cpu及内存的使用率
每隔5秒,top工具确定哪些进程消耗最多的cpu时间,并按递减顺序在屏幕显示。
输入:
[oracle@localhost/]$top
输出:
top-10:
52:
46up6days,39min,2users,loadaverage:
0.12,0.09,0.02
Tasks:
123total,1running,122sleeping,0stopped,0zombie
Cpu(s):
0.2%us,0.2%sy,0.0%ni,99.3%id,0.4%wa,0.0%hi,0.0%si
Mem:
8247956ktotal,1828612kused,6419344kfree,119476kbuffers
Swap:
8385920ktotal,0kused,8385920kfree,1526064kcached
PIDUSERPRNIVIRTRESSHRS%CPU%MEMTIME+COMMAND
1root1603004552472S0.00.00:
01.02init
2rootRT0000S0.00.00:
01.28migration/0
3root3419000S0.00.00:
00.04ksoftirqd/0
4rootRT0000S0.00.00:
01.28migration/1
5root3419000S0.00.00:
00.04ksoftirqd/1
6rootRT0000S0.00.00:
00.65migration/2说明:
当发现个别进程占用率很高,可以通过用“ps–axj|grep进程名”查看这个进程在进行什么操作,如果发现这个进程持续的时间很长,而且非系统必要进程;可以通过“kill–9”进程的PID号,将进程杀死。
(不确定情况下,请不要使用);
退出top用ctrl+c。
6.3定期查看root邮件
输入:
[oracle@localhostlog]$su-l
Password:
[root@localhostroot]#mail
输出:
1root@localhost.localFriSep816:
2318/704"HPInsightManagementAgentsTrapAlarm"
N2root@localhost.localFriSep816:
2318/684"HPA