系统日常维护指导手册超详细.docx
《系统日常维护指导手册超详细.docx》由会员分享,可在线阅读,更多相关《系统日常维护指导手册超详细.docx(30页珍藏版)》请在冰豆网上搜索。
系统日常维护指导手册超详细
Forpersonaluseonlyinstudyandresearch;notforcommercialuse
系统日常维护
指导手册
目录
1、目的4
2、适用范围4
3、服务器及数据库概述4
3.1服务器概述4
3.2数据库概述4
4、系统服务程序的详细说明5
4.1系统服务程序的构成5
4.2系统服务程序的启动、关闭及维护管理5
4.2.1dhcp主服务5
4.2.1.1dhcp主服务说明5
4.2.1.2dhcp启动、关闭及进程查看方法5
4.2.1.3配置说明6
4.2.2dhcp从服务6
4.2.2.1dhcp从服务说明6
4.2.2.2dhcp启动、关闭及进程查看方法6
4.2.2.3配置说明7
4.2.3web管理模块7
4.2.3.1web管理模块中主要目录说明7
4.2.5.2web管理模块中各程序说明8
4.2.5.3web站点启动、关闭及进程查看方法8
4.2.5.4web日志说明8
4.2.5.5日常维护8
5、服务器硬件维护(略)9
6、linux系统的日常维护9
6.1定期检查磁盘空间9
6.2使用top工具监视cpu及内存的使用率10
6.3定期查看root邮件10
6.4定期查看系统日志11
7、备份策略11
7.1备份方式11
7.2备份计划11
7.3常见故障恢复11
7.3.1实例故障12
7.3.2介质故障12
9、数据库的日常维护14
9.1检查数据库的基本状况14
9.1.1检查oracle的进程14
9.1.2检查oracle监听进程15
9.1.3检查oracle实例状态16
9.2检查数据库日志文件17
9.3检查oracle对象的状态17
9.3.1检查oracle控制文件状态17
9.3.2检查oracle在线日志状态18
9.3.3检查oracle表空间的状态18
9.3.4检查oracle所有数据文件状态18
9.3.5检查Oracle所有回滚段的状态19
9.3.6检查Oracle所有表、索引、存储过程、触发器等对象的状态19
9.4监控数据库表空间的使用情况(字典管理表空间)19
9.4.1判断是否需要碎片整理20
9.4.2判断是否需要扩展表空间20
9.5查看数据库的连接情况21
9.6术语解释22
10、命令解释22
1、目的
网e通宽带网络运营支撑系统使用的服务器中,服务器均采用redhatlinuxas4操作系统,数据库版本为:
oracle10g,随着业务的开展,oracle数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。
本手册详细描述了程序模块,linux操作系统,DHCP双机热备、负载平衡及oracle数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。
2、适用范围
使用者为网e通宽带网络运营支撑系统维护工程师
3、服务器及数据库概述
3.1服务器概述
服务器数量:
4台,基本信息如下:
服务器
机器型号
操作系统
安装的模块
主机名
Ip地址
主服务器
DELLPC
RedHatlinuxAS4.0
Cm鉴权数据库
业务支撑数据库
主DHCP服务
oracle01
eth0:
192.168.20.60
从服务器
DELLPC
RedHatlinuxAS4.0
从DHCP服务
oracle02
eth0:
192.168.20.61
3.2数据库概述
数据库软件分别安装在主服务器上。
/dev/mapper/VolGroup00-LogVol00逻辑卷上
ORACLE_BASE=/opt/oracle
ORACLE_HOME=/opt/oracle/product/10.2.0
ORACLE_SID=oracmts
4、系统服务程序的详细说明
4.1系统服务程序的构成
DHCP主程序:
所在服务器
主服务器(ip:
192.168.20.60)
程序名称
Dhcpd
所在目录
/opt/dpcp
DHCP从程序:
所在服务器
从服务器(ip:
192.168.20.61)
程序名称
Dhcpd
所在目录
/opt/dpcp
4.2系统服务程序的启动、关闭及维护管理
4.2.1dhcp主服务
4.2.1.1dhcp主服务说明
所在目录
程序名称
程序简要说明
/opt/dpcp
Dhcpd
Dhcp主程序
/etc/dhcpd.conf
主程序的配置文件
/var/state/dhcp/dhcpd.leases
租约数据库
4.2.1.2dhcp启动、关闭及进程查看方法
1、启动方法:
输入:
cd/opt/dpcp
./dhcpd即可
注意:
请首先确认数据库服务正常,数据库监听正常。
输出:
[root@localhostdhcp]$./dhcpd
InternetSystemsConsortiumDHCPServerV3.0.4
Copyright2004-2006InternetSystemsConsortium.
Allrightsreserved.
Forinfo,pleasevisithttp:
//www.isc.org/sw/dhcp/
Wrote1leasestoleasesfile.
ListeningonLPF/eth0/00:
0c:
29:
fb:
d4:
32/192.168.50/24
SendingonLPF/eth0/00:
0c:
29:
fb:
d4:
32/192.168.50/24
SendingonSocket/fallback/fallback-net
说明:
dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。
2、关闭方法
输入:
killpid
说明:
pid为进程号,可使用进程查看获得。
如|-dhcpd(4665),则进程id为4665,则kill4665就可关闭dhcp。
3、进程查看
输入:
[root@localhostdhcp]#pstree-p|grepdhcp
输出:
|-dhcpd(4665)
4.2.1.3配置说明
启动配置文件:
etc/dhcpd.conf
可使用more或者tail命令查看
配置服务配置,更改后需要重新启动才能生效,该配置文件的设置需要与从服务器的配置文件吻合。
配置文件全文如下:
#
#DHCPServerConfigurationfile.
#see/usr/share/doc/dhcp*/dhcpd.conf.sample
#
ddns-update-stylenone;
failoverpeer"buptdhcp"
{
primary;
address192.168.20.60;
port519;
peeraddress192.168.20.61;
peerport520;
max-response-delay60;
max-unacked-updates10;
mclt600;
split128;
loadbalancemaxseconds3;
}
subnet192.168.20.0netmask255.255.255.0{
}
#---------------cisico1_cm---------------------------
subnet10.10.128.0netmask255.255.240.0{
optionrouters10.10.128.1;
filename"Disable.cm";
next-server192.168.20.60;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range10.10.128.210.10.143.254;
}
}
#---------------cisico1_iad---------------------------
shared-networkcisico1_iad{
subnet10.8.80.0netmask255.255.255.0{
optionrouters10.8.80.1;
optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range10.8.80.210.8.80.254;
}
}
}
#---------------cisico1_cpe---------------------------
shared-networkcisico1_cpe{
subnet219.234.16.0netmask255.255.248.0{
optionrouters219.234.16.1;
optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range219.234.16.2219.234.23.254;
}
}
}
租约数据库/var/state/dhcp/dhcpd.leases
可使用more或者tail命令查看
记录当前服务器与对方服务器的服务状态与分配的ip租约。
示例如下:
lease192.168.5.254{
starts22007/11/2713:
15:
22;
ends32007/11/2813:
15:
22;
tstp32007/11/2813:
15:
22;
bindingstateactive;
nextbindingstatefree;
hardwareethernet00:
11:
1a:
07:
2e:
8e;
uid"\001\000\021\032\007.\216";
optionagent.remote-id0:
11:
1a:
7:
2e:
8e;
}
Dhcp状态如下:
failoverpeer"name"state{
mystatenormalat2007/11/2713:
15:
22;
peerstatenormalat2007/11/2713:
15:
22;
}
4.2.2dhcp从服务
4.2.2.1dhcp从服务说明
所在目录
程序名称
程序简要说明
/opt/dpcp
Dhcpd
Dhcp主程序
/etc/dhcpd.conf
主程序的配置文件
/var/state/dhcp/dhcpd.leases
租约数据库
所在目录
程序名称
程序简要说明
/opt/dpcp
Dhcpd
Dhcp主程序
/etc/dhcpd.conf
主程序的配置文件
/var/state/dhcp/dhcpd.leases
租约数据库
4.2.2.2dhcp启动、关闭及进程查看方法
1、启动方法:
输入:
cd/opt/dpcp
./dhcpd即可
注意:
请首先确认数据库服务正常,数据库监听正常。
输出:
[root@localhostdhcp]$./dhcpd
InternetSystemsConsortiumDHCPServerV3.0.4
Copyright2004-2006InternetSystemsConsortium.
Allrightsreserved.
Forinfo,pleasevisithttp:
//www.isc.org/sw/dhcp/
Wrote1leasestoleasesfile.
ListeningonLPF/eth0/00:
0c:
29:
fb:
d4:
32/192.168.50/24
SendingonLPF/eth0/00:
0c:
29:
fb:
d4:
32/192.168.50/24
SendingonSocket/fallback/fallback-net
说明:
dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。
2、关闭方法
输入:
killpid
说明:
pid为进程号,可使用进程查看获得。
如|-dhcpd(4665),则进程id为4665,则kill4665就可关闭dhcp。
3、进程查看
输入:
[root@localhostdhcp]#pstree-p|grepdhcp
输出:
|-dhcpd(4665)
4.2.2.3配置说明
启动配置文件:
etc/dhcpd.conf
可使用more或者tail命令查看.
配置服务配置,更改后需要重新启动才能生效,该配置文件的设置需要与主服务器的配置文件吻合。
配置文件全文如下:
#
#DHCPServerConfigurationfile.
#see/usr/share/doc/dhcp*/dhcpd.conf.sample
#
ddns-update-stylenone;
failoverpeer"buptdhcp"
{
secondary;
address192.168.20.61;
port520;
peeraddress192.168.20.60;
peerport519;
max-response-delay60;
max-unacked-updates10;
mclt600;
#split128;
loadbalancemaxseconds3;
}
subnet192.168.20.0netmask255.255.255.0{
}
#---------------cisico1_cm---------------------------
subnet10.10.128.0netmask255.255.240.0{
optionrouters10.10.128.1;
filename"Disable.cm";
next-server192.168.20.60;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range10.10.128.210.10.143.254;
}
}
#---------------cisico1_iad---------------------------
shared-networkcisico1_iad{
subnet10.8.80.0netmask255.255.255.0{
optionrouters10.8.80.1;
optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range10.8.80.210.8.80.254;
}
}
}
#---------------cisico1_cpe---------------------------
shared-networkcisico1_cpe{
subnet219.234.16.0netmask255.255.248.0{
optionrouters219.234.16.1;
optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;
default-lease-time3600;
pool
{
failoverpeer"buptdhcp";
denydynamicbootpclients;
range219.234.16.2219.234.23.254;
}
}
}
租约数据库/var/state/dhcp/dhcpd.leases
记录当前服务器与对方服务器的服务状态与分配的ip租约。
示例如下:
lease192.168.5.254{
starts22007/11/2713:
15:
22;
ends32007/11/2813:
15:
22;
tstp32007/11/2813:
15:
22;
bindingstateactive;
nextbindingstatefree;
hardwareethernet00:
11:
1a:
07:
2e:
8e;
uid"\001\000\021\032\007.\216";
optionagent.remote-id0:
11:
1a:
7:
2e:
8e;
}
Dhcp状态如下:
failoverpeer"name"state{
mystatenormalat2007/11/2713:
15:
22;
peerstatenormalat2007/11/2713:
15:
22;
}
4.2.3web管理模块
4.2.3.1web管理模块中主要目录说明
/opt/apache-2.0.52为apache模块所在目录
/opt/taiyuan为web程序存储目录
4.2.5.2web管理模块中各程序说明
命令所在目录:
/opt/apache/bin
命令
命令说明
apachectl
ApacheHTTP服务器控制接口
httpd
Apache超文本传输协议服务器
ab
ApacheHTTP服务器性能测试工具
apxs
APache功能扩展工具
dbmmanage
建立和更新DBM形式的基本认证文件
htdigest
建立和更新摘要认证文件
htpasswd
建立和更新基本认证文件
logresolve
将Apache日志文件中的IP地址解析为主机名
rotatelogs
滚动Apache日志而无须终止服务器
4.2.5.3web站点启动、关闭及进程查看方法
命令所在目录
命令
命令说明
/opt/apache/bin
./apachectlstart
启动httpd
/opt/apache/bin
./apachectlstartssl
启动httpd并加载SSL服务
/opt/apache/bin
./apachectlstop
关闭apache
/opt/apache/bin
./apachectlstatus
查看apache的状态
4.2.5.4web日志说明
Log存放目录为:
/opt/apache/logs
/opt/apache/logs/access_log为所有访问网站的日志
/opt/apache/logs/error_log为错误信息日志
/opt/apache/logs/httpd.pid为主进程的pid号
/opt/apache/logs/ssl_engine_log为ssl引擎日志,即ssl的运行日志,可以通过查看此日志了解运行状态及错误。
/opt/apache/logs/ssl_request_log为ssl请求日志
即是哪个ip使用httpsssi协议登录web站点,请求的时间,内容,访问的页面等。
4.2.5.5日常维护
维护分为:
业务维护及系统维护
业务维护就是,利用系统管理员的身份,查看操作日志
系统维护是:
定期查看系统日志,apache日志等,看是否有运行错误,并定期备份日志。
5、服务器硬件维护(略)
6、linux系统的日常维护
6.1定期检查磁盘空间
使用df显示磁盘空间
输入:
[oracle@localhostserver]$df
输出:
Filesystem1K-blocksUsedAvailableUse%Mountedon
/dev/cciss/c0d0p21079383367612144948432088%/
/dev/cciss/c0d0p1101086123088355913%/boot
none2073908420739041%/dev/shm
/dev/cciss/c0d0p530976636185056292180161%/home
说明:
这里显示了/、/boot、/home分区挂载的系统分区使用的大小,磁盘空间以k为单位。
可以加参数-h
[oracle@localhostserver]$df-h
FilesystemSizeUsedAvailUse%Mountedon
/dev/cciss/c0d0p2103G7.3G91G8%/
/dev/cciss/c0d0p199M13M82M13%/boot
none2.0G4.0K2.0G1%/dev/shm
/dev/cciss/c0d0p530G181M28G1%/home
注意:
当某空间使用率超过85%时,通过du查看是哪些文件占用的空间比较大
例如/home使用了85%
cd/home
以root用户查看
su
输入root用户密码
[root@localhost/]#du-m--max-depth=1
-m是以M大小显示
--max-depth=1表示只是一级子目录的大小,如果想查看二级的就写为2
找出占用很大的文件,经判断后决定删除或转移。
6.2使用top工具监视cpu及内存的使用率
每隔5秒,top工具确定哪些进程消耗最多的cpu时间,并按递减顺序在屏幕显示。
输入:
[oracle@lo