利用Oracle数据库存储和分析Unix操作系统的性能.docx
《利用Oracle数据库存储和分析Unix操作系统的性能.docx》由会员分享,可在线阅读,更多相关《利用Oracle数据库存储和分析Unix操作系统的性能.docx(11页珍藏版)》请在冰豆网上搜索。
![利用Oracle数据库存储和分析Unix操作系统的性能.docx](https://file1.bdocx.com/fileroot1/2023-7/9/1b6fc643-2c72-445d-ad4c-8d54708a4dd3/1b6fc643-2c72-445d-ad4c-8d54708a4dd31.gif)
利用Oracle数据库存储和分析Unix操作系统的性能
文章来源:
王朝网络 网友评论 转载本文
标签:
OracleUnix分析利用存储性能操作系统数据
利用Oracle数据库存储和分析Unix操作系统的性能
利用Oracle数据库存储和分析Unix操作系统的性能作者简介:
张乐奕,通常使用的网名为kamus,也曾用过seraphim,现在任职于北京某大型软件公司,Oracle数据库DBA,主要负责证券行业的核心交易系统数据库管理及维护工作。
热切关注Oracle技术和相关操作系统技术,出没于各大数据库技术论坛,目前是中国最大的Oracle技术论坛的数据库管理版版主。
我的邮件地址:
kamus@
我的MSN:
kamusis@
期望与各位朋友讨论Oracle相关技术。
本人所有文章,不经许可,不得转载。
目录
一、前言...4
二、思路...4
三、vmstat脚本及步骤...4
1.安装statspack.4
2.创建stats$vmstat表...4
3.创建vmstat目录...6
4.创建get_vmstat.ksh脚本...6
5.创建run_vmstat.ksh脚本...8
6.创建crontab作业,定时执行run_vmstat.ksh脚本...9
7.分析数据...9
1)异常报告...9
2)每小时趋势报告...13
3)周趋势报告...14
4)长期趋势报告...14
四、使用Excel生成趋势图...15
五、参考资料...15
一、前言作为UNIX系统中的Oracle数据库管理员,时刻监控操作系统的性能无疑是非常重要的,幸运的是UNIX系统提供了大量的监控命令,比如vmstat,iostat,sar,top等等,这些监控命令均以字符界面输出结果,再加上UNIX系统中shell的强大分析功能,这样我们只需要编写一些脚本就可以实现自动的后台监控,当有问题的时候再自动发送邮件给DBA。
其实相类似的一些监控脚本可能已经随处可见了,但是本文提到的一个新的思路,就是利用Oracle数据库的statspack空间来存储监控的结果,再利用数据库天生的检索优势,这样比以往靠shell分析甚或是人工分析生成的监控结果文件要更加轻松,智能,同时也能实现更持久和更广泛的监控。
本文大部分素材来源自DonaldK.Burleson的Oracle9iUNIXAdministrationHandbook,但是对于脚本中的一些错误和不合理的地方作了修改,并且添加了一些功能,本文的测试环境全部基于SunSolaris8Sparc64bit+Oracle9.2.0.5。
本文第一版主要以监控内存消耗和CPU等待的vmstat命令为例,将陆续添加iostat等其它命令的监控脚本。
二、思路首先安装statspack,然后手工创建一个用于存储vmstat命令输出结果的表,再作一个shell定时执行vmstat,将结果全部插入数据库表中,最后就是通过SQL定时分析表中的数据,超过预先指定的门限值就告警。
同时根据表中的数据,我们还能作出系统性能的趋势报告。
三、vmstat脚本及步骤1.安装statspacksqlplus“/assysdba”
SQL>@?
/rdbms/admin/spcreate.sql
按照提示设定perfstat用户的密码之后,由于是10g,我选择了SYSAUX表空间作为perfstat用户的默认表空间,而没有另行创建表空间。
2.创建stats$vmstat表SQL>connectperfstat/perfstat
SQL>@create_vmstat_tab.sql
#create_vmstat_tab.sql
droptablestats$vmstat;
createtablestats$vmstat
(
start_datedate,
durationnumber,
server_namevarchar2(20),
running_queuenumber,
waiting_queuenumber,
swap_innumber,
swap_outnumber,
kbytes_page_innumber,
Kbytes_page_outnumber,
page_scannumber,
user_cpunumber,
system_cpunumber,
idle_cpunumber,
wait_cpunumber
)
tablespacesysaux
storage(initial10m
next1m
pctincrease0)
;
commentoncolumnstats$vmstat.start_date
is'监控时间';
commentoncolumnstats$vmstat.duration
is'监控时长';
commentoncolumnstats$vmstat.server_name
is'服务器名称';
commentoncolumnstats$vmstat.running_queue
is'执行队列';
commentoncolumnstats$vmstat.waiting_queue
is'等待队列';
commentoncolumnstats$vmstat.swap_in
is'每秒平均交换进LWPs数';
commentoncolumnstats$vmstat.swap_out
is'交换出进程数';
commentoncolumnstats$vmstat.kbytes_page_in
is'换页进字节(K)';
commentoncolumnstats$vmstat.kbytes_page_out
is'换页出字节(K)';
commentoncolumnstats$vmstat.page_scan
is'换页守护进程扫描页数';
commentoncolumnstats$vmstat.user_cpu
is'用户操作占用的CPU';
commentoncolumnstats$vmstat.system_cpu
is'系统操作占用的CPU';
commentoncolumnstats$vmstat.idle_cpu
is'CPU空闲率';
commentoncolumnstats$vmstat.wait_cpu
is'CPU等待率(AIX独有)';
3.创建vmstat目录在oracle用户主目录下创建用于存放所有相关脚本的vmstat目录。
$cd
$mkdirvmstat
4.创建get_vmstat.ksh脚本改脚本用于定时执行vmstat命令并且将结果存入数据库。
#get_vmstat.ksh
#!
/bin/ksh
#----------------------------------------
#首先设定环境变量,根据实际环境修改....
#----------------------------------------
ORACLE_SID=kamusdb
exportORACLE_SID
ORACLE_HOME=`cat/var/opt/oracle/oratab|grep\^$ORACLE_SID:
|cut-f2-d':
'`
exportORACLE_HOME
PATH=$ORACLE_HOME/bin:
$PATH
exportPATH
SERVER_NAME=`uname-a|awk'{print$2}'`
typeset-uSERVER_NAME
exportSERVER_NAME
#----------------------------------------
#每5分钟运行一次vmstat(300秒),可以根据实际情况修改....
#----------------------------------------
SAMPLE_TIME=300
#----------------------------------------
#脚本一旦运行将不会停止,除非关闭操作系统....
#-S参数表示监控swap空间的情况,报告si,so列
#msg$$中的$$表示一个任意2位数字,系统自动生成
#----------------------------------------
whiletrue
do
vmstat–S${SAMPLE_TIME}2>/tmp/msg$$
#----------------------------------------
#Solaris系统的vmstat没有waitCPU统计,所以我们在那一列中存入0
#$1,$2,$6,$7等数字分别表示vmstat输出中的第几列,
#每个Unix系统中的vmstat输出可能都不一样,
#所以修改这些列号,就可以应对不同的操作系统。
#----------------------------------------
cat/tmp/msg$$|sed1,3d|awk'{printf("%s%s%s%s%s%s%s%s%s%s\n",$1,$2,$6,$7,$8,$9,$12,$20,$21,$22)}'|whilereadRUNQUEWAITQUESWAPINSWAPOUTPAGE_INPAGE_OUTPAGE_SCANUSER_CPUSYSTEM_CPUIDLE_CPU
do
$ORACLE_HOME/bin/sqlplusperfstat/perfstat< insertintoperfstat.stats\$vmstat
values(
SYSDATE,
$SAMPLE_TIME,
'$SERVER_NAME',
$RUNQUE,
$WAITQUE,
$SWAPIN,
$SWAPOUT,
$PAGE_IN,
$PAGE_OUT,
$PAGE_SCAN,
$USER_CPU,
$SYSTEM_CPU,
$IDLE_CPU,
0
);
commit;
EXIT
EOF
done
done
#----------------------------------------
#删除临时文件
#----------------------------------------
rm/tmp/msg$$
5.创建run_vmstat.ksh脚本该脚本放在crontab中,用来定时检查get_vmstat.ksh脚本有没有正常运行,如果在运行,那么不作任何动作,如果不在运行,那么就运行get_vmstat.ksh脚本。
这个脚本的意义在于防止重新启动操作系统之后忘记运行get_vmstat.ksh脚本。
#run_vmstat.ksh
#!
/bin/ksh
#----------------------------------------
#首先设定环境变量,根据实际环境修改....
#----------------------------------------
SCRIPT_PATH=`echo~oracle/vmstat`
exportSCRIPT_PATH
ORACLE_SID=kamusdb
exportORACLE_SID
ORACLE_HOME=`cat/var/opt/oracle/oratab|grep$ORACLE_SID:
|cut-f2-d':
'`
exportORACLE_HOME
PATH=$ORACLE_HOME/bin:
$PATH
exportPATH
#----------------------------------------
#作更进一步地控制,在系统没有操作的时间内停止监控
#晚上8点到第二天凌晨8点之间停止监控
#其它时间如果get_vmstat不在运行,就运行它
#----------------------------------------
HOUR=`date+"%H"`
check_stat=`ps-ef|grepget_vmstat|grep-vgrep|wc-l`
vmstat_num=`expr$check_stat`
if[$HOUR-gt19]||[$HOUR-lt8]
then
if[$vmstat_num-gt0]
thenkill-9`ps-ef|grepget_vmstat|grep-vgrep|awk'{print$2}'`>/dev/null
fi
else
if[$vmstat_num-le0]
thennohup$SCRIPT_PATH/get_vmstat.ksh>/dev/null2>&1&
fi
fi
6.创建crontab作业,定时执行run_vmstat.ksh脚本该作业每半小时运行一次。
$crontab–l>oracle.cron
$echo’00,30****/export/home/oracle/vmstat/run_vmstat.ksh>>/export/home/oracle/vmstat/run.lst2>&1’>>oracle.cron
$crontaboracle.cron
7.分析数据至此已经完成了定时运行vmstat和在数据库中存储vmstat结果的步骤。
自然,仅仅是搜集了统计信息是远远不够的,下面我们要分析搜集来的信息,产生操作系统的性能报告。
将报告分为以下几类,分别用脚本实现。
异常报告:
显示超过了门限值的时间段(vmstat_alert.ksh+vmstat_alert.sql)
每小时趋势报告:
显示一天内每小时的系统平均利用情况(rpt_vmstat_hr.sql)
周趋势报告:
显示每天的系统平均利用情况(rpt_vmstat_dy.sql)
长期趋势报告:
显示系统性能的一个长期趋势线(rpt_vmstat.sql))
1)异常报告#vmstat_alert.sql
REM----------------------------------------
REM该SQL用于报告Oracle环境中每个服务器的异常情况。
REM根据get_vmstat.ksh脚本得到的信息,报告每个小时的平均值。
REMDBA发现异常时间段,则可以深入检查每5分钟的详细数据。
REM在这个脚本中接受一个参数,表示需要报告的时间跨度。
REM对于runingqueue的门限值应该设置为CPU数,
REM表示如果出现大量等待执行的任务就报警,这通常表示CPU负载过重。
REM对于pagescan(sr)的门限值设置为1,
REM表示只要出现pagedaemon扫描页就报警,这通常表示内存不足。
REM对于CPU利用率,设置为70,表示超过70%以上的利用率才报警。
REM比如运行vmstat_alert7
REM表示输出当前日期之前7天之内的执行队列大于4,
REMsr大于1,CPU利用率超过70%的按照小时统计的报告。
REM----------------------------------------
setlines80;
setpages999;
setfeedbackoff;
setverifyoff;
columnmy_dateheading'datehour'formata20
columnc2headingwaitqformat9999
columnc3headingpg_informat9999
columnc4headingpg_otformat9999
columnc5headingusrformat9999
columnc6headingsysformat9999
columnc7headingidlformat9999
columnc8headingwtformat9999
ttitle'runqueue>CPUs|MayindicateanoverloadedCPU|WhenrunqueueexceedsthenumberofCPUs|ontheserver,tasksarewaitingforservice.';
select
server_name,
to_char(start_date,'YY/MM/DDHH24')my_date,
avg(running_queue)c2,
avg(kbytes_page_in)c3,
avg(kbytes_page_out)c4,
avg(user_cpu)c5,
avg(system_cpu)c6,
avg(idle_cpu)c7
from
perfstat.stats$vmstat
WHERE
running_queue>4
andstart_date>sysdate-&1
groupby
server_name,
to_char(start_date,'YY/MM/DDHH24')
ORDERBY
server_name,
to_char(start_date,'YY/MM/DDHH24')
;
ttitle'page_scan>1|Mayindicateoverloadedmemory|WheneverUnixperformsapage-in,theRAMmemory|ontheserverhasbeenexhaustedandswappagesarebeingused.';
select
server_name,
to_char(start_date,'YY/MM/DDHH24')my_date,
avg(running_queue)c2,
avg(kbytes_page_in)c3,
avg(kbytes_page_out)c4,
avg(user_cpu)c5,
avg(system_cpu)c6,
avg(idle_cpu)c7
from
perfstat.stats$vmstat
WHERE
page_scan>1
andstart_date>sysdate-&1
groupby
server_name,
to_char(start_date,'YY/MM/DDHH24')
ORDERBY
server_name,
to_char(start_date,'YY/MM/DDHH24')
;
ttitle'user+systemCPU>70%|Indicatesperiodswithafully-loadedCPUsubssystem.|Periodsof100%utilizationareonlya|concernwhenrunqueuevaluesexceedsthenumberofCPsontheserver.';
select
server_name,
to_char(start_date,'YY/MM/DDHH24')my_date,
avg(running_queue)c2,
avg(kbytes_page_in)c3,
avg(kbytes_page_out)c4,
avg(user_cpu)c5,
avg(system_cpu)c6,
avg(idle_cpu)c7
from
perfstat.stats$vmstat
WHERE
(user_cpu+system_cpu)>70
andstart_date>sysdate-&1
groupby
server_name,
to_char(start_date,'YY/MM/DDHH24')
ORDERBY
server_name,
to_char(start_date,'YY/MM/DDHH24')
;
#vmstat_alert.ksh
#----------------------------------------
#可以将此shell加入cron中,每天7点运行
#----------------------------------------
#!
/bin/ksh
#----------------------------------------
#首先设定环境变量,根据实际环境修改....
#接受一个参数输入,表示当前要报告的数据库SID
#----------------------------------------
ORACLE_SID=$1
exportORACLE_SID
ORACLE_HOME=`cat/var/opt/oracle/oratab|grep$ORACLE_SID:
|cut-f2-d':
'`
exportORACLE_HOME
PATH=$ORA