Oracle 常见的一些等待事件.docx
《Oracle 常见的一些等待事件.docx》由会员分享,可在线阅读,更多相关《Oracle 常见的一些等待事件.docx(28页珍藏版)》请在冰豆网上搜索。
Oracle常见的一些等待事件
以后的小分享都直接注明文章的名字好了,不再用littlesharing,方便查找。
这次介绍下Oracle的常见的一些等待事件。
当然到了Oracle11g,已经都是上千种等待事件了,我们也没必须一个一个弄清楚,只需要关注常见的就好了。
通过Oracle的等待事件,我们可以最直接地看出当前数据库的性能瓶颈所在,接下面的优化也就是水到渠成的事了。
文章我直接转别人的了,Dave整理的非常好了。
一. 等待事件的相关知识:
1.1 等待事件主要可以分为两类,即空闲(IDLE)等待事件和非空闲(NON-IDLE)等待事件。
1). 空闲等待事件指ORACLE正等待某种工作,在诊断和优化数据库的时候,不用过多注意这部分事件。
2). 非空闲等待事件专门针对ORACLE的活动,指数据库任务或应用运行过程中发生的等待,这些等待事件是在调整数据库的时候需要关注与研究的。
在Oracle10g中的等待事件有872个,11g中等待事件1116个。
我们可以通过v$event_name 视图来查看等待事件的相关信息。
1.2 查看v$event_name视图的字段结构:
SQL>descv$event_name;
名称 是否为空?
类型
----------------------------------------------------------------
EVENT# NUMBER
EVENT_ID NUMBER
NAME VARCHAR2(64)
PARAMETER1 VARCHAR2(64)
PARAMETER2 VARCHAR2(64)
PARAMETER3 VARCHAR2(64)
WAIT_CLASS_ID NUMBER
WAIT_CLASS# NUMBER
WAIT_CLASS VARCHAR2(64)
1.3 查看等待事件总数:
SQL>selectcount(*)fromv$event_name;
COUNT(*)
----------
1116
1.4 查看等待事件分类情况:
/*Formattedon2010/8/1116:
08:
55(QP5v5.115.810.9015)*/
SELECT wait_class#,
wait_class_id,
wait_class,
COUNT ( * ) AS "count"
FROM v$event_name
GROUP BY wait_class#, wait_class_id, wait_class
ORDER BY wait_class#;
WAIT_CLASS#WAIT_CLASS_IDWAIT_CLASS count
------------------------------------------------------
0 1893977003Other 717
1 4217450380Application 17
2 3290255840Configuration 24
3 4166625743Administrative 54
4 3875070507Concurrency 32
5 3386400367Commit 2
6 2723168908Idle 94
7 2000153315Network 35
8 1740759767UserI/O 45
9 4108307767SystemI/O 30
10 2396326234Scheduler 7
11 3871361733Cluster 50
12 644977587Queueing 9
1.5 相关的几个视图:
V$SESSION:
代表数据库活动的开始,视为源起。
V$SESSION_WAIT:
视图用以实时记录活动SESSION的等待情况,是当前信息。
V$SESSION_WAIT_HISTORY:
是对V$SESSION_WAIT的简单增强,记录活动SESSION的最近10次等待。
V$SQLTEXT:
当数据库出现瓶颈时,通常可以从V$SESSION_WAIT找到那些正在等待资源的SESSION,通过SESSION的SID,联合V$SESSION和V$SQLTEXT视图就可以捕获这些SESSION正在执行的SQL语句。
V$ACTIVE_SESSION_HISTORY:
是ASH的核心,用以记录活动SESSION的历史等待信息,每秒采样一次,这部分内容记录在内存中,期望值是记录一个小时的内容。
WRH#_ACTIVE_SESSION_HISTORY :
是V$ACTIVE_SESSION_HISTORY在AWR的存储地。
V$ACTIVE_SESSION_HISTORY:
中的信息会被定期(每小时一次)的刷新到负载库中,并缺省保留一个星期用于分析。
DBA_HIST_ACTIVE_SESS_HISTORY:
视图是WRH#_ACTIVE_SESSION_HISTORY视图和其他几个视图的联合展现,通常通过这个视图进行历史数据的访问。
V$SYSTEM_EVENT 由于V$SESSION记录的是动态信息,和SESSION的生命周期相关,而并不记录历史信息,所以ORACLE提供视图V$SYSTEM_EVENT来记录数据库自启动以来所有等待事件的汇总信息。
通过这个视图,用户可以迅速获得数据库运行的总体概况。
二. 33个常见的等待事件
1. Bufferbusywaits
从本质上讲,这个等待事件的产生仅说明了一个会话在等待一个Buffer(数据块),但是导致这个现象的原因却有很多种。
常见的两种是:
当一个会话视图修改一个数据块,但这个数据块正在被另一个会话修改时。
当一个会话需要读取一个数据块,但这个数据块正在被另一个会话读取到内存中时。
Oracle 操作的最小单位是块(Block),即使你要修改一条记录,也需要对这条记录所在的这个数据块做操作。
当你对这个数据块做修改时,其他的会话将被阻止对这个数据块上的数据做修改(即使其他用户修改的不是当前用户修改的数据),但是可以以一致性的方式读取这个数据块(fromundo)。
当前的用户修改完这个数据块后,将会立即释放掉加在这个数据块上的排他锁,这样另一个会话就可以继续修改它。
修改操作是一个非常短暂的时间,这种加锁的机制我们叫Latch。
当一个会话修改一个数据块时,是按照以下步骤来完成的:
以排他的方式获得这个数据块(Latch)
修改这个数据块。
释放Latch。
Bufferbusywaits等待事件常见于数据库中存在的热快的时候,当多个用户频繁地读取或者修改同样的数据块时,这个等待事件就会产生。
如果等待的时间很长,我们在AWR或者statspack 报告中就可以看到。
这个等待事件有三个参数。
查看有几个参数我们可以用以下SQL:
SQL>selectname,parameter1,parameter2,parameter3fromv$event_namewherename='bufferbusywaits';
NAME PARAMETER1 PARAMETER2 PARAMETER3
-------------------- ---------- ---------- ----------
bufferbusywaits file# block# class#
在下面的示例中,查询的方法和这个一样,所以其他事件对参数的查询将不做过多的说明。
File#:
等待访问数据块所在的文件id号。
Blocks:
等待访问的数据块号。
ID:
在10g之前,这个值表示一个等待时间的原因,10g之后则表示等待事件的类别。
2. Buffer latch
内存中数据块的存放位置是记录在一个hash列表(cachebufferchains)当中的。
当一个会话需要访问某个数据块时,它首先要搜索这个hash 列表,从列表中获得数据块的地址,然后通过这个地址去访问需要的数据块,这个列表Oracle会使用一个latch来保护它的完整性。
当一个会话需要访问这个列表时,需要获取一个Latch,只有这样,才能保证这个列表在这个会话的浏览当中不会发生变化。
产生bufferlatch的等待事件的主要原因是:
Bufferchains太长,导致会话搜索这个列表花费的时间太长,使其他的会话处于等待状态。
同样的数据块被频繁访问,就是我们通常说的热快问题。
产生bufferchains太长,我们可以使用多个bufferpool的方式来创建更多的bufferchains,或者使用参数DB_BLOCK_LRU_LATCHES来增加latch的数量,以便于更多的会话可以获得latch,这两种方法可以同时使用。
这个等待事件有两个参数:
Latchaddr:
会话申请的latch在SGA中的虚拟地址,通过以下的SQL语句可以根据这个地址找到它对应的Latch名称:
select * from v$latch a,v$latchnameb where
addr=latchaddr -- 这里的latchaddr 是你从等待事件中看到的值
and a.latch#=b.latch#;
chain#:
bufferchainshash 列表中的索引值,当这个参数的值等于s0xfffffff时,说明当前的会话正在等待一个LRUlatch。
3. Controlfileparallelwrite
当数据库中有多个控制文件的拷贝时,Oracle 需要保证信息同步地写到各个控制文件当中,这是一个并行的物理操作过程,因为称为控制文件并行写,当发生这样的操作时,就会产生controlfileparallelwrite等待事件。
控制文件频繁写入的原因很多,比如:
日志切换太过频繁,导致控制文件信息相应地需要频繁更新。
系统I/O 出现瓶颈,导致所有I/O出现等待。
当系统出现日志切换过于频繁的情形时,可以考虑适当地增大日志文件的大小来降低日志切换频率。
当系统出现大量的controlfileparallelwrite 等待事件时,可以通过比如降低控制文件的拷贝数量,将控制文件的拷贝存放在不同的物理磁盘上的方式来缓解I/O 争用。
这个等待事件包含三个参数:
Files:
Oracle 要写入的控制文件个数。
Blocks:
写入控制文件的数据块数目。
Requests:
写入控制请求的I/O 次数。
4. Controlfilesequentialread
当数据库需要读取控制文件上的信息时,会出现这个等待事件,因为控制文件的信息是顺序写的,所以读取的时候也是顺序的,因此称为控制文件顺序读,它经常发生在以下情况:
备份控制文件
RAC 环境下不同实例之间控制文件的信息共享
读取控制文件的文件头信息
读取控制文件其他信息
这个等待事件有三个参数:
File#:
要读取信息的控制文件的文件号。
Block#:
读取控制文件信息的起始数据块号。
Blocks:
需要读取的控制文件数据块数目。
5. Dbfileparallelread
这是一个很容易引起误导的等待事件,实际上这个等待事件和并行操作(比如并行查询,并行DML)没有关系。
这个事件发生在数据库恢复的时候,当有一些数据块需要恢复的时候,Oracle会以并行的方式把他们从数据文件中读入到内存中进行恢复操作。
这个等待事件包含三个参数:
Files:
操作需要读取的文件个数。
Blocks:
操作需要读取的数据块个数。
Requests:
操作需要执行的I/O次数。
6. Dbfileparallelwrite
这是一个后台等待事件,它同样和用户的并行操作没有关系,它是由后台进程DBWR产生的,当后台进程DBWR想磁盘上写入脏数据时,会发生这个等待。
DBWR会批量地将脏数据并行地写入到磁盘上相应的数据文件中,在这个批次作业完成之前,DBWR将出现这个等待事件。
如果仅仅是这一个等待事件,对用户的操作并没有太大的影响,当伴随着出现freebufferwaits等待事件时,说明此时内存中可用的空间不足,这时候会影响到用户的操作,比如影响到用户将脏数据块读入到内存中。
当出现dbfileparallelwrite等待事件时,可以通过启用操作系统的异步I/O的方式来缓解这个等待。
当使用异步I/O时,DBWR不在需要一直等到所有数据块全部写入到磁盘上,它只需要等到这个数据写入到一个百分比之后,就可以继续进行后续的操作。
这个等待事件有两个参数:
Requests:
操作需要执行的I/O次数。
Timeouts:
等待的超时时间。
7. Dbfilescatteredread
这个等待事件在实际生产库中经常可以看到,这是一个用户操作引起的等待事件,当用户发出每次I/O需要读取多个数据块这样的SQL 操作时,会产生这个等待事件,最常见的两种情况是全表扫描(FTS:
FullTableScan)和索引快速扫描(IFFS:
indexfastfullscan)。
这个名称中的scattered( 发散),可能会导致很多人认为它是以scattered 的方式来读取数据块的,其实恰恰相反,当发生这种等待事件时,SQL的操作都是顺序地读取数据块的,比如FTS或者IFFS方式(如果忽略需要读取的数据块已经存在内存中的情况)。
这里的scattered指的是读取的数据块在内存中的存放方式,他们被读取到内存中后,是以分散的方式存在在内存中,而不是连续的。
这个等待事件有三个参数:
File#:
要读取的数据块所在数据文件的文件号。
Block#:
要读取的起始数据块号。
Blocks:
需要读取的数据块数目。
8. Dbfilesequentialread
这个等待事件在实际生产库也很常见,当Oracle 需要每次I/O只读取单个数据块这样的操作时,会产生这个等待事件。
最常见的情况有索引的访问(除IFFS外的方式),回滚操作,以ROWID的方式访问表中的数据,重建控制文件,对文件头做DUMP等。
这里的sequential也并非指的是Oracle 按顺序的方式来访问数据,和dbfilescatteredread一样,它指的是读取的数据块在内存中是以连续的方式存放的。
这个等待事件有三个参数:
File#:
要读取的数据块锁在数据文件的文件号。
Block#:
要读取的起始数据块号。
Blocks:
要读取的数据块数目(这里应该等于1)。
9. Dbfilesinglewrite
这个等待事件通常只发生在一种情况下,就是Oracle 更新数据文件头信息时(比如发生Checkpoint)。
当这个等待事件很明显时,需要考虑是不是数据库中的数据文件数量太大,导致Oracle 需要花较长的时间来做所有文件头的更新操作(checkpoint)。
这个等待事件有三个参数:
File#:
需要更新的数据块所在的数据文件的文件号。
Block#:
需要更新的数据块号。
Blocks:
需要更新的数据块数目(通常来说应该等于1)。
10. Directpathread
这个等待事件发生在会话将数据块直接读取到PGA当中而不是SGA中的情况,这些被读取的数据通常是这个会话私有的数据,所以不需要放到SGA作为共享数据,因为这样做没有意义。
这些数据通常是来自与临时段上的数据,比如一个会话中SQL的排序数据,并行执行过程中间产生的数据,以及HashJoin,mergejoin产生的排序数据,因为这些数据只对当前的会话的SQL操作有意义,所以不需要放到SGA当中。
当发生directpathread等待事件时,意味着磁盘上有大量的临时数据产生,比如排序,并行执行等操作。
或者意味着PGA中空闲空间不足。
这个等待事件有三个参数:
Descriptoraddress:
一个指针,指向当前会话正在等待的一个directreadI/O。
Firstdba:
descriptoraddress 中最旧的一个I/O数据块地址。
Blockcnt:
descriptoraddress上下文中涉及的有效的buffer 数量。
11. Directpathwrite
这个等待事件和directpathread 正好相反,是会话将一些数据从PGA中直接写入到磁盘文件上,而不经过SGA。
这种情况通常发生在:
使用临时表空间排序(内存不足)
数据的直接加载(使用append方式加载数据)
并行DML操作。
这个等待事件有三个参数:
Descriptoraddress:
一个指针,指向当前会话正在等待的一个directI/O.
Firstdba:
descriptoraddress 中最旧的一个I/O数据块地址。
Blockcnt:
descriptoraddress 上下文中涉及的有效地 buffer 数量。
12. Enqueue
Enqueue 这个词其实是lock 的另一种描述语。
当我们在AWR 报告中发现长时间的enqueue 等待事件时,说明数据库中出现了阻塞和等待,可以关联AWR报告中的enqueueactivity部分来确定是哪一种锁定出现了长时间等待。
这个等待事件有2个参数:
Name:
enqueue 的名称和类型。
Mode:
enqueue的模式。
可以使用如下SQL 查看当前会话等待的enqueue名称和类型:
/*Formattedon2010/8/1211:
00:
56(QP5v5.115.810.9015)*/
SELECT CHR (TO_CHAR (BITAND (p1, -16777216)) / 16777215)
|| CHR (TO_CHAR (BITAND (p1, 16711680)) / 65535)
"Lock",
TO_CHAR (BITAND (p1, 65535)) "Mode"
FROM v$session_wait
WHERE event = 'enqueue'
Oracle 的enqueue 包含以下模式:
模式代码
解释
1
Nullmode
2
Sub-Share
3
Sub-Exclusive
4
Share
5
Share/Sub-Exclusive
6
Exclusive
Oracle的enqueue 有如下类型:
Enqueue 缩写
缩写解释
BL
BufferCachemanagement
BR
Backup/Restore
CF
Controlfiletransaction
CI
Cross-instanceCallInvocation
CU
BindEnqueue
DF
Datafile
DL
DirectLoaderIndexCreation
DM
DatabaseMount
DR
DistributedRecoveryProcess
DX
DirstributedTransaction
FP
FileObject
FS
FileSet
HW
High-waterLock
IN
InstanceNumber
IR
InstanceRecovery
IS
InstanceState
IV
LibraryCacheInvalidation
JI
EnqueueusedduringAJVsnapshotrefresh
JQ
JobQueue
KK
RedoLog“Kick”
KO
MultipleObjectCheckpoint
L[A-p]
LibraryCacheLock
LS
Logstartorswitch
MM
MountDefinition
MR
Mediarecovery
N[A-Z]
LibraryCachebin
PE
Altersystemsetparameter=value
PF
Passwordfile
PI
Parallelslaves
PR
Processstartup
PS
Parallelslavesynchronization
Q[A-Z]
RowCache
RO
ObjectReuse
RT
RedoThread
RW
RowWait
SC
SystemCo