SQL调优Word文档下载推荐.docx
《SQL调优Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《SQL调优Word文档下载推荐.docx(38页珍藏版)》请在冰豆网上搜索。
共享SQL语句
为了不重复解析相同的SQL语句,在第一次解析之后,
ORACLE将SQL语句存放在内存中.这块位于系统全局区域SGA(system
global
area)的共享池(shared
buffer
pool)中的内存可以被所有的数据库用户共享.
因此,当你执行一个SQL语句(有时被称为一个游标)时,如果它
和之前的执行过的语句完全相同,
ORACLE就能很快获得已经被解析的语句以及最好的执行路径.
ORACLE的这个功能大大地提高了SQL的执行性能并节省了内存的使用.
可惜的是ORACLE只对简单的表提供高速缓冲(cache
buffering)
这个功能并不适用于多表连接查询.
数据库管理员必须在init.ora中为这个区域设置合适的参数,当这个内存区域越大,就可以保留更多的语句,当然被共享的可能性也就越大了.
当你向ORACLE
提交一个SQL语句,ORACLE会首先在这块内存中查找相同的语句.
这里需要注明的是,ORACLE对两者采取的是一种严格匹配,要达成共享,SQL语句必须
完全相同(包括空格,换行等).
共享的语句必须满足三个条件:
A.
字符级的比较:
当前被执行的语句和共享池中的语句必须完全相同.
例如:
SELECT
*
FROM
EMP;
和下列每一个都不同
from
Select
From
Emp;
B.
两个语句所指的对象必须完全相同:
用户对象名如何访问
Jacksal_limitprivate
synonym
Work_citypublic
Plant_detailpublic
Jillsal_limitprivate
Plant_detailtable
owner
考虑一下下列SQL语句能否在这两个用户之间共享.
SQL能否共享原因
select
max(sal_cap)
sal_limit;
不能每个用户都有一个private
synonym
-
sal_limit
它们是不同的对象
count(*0
work_city
where
sdesc
like
'
NEW%'
;
能两个用户访问相同的对象public
a.sdesc,b.location
a
plant_detail
b
a.city_id
=
b.city_id不能用户jack
通过private
synonym访问plant_detail
而jill
是表的所有者,对象不同.
C.
两个SQL语句中必须使用相同的名字的绑定变量(bind
variables)
例如:
第一组的两个SQL语句是相同的(可以共享),而第二组中的两个语句是不同的(即使在运行时,赋于不同的绑定变量相同的值)
a.
pin
name
people
:
blk1.pin;
b.
blk1.ot_ind;
blk1.ov_ind;
4.
选择最有效率的表名顺序(只在基于规则的优化器中有效)
ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表
driving
table)将被最先处理.
在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表.当ORACLE处理多个表时,
会运用排序及合并的方式连接它们.首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并.
表
TAB1
16,384
条记录
TAB2
1
选择TAB2作为基础表
(最好的方法)
count(*)
tab1,tab2
执行时间0.96秒
(不佳的方法)
tab2,tab1
执行时间26.09秒
如果有3个以上的表连接查询,
那就需要选择交叉表(intersection
table)作为基础表,
交叉表是指那个被其他表所引用的表.
EMP表描述了LOCATION表和CATEGORY表的交集.
LOCATION
L
CATEGORY
C,
EMP
E
WHERE
E.EMP_NO
BETWEEN
1000
AND
2000
E.CAT_NO
C.CAT_NO
E.LOCN
L.LOCN
将比下列SQL更有效率
C
5.
WHERE子句中的连接顺序.
ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前,
那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾.
(低效,执行时间156.3秒)
…
E
SAL
>
50000
JOB
‘MANAGER’
25
<
(SELECT
COUNT(*)
EMP
MGR=E.EMPNO);
(高效,执行时间10.6秒)
EMP
MGR=E.EMPNO)
‘MANAGER’;
6.
SELECT子句中避免使用
‘
‘
当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用
‘*’
是一个方便的方法.不幸的是,这是一个非常低效的方法.
实际上,ORACLE在解析的过程中,
会将’*’
依次转换成所有的列名,
这个工作是通过查询数据字典完成的,
这意味着将耗费更多的时间.
7.
减少访问数据库的次数
当执行每条SQL语句时,
ORACLE在内部执行了许多工作:
解析SQL语句,
估算索引的利用率,
绑定变量
读数据块等等.
由此可见,
减少访问数据库的次数
就能实际上减少ORACLE的工作量.
例如,
以下有三种方法可以检索出雇员号等于0342或0291的职员.
方法1
(最低效)
EMP_NAME
SALARY
GRADE
EMP_NO
342;
291;
方法2
(次低效)
DECLARE
CURSOR
C1
(E_NO
NUMBER)
IS
EMP_NAME,SALARY,GRADE
E_NO;
BEGIN
OPEN
C1(342);
FETCH
INTO
…,..,..
C1(291);
CLOSE
C1;
END;
方法3
(高效)
A.EMP_NAME
A.SALARY
A.GRADE,
B.EMP_NAME
B.SALARY
B.GRADE
A,EMP
B
A.EMP_NO
342
B.EMP_NO
注意:
在SQL*Plus
SQL*Forms和Pro*C中重新设置ARRAYSIZE参数,
可以增加每次数据库访问的检索数据量
建议值为200.
8.
使用DECODE函数来减少处理时间
使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表.
COUNT(*),SUM(SAL)
FROM EMP
DEPT_NO
0020
ENAME
LIKE ‘SMITH%’;
0030
你可以用DECODE函数高效地得到相同结果
COUNT(DECODE(DEPT_NO,0020,’X’,NULL))
D0020_COUNT,
COUNT(DECODE(DEPT_NO,0030,’X’,NULL))
D0030_COUNT,
SUM(DECODE(DEPT_NO,0020,SAL,NULL))
D0020_SAL,
SUM(DECODE(DEPT_NO,0030,SAL,NULL))
D0030_SAL
LIKE
‘SMITH%’;
类似的,DECODE函数也可以运用于GROUP
BY
和ORDER
BY子句中.
9.
整合简单,无关联的数据库访问
如果你有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系)
NAME
1234;
DPT
DPT_NO
10
CAT
CAT_TYPE
‘RD’;
上面的3个查询可以被合并成一个:
E.NAME
D.NAME
C.NAME
CAT
C
DPT
D
E,DUAL
X
NVL(‘X’,X.DUMMY)
NVL(‘X’,E.ROWID(+))
NVL(‘X’,D.ROWID(+))
NVL(‘X’,C.ROWID(+))
E.EMP_NO(+)
1234
D.DEPT_NO(+)
10
C.CAT_TYPE(+)
(备注:
虽然采取这种方法,效率得到提高,但是程序的可读性大大降低,所以读者
还是要权衡之间的利弊)
10.
删除重复记录
最高效的删除重复记录方法
(
因为使用了ROWID)
DELETE
E.ROWID
MIN(X.ROWID)
X.EMP_NO
E.EMP_NO);
11.
用TRUNCATE替代DELETE
当删除表中的记录时,在通常情况下,
回滚段(rollback
segments
)
用来存放可以被恢复的信息.
如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况)
而当运用TRUNCATE时,
回滚段不再存放任何可被恢复的信息.当命令运行后,数据不能被恢复.因此很少的资源被调用,执行时间也会很短.
TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML)
12.
尽量多使用COMMIT
只要有可能,在程序中尽量多使用COMMIT,
这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:
COMMIT所释放的资源:
回滚段上用于恢复数据的信息.
被程序语句获得的锁
redo
log
中的空间
d.
ORACLE为管理上述3种资源中的内部花费
在使用COMMIT时必须要注意到事务的完整性,现实中效率和事务完整性往往是鱼和熊掌不可得兼)
13.
计算记录条数
和一般的观点相反,
比count
(1)稍快
当然如果可以通过索引检索,对索引列的计数仍旧是最快的.
例如
COUNT(EMPNO)
在CSDN论坛中,曾经对此有过相当热烈的讨论,
作者的观点并不十分准确,通过实际的测试,上述三种方法并没有显著的性能差别)
14.
用Where子句替换HAVING子句
避免使用HAVING子句,
HAVING
只会在检索出所有记录之后才对结果集进行过滤.
这个处理需要排序,总计等操作.
如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销.
低效:
REGION,AVG(LOG_SIZE)
LOCATION
GROUP
REGION
REGION
!
‘SYDNEY’
‘PERTH’
高效
中的条件一般用于对一些集合函数的比较,如COUNT()
等等.
除此而外,一般的条件应该写在WHERE子句中)
15.
减少对表的查询
在含有子查询的SQL语句中,要特别注意减少对表的查询.
低效
TAB_NAME
TABLES
TAB_NAME
TAB_COLUMNS
VERSION
604)
AND DB_VER=
DB_VER
(TAB_NAME,DB_VER)
TAB_NAME,DB_VER)
Update
多个Column
例子:
UPDATE
SET
EMP_CAT
MAX(CATEGORY)
EMP_CATEGORIES),
SAL_RANGE
MAX(SAL_RANGE)
EMP_CATEGORIES)
EMP_DEPT
0020;
高效:
(EMP_CAT,
SAL_RANGE)
MAX(SAL_RANGE)
16.
通过内部函数提高SQL效率.
H.EMPNO,E.ENAME,H.HIST_TYPE,T.TYPE_DESC,COUNT(*)
HISTORY_TYPE
T,EMP
E,EMP_HISTORY
H
H.EMPNO
E.EMPNO
H.HIST_TYPE
T.HIST_TYPE
H.EMPNO,E.ENAME,H.HIST_TYPE,T.TYPE_DESC;
通过调用下面的函数可以提高效率.
FUNCTION
LOOKUP_HIST_TYPE(TYP
IN
RETURN
VARCHAR2
AS
TDESC
VARCHAR2(30);
TYPE_DESC
HISTORY_TYPE
HIST_TYPE
TYP;
TDESC;
(NVL(TDESC,’?
’));
LOOKUP_EMP(EMP
ENAME
EMPNO=EMP;
ENAME;
(NVL(ENAME,’?
SELECT
H.EMPNO,LOOKUP_EMP(H.EMPNO),
H.HIST_TYPE,LOOKUP_HIST_TYPE(H.HIST_TYPE),COUNT(*)
EMP_HISTORY
H.HIST_TYPE;
经常在论坛中看到如
’能不能用一个SQL写出….’
的贴子,
殊不知复杂的SQL往往牺牲了执行效率.
能够掌握上面的运用函数解决问题的方法在实际工作中是非常有意义的)
17.
使用表的别名(Alias)
当在SQL语句中连接多个表时,
请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误.
(译者注:
Column歧义指的是由于SQL中不同的表具有相同的Column名,当SQL语句中出现这个Column时,SQL解析器无法判断这个Column的归属)
18.
用EXISTS替代IN
在许多基于基础表的查询中,为了满足一个条