Oracle优化规则Word格式文档下载.docx
《Oracle优化规则Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《Oracle优化规则Word格式文档下载.docx(41页珍藏版)》请在冰点文库上搜索。
用户
对象名
如何访问
Jack
sal_limit
privatesynonym
Work_city
publicsynonym
Plant_detail
Jill
sal_limit
privatesynonym
tableowner
考虑一下下列SQL语句能否在这两个用户之间共享。
C.两个SQL语句中必须使用相同的名字的绑定变量(bindvariables)
第一组的两个SQL语句是相同的(可以共享),而第二组中的两个语句是不同的(即使在运行时,赋于不同的绑定变量相同的值)
a.
select
pin
,
name
from
people
where
=
:
blk1.pin;
b.
blk1.ot_ind;
blk1.ov_ind;
4.选择最有效率的表名顺序(只在基于规则的优化器中有效)
ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表drivingtable)将被最先处理。
在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。
当ORACLE处理多个表时,会运用排序及合并的方式连接它们。
首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并。
表TAB116,384条记录
表TAB21条记录
选择TAB2作为基础表(最好的方法)
selectcount(*)fromtab1,tab2执行时间0.96秒
选择TAB2作为基础表(不佳的方法)
selectcount(*)fromtab2,tab1执行时间26.09秒
如果有3个以上的表连接查询,那就需要选择交叉表(intersectiontable)作为基础表,交叉表是指那个被其他表所引用的表。
EMP表描述了LOCATION表和CATEGORY表的交集。
SELECT*
FROMLOCATIONL,
CATEGORYC,
EMPE
WHEREE.EMP_NOBETWEEN1000AND2000
ANDE.CAT_NO=C.CAT_NO
ANDE.LOCN=L.LOCN
将比下列SQL更有效率
FROMEMPE,
LOCATIONL,
CATEGORYC
WHEREE.CAT_NO=C.CAT_NO
ANDE.EMP_NOBETWEEN1000AND2000
第二篇
1.WHERE子句中的连接顺序。
ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前,那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。
(低效,执行时间156.3秒)
SELECT
…
FROM
EMP
E
WHERE
SAL
>
50000
AND
JOB
‘MANAGER’
25
<
(SELECT
COUNT(*)
FROM
EMP
MGR=E.EMPNO);
(高效,执行时间10.6秒)
MGR=E.EMPNO)
‘MANAGER’;
2.SELECT子句中避免使用‘*’
当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用‘*’是一个方便的方法。
不幸的是,这是一个非常低效的方法。
实际上,ORACLE在解析的过程中,会将‘*’依次转换成所有的列名,这个工作是通过查询数据字典完成的,这意味着将耗费更多的时间。
3.减少访问数据库的次数
当执行每条SQL语句时,ORACLE在内部执行了许多工作:
解析SQL语句,估算索引的利用率,绑定变量,读数据块等等。
由此可见,减少访问数据库的次数,就能实际上减少ORACLE的工作量。
例如,以下有三种方法可以检索出雇员号等于0342或0291的职员。
方法1(最低效)
EMP_NAME
SALARY
GRADE
EMP_NO
342;
291;
方法2(次低效)
DECLARE
CURSOR
C1
(E_NO
NUMBER)
IS
EMP_NAME,SALARY,GRADE
E_NO;
BEGIN
OPEN
C1(342);
FETCH
INTO
…,..,..
;
C1(291);
CLOSE
C1;
END;
方法3(高效)
以下是引用片段:
A.EMP_NAME
A.SALARY
A.GRADE,
B.EMP_NAME
B.SALARY
B.GRADE
A,EMP
B
A.EMP_NO
342
B.EMP_NO
注意:
在SQL*Plus,SQL*Forms和Pro*C中重新设置ARRAYSIZE参数,可以增加每次数据库访问的检索数据量,建议值为200.
4.使用DECODE函数来减少处理时间
使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表。
COUNT(*),SUM(SAL)
FROM EMP
DEPT_NO
0020
ENAME
LIKE ‘SMITH%’;
0030
你可以用DECODE函数高效地得到相同结果
COUNT(DECODE(DEPT_NO,0020,’X’,NULL))
D0020_COUNT,
COUNT(DECODE(DEPT_NO,0030,’X’,NULL))
D0030_COUNT,
SUM(DECODE(DEPT_NO,0020,SAL,NULL))
D0020_SAL,
SUM(DECODE(DEPT_NO,0030,SAL,NULL))
D0030_SAL
WHERE
LIKE
‘SMITH%’;
类似的,DECODE函数也可以运用于GROUPBY和ORDERBY子句中。
5.整合简单,无关联的数据库访问
如果你有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系)
NAME
1234;
DPT
DPT_NO
10
CAT
CAT_TYPE
‘RD’;
上面的3个查询可以被合并成一个:
E.NAME
D.NAME
C.NAME
CAT
C
DPT
D
E,DUAL
X
NVL(‘X’,X.DUMMY)
NVL(‘X’,E.ROWID(+))
NVL(‘X’,D.ROWID(+))
NVL(‘X’,C.ROWID(+))
E.EMP_NO(+)
1234
D.DEPT_NO(+)
10
C.CAT_TYPE(+)
(虽然采取这种方法,效率得到提高,但是程序的可读性大大降低,所以还是要权衡之间的利弊)
第三篇
1.删除重复记录
最高效的删除重复记录方法(因为使用了ROWID)
DELETEFROMEMPE
WHEREE.ROWID>
(SELECTMIN(X.ROWID)
FROMEMPX
WHEREX.EMP_NO=E.EMP_NO);
2.用TRUNCATE替代DELETE
当删除表中的记录时,在通常情况下,回滚段(rollbacksegments)用来存放可以被恢复的信息。
如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况)
而当运用TRUNCATE时,回滚段不再存放任何可被恢复的信息。
当命令运行后,数据不能被恢复。
因此很少的资源被调用,执行时间也会很短。
(译者按:
TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML)
3.尽量多使用COMMIT
只要有可能,在程序中尽量多使用COMMIT,这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:
COMMIT所释放的资源:
a.回滚段上用于恢复数据的信息。
b.被程序语句获得的锁
c.redologbuffer中的空间
d.ORACLE为管理上述3种资源中的内部花费
在使用COMMIT时必须要注意到事务的完整性,现实中效率和事务完整性往往是鱼和熊掌不可得兼)
4.计算记录条数
和一般的观点相反,count(*)比count
(1)稍快,当然如果可以通过索引检索,对索引列的计数仍旧是最快的。
例如COUNT(EMPNO)
在CSDN论坛中,曾经对此有过相当热烈的讨论,作者的观点并不十分准确,通过实际的测试,上述三种方法并没有显著的性能差别)
5.用Where子句替换HAVING子句
避免使用HAVING子句,HAVING只会在检索出所有记录之后才对结果集进行过滤。
这个处理需要排序,总计等操作。
如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销。
低效
SELECT
REGION,AVG(LOG_SIZE)
LOCATION
GROUP
BY
REGION
HAVING
REGION
!
‘SYDNEY’
‘PERTH’
高效
‘PERTH’
REGION
HAVING中的条件一般用于对一些集合函数的比较,如COUNT()等等。
除此而外,一般的条件应该写在WHERE子句中)
6.减少对表的查询
在含有子查询的SQL语句中,要特别注意减少对表的查询。
TAB_NAME
TABLES
TAB_NAME
(
SELECT
TAB_COLUMNS
VERSION
604)
AND DB_VER=
DB_VER
604)
(TAB_NAME,DB_VER)
=
TAB_NAME,DB_VER)
Update多个Column例子:
低效:
UPDATE
SET
EMP_CAT
MAX(CATEGORY)
EMP_CATEGORIES)
第四篇
1.使用表的别名(Alias)
当在SQL语句中连接多个表时,请使用表的别名并把别名前缀于每个Column上。
这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误。
(Column歧义指的是由于SQL中不同的表具有相同的Column名,当SQL语句中出现这个Column时,SQL解析器无法判断这个Column的归属)
2.用EXISTS替代IN
在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接。
在这种情况下,使用EXISTS(或NOTEXISTS)通常将提高查询的效率。
*
(基础表)
EMPNO
0
DEPTNO
IN
DEPTNO
DEPT
LOC
‘MELB’)
高效:
EXISTS
‘X’
DEPT.DEPTNO
EMP.DEPTNO
(相对来说,用NOTEXISTS替换NOTIN将更显著地提高效率,下面将指出)
3.用NOTEXISTS替代NOTIN
在子查询中,NOTIN子句将执行一个内部的排序和合并。
无论在哪种情况下,NOTIN都是最低效的(因为它对子查询中的表执行了一个全表遍历)。
为了避免使用NOTIN,我们可以把它改写成外连接(OuterJoins)或NOTEXISTS.
NOT
DEPT_NO
DEPT_CAT=’A’);
为了提高效率。
改写为:
(方法一:
高效)
….
A,DEPT
A.DEPT_NO
B.DEPT(+)
B.DEPT_NO
IS
NULL
B.DEPT_CAT(+)
‘A’
(方法二:
最高效)
DEPT
D
D.DEPT_NO
E.DEPT_NO
DEPT_CAT
‘A’);
4.用表连接替换EXISTS
通常来说,采用表连接的方式比EXISTS更有效率
ENAME
(更高效)
D,EMP
E.DEPT_NO
D.DEPT_NO
‘A’
(在RBO的情况下,前者的执行路径包括FILTER,后者使用NESTEDLOOP)
5.用EXISTS替换DISTINCT
当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT.一般可以考虑用EXIST替换
DISTINCT
DEPT_NO,DEPT_NAME
E.DEPT_NO
高效:
D.DEPT_NO);
EXISTS使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。
6.识别‘低效执行’的SQL语句
用下列SQL工具找出低效SQL:
EXECUTIONS
DISK_READS,
BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2)
Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2)
Reads_per_run,
SQL_TEXT
V$SQLAREA
EXECUTIONS>
BUFFER_GETS
(BUFFER_GETS-DISK_READS)/BUFFER_GETS
0.8
ORDER
4
DESC;
(虽然目前各种关于SQL优化的图形化工具层出不穷,但是写出自己的SQL工具来解决问题始终是一个最好的方法)
7.使用TKPROF工具来查询SQL性能状态
SQLtrace工具收集正在执行的SQL的性能状态数据并记录到一个跟踪文件中。
这个跟踪文件提供了许多有用的信息,例如解析次数。
执行次数,CPU使用时间等。
这些数据将可以用来优化你的系统。
设置SQLTRACE在会话级别:
有效
ALTER