ORACLE中AWR快照的深入分析和方法.docx
《ORACLE中AWR快照的深入分析和方法.docx》由会员分享,可在线阅读,更多相关《ORACLE中AWR快照的深入分析和方法.docx(19页珍藏版)》请在冰点文库上搜索。
![ORACLE中AWR快照的深入分析和方法.docx](https://file1.bingdoc.com/fileroot1/2023-5/23/c92a5a87-944d-415f-ad8b-ae9ea1723cc5/c92a5a87-944d-415f-ad8b-ae9ea1723cc51.gif)
ORACLE中AWR快照的深入分析和方法
ORACLE中AWR快照的深入分析和方法
我想,对于每一个从事数据库管理信息系统的IT人士,都对ORACLE性能分析和性能研究产生一些兴趣,同时仪受到性能方面的一些困扰。
根据我个人经验,认为每一个要成为ORACLE性能分析的高手,都应该对ORACLE的AWR有一个比较深入的理解和使用。
学会从AWR快照分析中获得对自己有用的信息,是性能分析专家不可少的一个方面,如果再能结合应用服务的日志结合分析的话,是能够分析出一些关键的存在性能问题的SQL,从这些SQL中再进行反推是应用的哪些功能造成的,由此组织技术团队进行优化,循序渐进,不断改进。
一个大的项目的性能优化是一个长期的过程。
以下是AWR的一些关键知识点,不是本人原创,我感觉解释的很透彻。
望阅读后能加深对AWR的理解和认识。
一、WHY——为什么会出现ASH和AWR?
1. 10g之前
用户的连接将产生会话,当前会话记录保存在v$session中;处于等待状态的会话会被复制一份放在v$session_wait中。
当该连接断开后,其原来的连接信息在v$session和v$session_wait中就会被删除。
这是10g之前的状况。
2. v$session_wait_history与ASH
若是一个普通的会话(我是指没有大量地耗费资源),则对于性能调整来说无足轻重。
但若该会话在活动时大量占用了资源(比如:
CPU,内存,I/O等),该会话信息的丢失,将无法评测当时的系统瓶颈究竟是什么。
令DBA高兴的是,oracle10g中保留下了v$session_wait中的这些信息。
在10g中新出现了一个视图:
v$session_wait_history。
这个视图保存了每个活动session在v$session_wait中最近10次的等待事件。
但这对于一段时期内的数据库性能状况的监测是远远不够的,为了解决这个问题,在10g中还新添加了一个视图:
v$active_session_history。
这就是ASH(activesessionhistory)。
典型的情况下,为了诊断当前数据库的状态,需要最近的五到十分钟的详细信息。
然而,由于记录session的活动信息是很费时间和空间的,ASH采用的策略是:
保存处于等待状态的活动session的信息,每秒从v$session_wait中采样一次,并将采样信息保存在内存中。
3. AWR
注意,ASH的采样数据是保存在内存中。
而分配给ASH的内存空间是有限的,当所分配空间占满后,旧的记录就会被覆盖掉;而且数据库重启后,所有的这些ASH信息都会消失。
这样,对于长期检测oracle的性能是不可能的。
在Oracle10g中,提供了永久保留ASH信息的方法,这就是AWR(autoworkloadrepository)。
由于全部保存ASH中的信息是非常耗费时间和空间的,AWR采用的策略是:
每小时对v$active_session_history进行采样一次,并将信息保存到磁盘中,并且保留7天,7天后旧的记录才会被覆盖。
这些采样信息被保存在视图wrh$_active_session_history中。
而这个采样频率(1小时)和保留时间(7天)是可以根据实际情况进行调整的,这就给DBA们提供了更加有效的系统监测工具。
AWR永久地保存系统的性能诊断信息,由SYS用户拥有。
一段时间后,你可能想清除掉这些信息;有时候为了性能诊断,你可能需要自己定义采样频率来获取系统快照信息。
Oracle10g在包dbms_workload_repository中提供了很多过程,通过这些过程,你可以管理快照并设定基线(baselines)。
4. 小结
这样,我们就知道了ASH和AWR产生的原因和功能。
ASH保存了系统最新的处于等待的会话记录,可以用来诊断数据库的当前状态;而AWR中的信息最长可能有1小时的延迟,所以其采样信息并不能用于诊断数据库的当前状态,但可以用来作为一段时期内数据库性能调整的参考。
对于这些视图间的继承关系,eygle给出了一个关系图:
图1各个视图的层次
其中视图dba_hist_active_sess_history是wrh$_active_session_history和其他几个视图的联合展现,通常通过这个视图进行历史数据的访问。
二、WHAT——什么是AWR?
现在我们稍微详细地了解一下刚才所说内容。
1. ash占用的内存大小
ASH的采集信息保存在内存中,在旧的信息被采样到AWR中后,可被新采集的信息覆盖,重启oracle后该信息被清除。
分配给ASH的内存大小可以查询到:
SQL>selectpool,name,bytes/1024/1024Fromv$sgastatwherenamelike'%ASH%';
POOL NAME BYTES/1024/1024
-----------------------------------------
sharedpool ASHbuffers 2
2. AWR更正
为了便于描述和理解,在第一部分中,我们说AWR就是保存ASH中的信息。
其实,AWR记录的信息不仅是ASH,还可以收集到数据库运行的各方面统计信息和等待信息,用以诊断分析。
AWR的采样方式是,以固定的时间间隔为其所有重要的统计信息和负载信息执行一次采样,并将采样信息保存在AWR中。
可以这样说:
ASH中的信息被保存到了AWR中的视图wrh$_active_session_history中。
ASH是AWR的真子集。
3. mmon进程与mmnl进程
快照由一个称为MMON的新的后台进程(及其从进程)以及MMNL后台进程自动地每隔固定时间采样一次。
我们先来看一下10g的概念指南中对这两个新增加的后台进程的介绍:
* MMON进程负责执行多种和管理相关(manageability-related)的后台任务,例如:
*当某个测量值(metrics)超过了预设的限定值(thresholdvalue)后提交警告
*创建新的MMON隶属进程(MMONslaveprocess)来进行快照(snapshot)
*捕获最近修改过的SQL对象的统计信息
* MMNL进程负责执行轻量级的且频率较高的和可管理性相关的后台任务,例如捕获会话历史信息,测量值计算等。
AWR的采样工作由MMON进程每个1小时执行一次,ASH信息同样会被采样写出到AWR负载库中。
虽然ASHbuffer被设计为保留1小时的信息,但很多时候这个内存是不够的,当ASHbuffer写满后,另外一个后台进程MMNL将会主动将ASH信息写出。
4. SYSAUX表空间
这些采样数据都存储在SYSAUX表空间中,并且以WRM$_*和WRH$_*的格式命名。
前一种类型存储元数据信息(如检查的数据库和采集的快照),后一种类型保存实际采集的统计数据。
SQL>selecttable_namefromdba_tableswheretable_namelike'WRM$%';
TABLE_NAME
-----------------------
WRM$_WR_CONTROL
WRM$_SNAP_ERROR
WRM$_SNAPSHOT
WRM$_DATABASE_INSTANCE
WRM$_BASELINE
当SYSAUX表空间满后,AWR将自动覆盖掉旧的信息,并在警告日志中记录一条相关信息:
ORA-1688:
unabletoextendtableSYS.WRH$_ACTIVE_SESSION_HISTORYpartitionWRH$_ACTIVE_3533490838_1522by128in tablespaceSYSAUX
5. 采样频率和保留时间
可以通过查询视图dba_hist_wr_control或(wrm$_wr_control)来查询AWR的采样频率和保留时间。
默认为每1小时采样一次,采样信息保留时间为7天。
SQL>select*fromdba_hist_wr_control;
DBIDSNAP_INTERVALRETENTION TOPNSQL
--------------------------------------
1148+0000000:
1 +0000700:
0DEFAULT
SQL>selectDBID,SNAP_INTERVAL,SNAPINT_NUM,RETENTIONfromwrm$_wr_control;
DBIDSNAP_INTERVAL SNAPINT_NUMRETENTION
-----------------------------------------------------------
1160732652+0000001:
00:
00.0 3600+0000700:
00:
00.0
6. 采样数据量
由于数据量巨大,把所有ASH数据写到磁盘上是不可接受的。
一般是在写到磁盘的时候过滤这个数据,写出的数据占采样数据的10%,写出时通过direct-pathinsert完成,尽量减少日志生成,从而最小化数据库性能的影响。
7. 初始化参数statistics_level
AWR的行为受到参数STATISTICS_LEVEL的影响。
这个参数有三个值:
* BASIC:
awr统计的计算和衍生值关闭.只收集少量的数据库统计信息.
* TYPICAL:
默认值.只有部分的统计收集.他们代表需要的典型监控oracle数据库的行为.
* ALL:
所有可能的统计都被捕捉.并且有操作系统的一些信息.这个级别的捕捉应该在很少的情况下,比如你要更多的sql诊断信息的时候才使用.
三、HOW——如何使用AWR?
AWR由ORACLE自动产生,但是也可以通过DBMS_WORKLOAD_REPOSITORY包来手工创建、删除和修改。
可以使用desc命令查看该包中的过程。
下面只介绍几个常用的:
1. 手工创建一个快照
SQL>selectcount(*)fromwrh$_active_session_history;
COUNT(*)
----------
317
SQL>begin
2dbms_workload_repository.create_snapshot();
3end;
4/
PL/SQL过程已成功完成。
SQL>selectcount(*)fromwrh$_active_session_history;
COUNT(*)
----------
320
2. 手工删除指定范围的快照
SQL>select*fromwrh$_active_session_historywheresnap_id=96;
SNAP_ID DBIDINSTANCE_NUMBERSAMPLE_IDSAMPLE_TIME
-------------------------------------------------------------------------
961160732652 1 23693006-10月-0711.26.04.562上午
961160732652 1 23693006-10月-0711.26.04.562上午
961160732652 1 23693006-10月-0711.26.04.562上午
SQL>begin
2dbms_workload_repository.drop_snapshot_range(low_snap_id=>96,high_snap_id=>96,dbid=>1160732652);
3end;
4/
PL/SQL过程已成功完成。
SQL>select*fromwrh$_active_session_historywheresnap_id=96;
未选定行
3. 修改采集时间和统计信息保留时间
PROCEDUREMODIFY_SNAPSHOT_SETTINGS
参数名称 类型 输入/输出默认值?
-------------------------------------------------------------------
RETENTION NUMBER IN DEFAULT
INTERVAL NUMBER IN DEFAULT
TOPNSQL NUMBER IN DEFAULT
DBID NUMBER IN DEFAULT
通过修改retention参数可以修改awr信息的保留期限。
默认的是七天,最小的值是一天。
如果把retention设置为零,自动清除就关闭了.如果awr发现sysaux空间不够,它通过删除那些最老部分的快照来重新使用这些空间.同时,也会给dba发一条警告,告诉sysaux空间不够了(在警告日志中).
通过修改interval参数可以修改awr信息的采样频率。
最小的值是10分钟,默认的是60分钟.典型的值是10,20,30,60,120等等。
把interval设为0则关闭自动捕捉快照.如将收集间隔时间改为30分钟一次。
并且保留5天时间(注:
单位都是为分钟):
SQL>select*fromdba_hist_wr_control;
DBIDSNAP_INTERVAL RETENTION TOPNSQL
-----------------------------------------------------------------
1160732652+0000001:
00:
00.0+0000700:
00:
00.0 DEFAULT
SQL>execdbms_workload_repository.modify_snapshot_settings(interval=>30,retention=>5*24*60);
PL/SQL过程已成功完成。
SQL>SELECT*fromdba_hist_wr_control;
DBIDSNAP_INTERVAL RETENTION TOPNSQL
-----------------------------------------------------------------
1160732652+0000000:
30:
00.0 +0000500:
00:
00.0 DEFAULT
SQL>
4. 设置基线
基线(baseline)是一种机制,这样你可以在重要时间的快照信息集做标记。
一个基线定义在一对快照之间,快照通过他们的快照序列号识别.每个基线有且只有一对快照。
一次典型的性能调整实践从采集量度的基准线集合、作出改动、然后采集另一个基准线集合开始。
可以比较这两个集合来检查所作的改动的效果。
在AWR中,对现有的已采集的快照可以执行相同类型的比较。
假定一个名称为apply_interest的高度资源密集的进程在下午1:
00到3:
00之间运行,对应快照ID95到98。
我们可以为这些快照定义一个名称为apply_interest_1的基准线:
SQL>select*Fromdba_hist_baseline;
未选定行
SQL>select*fromwrm$_baseline;
未选定行
SQL>execdbms_workload_repository.create_baseline(95,98,'apply_interest_1');
PL/SQL过程已成功完成。
这一操作将快照从95到98编号,作为上面指定的基准线的一部分。
查看现有的基准线:
SQL>select*fromdba_hist_baseline;
DBIDBASELINE_IDBASELINE_NAME START_SNAP_IDSTART_SNAP_TIME END_SNAP_IDEND_SNAP_TIME
-----------------------------------------------------------------------------------------------------------------------
1160732652 1apply_interest_1 9506-10月-0711.00.05.375上午 9806-10月-0701.44.58.062下午
SQL>select*fromwrm$_baseline;
DBIDBASELINE_IDBASELINE_NAME START_SNAP_IDEND_SNAP_ID
-------------------------------------------------------------------------
1160732652 1apply_interest_1 95 98
SQL>
在一些调整步骤之后,我们可以创建另一个基准线—假设名称为apply_interest_2,然后只为那些与这两条基准线相关的快照比较量度。
SQL>execdbms_workload_repository.create_baseline(92,94,'apply_interest_2');
PL/SQL过程已成功完成。
像这样把快照分隔在仅仅几个集合中有助于研究调整对于性能量度的影响。
您可以在分析之后使用drop_baseline()来删除基准线;快照将保留(也可级联删除)。
此外,当清除例程开始删除旧的快照时,与基准线相关的快照不会被清除,从而允许进行进一步的分析。
5. 删除基线
如果要删除一个基准线:
SQL>execdbms_workload_repository.drop_baseline(baseline_name=>'apply_interest_1',cascade=>false);
PL/SQL过程已成功完成。
SQL>select*fromwrh$_active_session_historywheresnap_idin(95,96,97,98);
SNAP_ID DBIDINSTANCE_NUMBERSAMPLE_IDSAMPLE_TIME
----------------------------------------------------------------------------
951160732652 1 23536006-10月-0710.56.29.872上午
951160732652 1 23523006-10月-0710.54.19.857上午
951160732652 1 23313006-10月-0710.19.19.478上午
951160732652 1 23283006-10月-0710.14.18.859上午
951160732652 1 23225006-10月-0710.04.38.481上午
971160732652 1 23860006-10月-0712.33.08.420下午
971160732652 1 23860006-10月-0712.33.08.420下午
971160732652 1 23860006-10月-0712.33.08.420下午
971160732652 1 23860006-10月-0712.33.08.420下午
971160732652 1 23860006-10月-0712.33.08.420下午
971160732652 1 23860006-10月-0712.33.08.420下午
SNAP_ID DBIDINSTANCE_NUMBERSAMPLE_IDSAMPLE_TIME
----------------------------------------------------------------------------
971160732652 1 23842006-10月-0711.50.55.686上午
971160732652 1 23823006-10月-0711.47.45.687上午
981160732652 1 23914006-10月-0701.42.00.976下午
981160732652 1 23914006-10月-0701.42.00.976下午