Oracle 学习之性能优化(一)SQL语句处理

  当向Oracle提交一个sql命令时,Oracle到底做了哪些事情?对这个问题有很好的理解,能帮助你更好的分析sql语句的优化。

  执行一条sql语句从开始到结束,需要经历4个步骤:

  • 分析--对提交的语句进行语法分析、语义分析和共享池检查。

  • 优化--生成一个可在数据库中用来执行语句的最佳计划

  • 行资源生成--为会话取得最佳计划并建立执行计划

  • 语句执行--完成实际执行查询的行资源生成步骤的输出。对应DDL来说,这一步就是语句的结   束。对应SELECT来说,这一步是取数据的开始。


 以上步骤,有的是可以省略的,例如优化、行资源生成器阶段。这样可以节省大量的时间。

Oracle 学习之性能优化(一)SQL语句处理

一、分析:

  语法分析,sql是否符合语法标准。

SQL> select * form tab;
select * form tab
         *
ERROR at line 1:
ORA-00923: FROM keyword not found where expected

  语义分析,假设sql是合法的,但是它有意义吗?你要访问的对象,你有访问权限吗?查询的列存在吗?是否存在歧义等待。

SQL> conn scott/tiger
Connected.
SQL> select x from dual;
select x from dual
       *
ERROR at line 1:
ORA-00904: "X": invalid identifier


SQL> select * from dba_objects;
select * from dba_objects
              *
ERROR at line 1:
ORA-00942: table or view does not exist

  对于DML语句,还有第三步。

  共享池检查,此语句是否被其他用户使用过?可以重用已经执行过的工作吗?如果是,就是软解析soft parse,如果否,那就是硬解析。

  DDL总是硬解析,语句从不重用。

  Shared pool是SGA中的一部分,用来缓存以前执行过的sql语句、PLSQL、数据字典内容的缓存(以行的形式缓存内容,而buffer cache是以block的方式缓存内容)以及其他许多信息,以供会话重用。

 从技术上来说,Oracle的语句解析分为两种:

  • 硬解析--语句通过语句执行的每一个步骤从分析到优化,到行资源生成,到语句执行。

  • 软解析--语句通过语句执行的某些步骤,特别是跳过优化步骤(最昂贵的步骤)。为了执行软解析,必须通过两个步骤。首先Oracle必须进行语义匹配,查看提交给Oracle的语句是否已经被执行过。然后,进行环境匹配。比如一个会话的初始化参数optimizer_mode=ALL_ROWS,一个会话的初始化参数optimizer_mode=FIRST_ROWS,这两个会话的环境就不一样。

 

  为了开始这个处理,Oracle必须在Shared pool中寻找语句。为了高效的完成此操作,oracle将每个提交的sql语句,进行hash算法,生成一个hash_values。oracle使用hash_values查找Shared pool中是否有相同的语句。

Oracle 学习之性能优化(一)SQL语句处理

  一旦找到,Oracle将进行语义和环境检查,sql语句都相同,难道还有语义不同的吗?我们看下面的例子。

  1. 建立两个用户 

SQL> create user a identified by a;

User created.

SQL> create user b identified by b;

User created.

2. 赋予用户权限

SQL> grant connect ,resource to a;

Grant succeeded.

SQL> grant connect,resource to b;

Grant succeeded.

3.启用一个会话

SQL> conn a/a
Connected.
SQL> create table emp (id int);

Table created.
SQL> select * from emp;

no rows selected

4. 启用另一个会话

SQL> conn b/b
Connected.
SQL> create table emp (id int);

Table created.
SQL> select * from emp;

no rows selected
SQL> select * from emp;

no rows selected

5.启用另一会话,使用sys用户连接,进行如下查询。

SQL> SET LINESIZE 200
SQL> COL SQL_TEXT FOR A50
SQL> SELECT address, executions, sql_text
      FROM v$sql
     WHERE UPPER (sql_text) LIKE 'SELECT * FROM EMP';

ADDRESS 	 EXECUTIONS SQL_TEXT
---------------- ---------- --------------------------------------------------
00000000893DF470	  2 select * from emp
00000000893DF470	  1 select * from emp

SQL>

可见,虽然发出的语句是一样的,但是语义不同,所以v$sql中会有两条记录。b用户下,相同的语句执行了两次,因为语义相同,所以是一条记录,但是executions是2 。

  我们再看看,语义相同,但是环境不同,会是什么结果。

以上的连接全部退出,新建一个连接进行如下查询。

SQL> conn / as sysdba
Connected.
SQL> alter session set optimizer_mode=ALL_ROWS;

Session altered.

SQL> SELECT * FROM A.EMP;

no rows selected

SQL> alter session set optimizer_mode=FIRST_ROWS;

Session altered.

SQL> SELECT * FROM A.EMP;

no rows selected

查看sql解析情况

SQL> SET LINESIZE 200
SQL> COL SQL_TEXT FOR A50
SQL> select address,executions,sql_text 
       from v$sql 
      where upper(sql_text) like 'SELECT * FROM A.EMP';

ADDRESS 	 EXECUTIONS SQL_TEXT
---------------- ---------- --------------------------------------------------
0000000091CD7810	  1 SELECT * FROM A.EMP
0000000091CD7810	  1 SELECT * FROM A.EMP

可见,虽然语义相同,但是环境不同,Oracle也会当成2条语句来解析。


  分析总结:

   分析阶段做了如下操作,语法检查、计算散列值、语义检查、环境检查、计算子游标的散列值等。 此外Oracle还可能做了如下步骤:

  在Shared pool中查找匹配的hash_value,如果能找到,确认访问对象的权限、检查环境。生成子游标hash_value。如果子游标hash_value也能匹配。那么将跳过优化和行资源生成。(此部门我们将在游标中详细讨论)


二、优化和行资源生成

  当所有的DML语句第一次提交给Oracle时,在它的生命周期中至少被优化一次。优化发生在硬解析中。语义和语法完全相同,并且执行环境也相同的语句的执行可以利用以前的硬解析工作。这种情况下,对他们将进行软解析。

 优化是一个费劲的、CPU密集型的处理,可能花在优化上的时间比实际执行还要长。优化不单耗cpu,还是导致Shared pool 高栓锁率。优化的规则有两种

  1. 基于规则的优化法则(RBO)

  2. 基于成本的优化法则(CBO)

 优化就是根据优化法则,生成各种各样的执行计划,并且选择一个最好的执行计划。

 行资源生成器是一个软件,就是将执行计划转化成其他部分可以利用的数据结构。

三、执行

  利用行资源生成器输出的执行计划结构,执行具体的步骤。