1. 程式人生 > 實用技巧 >[轉] Oracle sql語句執行順序

[轉] Oracle sql語句執行順序

sql語法的分析是從右到左
一、sql語句的執行步驟:
1)語法分析,分析語句的語法是否符合規範,衡量語句中各表示式的意義。
2)語義分析,檢查語句中涉及的所有資料庫物件是否存在,且使用者有相應的許可權。
3)檢視轉換,將涉及檢視的查詢語句轉換為相應的對基表查詢語句。
4)表示式轉換, 將複雜的 SQL 表示式轉換為較簡單的等效連線表示式。
5)選擇優化器,不同的優化器一般產生不同的“執行計劃”
6)選擇連線方式, ORACLE 有三種連線方式,對多表連線 ORACLE 可選擇適當的連線方式。
7)選擇連線順序, 對多表連線 ORACLE 選擇哪一對錶先連線,選擇這兩表中哪個表做為源資料表。

8)選擇資料的搜尋路徑,根據以上條件選擇合適的資料搜尋路徑,如是選用全表搜尋還是利用索引或是其他的方式。
9)執行“執行計劃”
二、oracle 共享原理:
ORACLE將執行過的SQL語句存放在記憶體的共享池(shared buffer pool)中,可以被所有的資料庫使用者共享。
當你執行一個SQL語句(有時被稱為一個遊標)時,如果它和之前的執行過的語句完全相同,ORACLE就能很快獲得已經被解析的語句以及最好的執行路徑.。這個功能大大地提高了SQL的執行效能並節省了記憶體的使用。
三、oracle 語句提高查詢效率的方法:
1:where column in(select * from ... where ...);

2:... where exists (select 'X' from ...where ...);
第二種格式要遠比第一種格式的效率高。
在Oracle中可以幾乎將所有的IN操作符子查詢改寫為使用EXISTS的子查詢。
使用EXIST,Oracle系統會首先檢查主查詢,然後執行子查詢直到它找到第一個匹配項,
這就節省了時間Oracle系統在執行IN子查詢時,首先執行子查詢,並將獲得的結果列表存放在在一個加了索引的臨時表中。
避免使用having子句。HAVING 只會在檢索出所有記錄之後才對結果集進行過濾。
這個處理需要排序,總計等操作。如果能通過WHERE子句限制記錄的數目,那就能減少這方面的開銷。
四、SQL Select語句完整的執行順序:

  1. from子句組裝來自不同資料來源的資料;
  2. where子句基於指定的條件對記錄行進行篩選;
  3. group by子句將資料劃分為多個分組;
  4. 使用聚集函式進行計算;
  5. 使用having子句篩選分組;
  6. 計算所有的表示式;
  7. select 的欄位;
  8. 使用order by對結果集進行排序。
    SQL語言不同於其他程式語言的最明顯特徵是處理程式碼的順序。在大多資料庫語言中,程式碼按編碼順序被處理。但在SQL語句中,第一個被處理的子句式FROM,而不是第一齣現的SELECT。SQL查詢處理的步驟序號:

(8)SELECT (9) DISTINCT (11) <TOP_specification> <select_list>
(1) FROM <left_table>
(3) <join_type> JOIN <right_table>
(2) ON <join_condition>
(4) WHERE <where_condition>
(5) GROUP BY <group_by_list>
(6) WITH {CUBE | ROLLUP}
(7) HAVING <having_condition>
(10) ORDER BY <order_by_list>

以上每個步驟都會產生一個虛擬表,該虛擬表被用作下一個步驟的輸入。這些虛擬表對呼叫者(客戶端應用程式或者外部查詢)不可用。只有最後一步生成的表才會會給呼叫者。如果沒有在查詢中指定某一個子句,將跳過相應的步驟。
邏輯查詢處理階段簡介:
1、 FROM:對FROM子句中的前兩個表執行笛卡爾積(交叉聯接),生成虛擬表VT1。
2、 ON:對VT1應用ON篩選器,只有那些使為真才被插入到TV2。
3、 OUTER (JOIN):如果指定了OUTER JOIN(相對於CROSS JOIN或INNER JOIN),保留表中未找到匹配的行將作為外部行新增到VT2,生成TV3。如果FROM子句包含兩個以上的表,則對上一個聯接生成的結果表和下一個表重複執行步驟1到步驟3,直到處理完所有的表位置。
4、 WHERE:對TV3應用WHERE篩選器,只有使為true的行才插入TV4。
5、 GROUP BY:按GROUP BY子句中的列列表對TV4中的行進行分組,生成TV5。
6、 CUTE|ROLLUP:把超組插入VT5,生成VT6。
7、 HAVING:對VT6應用HAVING篩選器,只有使為true的組插入到VT7。
8、 SELECT:處理SELECT列表,產生VT8。
9、 DISTINCT:將重複的行從VT8中刪除,產品VT9。
10、ORDER BY:將VT9中的行按ORDER BY子句中的列列表順序,生成一個遊標(VC10)。
11、TOP:從VC10的開始處選擇指定數量或比例的行,生成表TV11,並返回給呼叫者。
Oracle中SQL語句執行過程中,Oracle內部解析原理如下:
  1、當一使用者第一次提交一個SQL表示式時,Oracle會將這SQL進行Hard parse,這過程有點像程式編譯,檢查語法、表名、欄位名等相關資訊(如下圖),這過程會花比較長的時間,因為它要分析語句的語法與語義。然後獲得最優化後的執行計劃(sql plan),並在記憶體中分配一定的空間儲存該語句與對應的執行計劃等資訊。
  2、當用戶第二次請求或多次請求時,Oracle會自動找到先前的語句與執行計劃,而不會進行Hard parse,而是直接進行Soft parse(把語句對應的執行計劃調出,然後執行),從而減少資料庫的分析時間。
  注意的是:Oracle中只能完全相同的語句,包大小寫、空格、換行都要求一樣時,才會重複使用以前的分析結果與執行計劃。
  分析過程如下圖:



對於大量的、頻繁訪問的SQL語句,如果不採用Bind 變數的方式,哪Oracle會花費大量的Shared latch與CPU在做Hard parse處理,所以,要儘量提高語句的重用率,減少語句的分析時間,通過了解Oracle SQL語句的分析過程可以明白Oracle的內部處理邏輯,並在設計與實現上避免。
在用JDBC或其它持久化資料(如Hibernate,JDO等)操作時,儘量用佔位符(?)
ORACLE sql 的處理過程大致如下:
1.運用HASH演算法,得到一個HASH值,這個值可以通過V$SQLAREA.HASH_VALUE 檢視
2.到shared pool 中的 library cache 中查詢是否有相同的HASH值,如果存在,則無需硬解析,進行軟解析
3.如果shared pool不存在此HASH值,則進行語法檢查,檢視是否有語法錯誤
4.如果沒有語法錯誤,就進行語義檢查,檢查該SQL引用的物件是否存在,該使用者是否具有訪問該物件的許可權
5.如果沒有語義錯誤,對該SQL進行解析,生成解析樹,執行計劃
6.生成ORACLE能執行的二進位制程式碼,執行該程式碼並且返回結果給使用者
硬解析和軟解析都在第5步進行
硬解析通常是昂貴的操作,大約佔整個SQL執行的70%左右的時間,硬解析會生成執行樹,執行計劃,等等。
當再次執行同一條SQL語句的時候,由於發現library cache中有相同的HASH值,這個時候不會硬解析,而會軟解析,
那麼軟解析究竟是幹了什麼呢?其實軟解析就是跳過了生成解析樹,生成執行計劃這個耗時又耗CPU的操作,直接利用生成的執行計劃執行
該SQL語句。
下面摘抄eygle深入解析ORACLE 中關於SQL執行過程的描述
1.首先獲得library cache latch,根據SQL的HASH_VALUE在library cache中查詢是否存在此HASH_VALUE,如果找到這個HASH_VALUE,稱之為軟解析,Server獲得改SQL執行計劃轉向第4步,如果找不到共享程式碼就進行硬解析。
2.釋放library pool cache,獲得shared pool latch,查詢並鎖定自由空間(在bucket 中查詢chunk)。如果找不到,報ORA-04031錯誤。
3.釋放shared pool latch,重新獲得library cache latch,將SQL執行計劃放入library cache中。
4.釋放library cache latch,保持null模式的library cache pin/lock。
5.開始執行。
Library cache latch可以理解為硬/軟解析的時候發生的,因為解析的時候會搜尋library cache,所以會產生library cache latch
Library cache pin 是在執行的階段發生的。



作者:丶沙工
連結:https://www.jianshu.com/p/bb19b6b0fdc3
來源:簡書
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。