SQL語句執行深入講解（MySQL架構總覽->查詢執行流程->SQL解析順序）

阿新 • • 發佈：2020-01-09

前言：

一直是想知道一條SQL語句是怎麼被執行的，它執行的順序是怎樣的，然後檢視總結各方資料，就有了下面這一篇博文了。

本文將從MySQL總體架構--->查詢執行流程--->語句執行順序來探討一下其中的知識。

一、MySQL架構總覽：

架構最好看圖，再配上必要的說明文字。

下圖根據參考書籍中一圖為原本，再在其上新增上了自己的理解。

從上圖中我們可以看到，整個架構分為兩層，上層是MySQLD的被稱為的‘SQL Layer'，下層是各種各樣對上提供介面的儲存引擎，被稱為‘Storage Engine Layer'。其它各個模組和元件，從名字上就可以簡單瞭解到它們的作用，這裡就不再累述了。

二、查詢執行流程

下面再向前走一些，容我根據自己的認識說一下查詢執行的流程是怎樣的：

1.連線

　　1.1客戶端發起一條Query請求，監聽客戶端的‘連線管理模組'接收請求

　　1.2將請求轉發到‘連線進/執行緒模組'

　　1.3呼叫‘使用者模組'來進行授權檢查

　　1.4通過檢查後，‘連線進/執行緒模組'從‘執行緒連線池'中取出空閒的被快取的連線執行緒和客戶端請求對接，如果失敗則建立一個新的連線請求

2.處理

　　2.1先查詢快取，檢查Query語句是否完全匹配，接著再檢查是否具有許可權，都成功則直接取資料返回

　　2.2上一步有失敗則轉交給‘命令解析器'，經過詞法分析，語法分析後生成解析樹

　　2.3接下來是預處理階段，處理解析器無法解決的語義，檢查許可權等，生成新的解析樹

　　2.4再轉交給對應的模組處理

　　2.5如果是SELECT查詢還會經由‘查詢優化器'做大量的優化，生成執行計劃

　　2.6模組收到請求後，通過‘訪問控制模組'檢查所連線的使用者是否有訪問目標表和目標欄位的許可權

　　2.7有則呼叫‘表管理模組'，先是檢視table cache中是否存在，有則直接對應的表和獲取鎖，否則重新開啟表文件

　　2.8根據表的meta資料，獲取表的儲存引擎型別等資訊，通過介面呼叫對應的儲存引擎處理

　　2.9上述過程中產生資料變化的時候，若開啟日誌功能，則會記錄到相應二進位制日誌檔案中

3.結果

　　3.1Query請求完成後，將結果集返回給‘連線進/執行緒模組'

　　3.2返回的也可以是相應的狀態標識，如成功或失敗等

　　3.3‘連線進/執行緒模組'進行後續的清理工作，並繼續等待請求或斷開與客戶端的連線

一圖小總結

三、SQL解析順序

接下來再走一步，讓我們看看一條SQL語句的前世今生。

首先看一下示例語句

SELECT DISTINCT
 < select_list >
FROM
 < left_table > < join_type >
JOIN < right_table > ON < join_condition >
WHERE
 < where_condition >
GROUP BY
 < group_by_list >
HAVING
 < having_condition >
ORDER BY
 < order_by_condition >
LIMIT < limit_number >

然而它的執行順序是這樣的

FROM <left_table>
ON <join_condition>
<join_type> JOIN <right_table>
WHERE <where_condition>
GROUP BY <group_by_list>
HAVING <having_condition>
SELECT 
DISTINCT <select_list>
ORDER BY <order_by_condition>
LIMIT <limit_number>

雖然自己沒想到是這樣的，不過一看還是很自然和諧的，從哪裡獲取，不斷的過濾條件，要選擇一樣或不一樣的，排好序，那才知道要取前幾條呢。

既然如此了，那就讓我們一步步來看看其中的細節吧。

準備工作

1.建立測試資料庫

create database testQuery

2.建立測試表

CREATE TABLE table1
(
 uid VARCHAR(10) NOT NULL,name VARCHAR(10) NOT NULL,PRIMARY KEY(uid)
)ENGINE=INNODB DEFAULT CHARSET=UTF8;

CREATE TABLE table2
(
 oid INT NOT NULL auto_increment,uid VARCHAR(10),PRIMARY KEY(oid)
)ENGINE=INNODB DEFAULT CHARSET=UTF8;

3.插入資料

INSERT INTO table1(uid,name) VALUES('aaa','mike'),('bbb','jack'),('ccc',('ddd','mike');

INSERT INTO table2(uid) VALUES('aaa'),('aaa'),('bbb'),('ccc'),(NULL);

4.最後想要的結果

SELECT
 a.uid,count(b.oid) AS total
FROM
 table1 AS a
LEFT JOIN table2 AS b ON a.uid = b.uid
WHERE
 a. NAME = 'mike'
GROUP BY
 a.uid
HAVING
 count(b.oid) < 2
ORDER BY
 total DESC
LIMIT 1;

！現在開始SQL解析之旅吧！

1. FROM

當涉及多個表的時候，左邊表的輸出會作為右邊表的輸入，之後會生成一個虛擬表VT1。

(1-J1)笛卡爾積

計算兩個相關聯表的笛卡爾積(CROSS JOIN) ，生成虛擬表VT1-J1。

mysql> select * from table1,table2;
+-----+------+-----+------+
| uid | name | oid | uid |
+-----+------+-----+------+
| aaa | mike | 1 | aaa |
| bbb | jack | 1 | aaa |
| ccc | mike | 1 | aaa |
| ddd | mike | 1 | aaa |
| aaa | mike | 2 | aaa |
| bbb | jack | 2 | aaa |
| ccc | mike | 2 | aaa |
| ddd | mike | 2 | aaa |
| aaa | mike | 3 | bbb |
| bbb | jack | 3 | bbb |
| ccc | mike | 3 | bbb |
| ddd | mike | 3 | bbb |
| aaa | mike | 4 | bbb |
| bbb | jack | 4 | bbb |
| ccc | mike | 4 | bbb |
| ddd | mike | 4 | bbb |
| aaa | mike | 5 | bbb |
| bbb | jack | 5 | bbb |
| ccc | mike | 5 | bbb |
| ddd | mike | 5 | bbb |
| aaa | mike | 6 | ccc |
| bbb | jack | 6 | ccc |
| ccc | mike | 6 | ccc |
| ddd | mike | 6 | ccc |
| aaa | mike | 7 | NULL |
| bbb | jack | 7 | NULL |
| ccc | mike | 7 | NULL |
| ddd | mike | 7 | NULL |
+-----+------+-----+------+
rows in set (0.00 sec)

(1-J2)ON過濾

基於虛擬表VT1-J1這一個虛擬表進行過濾，過濾出所有滿足ON 謂詞條件的列，生成虛擬表VT1-J2。

注意：這裡因為語法限制，使用了'WHERE'代替，從中讀者也可以感受到兩者之間微妙的關係；

mysql> SELECT
 -> *
 -> FROM
 -> table1,-> table2
 -> WHERE
 -> table1.uid = table2.uid
 -> ;
+-----+------+-----+------+
| uid | name | oid | uid |
+-----+------+-----+------+
| aaa | mike | 1 | aaa |
| aaa | mike | 2 | aaa |
| bbb | jack | 3 | bbb |
| bbb | jack | 4 | bbb |
| bbb | jack | 5 | bbb |
| ccc | mike | 6 | ccc |
+-----+------+-----+------+
rows in set (0.00 sec)

(1-J3)新增外部列

如果使用了外連線(LEFT,RIGHT,FULL)，主表（保留表）中的不符合ON條件的列也會被加入到VT1-J2中，作為外部行，生成虛擬表VT1-J3。

mysql> SELECT
 -> *
 -> FROM
 -> table1 AS a
 -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid;
+-----+------+------+------+
| uid | name | oid | uid |
+-----+------+------+------+
| aaa | mike | 1 | aaa |
| aaa | mike | 2 | aaa |
| bbb | jack | 3 | bbb |
| bbb | jack | 4 | bbb |
| bbb | jack | 5 | bbb |
| ccc | mike | 6 | ccc |
| ddd | mike | NULL | NULL |
+-----+------+------+------+
rows in set (0.00 sec)

下面從網上找到一張很形象的關於‘SQL JOINS'的解釋圖，如若侵犯了你的權益，請勞煩告知刪除，謝謝。

2. WHERE

對VT1過程中生成的臨時表進行過濾，滿足WHERE子句的列被插入到VT2表中。

注意：

此時因為分組，不能使用聚合運算；也不能使用SELECT中建立的別名；

與ON的區別：

如果有外部列，ON針對過濾的是關聯表，主表（保留表）會返回所有的列；

如果沒有新增外部列，兩者的效果是一樣的；

應用：

對主表的過濾應該放在WHERE；

對於關聯表，先條件查詢後連線則用ON，先連線後條件查詢則用WHERE；

mysql> SELECT
 -> *
 -> FROM
 -> table1 AS a
 -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
 -> WHERE
 -> a. NAME = 'mike';
+-----+------+------+------+
| uid | name | oid | uid |
+-----+------+------+------+
| aaa | mike | 1 | aaa |
| aaa | mike | 2 | aaa |
| ccc | mike | 6 | ccc |
| ddd | mike | NULL | NULL |
+-----+------+------+------+
rows in set (0.00 sec)

3. GROUP BY

這個子句會把VT2中生成的表按照GROUP BY中的列進行分組。生成VT3表。

注意：

其後處理過程的語句，如SELECT,HAVING，所用到的列必須包含在GROUP BY中，對於沒有出現的，得用聚合函式；

原因：

GROUP BY改變了對錶的引用，將其轉換為新的引用方式，能夠對其進行下一級邏輯操作的列會減少；

我的理解是：

根據分組欄位，將具有相同分組欄位的記錄歸併成一條記錄，因為每一個分組只能返回一條記錄，除非是被過濾掉了，而不在分組欄位裡面的欄位可能會有多個值，多個值是無法放進一條記錄的，所以必須通過聚合函式將這些具有多值的列轉換成單值；

mysql> SELECT
 -> *
 -> FROM
 -> table1 AS a
 -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
 -> WHERE
 -> a. NAME = 'mike'
 -> GROUP BY
 -> a.uid;
+-----+------+------+------+
| uid | name | oid | uid |
+-----+------+------+------+
| aaa | mike | 1 | aaa |
| ccc | mike | 6 | ccc |
| ddd | mike | NULL | NULL |
+-----+------+------+------+
rows in set (0.00 sec)

4. HAVING

這個子句對VT3表中的不同的組進行過濾，只作用於分組後的資料，滿足HAVING條件的子句被加入到VT4表中。

mysql> SELECT
 -> *
 -> FROM
 -> table1 AS a
 -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
 -> WHERE
 -> a. NAME = 'mike'
 -> GROUP BY
 -> a.uid
 -> HAVING
 -> count(b.oid) < 2;
+-----+------+------+------+
| uid | name | oid | uid |
+-----+------+------+------+
| ccc | mike | 6 | ccc |
| ddd | mike | NULL | NULL |
+-----+------+------+------+
rows in set (0.00 sec)

5. SELECT

這個子句對SELECT子句中的元素進行處理，生成VT5表。

(5-J1)計算表示式計算SELECT 子句中的表示式，生成VT5-J1

(5-J2)DISTINCT

尋找VT5-1中的重複列，並刪掉，生成VT5-J2

如果在查詢中指定了DISTINCT子句，則會建立一張記憶體臨時表（如果記憶體放不下，就需要存放在硬碟了）。這張臨時表的表結構和上一步產生的虛擬表VT5是一樣的，不同的是對進行DISTINCT操作的列增加了一個唯一索引，以此來除重複資料。

mysql> SELECT
 -> a.uid,-> count(b.oid) AS total
 -> FROM
 -> table1 AS a
 -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
 -> WHERE
 -> a. NAME = 'mike'
 -> GROUP BY
 -> a.uid
 -> HAVING
 -> count(b.oid) < 2;
+-----+-------+
| uid | total |
+-----+-------+
| ccc |  1 |
| ddd |  0 |
+-----+-------+
rows in set (0.00 sec)

6.ORDER BY

從VT5-J2中的表中，根據ORDER BY 子句的條件對結果進行排序，生成VT6表。

注意：

唯一可使用SELECT中別名的地方；

mysql> SELECT
 -> a.uid,-> count(b.oid) AS total
 -> FROM
 -> table1 AS a
 -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
 -> WHERE
 -> a. NAME = 'mike'
 -> GROUP BY
 -> a.uid
 -> HAVING
 -> count(b.oid) < 2
 -> ORDER BY
 -> total DESC;
+-----+-------+
| uid | total |
+-----+-------+
| ccc |  1 |
| ddd |  0 |
+-----+-------+
rows in set (0.00 sec)

7.LIMIT

LIMIT子句從上一步得到的VT6虛擬表中選出從指定位置開始的指定行資料。

注意：

offset和rows的正負帶來的影響；

當偏移量很大時效率是很低的，可以這麼做：

採用子查詢的方式優化，在子查詢裡先從索引獲取到最大id，然後倒序排，再取N行結果集

採用INNER JOIN優化，JOIN子句裡也優先從索引獲取ID列表，然後直接關聯查詢獲得最終結果

mysql> SELECT
 -> a.uid,-> count(b.oid) AS total
 -> FROM
 -> table1 AS a
 -> LEFT JOIN table2 AS b ON a.uid = b.uid
 -> WHERE
 -> a. NAME = 'mike'
 -> GROUP BY
 -> a.uid
 -> HAVING
 -> count(b.oid) < 2
 -> ORDER BY
 -> total DESC
 -> LIMIT 1;
+-----+-------+
| uid | total |
+-----+-------+
| ccc |  1 |
+-----+-------+
row in set (0.00 sec)

至此SQL的解析之旅就結束了，上圖總結一下：

參考書籍：

《MySQL效能調優與架構實踐》
《MySQL技術內幕：SQL程式設計》

尾聲：

　　嗯，到這裡這一次的深入瞭解之旅就差不多真的結束了，雖然也不是很深入，只是一些東西將其東拼西湊在一起而已，參考了一些以前看過的書籍，大師之筆果然不一樣。而且在這過程中也是get到了蠻多東西的，最重要的是更進一步意識到，計算機軟體世界的巨集大呀~

　　另由於本人才疏學淺，其中難免存在紕漏錯誤之處，若發現勞煩告知修改，感謝~

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作具有一定的參考學習價值，如果有疑問大家可以留言交流，謝謝大家對我們的支援。

SQL語句執行深入講解（MySQL架構總覽->查詢執行流程->SQL解析順序）

SQL語句執行深入講解（MySQL架構總覽-&gt;查詢執行流程-&gt;SQL解析順序）

MySQL儲存過程的深入講解（in、out、inout）

pymysql如何解決sql注入問題深入講解

Python流程控制語句的深入講解

sql server 效能調優之 SQL語句跟蹤採集分析(資訊包括:來源IP，耗時，執行緒狀態等)

python 多執行緒講解（如何實現多執行緒，遞迴鎖，互斥鎖，訊號量，事件等）

多執行緒2（常用的方法：join、interrupt、currentThread、isAlive、setDaemon...）

1:DNS詳解（DNS介紹，DNS報文詳解，DNS查詢詳解，DNS域名解析過程）

從 MySQL 架構設計出發，看它是如何執行一條 SQL 語句的

Mysql基礎（十二)：sql語句執行步驟詳解（一）準備工作

Mysql基礎（十三)：sql語句執行步驟詳解（二）SQL邏輯查詢語句執行順序

Mysql基礎（十四)：sql語句執行步驟詳解（三）查詢語句是如何執行

Mysql基礎（十五)：sql語句執行步驟詳解（四）SQL書寫習慣

【轉】2.1【MySQL】執行原理（一）：查詢sql的執行過程及MySQL架構分析

mysql 慢查詢日誌（用於分析執行慢的sql語句 windows下使用mysqldumpslow）

如何讓docker中的mysql啟動時自動執行sql語句

詳解一條sql語句在mysql中是如何執行的

基於SQLAlchemy實現操作MySQL並執行原生sql語句

在IDEA中安裝MyBatis Log Plugin外掛,執行mybatis的sql語句（推薦）

SQL語句 Server 分頁儲存過程（SQL Server 、MySQL）

SQL語句執行深入講解（MySQL架構總覽-&gt;查詢執行流程-&gt;SQL解析順序）

相關推薦

SQL語句執行深入講解（MySQL架構總覽->查詢執行流程->SQL解析順序）