高階資料庫十五：查詢優化器（一）

阿新 • • 發佈：2019-01-11

Optimizer Implementation(Part I)

背景

在講述這個優化器的時候，就必須先了解查詢過程。在本系列的資料庫四：淺談資料庫查詢過程（Query Processing）中大致地說明了一下資料庫的查詢過程，但是沒提到查詢優化器的具體策略與實現。

對於查詢而言，我們期望優化器的作用是找到最小代價的正確執行方案。但是這是一個NP完全問題，所以沒有一個優化器能夠真正地找到真正的最佳方案。

關於OLTP的查詢優化會更加簡單，一般來說選取最好的索引，JOIN操作也大多使用外來鍵，用一些簡單的策略就行。

比如，大家可以畫一棵關係代數查詢樹，如果我們將選擇操作儘可能下放到深處，則在進行笛卡爾乘或者JOIN的時候，參與運算的資料就少了。這就是heuristic optimazation。

所以在這兒我們將說明OLAP查詢的優化策略。

優化器基礎

優化器粒度

單查詢

更小的搜尋空間。
DBMS不能在查詢中重複使用結果。
為了解決資源爭奪問題，成本模型必須考慮當前正在執行的內容。

多查詢

如果有很多類似的查詢，效率會更高。
搜尋空間要大得多。
用於掃描共享（之後的文章會提到，大致就是多個查詢共用一個掃描表的結果，而不是各自掃描一次）

優化時間

靜態優化

在執行之前選擇最佳計劃。
計劃質量取決於成本模型的準確性。
可以使用準備好的支票分攤執行。

動態優化

主要在流式資料的時候使用
查詢執行時，即時選擇運營商計劃。
將重新優化多次執行。

難以實現/除錯（非確定性）

混合優化

使用靜態演算法編譯。
如果估計>閾值的誤差，則重新優化。

計劃穩定

提示

執行資料庫系統管理員幫助優化器進行決策，比如，我希望用hash表進行JOIN等
mysql、sqlserver似乎都支援這種方法

固定優化器版本

設定優化器版本號並將查詢逐個遷移到新優化器。比如，雖然用了新版本的資料庫，但是對於某種特定的查詢，我們發現了舊版本的優化器似乎更快，則可以將版本調回去。

向後相容的計劃

從舊版本儲存備份查詢計劃，並將其提供給新的DBMS。

優化器搜尋策略

Heuristics

之前舉了一個關係代數查詢樹的例子，說的就是Heuristics優化方法。它定義了一些規則，通過靜態的方式來進行優化：

儘早進行選擇，越嚴格的限制應該越早進行
在連線之前執行所有選擇
謂詞/限制/投影下推
基於基數加入排序

Oracle在早起非常受歡迎的原因就是因為它使用了這種方法。

優點：

易於實施和除錯。
效果相當好，對於簡單的查詢很快。

缺點：

依靠玄學常數來預測計劃決策的有效性。
當操作之間存在複雜的相互依賴關係時，幾乎不可能產生好的查詢計劃。

Heuristics + Cost-based Join Order Search

使用靜態規則執行初始優化,然後使用動態規劃來確定表格的最佳連線順序。

第一個基於成本的查詢優化器
使用分而治之搜尋方法進行自底向上（向前連結）

現在也非常常用的技術，MySQL、SQLite都用這個。

SYSTEM R OPTIMIZER

假設都沒有索引，則得到資料的方式就是線性掃描。

然後將所有的JOIN操作的可能性都列出來，並找出最少代價的JOIN策略。其中也包括每個具體的JOI操作的演算法。

因為有ORDER BY，所以要進行排序

優點：

通常找到一個合理的計劃，而不必執行詳盡的搜尋。

缺點：

所有與啟發式方法相同的問題。
左深連線樹並不總是最佳的。
必須考慮成本模型中資料的物理屬性（例如排序順序）。

Randomized Algorithms

執行隨機遍歷查詢的所有可能（有效）計劃的解決方案空間。
繼續搜尋，直到達到代價閾值或優化器執行一段特定的時間。

例如：Postgres的遺傳演算法。

優點：

隨機跳轉搜尋空間允許優化器跳出區域性最小值(這個地方可以去看看遺傳演算法的文章來理解原理)。
低記憶體開銷（如果沒有歷史儲存）。

缺點：

很難確定為什麼DBMS可能選擇了一個特定的計劃。
必須做額外的工作來確保查詢計劃是確定性的。
仍然必須執行正確性規則。

SIMULATED ANNEALING

用Heuristics方發生成的最初的查詢計劃，然後通過SQL運算子的隨機排列（例如，交換兩個表的連線順序）來產生新的解。

始終接受降低成本的更改
只接受一個可能會增加成本的變化。
拒絕違反正確性的任何更改（例如，排序順序）

POSTGRES OPTIMIZER

更復雜的查詢使用遺傳演算法來選擇連線順序的。

在每一輪開始時，生成查詢計劃的不同版本，選擇成本最低的計劃，並用其他計劃進行排列。重複該操作。

變異函式只產生有效的計劃。

Stratified Search

首先使用轉換規則重寫邏輯查詢計劃。

引擎檢查是否允許轉換，然後才能應用。
這一步從來不考慮成本。

然後執行基於成本的搜尋，從而將邏輯查詢計劃對映到物理查詢計劃。

優點：

在快速表現的實踐中運作良好。

缺點：

難以為轉換指定優先順序
如果不計算多重成本估算，一些轉換難以評估。
規則維護是一個巨大的痛苦。

STARBURST OPTIMIZER

用此方法實現更好地System R optimizer。

階段1：查詢重寫

計算查詢的SQL塊級關係微積分表示。

階段2：計劃優化

一旦查詢重寫完成，執行System RR風格的動態規劃階段。

Unified Search

使用唯一的一個搜尋空間，統一邏輯- 邏輯和邏輯- 物理轉換的概念。不需要單獨的階段，因為一切都是轉換。

這種方法產生了更多的轉換，因此大量使用memoization來減少冗餘工作。

VOLCANO OPTIMIZER

通用基於成本的查詢優化器，基於關係代數上的等價規則。

輕鬆新增新的操作和等價規則。
計劃過程中將資料的物理屬性視為一流的實體。
使用分枝定界搜尋的自頂向下方法（反向連結）。

不過這種方法似乎只在實驗室或者學校中才有用到，工業界似乎沒有用過這種方式。

優點

使用宣告性規則來生成轉換。
通過高效的搜尋引擎實現更好的可擴充套件性。減少使用記憶的冗餘估計。

缺點：

在優化搜尋之前，所有等價類都完全展開以生成所有可能的邏輯運算子。
不容易修改謂詞。

TOP-DOWN VS. BOTTOM-UP

自上而下的優化：從你想要的最終結果開始，然後在樹上尋找最適合你的目標。

自下而上的優化：從一無所有開始，然後制定計劃以達到您想要的最終結果。

高階資料庫十五：查詢優化器（一）

Optimizer Implementation(Part I) 背景在講述這個優化器的時候，就必須先了解查詢過程。在本系列的資料庫四：淺談資料庫查詢過程（Query Processing）中大致地說明了一下資料庫的查詢過程，但是沒提到查詢優化器的具體

資料庫查詢優化技術（一）：資料庫與關係代數

資料庫查詢優化技術學習筆記（一）我是看李海翔的《資料庫技術叢書·資料庫查詢優化器的藝術：原理解析與SQL效能優化》這本書的視訊講解學習的，因為資料庫的知識學的不多，直接看優化有些吃力，慢慢補吧。現在要用一些優化的知識只能先看著了。本文大概內容：

【黑金原創教程】【FPGA那些事兒-驅動篇I 】實驗十五：FIFO儲存模組（同步）

實驗十五：FIFO儲存模組（同步）筆者雖然在實驗十四曾解釋儲存模組，而且也演示奇怪的傢伙，但是實驗十四隻是一場遊戲而已。至於實驗十五，筆者會稍微嚴肅一點，手動建立有規格的儲存模組，即同步FIFO。那些看過《時序篇》的同學一定對同步FIFO不會覺得陌生吧？因為筆者曾在《時序篇》建立基於移位暫存器的同步FIF

laravel 查詢構造器（一）

DB::table() 查詢構造器演示插入 insert() insert 裡面寫陣列。返回一個布林值。 DB::table('user_ali') -> insert(['ali_us

JVM初窺：垃圾收集器（一）

參考書籍：《深入理解Java虛擬機器——JVM高階特性與最佳實踐(第2版)》 Java語言出來之前，程式開發更多的是使用C或者C++語言，然而在C或者C++語言中存在一個很大的矛盾：建立物件時要不斷

資料庫查詢優化技術（二）：子查詢優化

查詢的基本操作 1選擇操作對應的是限制條件(格式類似“field<op>consant”, field表示列物件,op是操作符如"="、">"等)。操作物件是二維表中的行優化方式：選擇操作下推目的：是儘

Unity3D學習筆記（三十五）：Shader著色器（2）- 頂點片元著色器

結構體意義 float inline 有意義 pro spa ocl rcu Alpha測試 AlphaTest Great：大於 AlphaTest Less：小於 AlphaTest Equal：等於 AlphaTest GEqual：大於等於 AlphaTest L

性能測試十五：liunx下搭建（tomcatr+項目+jmete命令行）

jmeter 啟動機器進程 img src 變量 javac 上傳單機準備工作： 1、壓力機安裝並配置好JDK，輸入java和javac驗證環境變量 2、上傳jmeter到liunx下：準備好jmeter的壓縮包在第三方工具中對linux文件上傳下載（需先裝

效能測試十五：liunx下搭建（tomcatr+專案+jmete命令列）

單機準備工作： 1、壓力機安裝並配置好JDK，輸入java和javac驗證環境變數 2、上傳jmeter到liunx下：準備好jmeter的壓縮包在第三方工具中對linux檔案上傳下載（需先裝好rz/sz工具），以liunx系統本身出發：sz下載/傳送（send） &nbs

mysql實用優化筆記（一）：like查詢優化

like查詢優化方案 like模糊查詢形如'%AAA%'和'%AAA'將不會使用索引，但是業務上不可避免可能又需要使用到這種形式查詢方式：優化方案一：使用覆蓋索引，即查詢出的列只是用索引就可以獲取，而無須查詢表記錄，這樣也走了索引；優化方案二：使用locate函式或

Unity3D學習筆記（三十四）：Shader著色器（1）

mission inf 向量投影 rim tags 系統依賴什麽是一、GPU：圖形處理器，Graphics Processing Unit 顯卡的處理器就是圖形處理器。與CPU類似。 GPU和CPU的區別？ 1.CPU主要是為了串行指令設計，GPU則是為了大規模

Unity3D學習筆記（三十六）：Shader著色器（3）- 光照

像素環境斜率偏移 target off 分辨屬性思路光照模型：用數學的方法模擬現實世界中的光照效果。場景中模型身上的光反射到相機中的光線： 1.漫反射：產生明暗效果 2.高光反射：產生鏡面反射，物體中有最亮且比較耀眼的一部分 3.自發光： 4.環境光：

RabbitMQ指南之五：主題交換器（Topic Exchange）

vmw 有效組成 oot alt basic env serve .com 　　在上一章中，我們完善了我們的日誌系統，用direct交換器替換了fanout交換器，使得我們可以有選擇性地接收消息。盡管如此，仍然還有限制：不能基於多個標準進行路由。在我們的日誌系統中，我們可

設計模式之十八：橋接模式（Bridge）

ora 它的 pla sin string src ams down ng- 橋接模式：將抽象部分和它的實現部分相分離開來，以使它們能夠單獨地變化。 UML圖：主要包含： Abstraction:定義了抽象部分的接口。操作一個實現部分對

SGI STL內存配置器（一）：內存泄漏？

分解產生 for void 客戶端 lin call free 創建過程閱讀了Alexander大神的SGI STL源碼，膜拜，很高質量的源碼，獲益匪淺。溫故而知新！下文中所有STL如無特殊說明均指SGI版本實現。 STL 內存配置器 STL對內存管理最核心部分我覺得是

第五章：循環結構（一）

如何如何使用滿足為什麽發現每日生活打印機結構第五章：循環結構（一） 1.什麽是循環結構在日常生活中，會有很多需要反復執行的事情，比如：每一年的 4個季節，每一周的7天，每日的3餐，打印機每份文檔打印50 份，一圈跑道400米跑3圈，都是在反復執行的。 2

Apache Spark 2.2中基於成本的優化器（CBO）（轉載）

ons roc art 3.4 post tinc ner sort 重排序 Apache Spark 2.2最近引入了高級的基於成本的優化器框架用於收集並均衡不同的列數據的統計工作 (例如., 基（cardinality）、唯一值的數量、空值、最大最小值、平均/最大長度，

Android項目實戰（十六）：QQ空間實現（一）—— 展示說說中的評論內容並有相應點擊事件

con toast short demo append 集合 obj parent 自帶原文:Android項目實戰（十六）：QQ空間實現（一）—— 展示說說中的評論內容並有相應點擊事件大家都玩QQ空間客戶端，對於每一個說說，我們都可以評論，那麽，對於某一條評論：

Silverlight & Blend動畫設計系列十二：三角函數（Trigonometry）動畫之自由旋轉（Free-form rotation）

name angle 最終 clas oot pos ftp 旋轉動畫 one 說到對象的旋轉，或許就會聯想到對象角度的概念。對象的旋轉實現實際上就是利用對象的角度改變來實現的位置變換，在《Silverlight & Blend動畫設計系列二：旋轉動畫（Rotate

遍歷一個Set的方法只有一個：叠代器（interator）

oid 能夠 sys 比較 hashcode 排列兩個 fin span Set-HashSet實現類：遍歷一個Set的方法只有一個：叠代器（interator）。 HashSet中元素是無序的（這個無序指的是數據的添加順序和後來的排列順序不同），而且元素不可重復。在

高階資料庫十五：查詢優化器（一）

Optimizer Implementation(Part I)

背景

優化器基礎

優化器粒度

優化時間

計劃穩定

優化器搜尋策略

Heuristics

Heuristics + Cost-based Join Order Search

SYSTEM R OPTIMIZER

Randomized Algorithms

SIMULATED ANNEALING

POSTGRES OPTIMIZER

Stratified Search

STARBURST OPTIMIZER

Unified Search

VOLCANO OPTIMIZER

TOP-DOWN VS. BOTTOM-UP

相關推薦