淺談ORDER BY分類

阿新 • • 發佈：2017-11-20

order by 優化

前言

排序是數據庫中的一個基本功能，MySQL也不例外。通過Order by語句即能達到將指定的結果集排序的目的，

其實不僅僅是Order by語句，Group by語句，Distinct語句都會隱含使用排序

在實際業務場景中，一些開發的大牛動不動來個orderby，SQL看起寫的非常溜,而實際業務應用導致GAME OVER......

首先介紹MySQL實現排序的內部原理，並介紹與排序相關的參數，最後結合實際給出幾個"奇怪"排序，來談談排序一致問題

1、排序實現的算法：

對於不能利用索引避免排序的 SQL，數據庫不得不自己排序功能以滿足業務需求，執行計劃中會出現"USING TEMPORARY; USING filesort",

有時候filesore並不意味著就是文件排序也有可能是內存排序，只有由參數sort_buffer_size和結果集大小確定。

MySQL內部排序主要有3種方式：常規排序、優化排序和優先隊列排序，假設表結構如下:

CREATE TABLE `t1` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`col1` varchar(64) COLLATE utf8mb4_unicode_ci NOT NULL,

`col2` varchar(64) COLLATE utf8mb4_unicode_ci NOT NULL,

`col3` varchar(64) COLLATE utf8mb4_unicode_ci DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `col1` (`col1`,`col2`)

) ENGINE=InnoDB AUTO_INCREMENT=10 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci

SELECT col1,col2,col3 FROM t1 WHERE col1="100" ORDER BY col2;

a.常規排序

(1).從表t1中獲取滿足WHERE條件的記錄

(2).對於每條記錄，將記錄的主鍵+排序鍵(id,col2)取出放入sort buffer

(3).如果sort buffer可以存放所有滿足條件的(id,col2)對，則進行排序；否則sort buffer滿後，進行排序並固化到臨時文件中。(排序算法采用的是快速排序算法)

(4).若排序中產生了臨時文件，需要利用歸並排序算法，保證臨時文件中記錄是有序的

(5).循環執行上述過程，直到所有滿足條件的記錄全部參與排序

(6).掃描排好序的(id,col2)對，並利用id去撈取SELECT需要返回的列(col1,col2,col3)

(7).將獲取的結果集返回

從上述流程來看，是否使用文件排序主要看sort buffer是否能容下需要排序的(id,col2)對，這個buffer的大小由sort_buffer_size參數控制。此外一次排序需要兩次IO，一次是撈(id,col2),第二次是撈(col1,col2,col3)，由於返回的結果集是按col2排序，因此id是亂序的，通過亂序的id去撈(col1,col2,col3)時會產生大量的隨機IO。對於第二次MySQL本身一個優化，

即在撈之前首先將id排序，並放入緩沖區，這個緩存區大小由參數read_rnd_buffer_size控制，然後有序去撈記錄，將隨機IO轉為順序IO

b.優化排序

常規排序方式除了排序本身，還需要額外兩次IO。優化的排序方式相對於常規排序，減少了第二次IO。主要區別在於，放入sort buffer不是(id,col2),而是(col1,col2,col3)。由於sort buffer中包含了查詢需要的所有字段，因此排序完成後可以直接返回，無需二次撈數據。這種方式的代價在於，同樣大小的sort buffer，能存放的(col1,col2,col3)數目要小於(id,col2)，如果sort buffer不夠大，可能導致需要寫臨時文件，造成額外的IO。當然MySQL提供了參數max_length_for_sort_data，

只有當排序元組小於max_length_for_sort_data時，才能利用優化排序方式，否則只能用常規排序方式

c.優先隊列排序

為了得到最終的排序結果，無論怎樣，我們都需要將所有滿足條件的記錄進行排序才能返回。那麽相對於優化排序方式,

在空間層面做了優化黑盒加入了一種新的排序方式--優先隊列，這種方式采用堆排序實現,堆排序算法特征正好可以解limit M，N 這類排序的問題，雖然仍然需要所有元素參與排序，但是只需要M+N個元組的sort buffer空間即可，對於M，N很小的場景，基本不會因為sort buffer不夠而導致需要臨時文件進行歸並排序的問題。

對於升序，采用大頂堆，最終堆中的元素組成了最小的N個元素，對於降序，采用小頂堆，最終堆中的元素組成了最大的N的元素

2、排序優化與索引使用

為了優化SQL語句的排序性能，最好的情況是避免排序，合理利用索引是一個不錯的方法。

因為索引本身也是有序的，如果在需要排序的字段上面建立了合適的索引，那麽就可以跳過排序的過程，提高SQL的查詢速度，\

通過一些典型SQL說明哪些可以利用索引減少排序，哪些不能，

1、select * from t1 order by col1,col2

2、select * from t1 where col1="100" order by col2

3、select *from t1 col1>"100" order by col1 asc

4、select * from t1 where col1="100" and col2>"100" order by col2

3、不能利用索引避免排序

通過索引掃描的記錄數超過30%，變全表掃描

聯合索引中，第一索引列使用範圍查詢

聯合索引中，第一查詢條件不是最左索引列

升降序不一致無法使用

排序字段在多個索引中無法使用(一個聯合索引一個單列索引，一條SQL一次只能使用一個索引)

排序字段是單獨的列無法使用索引

4、業務案例，添加合理的索引

1、業務DDL：

技術分享圖片

2、對原SQL執行計劃的查看:

技術分享圖片

3、優化後的SQL執行計劃-1

技術分享圖片

3、優化後的SQL執行計劃-2

技術分享圖片

主要對原SQL進行改寫以及添加相應的索引，即可實現SQL優化，運行效率的最優。

淺談ORDER BY分類

order by 優化前言排序是數據庫中的一個基本功能，MySQL也不例外。通過Order by語句即能達到將指定的結果集排序的目的，其實不僅僅是Order by語句，Group by語句，Distinct語句都會隱含使用排序在實際業務場景中，一些開發的大牛動不動來個orderby，SQL看起寫的非

淺談group by和order by的用法和區別

前一段時間的面試，問道這個問題，不太清楚了，感覺有必要來總結一下。話不多說，直接開始吧！一、order by的用法使用order by，一般是用來，依照查詢結果的某一列（或多列）屬性，進行排序（升序：ASC；降序：DESC；預設為升序）。當排序列含空值時： ASC：

淺談IP地址分類及預留地址

ip地址由32位二進位制組成，表示為四個0-255的數，用三個點（.）隔開，表示ipv4地址網路地址=網路號+主機號為了緩解ip地址匱乏，國際網際網路資訊中心（NIC）保留了3個區域作為私有地址： A類地址：10.0.0.0～10.255.255.255 B類地址：17

淺談ORDER排序對HIBERNATE分頁查詢的影響

hql = hql + " ORDER BY isSystem"; hql4Tot =hql4Tot+" ORDER BY isSystem"; Query query = this.getHibernateTemp

淺談二分—— by hyl天夢

二分解決範圍二分法可以用來解決這一系列具有單調性質的題，例如求單調函式的零點其實在小學奧數中就用到了二分法例如手動開根號，再比如猜數遊戲二分的具體過程就是先取一箇中間值，判定一下正確答案在哪邊，然後接著再二分，直到找到答案為止二分法的本質是把求解問題轉化成判定問題優勢二分相對於暴力列舉來講，判

淺談NLP 文字分類/情感分析任務中的文字預處理工作

[toc] # 淺談NLP 文字分類/情感分析任務中的文字預處理工作 ## 前言之所以心血來潮想寫這篇部落格，是因為最近在關注NLP文字分類這類任務中的文字預處理工作，想總結一下自己的所學所想，老規矩，本博文記載**僅供備忘與參考**，不具備學術價值，本文預設使用python3程式設計（程式碼能力是屎山級

淺談高清顯示接口RGB、LVDS、MIPI、eDP、HDMI、mini-LVDS、V-By-One(轉載）

morn 設備宋體解決產品 key one txt targe 淺談高清顯示接口RGB、LVDS、MIPI、eDP、HDMI、mini-LVDS、V-By-One 標簽： hdmi轉edp rgb轉edp lvds轉edp lvds轉v-by-one

淺談by course研究生

by course 和 by research 兩種的區別主要在於, Master by course, 可以只用修課,不做論文(你也可以選擇做論文). 課修夠了就畢業. 最短學制1年 (full time). 讀part time的人比較多. 大多數by course沒有獎

淺談線段樹（by Shine_hale）

一. 線段樹是什麼？線段樹，顧名思義，就是將區間變成線段進行處理如圖可以看出，將1-10這個線段不斷拆分，進而得到子節點；摘自網際網路二、為什麼要用線段樹線段樹修改簡單，方便快捷，同時；在查詢上可以使時間複雜度到達O（1），這很厲害了同時不同於RMQ問題，可以線上進行修改，不用花時間進行重構

淺談zkw線段樹（by Shine_hale）

說我 sca can 心理 www. node -- mes 處理線段樹嘛，很好用的數據結構處理方法但是有個缺點代碼長，不好理解，但是很強大其建樹方法是遞歸建樹，調用棧來運行，從上至下，有人說，這類似一個回溯的過程其實也不然，標記下放後，標記仍需上浮，一上一下，自然

淺談ROC與PR曲線-分類器閾值確定

今天早上看了一下閾值的問題，後來來了ROC受試者工作特徵，發現可以測試多組資料，然後得到每個閾值下的真正例（True positive）和假正例（False positive），發現可以用這個曲線進行統計從而得到每個閾值的情況下分類器的效能，並且進行擬合，最後找到這個均衡

以一次專案經歷淺談php無限極分類和遞迴的關係

專案背景：新專案是一個分銷系統，核心技術就是無限極分類，每個會員都可以邀請別人進入這個團隊，會員可以升級，可以享受獎勵，前提是不斷地邀請別人加入，這樣每個團隊的長遠可以層層繫結關係。資料庫設計：資料庫的user表這樣設計，

淺談聚合支付的分類及發展前景

系統輕松其他增值服務需求大致靈活解決朋友圈聚合支付的產品分類有哪些？目前市面上的產品大致分為兩種：一種是面向線下商家的，做支付平臺解決方案的。就像前面提到的，面向超市或者其他商家收銀使用的。除了軟件支持，還提供的有硬件設備，比如收銀臺，收銀掃碼槍等。根據這

淺談計算機領域及職業憧憬

計算機科學軟件工程師計算機行業雖然自己的專業是計算機，可是慚愧的說其實對這個行業的了解並不是很多，大多時候是通過網絡或者新聞才了解到的。據我所知，現在計算機行業是非常流行的行業，當然競爭也是十分激烈，信息化的時代我們的生活都離不開與計算機有關的東西，比如上學坐公共汽車，需要刷卡，這就是

NumberFormatException: Invalid int類型不匹配異常——使用SQL數據庫查詢語句select * from blacknumber order by _id desc limit ?,20;出現

rom add ray 修改 java turn 技術分享 data color 異常：類型不匹配 05-06 08:12:38.151: E/AndroidRuntime(14904): java.lang.NumberFormatException: Invalid i

Java學習筆記——淺談數據結構與Java集合框架（第一篇、List）

技術分享 emp 鏈表 adc 下標 -c nod nal integer 橫看成嶺側成峰，遠近高低各不同。不識廬山真面目，只緣身在此山中。　　　　　　　　　　　　　　——蘇軾這一塊兒學的是雲裏霧裏，咱們先從簡單的入手。逐漸的撥開迷霧見太陽。本次先做List集合的三

解決mysql報錯：- Expression #1 of ORDER BY clause is not in GROUP BY clause and contains nonaggregated column 'information_schema.PROFILING.SEQ'

_for tran contains column schema mysql eat table express mysql執行報錯： - Expression #1 of ORDER BY clause is not in GROUP BY clause and cont

淺談ORDER BY分類

淺談ORDER BY分類

淺談group by和order by的用法和區別

淺談IP地址分類及預留地址

淺談ORDER排序對HIBERNATE分頁查詢的影響

淺談二分—— by hyl天夢

淺談NLP 文字分類/情感分析任務中的文字預處理工作

淺談高清顯示接口RGB、LVDS、MIPI、eDP、HDMI、mini-LVDS、V-By-One(轉載）

淺談by course研究生

淺談線段樹（by Shine_hale）

淺談zkw線段樹（by Shine_hale）

淺談ROC與PR曲線-分類器閾值確定

以一次專案經歷淺談php無限極分類和遞迴的關係

淺談聚合支付的分類及發展前景

淺談計算機領域及職業憧憬

NumberFormatException: Invalid int類型不匹配異常——使用SQL數據庫查詢語句select * from blacknumber order by _id desc limit ?,20;出現

Java學習筆記——淺談數據結構與Java集合框架（第一篇、List）

解決mysql報錯：- Expression #1 of ORDER BY clause is not in GROUP BY clause and contains nonaggregated column 'information_schema.PROFILING.SEQ'

淺談HTTP請求與響應

淺談C#解析網頁

淺談三層

淺談ORDER BY分類

相關推薦