排序演算法雜談（五） —— 關於快速排序的優化策略分析

阿新 • • 發佈：2018-12-18

1. 前提

2. 優化策略1：主元（Pivot）的選取

歸併排序（Merge Sort）有一個很大的優勢，就是每一次的遞迴都能夠將陣列平均二分，從而大大減少了總遞迴的次數。

而快速排序（Quick Sort）在這一點上就做的很不好。

快速排序是通過選擇一個主元，將整個陣列劃分（Partition）成兩個部分，小於等於主元 and 大於等於主元。

這個過程對於陣列的劃分完全就是隨機的，俗稱看臉吃飯。

這個劃分是越接近平均二分，那麼這個劃分就越是優秀；而若果不巧取到了陣列的最大值或是最小值，那這次劃分其實和沒做沒有什麼區別。

因此，主元的選取，直接決定了一個快速排序的效率。

通過之前快速排序的學習，我們知道了基本上有兩種主流的劃分方式，我將其稱之為：

挖坑取數
快慢指標

前者將最左側的數作為主元，後者將最右側的數作為主元，這種行為完全就是隨機取數。

最簡單的的方法，就是在範圍內取一個隨機數，但是這種方法從概率的角度上來說，和之前的沒有區別。

進一步的思考，可以從範圍內隨機取出三個數字，找到三個數字的中位數，然後和原主元的位置進行交換。

將中位數作為主元，相比於隨機取出的另外兩個數字，對於劃分的影響還是很明顯的。

 1 package com.gerrard.sort.compare.quick.partition.pivot;
 2 
 3 import com.gerrard.util.RandomHelper;
 4 
 5 
 public final class MediumPivot implements Pivot {
 6 
 7     @Override
 8     public int getPivotIndex(int[] array, int left, int right) {
 9         int index1 = RandomHelper.randomBetween(left, right);
10         int index2 = RandomHelper.randomBetween(left, right);
11         int index3 = RandomHelper.randomBetween(left, right);
 
12         if (array[index1] > array[index2]) {
13             if (array[index2] > array[index3]) {
14                 return index2;
15             } else {
16                 return array[index1] > array[index3] ? index3 : index1;
17             }
18         } else {
19             if (array[index1] > array[index3]) {
20                 return index3;
21             } else {
22                 return array[index2] > array[index3] ? index3 : index2;
23             }
24         }
25     }
26 }

3. 優化策略2：閾值的選取

同樣是參考歸併排序的優化策略，歸併排序可以通過判斷陣列的長度，設定一個閾值。

陣列長度大於閾值的，使用歸併排序策略。

陣列長度小於閾值的，使用直接插入排序。

通過這種方式，歸併排序避免了針對小陣列時候的遞迴（遞迴層次增加最多的場景，就是大量的小陣列），從而減輕了JVM的負擔。

 1 public class OptimizedQuickSort implements Sort {
 2 
 3     private ThreeWayPartition partitionSolution = new ThreeWayPartition();
 4     private int threshold = 2 << 4;
 5 
 6     public void setPartitionSolution(ThreeWayPartition partitionSolution) {
 7         this.partitionSolution = partitionSolution;
 8     }
 9 
10     public void setThreshold(int threshold) {
11         this.threshold = threshold;
12     }
13 
14     @Override
15     public void sort(int[] array) {
16         sort(array, 0, array.length - 1);
17     }
18 
19     private void sort(int[] array, int left, int right) {
20         if (right - left < threshold) {
21             insertionSort(array, left, right);
22         } else if (left < right) {
23             int[] partitions = partitionSolution.partition(array, left, right);
24             sort(array, left, partitions[0] - 1);
25             sort(array, partitions[1] + 1, right);
26         }
27     }
28 
29     private void insertionSort(int[] array, int startIndex, int endIndex) {
30         for (int i = startIndex + 1; i <= endIndex; ++i) {
31             int cur = array[i];
32             boolean flag = false;
33             for (int j = i - 1; j > -1; --j) {
34                 if (cur < array[j]) {
35                     array[j + 1] = array[j];
36                 } else {
37                     array[j + 1] = cur;
38                     flag = true;
39                     break;
40                 }
41             }
42             if (!flag) {
43                 array[0] = cur;
44             }
45         }
46     }
47 }

4. 優化策略3：三路劃分

從上面的程式碼中，我們可以看到一個 ThreeWayPartition，這就是現在要講的三路劃分。

回顧之前的快速排序劃分的描述：

快速排序是通過選擇一個主元，將整個陣列劃分成兩個部分，小於等於主元 and 大於等於主元。

不難發現，一次劃分之後，我們將原陣列劃分成了三個部分，小於等於主元 and 主元 and 大於等於主元，劃分結束之後，再將主元兩側進行遞迴。

由此可見，等於主元的部分被劃分到了三個部分，那麼我們就有了這樣的思考：

能不能將陣列明確地劃分成三個部分：小於主元 and 主元和等於主元 and 大於主元。

這樣一來，等於主元的部分就直接從下一次的遞迴中去除了。

回看一下 “挖坑取數” 的程式碼：

 1     @Override
 2     public int partition(int[] array, int left, int right) {
 3         int pivot = array[left];
 4         int i = left;
 5         int j = right + 1;
 6         boolean forward = false;
 7         while (i < j) {
 8             while (forward && array[++i] <= pivot && i < j) ;
 9             while (!forward && array[--j] >= pivot && i < j) ;
10             ArrayHelper.swap(array, i, j);
11             forward ^= true;
12         }
13         return j;
14     }

在內迴圈中，我們的判斷條件是： array[++i] <= pivot。

在這個基礎上，再做一次判斷，針對等於 pivot 的情況，將等於 pivot 的值，與一個已經遍歷過的位置交換：

從左往右找大於 pivot 的值時，與陣列開頭部分交換。
從右往左找小於 pivot 的值時，與陣列結束部分交換。

那麼，在整個劃分結束之後，我們會得到這麼一個數據模型：

其中：

等於 pivot：[left,p) & i & (q,right]
小於 pivot：[p,i)
大於 pivot：(j,q]

然後將 left->p 的資料依次交換到 i 的左側，同理，將q->right 的資料依次交換到 j 的右側。

這樣我們就能得到整個陣列關於 pivot 的嚴格大小關係：

等於 pivot：[p',q']
小於 pivot：[left,p')
大於 pivot：(q',right]

 1 package com.gerrard.sort.compare.quick.partition;
 2 
 3 import com.gerrard.sort.compare.quick.partition.pivot.Pivot;
 4 import com.gerrard.util.ArrayHelper;
 5 
 6 /**
 7  * Three-Way-partition is an optimized solution for partition, also with complexity O(n).
 8  * It directly separate the original array into three parts: smaller than pivot, equal to pivot, larger than pivot.
 9  * It extends {@link SandwichPartition} solution.
10  *
11  * Step1: Select the left one as pivot.
12  * Step2: Besides i and j, define two more index p and q as two sides index.
13  * Step3: Work as SandwichPartition, from sides->middle, the only difference is:
14  *        when meeting equal to pivot scenario, swap i and p or j and q.
15  *
16  * Step4: After iterator ends, the array should look like:
17  *
18  *        left                   i=j                     right
19  *        ---------------------------------------------------
20  *        |     |           |     |     |               |   |
21  *        ---------------------------------------------------
22  *              p           p'          q'              q
23  *
24  *        The distance between left->p and p'->i should be same.
25  *        The distance between j->q' and q->right should also be same.
26  *        [left,p) and (q,right] is equal to pivot, [p,i) is smaller than pivot, (j,q] is larger than pivot.
27  *
28  * Step5: Exchange [left,p) and [p',i), exchange (q,right] and (j,q'].
29  * Step6: Returns two number p'-1 and q'+1.
30  *
31  */
32 public final class ThreeWayPartition {
33 
34     public int[] partition(int[] array, int left, int right) {
35         if (pivotSolution != null) {
36             int newPivot = pivotSolution.getPivotIndex(array, left, right);
37             ArrayHelper.swap(array, left, newPivot);
38         }
39         int pivot = array[left];
40         int i = left;
41         int j = right + 1;
42         int p = i;
43         int q = j - 1;
44         boolean forward = false;
45         while (i < j) {
46             while (forward && array[++i] <= pivot && i < j) {
47                 if (array[i] == pivot) {
48                     ArrayHelper.swap(array, i, p++);
49                 }
50             }
51             while (!forward && array[--j] >= pivot && i < j) {
52                 if (array[j] == pivot) {
53                     ArrayHelper.swap(array, j, q--);
54                 }
55             }
56             ArrayHelper.swap(array, i, j);
57             forward ^= true;
58         }
59         while (p > left) {
60             ArrayHelper.swap(array, --p, --i);
61         }
62         while (q < right) {
63             ArrayHelper.swap(array, ++q, ++j);
64         }
65         return new int[]{i, j};
66     }
67 }

5. 優化測試

最後，針對各種快速排序的演算法，我做了一系列的效能測試：

 1 package com.gerrard.helper;
 2 
 3 import com.gerrard.sort.Sort;
 4 
 5 public final class ComparableTestHelper {
 6 
 7     private ComparableTestHelper() {
 8 
 9     }
10 
11     public static void printCompareResult(int[] array, Sort... sorts) {
12         for (Sort sort : sorts) {
13             int[] copyArray = ArrayTestHelper.copyArray(array);
14             long t1 = System.nanoTime();
15             sort.sort(copyArray);
16             long t2 = System.nanoTime();
17             double timeInSeconds = (t2 - t1) / Math.pow(10, 9);
18             System.out.println("Algorithm " + sort + ", using " + timeInSeconds + " seconds");
19         }
20     }
21 }

測試結果：

從測試結果中，我們可以發現：

取原來的主元，和用隨機數做主元，對於效能的影響完全是隨機的。
取中位數做主元，對於效能有著比較明顯的提高。
增加閾值，對於效能也有提高，但是閾值選取的數值，還有待深一步的研究。
三路快排，在陣列區間較小的情況，對於效能的影響是顯著的，但是陣列區間較大時，對於效能有一定的影響。
遞迴轉迭代的方式，能規避StackOverFlow的情況。

但是還有幾個比較奇怪的現象：

快速排序，對於陣列內部有很多數字相等的情況，處理情況不佳。
快慢指標的方式，對於數字相等的情況，效率降低明顯。
挖坑填數的方式，比快慢指標的方式，更容易出現StackOverFlow的情況，而快慢指標似乎通過了某種時間為代價的方式，規避了這種情況。

希望有讀者能夠解惑這些現象。

排序演算法雜談（五） —— 關於快速排序的優化策略分析

1. 前提 2. 優化策略1：主元（Pivot）的選取歸併排序（Merge Sort）有一個很大的優勢，就是每一次的遞迴都能夠將陣列平均二分，從而大大減少了總遞迴的次數。而快速排序（Quick Sort）在這一點上就做的很不好。快速排序是通過選擇一個主元，將整個陣列劃分（Partition）成

八大排序演算法之（五）氣泡排序

氣泡排序演算法原理：比較相鄰的元素。如果第一個比第二個大，就交換他們兩個。對每一對相鄰元素作同樣的工作，從開始第一對到結尾的最後一對。在這一點，最後的元素應該會是最大的數。針對所有的元素重複以上的步驟，除了最後一個。持續每次對越來越少的元素重複上面的步驟，直到沒有任何一對數

八大排序演算法（五）——快速排序

快速排序可能是應用最廣泛的排序演算法。快速排序流行的原因是因為它實現簡單、適用於各種不同的輸入資料且在一般應用中比其他排序演算法都要快的多。快速排序的特點包括它是原地排序（只需要一個很小的輔助棧），且將長度為n的陣列排序所需的時間和nlogn成正比。快速排序的內迴圈比大多數排序演算法都要短小，這

排序演算法（五）快速排序多種版本

快速排序，就像它的名稱一樣，是時間複雜度比較低的一種排序演算法。我們知道，快速排序是通過分治的方法，將一個大的區間劃分成小區間（找一個樞紐，將大的數放置在樞紐的右邊，小的數放置在樞紐左

【算法】排序（五）快速排序

情況 java while random chang 歸並快速排序並排 pub 正文之前快速排序（英語：Quicksort），又稱劃分交換排序（partition-exchange sort），一種排序算法，最早由東尼 * 霍爾提出。在平均狀況下，排序n個項目要O(

八大排序算法總結：（五）快速排序

con 遞歸調用結果 width 算法總結調用小數排序算法總結 png 目的：掌握快速排序的基本思想與過程、代碼實現、時間復雜度 1、基本思想與過程：（分治思想，挖坑填數）　　（1）從數列中選擇一個數作為key值；　　（2）將比這個數小的數全部放在它的左邊

演算法介紹（2）快速排序演算法

本篇介紹快速排序演算法，以及相應的時間空間複雜度求解。 &nb

常用排序算法（五）基數排序、桶排序以及計數排序

同時通過特性 true 線性大數收集只有一個 input 這是三種線性時間復雜度的排序算法，它們是用運算而不是比較來確定排序順序的一、基數排序 1.簡介它一種與其他排序算法完全不同的排序方法，其他的排序算法都是通過關鍵字之間的比較和移動來完成的，而它是采用一種

排序演算法之（二）選擇排序

原理：每一次從待排序的資料元素中選出最小（或最大）的一個元素，存放在序列的起始位置，然後，再從剩餘未排序元素中繼續尋找最小（大）元素，然後放到已排序序列的末尾。以此類推，直到全部待排序的資料元素排完。選擇排序是不穩定的排序方法。思路： n個數進行n-1次排序每一次排

排序演算法之（一）氣泡排序

原理：比較相鄰的元素。如果第一個比第二個大，就交換他們兩個。對每一對相鄰元素做同樣的工作，從開始第一對到結尾的最後一對。在這一點，最後的元素應該會是最大的數。針對所有的元素重複以上的步驟，除了最後一個。持續每次對越來越少的元素重複上面的步驟，直到沒有任何

常用排序演算法總結（1）-- 比較排序

我們通常所說的排序演算法往往指的是內部排序演算法，即資料記錄在記憶體中進行排序。排序演算法大體可分為兩種：一種是比較排序，時間複雜度O(nlogn) ~ O(n^2)，主要有：氣泡排序，選擇排序，插入排序，歸併排序，堆排序，快速排序等。另一種是非比較排序，時間複雜度可以達到O(n)，

排序演算法總結（一）——選擇排序

選擇排序的基本宗旨就是每次選出剩餘元素中最大的或者最小放在最終排序的對應位置。 1.直接選擇排序基本思想：在a[1]-a[n-1]中選擇最小的元素和a[0]交換；在a[2]-a[n-1]中選擇最小的元素和a[1]交換； …… 在a[i]-a[n

(排序演算法)linux c語言實現快速排序（氣泡排序的改進版）

快速排序演算法是對氣泡排序演算法的一種改進，氣泡排序是對單個元素的升降，快速排序是對所有元素的升降，不過這個升降是取了某一個標準的前提下，在本文程式碼中，就以a[i]，其實就是以最左邊的元素為參考，比較交換之後，將這個參考元素放到分界的地方，即i的位置。程式碼如下，裡面有比較詳細的

排序演算法（5）--快速排序QuickSort

快速排序時間複雜度：平均O(nlogn) 最差的情況就是每一次取到的元素就是陣列中最小/最大的，這種情況其實就是氣泡排序了(每一次都排好一個元素的順序) 這種情況時間複雜度，就是氣泡排序的時間複雜度：T[n] = n * (n-1) = n^2 + n; 綜

java 實現常見排序演算法（三）快速排序

大家好，我是烤鴨：今天分享一下基礎排序演算法之快速排序。快速排序是內部排序（基於比較排序）中最好的比較演算法。 1. 快速排序：

分治法在排序演算法中的應用（JAVA）--快速排序（Lomuto劃分、Hoare劃分、隨機化快排）

分治法在排序演算法中的應用快速排序：時間複雜度O(nlogn) 如果說歸併排序是按照元素在陣列中的位置劃分的話，那麼快速排序就是按照元素的值進行劃分。劃分方法由兩種，本節將主要介紹Huare劃分，在減治法在查詢演算法中的應用（JAVA）--快速查詢這篇文章中講述了Lomu

七大排序演算法（5）------快速排序（遞迴和非遞迴）

在本文中使用到的升序，降序，交換函式的程式碼見：這篇部落格快速排序（遞迴實現）快速排序的基本思想是在待排序序列中找到一個基準值（一般取待排序序列的最後一個元素），然後將該基準值放置在一個合適的位置，使得在基準值之前的元素都小於等於基準值，基準值之後的

排序演算法（三）——快速排序

快速排序（英語：Quicksort），簡稱快排，一種排序演算法。在平均狀況下，排序個專案要次比較。在最壞狀況下則需要次比較。運作方式如下： 1.從陣列中挑出一個元素，作為基準，一般是第一個元素。 2.重新排序數列，所有比基準值小的元素擺放在基準前面，所有比基準值大的元素擺在基準後面（相

對資料結構和演算法的總結和思考（五）--堆排序

本篇分享的內容為堆排序，提到堆排序就不得不提一下堆這個資料結構。堆實際上是一棵完全二叉樹，因此其任何一非葉節點滿足性質： Key[i]<=key[2i+1]&&Key[i]<=key[2i+2]或者Key[i]>=Key

使用插入排序演算法對列表進行排序——Leetcode系列（五）

Sort a linked list using insertion sort. My Answer: <span style="font-size:14px;">/** * Defin

排序演算法雜談（五） —— 關於快速排序的優化策略分析

相關推薦