為什麼說MySQL單表資料不要超過500萬行

阿新 • • 發佈：2020-01-09

今天，探討一個有趣的話題：MySQL 單表資料達到多少時才需要考慮分庫分表？有人說 2000 萬行，也有人說 500 萬行。那麼，你覺得這個數值多少才合適呢？

曾經在中國網際網路技術圈廣為流傳著這麼一個說法：MySQL 單表資料量大於 2000 萬行，效能會明顯下降。事實上，這個傳聞據說最早起源於百度。具體情況大概是這樣的，當年的 DBA 測試 MySQL效能時發現，當單表的量在 2000 萬行量級的時候，SQL 操作的效能急劇下降，因此，結論由此而來。然後又據說百度的工程師流動到業界的其它公司，也帶去了這個資訊，所以，就在業界流傳開這麼一個說法。

再後來，阿里巴巴《Java 開發手冊》提出單錶行數超過 500 萬行或者單表容量超過 2GB，才推薦進行分庫分表。對此，有阿里的黃金鐵律支撐，所以，很多人設計大資料儲存時，多會以此為標準，進行分表操作。

那麼，你覺得這個數值多少才合適呢？為什麼不是 300 萬行，或者是 800 萬行，而是 500 萬行？也許你會說這個可能就是阿里的最佳實戰的數值吧？那麼，問題又來了，這個數值是如何評估出來的呢？稍等片刻，請你小小思考一會兒。

事實上，這個數值和實際記錄的條數無關，而與 MySQL 的配置以及機器的硬體有關。因為，MySQL 為了提高效能，會將表的索引裝載到記憶體中。InnoDB buffer size 足夠的情況下，其能完成全載入進記憶體，查詢不會有問題。但是，當單表資料庫到達某個量級的上限時，導致記憶體無法儲存其索引，使得之後的 SQL 查詢會產生磁碟 IO，從而導致效能下降。當然，這個還有具體的表結構的設計有關，最終導致的問題都是記憶體限制。這裡，增加硬體配置，可能會帶來立竿見影的效能提升哈。

那麼，我對於分庫分表的觀點是，需要結合實際需求，不宜過度設計，在專案一開始不採用分庫與分表設計，而是隨著業務的增長，在無法繼續優化的情況下，再考慮分庫與分表提高系統的效能。對此，阿里巴巴《Java 開發手冊》補充到：如果預計三年後的資料量根本達不到這個級別，請不要在建立表時就分庫分表。那麼，回到一開始的問題，你覺得這個數值多少才合適呢？我的建議是，根據自身的機器的情況綜合評估，如果心裡沒有標準，那麼暫時以 500 萬行作為一個統一的標準，相對而言算是一個比較折中的數值。

我們再來看一下關於SQL書寫的一些注意點，會給大家帶來幫助

sql的編寫需要注意優化

使用limit對查詢結果的記錄進行限定

避免select *，將需要查詢的欄位列出來
使用連線（join）來代替子查詢
拆分大的delete或insert語句
可通過開啟慢查詢日誌來找出較慢的SQL
不做列運算：SELECT id WHERE age + 1 = 10，任何對列的操作都將導致表掃描，它包括資料庫教程函式、計算表示式等等，查詢時要儘可能將操作移至等號右邊
sql語句儘可能簡單：一條sql只能在一個cpu運算；大語句拆小語句，減少鎖時間；一條大sql可以堵死整個庫
OR改寫成IN：OR的效率是n級別，IN的效率是log(n)級別，in的個數建議控制在200以內
不用函式和觸發器，在應用程式實現
避免%xxx式查詢
少用JOIN
使用同類型進行比較，比如用'123'和'123'比，123和123比
儘量避免在WHERE子句中使用!=或<>操作符，否則將引擎放棄使用索引而進行全表掃描
對於連續數值，使用BETWEEN不用IN：SELECT id FROM t WHERE num BETWEEN 1 AND 5
列表資料不要拿全表，要使用LIMIT來分頁，每頁數量也不要太大

為什麼說MySQL單表資料不要超過500萬行

為什麼說MySQL單表資料不要超過500萬行

MySQL使用全庫備份資料恢復單表資料的方法

MySQL 之 LOAD DATA INFILE 快速匯入資料 (單表資料很大)

MySQL單表查詢操作例項詳解【語法、約束、分組、聚合、過濾、排序等】

MySQL單表查詢常見操作例項總結

MySQL刪除表資料的方法

MySQL 單表操作

SQL查詢單表資料（一）

MySQL更新表資料

MySQL單表恢復的步驟

MySQL 單表查詢

（四）MySQL單表索引優化

MySQL -單表查詢

Mysql 單表查詢-排序-分頁-group by初識

5DQL之mysql單表查詢語句select

MySQL 優化表資料型別

《足球經理2021》冬季主要更新現已上線資料調整超過370萬個

mysql 單表查詢 & 多表查詢 & 子查詢

遊戲《死亡擱淺》全平臺銷售已超過 500 萬份

mysql修改表資料，鎖表解決辦法

為什麼說MySQL單表資料不要超過500萬行

相關推薦