MySQL中無過濾條件的count詳解

阿新 • • 發佈：2020-01-09

count(*)

實現

1、MyISAM：將表的總行數存放在磁碟上，針對無過濾條件的查詢可以直接返回

如果有過濾條件的count(*)，MyISAM也不能很快返回

2、InnoDB：從儲存引擎一行行地讀出資料，然後累加計數

由於MVCC，在同一時刻，InnoDB應該返回多少行是不確定

樣例

假設表t有10000條記錄

session A session B session C

BEGIN;

SELECT COUNT(*) FROM t;（返回10000）

INSERT INTO t;（插入一行）

BEGIN;

INSERT INTO t（插入一行）;

SELECT COUNT(*) FROM t;（返回10000） SELECT COUNT(*) FROM t;（返回10002） SELECT COUNT(*) FROM T;（返回10001）

最後時刻三個會話同時查詢t的總行數，拿到的結果卻是不同的

InnoDB預設事務隔離級別是RR，通過MVCC實現

每個事務都需要判斷每一行記錄是否對自己可見

優化

1、InnoDB是索引組織表

聚簇索引樹：葉子節點是資料
二級索引樹：葉子節點是主鍵值

2、二級索引樹佔用的空間比聚簇索引樹小很多

3、優化器會在保證邏輯正確的前提下，遍歷最小的索引樹，儘量減少掃描的資料量

針對無過濾條件的count操作，無論遍歷哪一顆索引樹，效果都是一樣的
優化器會為count(*)選擇最優的索引樹

show table status

mysql> SHOW TABLE STATUS\G;
*************************** 1. row ***************************
 Name: t
 Engine: InnoDB
 Version: 10
 Row_format: Dynamic
 Rows: 100256
 Avg_row_length: 47
 Data_length: 4734976
Max_data_length: 0
 Index_length: 5275648
 Data_free: 0
 Auto_increment: NULL
 Create_time: 2019-02-01 17:49:07
 Update_time: NULL
 Check_time: NULL
 Collation: utf8_general_ci
 Checksum: NULL
 Create_options:
 Comment:

SHOW TABLE STATUS同樣通過取樣來估算（非常不精確），誤差能到40%~50%

維護計數

快取

方案

用Redis來儲存表的總行數（無過濾條件）
這個表每插入一行，Redis計數+1，每刪除一行，Redis計數-1

缺點

丟失更新

1、Redis可能會丟失更新

2、解決方案：Redis異常重啟後，到資料庫執行一次count(*)

異常重啟並不常見，這時全表掃描的成本是可以接受的

邏輯不精確 – 致命

1、場景：顯示操作記錄的總數和最近操作的100條記錄

2、Redis和MySQL是兩個不同的儲存系統，不支援分散式事務，因此無法拿到精確的一致性檢視

時序A

session B在T3時刻，查到的100行結果裡面有最新插入的記錄，但Redis還沒有+1，邏輯不一致

時刻 session A session B

T1

T2 插入一行資料R;

T3 讀取Redis計數;
查詢最近100條記錄;

T4 Redis計數+1;

時刻	session A	session B
T1
T2	插入一行資料R;
T3		讀取Redis計數; 查詢最近100條記錄;
T4	Redis計數+1;

時序B

session B在T3時刻，查到的100行結果裡面沒有最新插入的記錄，但Redis已經+1，邏輯不一致

時刻 session A session B

T1

T2 Redis計數+1;

T3 讀取Redis計數;
查詢最近100條記錄;

T4 插入一行資料R;

時刻	session A	session B
T1
T2	Redis計數+1;
T3		讀取Redis計數; 查詢最近100條記錄;
T4	插入一行資料R;

資料庫

把計數值放到資料庫單獨的一張計數表C中
利用InnoDB的crash-safe的特性，解決了崩潰丟失的問題
利用InnoDB的支援事務的特性，解決了一致性檢視的問題
session B在T3時刻，session A的事務還未提交，表C的計數值+1對自己不可見，邏輯一致

時刻 session A session B

T1

T2 BEGIN;
表C中的計數值+1;

T3 BEGIN;
讀表C計數值;
查詢最新100條記錄;
COMMIT;

T4 插入一行資料R;
COMMIT;

時刻	session A	session B
T1
T2	BEGIN; 表C中的計數值+1;
T3		BEGIN; 讀表C計數值; 查詢最新100條記錄; COMMIT;
T4	插入一行資料R; COMMIT;

count的效能

語義

1、count()是一個聚合函式，對於返回的結果集，一行一行地進行判斷

如果count函式的引數值不是NULL，累計值+1，否則不加，最後返回累計值

2、count(欄位F)

欄位F有可能為NULL
表示返回滿足條件的結果集裡欄位F不為NULL的總數

3、count(主鍵ID)、count(1)、count(*)

不可能為NULL
表示返回滿足條件的結果集的總數

4、Server層要什麼欄位，InnoDB引擎就返回什麼欄位

count(*)例外，不返回整行，只返回空行

效能對比

count(欄位F)

1、如果欄位F定義為不允許為NULL，一行行地從記錄裡讀出這個欄位，判斷通過後按行累加

通過表結構判斷該欄位是不可能為NULL

2、如果欄位F定義為允許NULL，一行行地從記錄裡讀出這個欄位，判斷通過後按行累加

通過表結構判斷該欄位是有可能為NULL
判斷該欄位值是否實際為NULL

3、如果欄位F上沒有二級索引，只能遍歷整張表（聚簇索引）

4、由於InnoDB必須返回欄位F，因此優化器能做出的優化決策將減少

例如不能選擇最優的索引來遍歷

count(主鍵ID)

InnoDB會遍歷整張表（聚簇索引），把每一行的id值取出來，返回給Server層
Server層拿到id後，判斷為不可能為NULL，然後按行累加
優化器可能會選擇最優的索引來遍歷

count(1)

InnoDB引擎會遍歷整張表（聚簇索引），但不取值
Server層對於返回的每一行，放一個數字1進去，判斷是不可能為NULL，按行累加
count(1)比count(主鍵ID)快，因為count(主鍵ID)會涉及到兩部分操作

解析資料行
拷貝欄位值

count(*)

count(*)不會把所有值都取出來，而是專門做了優化，不取值，因為『*』肯定不為NULL，按行累加
不取值：InnoDB返回一個空行，告訴Server層不是NULL，可以計數

效率排序

count(欄位F) < count(主鍵ID) < count(1) ≈ count(*)
儘量使用count(*)

樣例

mysql> SHOW CREATE TABLE prop_action_batch_reward\G;
*************************** 1. row ***************************
 Table: prop_action_batch_reward
Create Table: CREATE TABLE `prop_action_batch_reward` (
 `id` bigint(20) NOT NULL,`source` int(11) DEFAULT NULL,`serial_id` bigint(20) NOT NULL,`create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,`user_ids` mediumtext,`serial_index` tinyint(4) DEFAULT '0',PRIMARY KEY (`id`),UNIQUE KEY `uniq_serial_id_source_index` (`serial_id`,`source`,`serial_index`),KEY `idx_create_time` (`create_time`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

count(欄位F)

無索引

user_ids上無索引，而InnoDB又必須返回user_ids欄位，只能遍歷聚簇索引

mysql> EXPLAIN SELECT COUNT(user_ids) FROM prop_action_batch_reward;
+----+-------------+--------------------------+------+---------------+------+---------+------+----------+-------+
| id | select_type | table   | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+--------------------------+------+---------------+------+---------+------+----------+-------+
| 1 | SIMPLE | prop_action_batch_reward | ALL | NULL  | NULL | NULL | NULL | 16435876 | NULL |
+----+-------------+--------------------------+------+---------------+------+---------+------+----------+-------+

mysql> SELECT COUNT(user_ids) FROM prop_action_batch_reward;
+-----------------+
| count(user_ids) |
+-----------------+
| 17689788 |
+-----------------+
1 row in set (10.93 sec)

有索引

1、serial_id上有索引，可以遍歷uniq_serial_id_source_index

2、但由於InnoDB必須返回serial_id欄位，因此不會遍歷邏輯結果等價的更優選擇idx_create_time

如果選擇idx_create_time，並且返回serial_id欄位，這意味著必須回表

mysql> EXPLAIN SELECT COUNT(serial_id) FROM prop_action_batch_reward;
+----+-------------+--------------------------+-------+---------------+-----------------------------+---------+------+----------+-------------+
| id | select_type | table   | type | possible_keys | key    | key_len | ref | rows | Extra |
+----+-------------+--------------------------+-------+---------------+-----------------------------+---------+------+----------+-------------+
| 1 | SIMPLE | prop_action_batch_reward | index | NULL  | uniq_serial_id_source_index | 15 | NULL | 16434890 | Using index |
+----+-------------+--------------------------+-------+---------------+-----------------------------+---------+------+----------+-------------+

mysql> SELECT COUNT(serial_id) FROM prop_action_batch_reward;
+------------------+
| count(serial_id) |
+------------------+
|  17705069 |
+------------------+
1 row in set (5.04 sec)

count(主鍵ID)

優化器選擇了最優的索引idx_create_time來遍歷，而非聚簇索引

mysql> EXPLAIN SELECT COUNT(id) FROM prop_action_batch_reward;
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+
| id | select_type | table   | type | possible_keys | key  | key_len | ref | rows | Extra |
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+
| 1 | SIMPLE | prop_action_batch_reward | index | NULL  | idx_create_time | 5 | NULL | 16436797 | Using index |
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+

mysql> SELECT COUNT(id) FROM prop_action_batch_reward;
+-----------+
| count(id) |
+-----------+
| 17705383 |
+-----------+
1 row in set (4.54 sec)

count(1)

mysql> EXPLAIN SELECT COUNT(1) FROM prop_action_batch_reward;
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+
| id | select_type | table   | type | possible_keys | key  | key_len | ref | rows | Extra |
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+
| 1 | SIMPLE | prop_action_batch_reward | index | NULL  | idx_create_time | 5 | NULL | 16437220 | Using index |
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+

mysql> SELECT COUNT(1) FROM prop_action_batch_reward;
+----------+
| count(1) |
+----------+
| 17705808 |
+----------+
1 row in set (4.12 sec)

count(*)

mysql> EXPLAIN SELECT COUNT(*) FROM prop_action_batch_reward;
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+
| id | select_type | table   | type | possible_keys | key  | key_len | ref | rows | Extra |
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+
| 1 | SIMPLE | prop_action_batch_reward | index | NULL  | idx_create_time | 5 | NULL | 16437518 | Using index |
+----+-------------+--------------------------+-------+---------------+-----------------+---------+------+----------+-------------+

mysql> SELECT COUNT(*) FROM prop_action_batch_reward;
+----------+
| count(*) |
+----------+
| 17706074 |
+----------+
1 row in set (4.06 sec)

參考資料

《MySQL實戰45講》

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作具有一定的參考學習價值，如果有疑問大家可以留言交流，謝謝大家對我們的支援。

MySQL中無過濾條件的count詳解

count(*) 實現 1、MyISAM：將表的總行數存放在磁碟上，針對無過濾條件的查詢可以直接返回

mysql中的sql_mode模式例項詳解

本文例項講述了mysql中的sql_mode模式。分享給大家供大家參考，具體如下： mysql資料庫的中有一個環境變數sql_mode,定義了mysql應該支援的sql語法，資料校驗等！我們可以通過以下方式檢視當前資料庫使用的sql_mode：

MySQL中的長事務示例詳解

前言：『入門MySQL』系列文章已經完結，今後我的文章還是會以MySQL為主，主要記錄下近期工作及學習遇到的場景或者自己的感悟想法，可能後續的文章不是那麼連貫，但還是希望大家多多支援。言歸正傳，本篇文章主要介紹

mysql中rpm方式安裝的詳解

檢視安裝以及解除安裝 # 檢視 rpm -qa | grep mysql # 解除安裝 yum -y remove mysql-libs-5.1.66-2.el6_3.x86_64

mysql中find_in_set()函式的使用詳解

首先舉個例子來說：有個文章表裡面有個type欄位，它儲存的是文章型別，有 1頭條、2推薦、3熱點、4圖文等等。

Python列表推導式/解析式/生成式的過濾條件形式詳解與應用

技術標籤：Python list()列表【Python學習專區】你不可錯過精彩內容列表python資料庫小程式

MySQL中ESCAPE關鍵字的用法詳解

MySQL轉義轉義即表示轉義字元原來的語義，一個轉義字元的目的是開始一個字元序列，使得轉義字元開頭的該字元序列具有不同於該字元序列單獨出現時的語義。

MySQL單表查詢操作例項詳解【語法、約束、分組、聚合、過濾、排序等】

本文例項講述了MySQL單表查詢操作。分享給大家供大家參考，具體如下：語法

Ubuntu中安裝MySQL更改預設密碼的步驟詳解

第一步：進入目錄：cd /etc/mysql,檢視debian.cnf檔案第二步：使用上圖中的賬號密碼登入MySQL。

MySQL主從同步中的server-id示例詳解

前言當我們搭建MySQL叢集時，自然需要完成資料庫的主從同步來保證資料一致性。而主從同步的方式也分很多種，一主多從、鏈式主從、多主多從，根據你的需要來進行設定。但只要你需要主從同步，就一定要注意server-id的

MySQL資料型別中DECIMAL的用法例項詳解

MySQL資料型別中DECIMAL的用法例項詳解在MySQL資料型別中，例如INT,FLOAT,DOUBLE,CHAR,DECIMAL等，它們都有各自的作用，下面我們就主要來介紹一下MySQL資料型別中的DECIMAL型別的作用和用法。

springboot中使用過濾器,jsoup過濾XSS指令碼詳解

目錄springboot使用過濾器,oup過濾XSS1.把可能包含指令碼的引數位置分析一下2.分析實現過程3.程式碼實現過程使用jsoup防止XSS攻擊springboot使用過濾器,jsoup過濾XSS指令碼

類載入器中的雙親委派模型詳解

本文首發於個人網站，如需轉載請註明來源：類載入器中的雙親委派模型，看這篇就夠了

C# Winfom 中ListBox的簡單用法詳解

1、如何新增listBox的值 this.listBox1.Items.Add(\"張曉東\"); 2、如何判斷listBox集合是否新增過

Android中layer-list基本使用詳解

使用layer-list可以將多個drawable按照順序層疊在一起顯示，預設情況下，所有的item中的drawable都會自動根據它附上view的大小而進行縮放，

Spring5中的WebClient使用方法詳解

前言 Spring5帶來了新的響應式web開發框架WebFlux，同時，也引入了新的HttpClient框架WebClient。WebClient是Spring5中引入的執行 HTTP 請求的非阻塞、反應式客戶端。它對同步和非同步以及流方案都有很好的支援，We

JDBC連線MySQL資料庫批量插入資料過程詳解

這篇文章主要介紹了JDBC連線MySQL資料庫批量插入資料過程詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

SQL中 patindex函式的用法詳解

返回pattern字串在表示式expression裡第一次出現的位置，起始值從1開始算。 pattern字串在expression表示式裡沒找就返回0，對所有有效的文字和字串就是有效的資料型別。

mysql檢視之管理檢視例項詳解【增刪改查操作】

本文例項講述了mysql檢視之管理檢視操作。分享給大家供大家參考，具體如下：

python+Django+pycharm+mysql 搭建首個web專案詳解

本文例項講述了python+Django+pycharm+mysql 搭建首個web專案。分享給大家供大家參考，具體如下：

session A	session B	session C
BEGIN;
SELECT COUNT(*) FROM t;（返回10000）
		INSERT INTO t;（插入一行）
	BEGIN;
	INSERT INTO t（插入一行）;
SELECT COUNT(*) FROM t;（返回10000）	SELECT COUNT(*) FROM t;（返回10002）	SELECT COUNT(*) FROM T;（返回10001）

MySQL中無過濾條件的count詳解

相關推薦