【轉】MySQL— 索引 Mysql幾種索引型別的區別及適用情況

阿新 • • 發佈：2018-12-05

上面都在說使用索引的好處，但過多的使用索引將會造成濫用。因此索引也會有它的缺點：雖然索引大大提高了查詢速度，同時卻會降低更新表的速度，如對錶進行INSERT、UPDATE和DELETE。因為更新表時，MySQL不僅要儲存資料，還要儲存一下索引檔案。

建立索引會佔用磁碟空間的索引檔案。

二、索引型別

Mysql目前主要有以下幾種索引型別：FULLTEXT，HASH，BTREE，RTREE。

1. FULLTEXT

即為全文索引，目前只有MyISAM引擎支援。其可以在CREATE TABLE ，ALTER TABLE ，CREATE INDEX 使用，不過目前只有 CHAR、VARCHAR ，TEXT 列上可以建立全文索引。

全文索引並不是和MyISAM一起誕生的，它的出現是為了解決WHERE name LIKE “%word%"這類針對文字的模糊查詢效率較低的問題。

2. HASH

由於HASH的唯一（幾乎100%的唯一）及類似鍵值對的形式，很適合作為索引。

HASH索引可以一次定位，不需要像樹形索引那樣逐層查詢,因此具有極高的效率。但是，這種高效是有條件的，即只在“=”和“in”條件下高效，對於範圍查詢、排序及組合索引仍然效率不高。

3. BTREE

BTREE索引就是一種將索引值按一定的演算法，存入一個樹形的資料結構中（二叉樹），每次查詢都是從樹的入口root開始，依次遍歷node，獲取leaf。這是MySQL裡預設和最常用的索引型別。

4. RTREE

RTREE在MySQL很少使用，僅支援geometry資料型別，支援該型別的儲存引擎只有MyISAM、BDb、InnoDb、NDb、Archive幾種。

相對於BTREE，RTREE的優勢在於範圍查詢。

ps. 此段詳細內容見此片博文：Mysql幾種索引型別的區別及適用情況

三、索引種類

普通索引：僅加速查詢
唯一索引：加速查詢 + 列值唯一（可以有null）
主鍵索引：加速查詢 + 列值唯一（不可以有null）+ 表中只有一個
組合索引：多列值組成一個索引，專門用於組合搜尋，其效率大於索引合併
全文索引：對文字的內容進行分詞，進行搜尋

ps.

索引合併，使用多個單列索引組合搜尋
覆蓋索引，select的資料列只用從索引中就能夠取得，不必讀取資料行，換句話說查詢列要被所建的索引覆蓋

四、操作索引

1. 建立索引

--建立普通索引
CREATE INDEX index_name ON table_name(col_name);

--建立唯一索引
CREATE UNIQUE INDEX index_name ON table_name(col_name);

--建立普通組合索引
CREATE INDEX index_name ON table_name(col_name_1,col_name_2);

--建立唯一組合索引
CREATE UNIQUE INDEX index_name ON table_name(col_name_1,col_name_2);

2. 通過修改表結構建立索引

ALTER TABLE table_name ADD INDEX index_name(col_name);

3. 建立表時直接指定索引

CREATE TABLE table_name (
    ID INT NOT NULL,
    col_name VARCHAR (16) NOT NULL,
    INDEX index_name (col_name)
);

4. 刪除索引

--直接刪除索引
DROP INDEX index_name ON table_name;

--修改表結構刪除索引
ALTER TABLE table_name DROP INDEX index_name;

5. 其它相關命令

- 查看錶結構
    desc table_name;
 
- 檢視生成表的SQL
    show create table table_name;
 
- 檢視索引
    show index from  table_name;
 
- 檢視執行時間
    set profiling = 1;
    SQL...
    show profiles;

五、建立索引的時機

到這裡我們已經學會了建立索引，那麼我們需要在什麼情況下建立索引呢？一般來說，在WHERE和JOIN中出現的列需要建立索引，但也不完全如此，因為MySQL只對<，<=，=，>，>=，BETWEEN，IN，以及某些時候的LIKE才會使用索引。例如：

SELECT t.Name  FROM mytable_t LEFT JOIN mytable_m ON t.Name=m.username WHERE m.age=20 AND m.city='鄭州' ;

此時就需要對city和age建立索引，由於mytable_m表的userame也出現在了JOIN子句中，也有對它建立索引的必要。

剛才提到只有某些時候的LIKE才需建立索引。因為在以萬用字元%和_開頭作查詢時，MySQL不會使用索引。

六、命中索引

資料庫表中新增索引後確實會讓查詢速度起飛，但前提必須是正確的使用索引來查詢，如果以錯誤的方式使用，則即使建立索引也會不奏效。
即使建立索引，索引也不會生效：

- like '%xx'
    select * from tb1 where name like '%cn';
- 使用函式
    select * from tb1 where reverse(name) = 'wupeiqi';
- or
    select * from tb1 where nid = 1 or email = '[email protected]';
    特別的：當or條件中有未建立索引的列才失效，以下會走索引
            select * from tb1 where nid = 1 or name = 'seven';
            select * from tb1 where nid = 1 or email = '[email protected]' and name = 'alex'
- 型別不一致
    如果列是字串型別，傳入條件是必須用引號引起來，不然...
    select * from tb1 where name = 999;
- !=
    select * from tb1 where name != 'alex'
    特別的：如果是主鍵，則還是會走索引
        select * from tb1 where nid != 123
- >
    select * from tb1 where name > 'alex'
    特別的：如果是主鍵或索引是整數型別，則還是會走索引
        select * from tb1 where nid > 123
        select * from tb1 where num > 123
- order by
    select email from tb1 order by name desc;
    當根據索引排序時候，選擇的對映如果不是索引，則不走索引
    特別的：如果對主鍵排序，則還是走索引：
        select * from tb1 order by nid desc;
 
- 組合索引最左字首
    如果組合索引為：(name,email)
    name and email       -- 使用索引
    name                 -- 使用索引
    email                -- 不使用索引

七、其它注意事項

- 避免使用select *
- count(1)或count(列) 代替 count(*)
- 建立表時儘量時 char 代替 varchar
- 表的欄位順序固定長度的欄位優先
- 組合索引代替多個單列索引（經常使用多個條件查詢時）
- 儘量使用短索引
- 使用連線（JOIN）來代替子查詢(Sub-Queries)
- 連表時注意條件型別需一致
- 索引雜湊值（重複多）不適合建索引，例：性別不適合

八、LIMIT分頁

若需求是每頁顯示10條資料，如何建立分頁？

我們可以先使用LIMIT嘗試：

--第一頁
SELECT * FROM table_name LIMIT 0,10;

--第二頁
SELECT * FROM table_name LIMIT 10,10;

--第三頁
SELECT * FROM table_name LIMIT 20,10;

但是這樣做有如下弊端：

每一條select語句都會從1遍歷至當前位置，若跳轉到第100頁，則會遍歷1000條記錄
若記錄的id不連續，則會出錯

改善：

若已知每頁的max_id和min_id，則可以通過主鍵索引來快速定位:

--下一頁
SELECT * FROM table_name WHERE id in (SELECT id FROM table_name WHERE id > max_id LIMIT 10);

--上一頁
SELECT * FROM table_name WHERE id in (SELECT id FROM table_name WHERE id < min_id ORDER BY id DESC LIMIT 10);

--當前頁之後的某一頁
SELECT * FROM table_name WHERE id in (SELECT id FROM (SELECT id FROM (SELECT id FROM table_name WHERE id < min_id ORDER BY id desc LIMIT (頁數差*10)) AS N ORDER BY N.id ASC LIMIT 10) AS P ORDER BY P.id ASC);

--當前頁之前的某一頁
SELECT * FROM table_name WHERE id in (SELECT id FROM (SELECT id FROM (SELECT id FROM table_name WHERE id > max_id LIMIT (頁數差*10)) AS N ORDER BY N.id DESC LIMIT 10) AS P) ORDER BY id ASC;

九、執行計劃

explain + 查詢SQL - 用於顯示SQL執行資訊引數，根據參考資訊可以進行SQL優化

mysql> explain select * from tb2;
+----+-------------+-------+------+---------------+------+---------+------+------+-------+
| id | select_type | table | type | possible_keys | key  | key_len | ref  | rows | Extra |
+----+-------------+-------+------+---------------+------+---------+------+------+-------+
|  1 | SIMPLE      | tb2   | ALL  | NULL          | NULL | NULL    | NULL |    2 | NULL  |
+----+-------------+-------+------+---------------+------+---------+------+------+-------+
1 row in set (0.00 sec)

id查詢順序標識
            如：mysql> explain select * from (select nid,name from tb1 where nid < 10) as B;
            +----+-------------+------------+-------+---------------+---------+---------+------+------+-------------+
            | id | select_type | table      | type  | possible_keys | key     | key_len | ref  | rows | Extra       |
            +----+-------------+------------+-------+---------------+---------+---------+------+------+-------------+
            |  1 | PRIMARY     | <derived2> | ALL   | NULL          | NULL    | NULL    | NULL |    9 | NULL        |
            |  2 | DERIVED     | tb1        | range | PRIMARY       | PRIMARY | 8       | NULL |    9 | Using where |
            +----+-------------+------------+-------+---------------+---------+---------+------+------+-------------+
        特別的：如果使用union連線其值可能為null


    select_type
        查詢型別
            SIMPLE          簡單查詢
            PRIMARY         最外層查詢
            SUBQUERY        對映為子查詢
            DERIVED         子查詢
            UNION           聯合
            UNION RESULT    使用聯合的結果
            ...
    table
        正在訪問的表名


    type
        查詢時的訪問方式，效能：all < index < range < index_merge < ref_or_null < ref < eq_ref < system/const
            ALL             全表掃描，對於資料表從頭到尾找一遍
                            select * from tb1;
                            特別的：如果有limit限制，則找到之後就不再繼續向下掃描
                                   select * from tb1 where email = '[email protected]'
                                   select * from tb1 where email = '[email protected]' limit 1;
                                   雖然上述兩個語句都會進行全表掃描，第二句使用了limit，則找到一個後就不再繼續掃描。

            INDEX           全索引掃描，對索引從頭到尾找一遍
                            select nid from tb1;

            RANGE          對索引列進行範圍查詢
                            select *  from tb1 where name < 'alex';
                            PS:
                                between and
                                in
                                >   >=  <   <=  操作
                                注意：!= 和 > 符號


            INDEX_MERGE     合併索引，使用多個單列索引搜尋
                            select *  from tb1 where name = 'alex' or nid in (11,22,33);

            REF             根據索引查詢一個或多個值
                            select *  from tb1 where name = 'seven';

            EQ_REF          連線時使用primary key 或 unique型別
                            select tb2.nid,tb1.name from tb2 left join tb1 on tb2.nid = tb1.nid;



            CONST           常量
                            表最多有一個匹配行,因為僅有一行,在這行的列值可被優化器剩餘部分認為是常數,const表很快,因為它們只讀取一次。
                            select nid from tb1 where nid = 2 ;

            SYSTEM          系統
                            表僅有一行(=系統表)。這是const聯接型別的一個特例。
                            select * from (select nid from tb1 where nid = 1) as A;
    possible_keys
        可能使用的索引

    key
        真實使用的

    key_len
        MySQL中使用索引位元組長度

    rows
        mysql估計為了找到所需的行而要讀取的行數 ------ 只是預估值

    extra
        該列包含MySQL解決查詢的詳細資訊
        “Using index”
            此值表示mysql將使用覆蓋索引，以避免訪問表。不要把覆蓋索引和index訪問型別弄混了。
        “Using where”
            這意味著mysql伺服器將在儲存引擎檢索行後再進行過濾，許多where條件裡涉及索引中的列，當（並且如果）它讀取索引時，就能被儲存引擎檢驗，因此不是所有帶where子句的查詢都會顯示“Using where”。有時“Using where”的出現就是一個暗示：查詢可受益於不同的索引。
        “Using temporary”
            這意味著mysql在對查詢結果排序時會使用一個臨時表。
        “Using filesort”
            這意味著mysql會對結果使用一個外部索引排序，而不是按索引次序從表裡讀取行。mysql有兩種檔案排序演算法，這兩種排序方式都可以在記憶體或者磁碟上完成，explain不會告訴你mysql將使用哪一種檔案排序，也不會告訴你排序會在記憶體裡還是磁碟上完成。
        “Range checked for each record(index map: N)”
            這個意味著沒有好用的索引，新的索引將在聯接的每一行上重新估算，N是顯示在possible_keys列中索引的點陣圖，並且是冗餘的。

上表詳解

十、慢查詢日誌

MySQL的慢查詢日誌是MySQL提供的一種日誌記錄，它用來記錄在MySQL中響應時間超過閥值的語句，具體指執行時間超過long_query_time值的SQL，則會被記錄到慢查詢日誌中。long_query_time的預設值為10，意思是執行10S以上的語句。預設情況下，MySQLl資料庫並不啟動慢查詢日誌，需要我們手動來設定這個引數，當然，如果不是調優需要的話，一般不建議啟動該引數，因為開啟慢查詢日誌會或多或少帶來一定的效能影響。慢查詢日誌支援將日誌記錄寫入檔案，也支援將日誌記錄寫入資料庫表。

1. 檢視慢日誌引數：

--查詢配置命令
show variables like '%query%';

--當前配置引數
binlog_rows_query_log_events    OFF
ft_query_expansion_limit    20
have_query_cache    YES

--時間限制，超過此時間，則記錄
long_query_time    10.000000

query_alloc_block_size    8192
query_cache_limit    1048576
query_cache_min_res_unit    4096
query_cache_size    1048576
query_cache_type    OFF
query_cache_wlock_invalidate    OFF
query_prealloc_size    8192

--是否開啟慢日誌記錄
slow_query_log    OFF

--日誌檔案
slow_query_log_file    D:\Program Files (x86)\mysql-5.7.18-winx64\data\Jack-slow.log
--

2. 修改當前配置

set global 變數名 = 值;

--例如，修改時間限制為20s
long_query_time = 20;

ps.也可以直接開啟慢日誌配置檔案進行修改，但必須重啟服務才能生效

3. 檢視MySQL慢日誌

mysqldumpslow -s at -a  /usr/local/var/mysql/MacBook-Pro-3-slow.log

"""
--verbose    版本
--debug      除錯
--help       幫助
 
-v           版本
-d           除錯模式
-s ORDER     排序方式
             what to sort by (al, at, ar, c, l, r, t), 'at' is default
              al: average lock time
              ar: average rows sent
              at: average query time
               c: count
               l: lock time
               r: rows sent
               t: query time
-r           反轉順序，預設檔案倒序拍。reverse the sort order (largest last instead of first)
-t NUM       顯示前N條just show the top n queries
-a           不要將SQL中數字轉換成N，字串轉換成S。don't abstract all numbers to N and strings to 'S'
-n NUM       abstract numbers with at least n digits within names
-g PATTERN   正則匹配；grep: only consider stmts that include this string
-h HOSTNAME  mysql機器名或者IP；hostname of db server for *-slow.log filename (can be wildcard),
             default is '*', i.e. match all
-i NAME      name of server instance (if using mysql.server startup script)
-l           總時間中不減去鎖定時間；don't subtract lock time from total time
"""

參考資料：

1. http://www.cnblogs.com/wupeiqi/articles/5716963.html

2. http://www.w3cschool.cn/mysql/mysql-index.html

3. http://www.cnblogs.com/yuan-shuai/p/3225417.html

4. http://www.jb51.net/article/49346.htm