1. 程式人生 > 資料庫 >隱式轉換引起的sql慢查詢實戰記錄

隱式轉換引起的sql慢查詢實戰記錄

引言

實在很無語呀,遇到一個mysql隱式轉換問題,問了周邊的dba大拿該問題,他們居然反問我,你連這個也不知道?白白跟他們混了那麼長 尼瑪,我還真不知道。罪過罪過….

問題是這樣的,一個欄位叫task_id,本身是varchar字串型別,但是因為老系統時間太長了,我以為是int或者bigint,所以直接在程式碼寫sql跑資料,結果等了好久就是沒有反應,感覺要壞事呀。在mysql processlist裡看到了該sql語句,直接kill掉。 該欄位是有索引的,並且他的sql選擇性很高,索引的價值也高。 但為什麼這麼慢?

分析問題

通過explain分析出了結果,當使用整型來查詢字串的欄位會出現無法走索引的情況,看下面可以知道,key為NULL,沒走索引,Rows是很大的數值,基本是全表掃描了。 當正常的用字串查詢字串就很正常了,索引沒問題,rows的值為1,這裡說的是掃描聚簇索引的rows,而不是索引二級索引。

那麼為什麼會出現這問題?

下面是mysql官方給出的說法, 最後一條很重要,當在其他情況下,兩個引數都會統一成 float 來比較。 居然新版的mysql在優化器層面已經做了一些調整規避這問題,但我自己的測試版本是mysql 5.6,阿里雲用的也是5.7,都沒有解決該問題。 看來是更高版本解決吧,這個待驗證。

看完了官方解說,我們知道上面那一句慢查詢sql,其實就相當於 where to_int(taskid) = 516006380 。當然直接用to_int是顯示轉換了,但是對比出來的效果是一致的。 不管是隱式轉換,還是顯示轉換,速度能起來才怪。。。 因為mysql不支援函式索引。

# xiaorui.cc


If both arguments in a comparison operation are strings,they are compared as strings.
If both arguments are integers,they are compared as integers.
Hexadecimal values are treated as binary strings if not compared to a number.
If one of the arguments is a TIMESTAMP or DATETIME column and the other argument is a constant,the constant is converted to a timestamp before the comparison is performed. This is done to be more ODBC-friendly. Note that this is not done for the arguments to IN()! To be safe,always use complete datetime,date,or time strings when doing comparisons. For example,to achieve best results when using BETWEEN with date or time values,use CAST() to explicitly convert the values to the desired data type.
If one of the arguments is a decimal value,comparison depends on the other argument. The arguments are compared as decimal values if the other argument is a decimal or integer value,or as floating-point values if the other argument is a floating-point value.
In all other cases,the arguments are compared as floating-point (real) numbers.

翻譯為中文就是:

  • 兩個引數至少有一個是 NULL 時,比較的結果也是 NULL,例外是使用 <=> 對兩個 NULL 做比較時會返回 1,這兩種情況都不需要做型別轉換
  • 兩個引數都是字串,會按照字串來比較,不做型別轉換
  • 兩個引數都是整數,按照整數來比較,不做型別轉換
  • 十六進位制的值和非數字做比較時,會被當做二進位制串
  • 有一個引數是 TIMESTAMP 或 DATETIME,並且另外一個引數是常量,常量會被轉換為 timestamp
  • 有一個引數是 decimal 型別,如果另外一個引數是 decimal 或者整數,會將整數轉換為 decimal 後進行比較,如果另外一個引數是浮點數,則會把 decimal 轉換為浮點數進行比較
  • 所有其他情況下,兩個引數都會被轉換為浮點數再進行比較

總結

sql查詢的時候,欄位的型別要保持一致,不然會資料欄位的隱式轉換,繼而出現慢查詢。 還是那句廢話,多看mysql的慢查詢日誌,有你想要的.

好了,以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對我們的支援。