MySQL中utf8字符集、排序規則及utf8mb4_bin列大小寫不敏感方法

阿新 • • 發佈：2018-11-08

轉載：https://my.oschina.net/u/1245414/blog/1831347

一、utf8mb4 和 utf8 比較

utf8mb4: A UTF-8 encoding of the Unicode character set using one to four bytes per character.
utf8mb3: A UTF-8 encoding of the Unicode character set using one to three bytes per character.
utf8: An alias for utfmb3.
(https://dev.mysql.com/doc/refman/8.0/en/charset-unicode-sets.html

)

UTF-8是使用1~4個位元組，一種變長的編碼格式。（字元編碼）

mb4即 most bytes 4，使用4個位元組來表示完整的UTF-8。而MySQL中的utf8是utfmb3，只有三個位元組，節省空間但不能表達全部的UTF-8，只能支援“基本多文種平面”（Basic Multilingual Plane，BMP）。

推薦使用utf8mb4。

二、utf8mb4_unicode_ci 和 utf8mb4_general_ci 比較

general_ci 更快，unicode_ci 更準確

in German and some other languages ß

is equal to ss.

這種情況unicode_ci能準確判斷。

具體有什麼差別呢？參見下面的連線。

http://mysql.rjweb.org/utf8mb4_collations.html

utf8mb4_general_ci           P=p  Q=q  R=r=Ř=ř   S=s=ß=Ś=ś=Ş=ş=Š=š  sh  ss    sz
utf8mb4_unicode_ci           P=p  Q=q  R=r=Ř=ř   S=s=Ś=ś=Ş=ş=Š=š    sh  ss=ß  sz

可以看到utf8mb4_general_ci中S=ß，而utf8mb4_unicode_ci中ss=ß 。

使用utf8mb4_bin可以將上面的字元區分開來。

貌似general_ci 也快不了多少，所以更推薦unicode_ci。

三、大小寫敏感

utf8mb4_general_cs 大小寫敏感

utf8mb4_bin 大小寫敏感

但貌似不存在utf8_unicode_cs ，可能是演算法決定的吧？

四、utf8mb4_bin 列大小寫不敏感方法

需求

插入的時候Uman 和Umān和uman 看做不同的單詞。
查詢的時候Uman 和Umān和uman 都能同時查出來。

解決方案

使用MySQL虛擬生成列。MYSQL UTF8_bin case insensitive unique index

create table test_utf8_bin_ci
( u8 varchar(50) charset utf8mb4 collate utf8mb4_unicode_ci,
  u8_bin_ci varchar(50) charset utf8mb4 collate utf8mb4_bin as (lower(u8)) unique
);

insert into test_utf8_bin_ci (u8)
values ('A'),('Ä'),('Å'),('Â'),('Á'),('À');

1529141523561

根據需求，插入資料時：

Uman 和Umān 看做不同的單詞，所以要utf8_bin.
Uman 和 uman看做相同的單詞，所以新增unique約束，在utf8_bin區分大小寫的情況下，使用low() 函式使其不區分大小寫。

1529142760719

查詢時：

查詢u8列，utf8mb4_unicode_ci不區分大小寫、不區分a和ā。都能查出來。

1529142689449

MySQL中utf8字符集、排序規則及utf8mb4_bin列大小寫不敏感方法

轉載：https://my.oschina.net/u/1245414/blog/1831347 一、utf8mb4 和 utf8 比較 utf8mb4: A UTF-8 encoding of the Unicode character set using one to four

mysql中的字符集和校對規則（mysql校對集）

1、簡要說明介紹字符集和校對規則字符集是一套符號和編碼。校對規則是在字符集內用於比較字元的一套規則。 MySql在collation提供較強的支援，oracel在這方面沒查到相應的資料。不同字符集有不同的校對規則，命名約定：以其相關的字符集名開始，通常包括一個語言名，並且

【mysql】資料庫字符集和排序規則

庫的字符集影響表和欄位的字符集資料庫字符集》表的字符集》欄位的字符集（從前往後優先順序由低到高，從左往右繼承，如果表沒設定字符集，繼承資料庫的，如果欄位沒設定，繼承表的）資料庫的字符集如果是utf8，表和欄位的字符集繼承欄位的字符集和排序規則繼承自表，例如表的字符集為

linux 下設定 MySQL8 表名大小寫不敏感方法，解決設定後無法啟動 MySQL 服務的問題

在安裝完成之後，初始化資料庫之前，修改 my.cnf 開啟mysql配置檔案 vim /etc/my.cnf 在尾部追加一行 lower_case_table_names=1 並儲存，然後再初始化資料庫。重啟mysql， systemctl restart mysqld.service

linux 下設置 MySQL8 表名大小寫不敏感方法，解決設置後無法啟動 MySQL 服務的問題

服務修改比較數據庫 res 重啟啟動 mys system 在安裝完成之後，初始化數據庫之前，修改 my.cnf 打開mysql配置文件 vim /etc/my.cnf 在尾部追加一行 lower_case_table_names=1 並保存，然後再初始化數據庫。

mysql中字符集和排序規則說明

存儲 blog character 語言 general utf 比較說明 target 數據庫需要適應各種語言和字符就需要支持不同的字符集（Character Set），每種字符集也有各自的排序規則（Collation）。一.字符集字符集，即用於定義字

修改MySql中資料表和欄位的字符集和排序規則

由於資料庫中的資料表和表字段的字符集和排序規則不統一，找了很多帖子，最後發現如下指令碼很好用。用法兒是：先執行如下指令碼生成修改資料表和表字段的指令碼，然後再執行這些生成的指令碼。 1. 修改指定資料庫中所有varchar型別的表字段的字符集為UTF8，並將排序規則

MySQL字符集與排序規則北京MySQL DBA學習

MySQL數據庫北京MySQL 數據庫管理員數據庫工程師　　MySQL提供了多種字符集和排序規則選擇，其中字符集設置和數據存儲以及客戶端與MySQL實例的交互相關，排序規則和字符串的對比規則相關。　　字符集的設置可以在MySQL實例、數據庫、表、列四個級別。MySQL設置字符集支持在In

簡單的給大家說一下mysql建庫建表的字符集和排序規則

直說重點字符集一般就 utf8 和utf8mb4的選擇注意，請選擇utf8mb4， mb4是用4個位元組來存的。utf8是3個位元組，有些特殊表情和字是四個位元組，就會insert錯誤。另外字符集 utf8_bin utf8_ge

【0012】mysql字符集和排序規則

1.關於字符集和排序規則所為字符集，就是用來定義字元在資料庫中的編碼的集合。常見的字符集有：utf8（支援中文）和AccIS（不支援中文）資料庫中的排序規則用來定義字元在進行排序和比較的時候的一種規則。常見的如下：（1） utf8_general_ci 不區分大小

2021-2-18：請你說說MySQL的字符集與排序規則對開發有哪些影響？

任何計算機儲存資料，都需要**字符集**，因為計算機儲存的資料其實都是二進位制編碼，將一個個字元，對映到對應的二進位制編碼的這個對映就是字元編碼（字符集）。這些字元如何排序呢？決定字元排序的規則就是**排序規則**。 # 檢視內建字符集與比較規則通過`show charset;`命令，可以檢視所有的字符

MySQL中的數據類型及創建

浮點 for rop base 創建 creat reat float text MySQL創建： 1.創建數據庫create database test2; 2.刪除數據庫drop database test2;3.創建表create table ceshi( id

MYSQL中的多類型查詢及高級查詢操作

最大值 -s 當前 and 最大笛卡爾 rand 必須 min 　　離散查詢select * from car where price=30 or price=40 or price=50 or price=60;select * from car where price

Mysql中錯誤日誌、binlog日誌、查詢日誌、慢查詢日誌簡單介紹

安全 view 記錄 bin 嚴重 like mod ng- ror 前言數據庫的日誌是幫助數據庫管理員，追蹤分析數據庫以前發生的各種事件的有力根據。mysq

mysql中的utf8mb4、utf8mb4_unicode_ci、utf8mb4_general_ci

常用精確基本算法 utf-8 strong 對比 utf8mb4 不常用 1.utf8與utf8mb4（utf8 most bytes 4） MySQL 5.5.3之後增加了utfmb4字符編碼支持BMP（Basic Multilingual Plane，基本多文

python向mysql中插入數字、字符串、日期總結

對象 cursor com print password tab cas test 處理 import pymysql# 連接數據庫conn = pymysql.connect( host="10.62.1.1", port=3306, user="roo

關於MySQL中的事務、回滾（rollback）、提交（commit）

0 場景需要連續對同一資料表進行增刪改操作時，我們會分別執行多條sql語句。此時可能會出現兩類問題：所有的語句執行完成後，發現其中一句執行錯了某一句執行完成後，後悔了想要重新執行遇到上述問題，能夠時光倒流和吃後悔藥嗎？ MySQL的Innodb引

mysql中對分組內容排序

id group sort 1 1 1 2 1 2 3 2 2 4 2

mysql乾貨——資料庫字符集和校對規則詳解

一、什麼是字符集字元是多個文字和符號的總稱，包括各個國家的文字、標點符號、圖形符號、數字等。字符集多個字元的集合。字元集合種類較多，每個字符集包含的字元的個數不同。對於字符集不支援的字元，則以亂碼顯示。常見的字符集有ASCII字符集、GBK字符集、GB2312字符集、GB18030字

Mysql中的DATE、DATETIME、TIMESTAMP區別？

碰到問題查了一下，路還遠： DATETIME、DATE 和 TIMESTAMP型別是相似的。查了一下它們的特性以及它們的相似點與不同點。 DATETIME型別： DATETIME 型別同時包含日期和時間資訊的值。即MyS

MySQL中utf8字符集、排序規則及utf8mb4_bin列大小寫不敏感方法

一、utf8mb4 和 utf8 比較

三、大小寫敏感

四、utf8mb4_bin 列大小寫不敏感方法

需求

解決方案

相關推薦