31 正則表示式

阿新 • • 發佈：2020-06-25

前面小節介紹過使用 LIKE 模糊查詢包含指定內容的欄位的結果集，本小節介紹正則表示式相關的基礎知識，學習之後，可以使用正則表示式來查詢更加符合需求的欄位內容。

1. 正則表示式中的元字元

元字元	描述
`\`	將下一個字元標記符、或一個向後引用、或一個八進位制轉義符。例如，“\n”匹配\n。“\n”匹配換行符。序列“\”匹配“\”而“(”則匹配“(”。即相當於多種程式語言中都有的“轉義字元”的概念。
`^`	匹配輸入字行首。如果設定了RegExp物件的Multiline屬性，^也匹配“\n”或“\r”之後的位置。
`$`	匹配輸入行尾。如果設定了RegExp物件的Multiline屬性，$也匹配“\n”或“\r”之前的位置。
`*`	匹配前面的子表示式任意次。例如，zo能匹配“z”，也能匹配“zo”以及“zoo”。等價於{0,}。
`+`	匹配前面的子表示式一次或多次(大於等於1次）。例如，“zo+”能匹配“zo”以及“zoo”，但不能匹配“z”。+等價於{1,}。
`?`	匹配前面的子表示式零次或一次。例如，“do(es)?”可以匹配“do”或“does”。?等價於{0,1}。
`{n}`	n是一個非負整數。匹配確定的n次。例如，“o{2}”不能匹配“Bob”中的“o”，但是能匹配“food”中的兩個o。
`{n,}`	n是一個非負整數。至少匹配n次。例如，“o{2,}”不能匹配“Bob”中的“o”，但能匹配“foooood”中的所有o。“o{1,}”等價於“o+”。“o{0,}”則等價於“o*”。
`{n,m}`	m和n均為非負整數，其中n<=m。最少匹配n次且最多匹配m次。例如，“o{1,3}”將匹配“fooooood”中的前三個o為一組，後三個o為一組。“o{0,1}”等價於“o?”。請注意在逗號和兩個數之間不能有空格。
`?`	當該字元緊跟在任何一個其他限制符（*,+,?，{n}，{n,}，{n,m}）後面時，匹配模式是非貪婪的。非貪婪模式儘可能少地匹配所搜尋的字串，而預設的貪婪模式則儘可能多地匹配所搜尋的字串。例如，對於字串“oooo”，“o+”將盡可能多地匹配“o”，得到結果[“oooo”]，而“o+?”將盡可能少地匹配“o”，得到結果 [‘o’, ‘o’, ‘o’, ‘o’]
`.`	匹配除“\n”和"\r"之外的任何單個字元。要匹配包括“\n”和"\r"在內的任何字元，請使用像“[\s\S]”的模式。
`(pattern)`	匹配pattern並獲取這一匹配。所獲取的匹配可以從產生的Matches集合得到，在VBScript中使用SubMatches集合，在JScript中則使用$0…$9屬性。要匹配圓括號字元，請使用“$”或“$”。
`(?:pattern)`	非獲取匹配，匹配pattern但不獲取匹配結果，不進行儲存供以後使用。這在使用或字元來組合一個模式的各個部分時很有用。
`(?=pattern)`	非獲取匹配，正向肯定預查，在任何匹配pattern的字串開始處匹配查詢字串，該匹配不需要獲取供以後使用。預查不消耗字元，也就是說，在一個匹配發生後，在最後一次匹配之後立即開始下一次匹配的搜尋，而不是從包含預查的字元之後開始。
`(?!pattern)`	非獲取匹配，正向否定預查，在任何不匹配pattern的字串開始處匹配查詢字串，該匹配不需要獲取供以後使用。例如“Windows(?!95
`(?<=pattern)`	非獲取匹配，反向肯定預查，與正向肯定預查類似，只是方向相反。*python的正則表示式沒有完全按照正則表示式規範實現，所以一些高階特性建議使用其他語言如java、scala等
`(?<!patte_n)`	非獲取匹配，反向否定預查，與正向否定預查類似，只是方向相反。*python的正則表示式沒有完全按照正則表示式規範實現，所以一些高階特性建議使用其他語言如java、scala等
`[xyz]`	字元集合。匹配所包含的任意一個字元。例如，“[abc]”可以匹配“plain”中的“a”。
`[^xyz]`	負值字元集合。匹配未包含的任意字元。例如，“[^abc]”可以匹配“plain”中的“plin”任一字元。
`[a-z]`	字元範圍。匹配指定範圍內的任意字元。例如，“[a-z]”可以匹配“a”到“z”範圍內的任意小寫字母字元。注意:只有連字元在字元組內部時,並且出現在兩個字元之間時,才能表示字元的範圍; 如果出字元組的開頭,則只能表示連字元本身.
`[^a-z]`	負值字元範圍。匹配任何不在指定範圍內的任意字元。例如，“[^a-z]”可以匹配任何不在“a”到“z”範圍內的任意字元。
`\b`	匹配一個單詞的邊界，也就是指單詞和空格間的位置（即正則表示式的“匹配”有兩種概念，一種是匹配字元，一種是匹配位置，這裡的\b就是匹配位置的）。例如，“er\b”可以匹配“never”中的“er”，但不能匹配“verb”中的“er”；“\b1_”可以匹配“1_23”中的“1_”，但不能匹配“21_3”中的“1_”。
`\B`	匹配非單詞邊界。“er\B”能匹配“verb”中的“er”，但不能匹配“never”中的“er”。
`\cx`	匹配由x指明的控制字元。例如，\cM匹配一個Control-M或回車符。x的值必須為A-Z或a-z之一。否則，將c視為一個原義的“c”字元。
`\d`	匹配一個數字字元。等價於[0-9]。grep 要加上-P，perl正則支援
`\D`	匹配一個非數字字元。等價於[^0-9]。grep要加上-P，perl正則支援
`\f`	匹配一個換頁符。等價於\x0c和\cL。
`\n`	匹配一個換行符。等價於\x0a和\cJ。
`\r`	匹配一個回車符。等價於\x0d和\cM。
`\s`	匹配任何不可見字元，包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。
`\S`	匹配任何可見字元。等價於[^ \f\n\r\t\v]。
`\t`	匹配一個製表符。等價於\x09和\cI。
`\v`	匹配一個垂直製表符。等價於\x0b和\cK。
`\w`	匹配包括下劃線的任何單詞字元。類似但不等價於“[A-Za-z0-9_]”，這裡的"單詞"字元使用Unicode字符集。
`\W`	匹配任何非單詞字元。等價於“[^A-Za-z0-9_]”。
`\xn`	匹配n，其中n為十六進位制轉義值。十六進位制轉義值必須為確定的兩個數字長。例如，“\x41”匹配“A”。“\x041”則等價於“\x04&1”。正則表示式中可以使用ASCII編碼。
`\num`	匹配num，其中num是一個正整數。對所獲取的匹配的引用。例如，“(.)\1”匹配兩個連續的相同字元。
`\n`	標識一個八進位制轉義值或一個向後引用。如果\n之前至少n個獲取的子表示式，則n為向後引用。否則，如果n為八進位制數字（0-7），則n為一個八進位制轉義值。
`\nm`	標識一個八進位制轉義值或一個向後引用。如果\nm之前至少有nm個獲得子表示式，則nm為向後引用。如果\nm之前至少有n個獲取，則n為一個後跟文字m的向後引用。如果前面的條件都不滿足，若n和m均為八進位制數字（0-7），則\nm將匹配八進位制轉義值nm。
`\nml`	如果n為八進位制數字（0-7），且m和l均為八進位制數字（0-7），則匹配八進位制轉義值nml。
`\un`	匹配n，其中n是一個用四個十六進位制數字表示的Unicode字元。例如，\u00A9匹配版權符號（©）。
`\p{P}`	小寫 p 是 property 的意思，表示 Unicode 屬性，用於 Unicode 正表示式的字首。中括號內的“P”表示Unicode 字符集七個字元屬性之一：標點字元。其他六個屬性：L：字母；M：標記符號（一般不會單獨出現）；Z：分隔符（比如空格、換行等）；S：符號（比如數學符號、貨幣符號等）；N：數字（比如阿拉伯數字、羅馬數字等）；C：其他字元。*注：此語法部分語言不支援，例：javascript。
`\< \>`	匹配詞（word）的開始（<）和結束（>）。例如正則表示式<the>能夠匹配字串"for the wise"中的"the"，但是不能匹配字串"otherwise"中的"the"。注意：這個元字元不是所有的軟體都支援的。
`( )`	將( 和 ) 之間的表示式定義為“組”（group），並且將匹配這個表示式的字元儲存到一個臨時區域（一個正則表示式中最多可以儲存9個），它們可以用 \1 到\9 的符號來引用。

2. 使用REGEXP正則表示式查詢

以 student 表為例，使用正則表示式查詢出 姓王 的教師：

SELECT * FROM student WHERE name REGEXP '^王';

查詢結果如下圖：

圖片描述

使用正則表示式查詢 name 欄位中包含 小 字的資料：

SELECT * FROM student  WHERE name REGEXP '小';

查詢結果如下圖：

圖片描述

以 teacher 表為例，使用正則表示式匹配符合郵箱格式的資料：

SELECT * FROM teacher  WHERE email REGEXP '^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$';

查詢結果如下圖：

圖片描述

Tips：如上圖所示，其中 ^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$ 為符合郵箱匹配規則的正則表示式，查詢結果 email 的值如果不滿足此正則表示式，則該條資料不會被查詢出來。

3. 小結

本小節介紹瞭如何使用 REGEXP 正則表示式查詢欄位匹配符合正則表示式的資料，列舉了正則表示式的元字元，介紹了在 MySQL 查詢中正則表示式的基本匹配用法，需要注意的是正則表示式更多具體知識這裡不做詳細的介紹，這裡主要介紹如何在查詢 sql 語句中如何對欄位進行已有的正則表示式正則匹配，下表列舉了幾個正則表示式：

(1) 11手機號正則表示式：

^1([38][0-9]|4[579]|5[0-3,5-9]|6[6]|7[0135678]|9[89])\d{8}$

(2) 域名網址正則表示式

^(?=^.{3,255}$)(http(s)?:\/\/)?(www\.)?[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+(：\d+)*(\/\w+\.\w+)*$

(3) 日期+時間正則表示式

^[1-9]\d{3}-(0[1-9]|1[0-2])-(0[1-9]|[1-2][0-9]|3[0-1])\s+(20|21|22|23|[0-1]\d)：[0-5]\d:[0-5]\d$

更多的正則表示式可根據自己的需求來改寫。

31 正則表示式

前面小節介紹過使用 LIKE 模糊查詢包含指定內容的欄位的結果集，本小節介紹正則表示式相關的基礎知識，學習之後，可以使用正則表示式來查詢更加符合需求的欄位內容。

正則表示式在iOS開發中的應用

在iOS開發過程中，正則的使用還是比較常見，用來判斷使用者名稱、手機號等的輸入。當碰到這種需求的時候，部分開發的第一印象可能是使用 NSPredicate 的 SELF MATCHES %@ 進行判斷，但遺憾的是此方法並非萬能，存在檢

iOS深思篇 | 正則表示式

一. 背景 1.1 簡介關於正則表示式，相信大家並不陌生，可能平時只是貼上下相關程式碼，並不瞭解裡面所寫匹配規則。這篇文章我們將介紹iOS相關正則表示式基本語法和一些例項，希望看完此文大家能有所收穫；

正則表示式之Matcher類中group方法

前言同事把一個excel表給我，裡面的資料大概有幾千的樣子吧。自己需要把裡面的資料一個一個拿出來做一個http請求，對得到的結果進行過濾，然後再寫到上面去。這是就涉及到用指令碼來進行操作了，於是自己搞了一個Ja

c++11中regex正則表示式示例簡述

regex庫中涉及到的主要型別有：以std::string為代表的處理字串的型別（我們知道還有儲存wchar_t的wstring類、原生c式字串const char*等等，為了簡化處理僅介紹std::string型別相關的操作，當你把握住了regex的主脈

使用pyqt5 tablewidget 單元格設定正則表示式

tablewidget pyqt5的tablewidget元件比較特殊，每個方格可以裝載其他元件來搭配實現不同的效果，所以在qtdesigner上找不到視覺化直接設定mask或者其他可以限制填入單元格的設定

python 利用正則表示式提取特殊資訊

1、刪除字串中的 Python註釋案例： import re time = \"2020-01-01 # 這是一個日期\" num = re.sub(r\'#.*$\',\"\",time)#以#為分隔，去掉後面的資訊

Eclipse使用正則表示式快速修改程式碼的方法

背景：因為pyhon2.7將停止維護，公司pyhon專案需要將python版本從2.7升級到3.8。所以在python中例如data.has_key(\'json\')將不可使用了，那麼需要全部更換成\'json\' in data

JS正則表示式驗證埠範圍(0-65535)

javascript正則表示式驗證IP地址的埠合法性 if (!(/^[1-9]\\d*$/.test(port) && 1 <= 1 * port && 1 * port <= 65535)){

通過正則表示式驗證IP和埠格式的正確性

在網頁開發中可能會遇到需要對在頁面輸入的ip和埠進行正確性驗證，那麼正則表示式就是最有力的工具：

Python正則表示式匹配字串中的數字

1.使用“\\d+”匹配全數字程式碼： import re zen = \"Arizona 479,501,870. Carlifornia 209,213,650.\"

python 正則表示式引數替換例項詳解

正則表示式是一個特殊的字元序列，它能幫助你方便的檢查一個字串是否與某種模式匹配。

常用正則表示式大全(金錢,非負整數,正整數,郵箱,手機號碼)

什麼是正則表示式？正則表示式是由一個字元序列形成的搜尋模式。當你在文字中搜索資料時，你可以用搜索模式來描述你要查詢的內容。

php正則表示式使用方法整理集合

平時做網站經常要用正則表示式，下面是一些講解和例子，僅供大家參考和修改使用：

JS常用正則表示式超全集(密碼強度校驗,金額校驗,IE版本,IPv4,IPv6校驗)

有時候正則表示式可以大大提高我們的開發效率呢比如這段校驗基本日期格式的javascript程式碼：

使用正則表示式生成隨機資料的方法

從正則表示式生成隨機資料專案地址 https://github.com/GitHub-Laziji/reverse-regexp 安裝

Python re正則表示式元字元分組()用法分享

分組小括號() 有直接分組和命名分組直接分組:()分組只顯示小括號括起來的內容

python使用正則表示式去除中文文字多餘空格，保留英文之間空格方法詳解

在pdf轉為文字的時候，經常會多出空格，影響資料觀感，因此需要去掉文字中多餘的空格，而文字中的英文之間的正常空格需要保留，輸入輸出如下：

C# 正則表示式進階

.NET 中的正則表示式是基於 Perl 5 的正則表示式。超時從 .NET Framework 4.5 開始，正則表示式支援在匹配操作中指定超時時間。如果匹配超時，就會丟擲 RegexMatchTimeoutException。

Mysql中正則表示式Regexp常見用法

Mysql中Regexp常見用法模糊匹配，包含特定字串 # 查詢content欄位中包含“車友俱樂部”的記錄

31 正則表示式

1. 正則表示式中的元字元

2. 使用REGEXP正則表示式查詢

3. 小結

相關推薦