python3正則模組re的使用方法詳解

阿新 • • 發佈：2020-02-12

一、正則

1.正則表示式定義

正則就是用一些具有特殊含義的符號組合到一起（稱為正則表示式）來描述字元或者字串的方法。或者說：正則就是用來描述一類事物的規則。（在Python中）它內嵌在Python中，並通過 re 模組實現。正則表示式模式被編譯成一系列的位元組碼，然後由用 C 編寫的匹配引擎執行。

2.目的和特點

給定一個正則表示式和另一個字串，我們可以達到如下的目的：

給定的字串是否符合正則表示式的過濾邏輯（稱作“匹配”）：

可以通過正則表示式，從字串中獲取我們想要的特定部分。

正則表示式的特點是：

靈活性、邏輯性和功能性非常強；

可以迅速地用極簡單的方式達到字串的複雜控制。

由於正則表示式主要應用物件是文字，因此它在各種文字編輯器場合都有應用，小到著名編輯器EditPlus，大到Microsoft Word、Visual Studio等大型編輯器，都可以使用正則表示式來處理文字內容。

3.常用的正則表示式

python3正則模組re的使用方法詳解

4.貪婪模式與非貪婪模式

正則表示式通常用於在文字中查詢匹配的字串。Python裡數量詞預設是貪婪的（在少數語言裡也可能是預設非貪婪），總是嘗試匹配儘可能多的字元；非貪婪的則相反，總是嘗試匹配儘可能少的字元。例如：正則表示式"ab*“如果用於查詢"abbbc”，將找到"abbb"。而如果使用非貪婪的數量詞"ab*?"，將找到"a"。

5.反斜槓

與大多數程式語言相同，正則表示式裡使用"“作為轉義字元，這就可能造成反斜槓困擾。假如你需要匹配文字中的字元”"，那麼使用程式語言表示的正則表示式裡將需要4個反斜槓"\\"：前兩個和後兩個分別用於在程式語言裡轉義成反斜槓，轉換成兩個反斜槓後再在正則表示式裡轉義成一個反斜槓。Python裡的原生字串很好地解決了這個問題，這個例子中的正則表示式可以使用r"\“表示。同樣，匹配一個數字的”\d"可以寫成r"\d"。有了原生字串，你再也不用擔心是不是漏寫了反斜槓，寫出來的表示式也更直觀。

二、python3正則模組re

1.match

match(string[,pos[,endpos]]) | re.match(pattern,string[,flags]):

Match物件是一次匹配的結果，包含了很多關於此次匹配的資訊，可以使用Match提供的可讀屬性或方法來獲取這些資訊。

屬性：

string: 匹配時使用的文字。

re: 匹配時使用的Pattern物件。

pos: 文字中正則表示式開始搜尋的索引。值與Pattern.match()和Pattern.seach()方法的同名引數相同。

endpos: 文字中正則表示式結束搜尋的索引。值與Pattern.match()和Pattern.seach()方法的同名引數相同。

lastindex: 最後一個被捕獲的分組在文字中的索引。如果沒有被捕獲的分組，將為None。

lastgroup: 最後一個被捕獲的分組的別名。如果這個分組沒有別名或者沒有被捕獲的分組，將為None。

方法：

group([group1,…])

獲得一個或多個分組截獲的字串；指定多個引數時將以元組形式返回。group1可以使用編號也可以使用別名；編號0代表整個匹配的子串；不填寫引數時，返回group(0)；沒有截獲字串的組返回None；截獲了多次的組返回最後一次截獲的子串。

groups([default])

以元組形式返回全部分組截獲的字串。相當於呼叫group(1,2,…last)。default表示沒有截獲字串的組以這個值替代，預設為None。

groupdict([default])

返回以有別名的組的別名為鍵、以該組截獲的子串為值的字典，沒有別名的組不包含在內。default含義同上。

start([group])

返回指定的組截獲的子串在string中的起始索引（子串第一個字元的索引）。group預設值為0。

end([group])

返回指定的組截獲的子串在string中的結束索引（子串最後一個字元的索引+1）。group預設值為0。

span([group])

返回(start(group),end(group))。

expand(template)

將匹配到的分組代入template中然後返回。template中可以使用\id或\g、\g引用分組，但不能使用編號0。\id與\g是等價的；但\10將被認為是第10個分組，如果你想表達\1之後是字元'0'，只能使用\g<1>0。

import re
ret1 = re.match('t.{6}w','taaa333w123')
try:
  print('匹配到的資料是：',ret1.group()) # 匹配的是一個group
except:
  print('沒有匹配到資料')

2.search

search(string[,endpos]]) | re.search(pattern,flags])

這個方法用於查詢字串中可以匹配成功的子串。從string的pos下標處起嘗試匹配pattern，如果pattern結束時仍可匹配，則返回一個Match物件；若無法匹配，則將pos加1後重新嘗試匹配；直到pos=endpos時仍無法匹配則返回None。

pos和endpos的預設值分別為0和len(string))；re.search()無法指定這兩個引數，引數flags用於編譯pattern時指定匹配模式。

ret5 = re.search('^[0-9].*','1hello python') # ^代表以什麼開頭
print(ret5.group())

3.split,findall,finditer三個方法

split(string[,maxsplit]) | re.split(pattern,maxsplit])
findall(string[,endpos]]) | re.findall(pattern,flags])
finditer(string[,endpos]]) | re.finditer(pattern,flags])

split類似string中的split方法，不多解釋

findall()方法搜尋string，以列表形式返回全部能匹配的子串。例項：

import re
p = re.compile(r'\d+')
print(p.findall('one1two2three3four4'))

輸出

['1','2','3','4']

finditer()方法搜尋string，返回一個順序訪問每一個匹配結果（Match物件）的迭代器。例項：

import re
p = re.compile(r'\d+')
for m in p.finditer('one1two2three3four4'):
  print(m.group(),)

輸出

4.sub

sub(repl,count]) | re.sub(pattern,repl,count])

使用repl替換string中每一個匹配的子串後返回替換後的字串。

當repl是一個字串時，可以使用\id或\g、\g引用分組，但不能使用編號0。

當repl是一個方法時，這個方法應當只接受一個引數（Match物件），並返回一個字串用於替換（返回的字串中不能再引用分組）。

count用於指定最多替換次數，不指定時全部替換。

import re
p = re.compile(r'(\w+) (\w+)')
s = 'i say,hello world!'
print(p.sub(r'\2 \1',s))
def func(m):
  return m.group(1).title() + ' ' + m.group(2).title()
print(p.sub(func,s))

輸出

say i,world hello!

更多關於python3正則模組re的使用方法請檢視下面的相關連結

python3正則模組re的使用方法詳解

一、正則

1.正則表示式定義

2.目的和特點

正則表示式的特點是：

3.常用的正則表示式

4.貪婪模式與非貪婪模式

5.反斜槓

二、python3正則模組re

1.match

2.search

3.split,findall,finditer三個方法

4.sub

python3正則模組re的使用方法詳解

通過字串匯入 Python 模組的方法詳解

python pillow模組使用方法詳解

Python collections模組使用方法詳解

node.JS的crypto加密模組使用方法詳解(MD5,AES,Hmac,Diffie-Hellman加密)

Node.JS獲取GET,POST資料之queryString模組使用方法詳解

node.JS路徑解析之PATH模組使用方法詳解

python使用docx模組讀寫docx檔案的方法與docx模組常用方法詳解

Go語言正則表示式的使用詳解

Python常用的正則表示式處理函式詳解

Python decimal模組使用方法詳解

8、正則表示式-re方法的屬性

python安裝sklearn模組的方法詳解

對Python3 goto 語句的使用方法詳解

Python正則表示式的應用詳解

輕鬆掌握正則表示式findall函式詳解

linux正則sed實戰案例詳解

grep的正則用法 grep用法詳解:grep與正則表示式

Python3正則表示式_re模組_教程詳解_筆記_完整內容

python正則過濾字母、中文、數字及特殊字元方法詳解

python3正則模組re的使用方法詳解

一、正則

1.正則表示式定義

2.目的和特點

正則表示式的特點是：

3.常用的正則表示式

4.貪婪模式與非貪婪模式

5.反斜槓

二、python3正則模組re

1.match

2.search

3.split,findall,finditer三個方法

4.sub

相關推薦