一篇文章帶你入門Python正則表示式

阿新 • • 發佈：2021-10-20

Python3 正則表示式

正則表示式是一個特殊的字元序列，它能幫助你方便的檢查一個字串是否與某種模式匹配。本文主要闡述re包中的主要函式。

在闡述re包中的函式之前，我們首先看議案正則表示式的模式，即使用特殊的語法來表示一個正則表示式。

Image Name

1.match函式

re.match 嘗試從字串的起始位置匹配一個模式，如果不是起始位置匹配成功的話，match()就返回none。
函式用法：re.match(pattern,string,flags=0)

pattern: 所要匹配的正則表示式string: 要匹配izzYwz的字串flags: 標誌位，用於控制正則表示式的匹配方式，如：是否區分大小寫，多行匹配等等。
- re.I 忽略大小寫
- re.L 表示特殊字符集 \w,\W,\b,\B,\s,\S 依賴於當前環境
- re.M 多行模式re.S 即為' . ‘並且包括換行符在內的任意字元（' . '不包括換行符）
- re.U 表示特殊字符集 \w,\d,\D,\S 依賴於 Unicode 字元屬性
- re.X 為了增加可讀性，忽略空格和' # '後面的註釋

匹配物件方法：

group(num=0): 匹配的整個表示式的字串，group() 可以一次輸入多個組號，在這種情況下它將返回一個包含那些組所對應值的元組。
groups(): 返回一個包含所有小組字串的元組，從 1 到所含的小組號。

import re
print(re.match("xixi","xixi_haha_heihei").group())

xixi

line = 'Cats are smarter than dogs'
b = re.match(r'(.*) are (.*?) .*',line,re.M|re.I)

print(b.group()) # 返回所有
print(b.group(1)) # 返回第一組，即(.*)對應的
print(b.group(2)) # 返回第二組，即(.*?)對應的

Cats are smarter than dogs
Cats
http://www.cppcns.comsmarter

2.search函式

re.search 掃描整個字串並返回第一個成功的匹配。

函式用法：re.search(pattern,flags=0)

print(re.match('heihei','xixi_haha_heihei'))
print(re.search('heihei','xixi_haha_heihei').group())

None
heihei

line = 'Cats are smarter than dogs'
b = re.search(r'(.*) are (.*?) .*',re.M|re.I)

print(b.group()) # 返回所有
print(b.group(1)) # 返回第一組，即(.*)對應的
print(b.group(2)) # 返回第二組，即(.*?)對應的

Cats are smarter than dogs
Cats
smarter

search和match的區別

match只匹配字串的開始，如果字串開始不符合正則表示式，則匹配失敗，函式返回None；而search匹配整個字串，直到找到一個匹配。

3. sub函式

re提供了re.sub來替換字串中的匹配項。
函式用法：re.sub(pattern,repl,count=0,flags=0)

pattern : 正則中的模式字串。
repl : 替換的字串，也可為一個函式。
string : 要被查詢替換的原始字串。
count : 模式匹配後替換的最大次數，預設 0 表示替換所有的匹配。
flags : 編譯時用的匹配模式，數字形式。

phone = '133-3333-3333  # this is a phone number'

num = re.sub(r'#.*$','',phone)
print('phone num',num)
# 移除註釋，找到以#開頭的。

num = re.sub(r'\D',num)
# 移除非數字內容

phone num 133-3333-3333  
phone num 13333333333

repl是函式的情況

def double(matched):
    value = int(matched.group('value'))
    return str(value * 2)

s = 'A233Sfd34'
print(re.sub('(?P<value>\d+)',double,s))

A466Sfd68

4.compile函式

compile 函式用於編譯正則表示式，生成一個正則表示式（ Pattern ）物件，供 match() 和 search() 這兩個函式使用。
函式使用：http://www.cppcns.comre.compile(pattern,flags)

pattern = re.compile(r'/d+')
m = pattern.match('ones123412')
print(m)

None

5.findall

在字串中找到正則表示式所匹配的所有子串，並返回一個列表，如果沒有找到匹配的，則返回空列表。
注意：match和search是匹配一次，但是findall是匹配所有。

函式使用：findall(string,pos,endpos)

string 待匹配的字串。
pos 可選引數，指定字串的起始位置，預設為 0。
endpos 可選引數，指定字串的結束位置，預設為字串的長度。

pattern = re.compile(r'\d+')
result1 = pattern.findall('xixixix 123 heihiehei 456')
result2 = pattern.findall('xixixix 123 heihiehei 456',15)

print(result1)
print(result2)

['123','456']
['123']

6.finditer

和 findall 類似，在字串中找到正則表示式所匹配的所有子串，並把它們作為一個迭代器返回。

ittt = re.finditer(r'\d+','12dsfasdf123asdf534')
for ttt in ittt:
    print(ttt.group())

12
123
534

7.split

split 方法按照能夠匹配的子串將字串分割後返回列表。

函式使用：

re.split(pattern,maxsplit=0,flags=0)

pattern：匹配的正則表示式
string：要匹配的字串。
maxsplit：分隔次數，maxsplit=1 分隔一次，預設為 0，不限制次數。
flags：標誌位，用於控制正則表示式的匹配方式，

print(re.split('\W+','xxixix,xixixi,hehiehei'))
print(re.split('(\W+)',' xxixix,hehiehei'))

['xxixix','xixixi','hehiehei']
['',' ','xxixix',','hehiehei']

總結

本篇文章就到這裡了，希望能夠給你帶來幫助，也希望您能夠多多關注我們的更多內容！

一篇文章帶你入門Python正則表示式

目錄3 正則表示式1.match函式2.search函式search和match的區別3. sub函式4.compile函式5.findall6.finditer7.split總結Python3 正則表示式

一篇文章帶你瞭解python正則表示式的正確用法

目錄正則表示式的介紹re模組匹配單個字元1.匹配任意一個字元2.匹配[ ]中列舉的字元3.\\d匹配數字，即0-94.\\D匹配非數字，即不是數字5.\\s匹配空白，即空格，tab鍵6.\\S匹配非空白7.\\w匹配非特殊字元，即a-z、A-Z、

一篇文章徹底搞懂python正則表示式

目錄前言1. 正則表示式的基本概念2. 的正則表示式re模組3. 正則表示式語法（1）匹配單個字元（2）匹配多個字元（3）邊界匹配（4）分組匹配4. re模組相關方法使用總結前言

一篇文章帶你入門Zookeeper

Zookeeper是什麼官方文件上這麼解釋zookeeper，它是一個分散式服務框架，是Apache Hadoop 的一個子專案，它主要是用來解決分散式應用中經常遇到的一些資料管理問題，如：統一命名服務、狀態同步服務、叢集管理、分

一篇文章帶你瞭解python的6大基本資料型別基礎篇

1.數字型(Number) 1.1 整型(int) 整型包括所有的正整數，負整數還有0。在python中所有的整型資料全部預設採用十進位制進行表示，但我們還可以手動表示其他進位制的整型，具體表示如下：

一篇文章帶你入門Java Script

目錄概述特點和的區別弱型別語言強型別語言書寫位置陣列函式中的自定義物件（擴充套件內容）Object形式的自定義物件JS中的事件常用的事件：動態註冊基本步驟：DOM模型總結概述

一篇文章帶你入門和了解Jquery的基礎操作

目錄1.的使用步驟:(1)匯入庫(2)頁面載入事件2.Jq物件和js物件的轉換(1)js物件------>jq物件(2)jq物件------>js物件3.jq的基本選擇器//(1)jq的id選擇器//(2)jq的class選擇器//(3)表單選擇器//(4)element選擇器4

（轉）一篇文章帶你瞭解Python運算子過載一篇文章帶你瞭解Python運算子過載

原文：https://developer.51cto.com/art/202104/657236.htm 您可以根據所使用的運算元來更改Python中運算子的含義。這種做法稱為運算子過載，今天我們一起來聊聊運算子過載。

帶你精通Python正則表示式

目錄正則表示式一、re模組1.匯入re模組2.findall（）的語法：二、正則表示式1.字串的匹配2、正則的使用Python正則表示式

一篇文章帶你徹底瞭解python的單例模式

什麼是單例模式？單例模式（Singleton Pattern）是一種常用的軟體設計模式，該模式的主要目的是確保某一個類只有一個例項存在。當你希望在整個系統中，某個類只能出現一個例項時，單例物件就能派上用場

一篇文章帶你解讀redis分散式鎖的發展史和正確實現方式

來源：點我達技術 http://tech.dianwoda.com/ 前言近兩年來微服務變得越來越熱門，越來越多的應用部署在分散式環境中，在分散式環境中，資料一致性是一直以來需要關注並且去解決的問題，分散式鎖也就成為了一種廣泛

一篇文章帶你掌握mysql的一致性檢視（MVCC）

提到事務，你肯定會想到ACID（Atomicity、Consistency、Isolation、Durability，即原子性、一致性、隔離性、永續性），我們就來說說其中I，也就是“隔離性”。

一篇文章帶你瞭解資料庫中JOIN的用法

前言本章主要介紹資料庫中Join的的用法，也是我們在使用資料庫時非常基礎的一個知識點。本次會介紹資料庫中的 inner join、 left join、 right join 的用法以及它們之間的區別。文章如有錯誤還請大家及時指出~

一篇文章帶你瞭解資料庫中group by的用法

前言本章主要介紹資料庫中group by的用法，也是我們在使用資料庫時非常基礎的一個知識點。並且也會涉及Join的使用，關於Join的用法，可以看我寫的上一篇文章：帶你瞭解資料庫中JOIN的用法如有錯誤還請大家及時指出

一篇文章帶你使用Typescript封裝一個Vue元件(簡單易懂)

一、搭建專案以及初始化配置 vue create ts_vue_btn 這裡使用了vue CLI3自定義選擇的服務，我選擇了ts、stylus等工具。然後建立完專案之後，進入專案。使用快捷命令code .進入Vs code編輯器(如果沒有code .，需要

一篇文章帶你輕鬆瞭解C# Lock關鍵字

　　相信絕大多數.NET玩家和我一樣，常常使用Timer這個物件，而在WPF中使用DispatcherTimer的人也是很多，DispatcherTimer是在UI執行緒跑的。我們的程式中大多數都會充斥很多Timer，可以理解它是一個執行緒，它繼承自

一篇文章帶你瞭解JavaScript中的變數，作用域和記憶體問題

1 在JavaScript中的變數分別區分為兩種：一種為基本型別值，一種為應用型別值。

一篇文章教會你利用Python網路爬蟲獲取有道翻譯手機版的翻譯介面

【一、專案背景】有道翻譯作為國內最大的翻譯軟體之一，使用者量巨大。在學習時遇到不會的英語詞彙，會第一時間找翻譯，有道翻譯就是首選。今天教大家如何去獲取有道翻譯手機版的翻譯介面。

一篇文章教會你用Python多執行緒獲取小米應用商店App

【一、專案背景】小米應用商店給使用者發現最好的安卓應用和遊戲,安全可靠，可是要下載東西要一個一個的搜尋太麻煩了。而已速度不是很快。

一篇文章帶你搞懂Vue虛擬Dom與diff演算法

前言使用過Vue和React的小夥伴肯定對虛擬Dom和diff演算法很熟悉，它扮演著很重要的角色。由於小編接觸Vue比較多，React只是淺學，所以本篇主要針對Vue來展開介紹，帶你一步一步搞懂它。

一篇文章帶你入門Python正則表示式

目錄

Python3 正則表示式

1.match函式

2.search函式

search和match的區別

3. sub函式

4.compile函式

5.findall

6.finditer

7.split

總結

相關推薦