python - re模塊(正則表達式)

阿新 • • 發佈：2018-09-20

ima mage 習題 dht 模式 spl 替換分享對象

元字符介紹:

. 　　　　單個字符匹配

^　　　　以字符開頭匹配在[]裏面作為非

$　　　　以字符結尾匹配

A|B　　匹配A或者B的字符串

註意 : |

>>> re.findall(r"\d+@(?:qq|163).com","[email protected]@qq.combfew")
[‘[email protected]‘, ‘[email protected]‘]

*　　　　(0,無窮多)重復匹配符號前字符

+　　　　(1,無窮多)重復匹配符號前字符

?　　　　(0,1)重復匹配符號前字符

*和+區別:

>>> re.findall(" 
aaf*","dwaadhtfhdw")
[‘aa‘]
>>> re.findall("aaf+","dwaadhtfhdw")
[]

{}　　　　重復萬金油

{0,}等同於 *

{1,}等同於+

{0,1}等同於?

{3}重復3次

[]　　　　匹配大括號內的字符

[a]　　　匹配大廓內的字符一次

[a-z]　　匹配a-z中任意字符一次

[0-9]　　　匹配0-9中任意字符一次　　　

[^a-z]　　非字符a-z一次

>>> re.findall("\([^()]*\)",‘2*(3+(2*4-(9+4)))‘)       
[‘(9+4) 
‘]
>>> 
#找到最內層的括號

分組

()　　　　　　　　將數據分組匹配

(?P<name>) 　　命名分組

#在運行分組的時候千萬要註意!!!!!!!!!!!!!
>>> re.findall("(abc)","abcabcabc")
[‘abc‘, ‘abc‘, ‘abc‘]
>>> re.findall("(abc)+","abcabcabc")
[‘abc‘]
>>> re.findall("(?:abc)","abcabcabc")
[‘abc‘, ‘abc‘, ‘abc‘]
>>> re.findall(" 
(?:abc)+","abcabcabc")
[‘abcabcabc‘]
>>>

#應用分組後,匹配規則優先反饋分組內的數據.

應用:

re.search().group(name)　　

>>> re.search(r"(?P<zjm>主機名)(?P<id>\w{2}\d+)","主機名PC201808110908n7旗艦版").group("zjm")
‘主機名‘
>>> re.search(r"(?P<zjm>主機名)(?P<id>\w{2}\d+)","主機名PC201808110908n7旗艦版").group("id")
‘PC201808110908‘
>>>

特殊符號:

\d　　匹配數字,[0-9]

\D　　匹配任何非數據[^0-9]

\s　　匹配任何空白字符,[\t\n\r\f\v]

\S　　匹配任何非空白字符,[^\t\n\r\f\v]

\w　　匹配任何字母數字,[a-zA-Z0-9]

\W　匹配任何非字符數字[^a-zA-Z0-9]

\b　　匹配一個reshuffle字符邊界,空格,&,#等

re 方法:

import re #導入模塊

re.findall()　　　　找到匹配數據,返回一個列表類型

re.match()　　　　找到匹配數據,返回一個對象(包含匹配字符位置以及字符) 可以group取出數據

re.split()　　　　找到匹配數據,已找到數據分割

re.sub()　　　　　參數:re.sub("匹配規則","替換規則",字符串,替換次數)

compile方法

obj = re.compile

obj.re方法(字符串)

>>> obj = re.compile("\d")
>>> obj.findall("123dasda323432")
[‘1‘, ‘2‘, ‘3‘, ‘3‘, ‘2‘, ‘3‘, ‘4‘, ‘3‘, ‘2‘]
>>>

re.finditer()　　　　將匹配到的數據轉換成生成器. .__next__.group()獲取數據.

練習題:

郵箱地址匹配:

import re
#從中找到4條郵箱地址:
#識別模式:數字+@+qq|163|135.com
msg = "sdfefsefEGDFSBD234T37YCUN32JF6SC5621RKI9JSF455342229@[email protected]@[email protected]"

#以列表形式返回:
email = re.findall("(\d+@(?:163|qq|135).com)",msg)
print(email)

#以單條數據返回
email2 = re.finditer("(\d+@(?:163|qq|135).com)",msg)
print(next(email2).group())
print(next(email2).group())
print(next(email2).group())
print(next(email2).group())

python - re模塊(正則表達式)

Python re模塊,正則表達式

spl 貪婪匹配制表符學會一段 pat true bce art re模塊講正題之前我們先來看一個例子：https://reg.jd.com/reg/person?ReturnUrl=https%3A//www.jd.com/ 這是京東的註冊頁面，打開頁面我

python - re模塊(正則表達式)

ima mage 習題 dht 模式 spl 替換分享對象元字符介紹: . 　　　　單個字符匹配 ^　　　　以字符開頭匹配在[]裏面作為非 $　　　　以字符結尾匹配 A|B　　匹配A或者B的字符串註意 : | >>> re.findal

python re模塊正則表達式

request 一個 pre sea finditer all spa ref 返回 1 re的工作是在python中執行正則表達式 2 import re 3 4 # find 5 result = re.findall(‘\d+‘, ‘baby的電話號是:

Python基礎（13）_python模塊之re模塊(正則表達式)

取反 clas 執行 true dha blog strong 邊界 .com 8、re模塊：正則表達式　　就其本質而言，正則表達式（或 RE）是一種小型的、高度專業化的編程語言，（在Python中）它內嵌在Python中，並通過 re 模塊實現。正則表達式模式被編譯

Python的學習之旅———re 模塊正則表達式

正則表達 fin 個數 logs find 1-1 bank clas col #重復匹配：. [] ? * + {} ?:左邊那個字符出現0次或1次 print(re.findall(‘ab?‘,‘a ab abb abbb abbbbbb‘)) print(re.fi

re模塊正則表達式

標誌位輸入加減乘 nor 元素 char 上海開頭必須引子請從以下文件裏取出所有的手機號姓名地區身高體重電話況詠蜜北京 171 48 13651054608 王心顏上海 16

re模塊正則表達式

返回 str sub 直觀開始 re.sub 編程語言 () search方法 1、表示字符 2、原始字符串 Python中字符串前面加上 r 表示原生字符串，與大多數編程語言相同，正則表達式裏使用"\"作為轉義字符，這就可能造成反斜杠困擾。假如你需要匹配文本中的字符

Python基礎知識之正則表達式re模塊

轉換成 spl html href earch 大小轉載 rec city **轉載自：http://www.cnblogs.com/alex3714/articles/5161349.html** re模塊常用方法 re.match(規則，字符串):默認從開頭開始

python之路---24 正則表達式 re模塊

findall group 表達 mat 替換 all arch bsp search 一.正則表達式　　1.字符組　　　① [abc] 匹配a或b或c 　　　② [a-z] 匹配a到z之間的所有字? 　　　　 [0-9]匹配所有阿拉伯數字　　2.元字符　

Python開發基礎-Day15正則表達式爬蟲應用，configparser模塊和subprocess模塊

表達 port 進行 false popen ext signal -- 默認正則表達式爬蟲應用（校花網） 1 import requests 2 import re 3 import json 4 #定義函數返回網頁的字符串信息 5 def getPage_

Python: 字符串搜索和匹配,re.compile() 編譯正則表達式字符串，然後使用match() , findall() 或者finditer() 等方法

nth post cde clas import 預編譯正則一次 find 1. 使用find()方法 >>> text = ‘yeah, but no, but yeah, but no, but yeah‘ >>> text.fi

Python日誌分析與正則表達式

logs sea 篩選 ear d+ class 時間針對日誌程序員經常會面臨日誌的分析工作。而正則表達式是處理日誌的必備工具。 “Line 622: 01-01 09:04:16.727 <6> [pid:14399, cpu1 dabc_pwym_t

Python爬蟲之利用正則表達式爬取內涵吧

file res start cnblogs all save nts quest ide 首先，我們來看一下，爬蟲前基本的知識點概括一. match()方法：這個方法會從字符串的開頭去匹配（也可以指定開始的位置），如果在開始沒有找到，立即返回None，匹配到一個結果

Python網絡爬蟲-正則表達式

blog jpa ocs gyp .com bwt agg sql tip x1ki8u拐悶性夢贍雇http://docstore.docin.com/uooy8648n1of45居謁簇源接目http://www.docin.com/pfryy96585ozqxbm首嘆鴉扯

python網絡爬蟲-正則表達式和BeautifulSoup

python www. dns pytho .com .html soup jin dnn ilaiut澇脊贅沙級撇http://www.docin.com/app/user/userinfo?userid=179057661ldn5ng押靨撓被槳映http://shufa

re模塊正則匹配

reimport rere.M 多行模式位或的意思parrterm就是正則表達式的字符串，flags是選項，表達式需要被編譯，通過語法、策劃、分析後衛其編譯為一種格式，與字符串之間進行轉換re模塊主要為了提速，re的其他方法為了提高效率都調用了編譯方法，就是為了提速re的方法單次匹配re.compile 和

兄弟連學Python（06）---- 正則表達式匹配規則

驗證列表 cas 斜杠小數點 php 能夠 spa 超過正則表達式 - 匹配規則基本模式匹配一切從最基本的開始。模式，是正則表達式最基本的元素，它們是一組描述字符串特征的字符。模式可以很簡單，由普通的字符串組成，也可以非常復雜，往往用特殊的字符表示一個範圍內的字

python 爬蟲入門之正則表達式一

簡單換行 find www. ever page oct search utf python 正則表達式知識點正則常用符號. : 匹配任意字符，換行符除外* ：匹配前一個字符 0 次或者無限次？：匹配前一個字符 0次或者1次.* ：貪心算法.*？：非貪心算

re庫、正則表達式基本使用

tro 表示 color blog mage sea match 正則表達式 strong re庫是python的標準庫，主要用於字符串匹配。Re庫主要功能函數 re.search()函數 re.match()函數正則表達式 1.特殊字符 ^h表示以h開頭，.表

Python課堂筆記之正則表達式

小寫多個一個指定 pytho 找到 IT groups 表達正則表達式的基本使用re.match(r’xxx’, 匹配的字符串) 嘗試從字符串的起始位置匹配一個模式匹配成功re.match方法返回一個匹配的對象，否則返回None。可以使用group(num) 或 g

python - re模塊(正則表達式)

元字符介紹:

相關推薦