輕鬆入門正則表示式之非貪婪匹配篇詳解

阿新 • • 發佈：2021-10-21

非貪婪匹配 `(.*?)`

import re
a = '456qwe789rty123abc'
re=re.findall('456(.*?)789',a)
print(re)

通http://www.cppcns.com常情況，滿足匹配規則“456(.*?)789”的內容通常不止一個，那麼findall()函式會從字串的起始位置開始尋找文字A，找到後開始尋找文字B，當找到第一個文字B後，暫時停止尋找，將文字A和文字B之間的內容存入列表；然後繼續尋找文字A，並重復之前的步驟，直到到達字串的結束位置，並將所有匹配到的內容存入列表。

import re
a = '456qwe789rty123456kkk789abc456xiaowang789'
re=re.findall('456(.*?)789',a)
print(re)

貪婪模式的話就會尋找最長的

import re
a = '456qwe789rty123456kkk789abc456xiaowang789'
re=re.findall('456(.*)789',a)
print(re)

非貪婪匹配 `.*?`

import re
a='<a href="https://blog.csdn.net/weixin_42403632/articletxxXYFVjD/details/120825546" rel="external nofollow"  target="_blank" data-report-click="{&quot;spm&quot;:&quot;3001.5501&quot;}" data-report-query="spm=3001.5501" data-v-6fe2b6a7="">'
re=re.findall('<a href="(.*?)" rel="external nofollow"  rel="external nofollowtxxXYFVjD 
" .*?',a)
print(re)

" 和 url後面的html程式碼用.*?代表，需要提取的是<a href="後的內容，用“(.*?)”代表

實戰爬取部落格專欄url

import re,requests
url='https://blog.csdn.net/weixin_42403632/category_11076268.html'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:93.0) Gecko/20100101 Firefox/93.0'}
html=requests.get(url,headers=headers).text

re=re.findall('<a href="(.*?)" rel="external nofollow"  rel="external notxxXYFVjD 
follow" .*?rel="noopener">',html)
for i in re:
    print(i)

到此這篇關於輕鬆入門正則表示式之非貪婪匹http://www.cppcns.com配篇詳解的文章就介紹到這了,更多相關正則表示式非貪婪匹配內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

輕鬆入門正則表示式之非貪婪匹配篇詳解

非貪婪匹配 `(.*?)`

非貪婪匹配 `.*?`

輕鬆入門正則表示式之非貪婪匹配篇詳解

java正則表示式之Pattern與Matcher類詳解

正則表示式量詞與貪婪的使用詳解

js正則表示式之前瞻後顧與非捕獲分組

盤點Python正則表示式中的貪婪模式和非貪婪模式

正則表示式之Matcher類中group方法

正則表示式之單行模式與多行模式

正則表示式之密碼驗證

正則表示式之分組的回溯引用問題

正則表示式之匹配分組

正則表示式之匹配多個字元

python 正則表示式之轉義字元

正則表示式之：sort、uniq、tr、cut、eval命令

輕鬆掌握正則表示式findall函式詳解

正則表示式之grep與sed用法

正則表示式實現跨行匹配

Python正則表示式：最短匹配

JavaScript正則表示式迷你書之貪婪模式-學習筆記

python 正則表示式與JSON-正則表示式匹配數字、非數字、字元、非字元、貪婪模式、非貪婪模式、匹配次數指定等

正則表示式中的多行和非貪婪模式

輕鬆入門正則表示式之非貪婪匹配篇詳解

非貪婪匹配 (.*?)

非貪婪匹配 .*?

相關推薦

非貪婪匹配 `(.*?)`

非貪婪匹配 `.*?`