1. 程式人生 > 實用技巧 >正則表示式re模組的高階用法——Python

正則表示式re模組的高階用法——Python

findall

sub 將匹配到的資料進行替換

需求:匹配出文章閱讀的次數

#coding=utf-8
import re

ret = re.search(r"\d+", "閱讀次數為 9999")
ret.group()

執行:

'9999'

需求:統計出python、c、c++相應文章閱讀的次數

#coding=utf-8
import re

ret = re.findall(r"\d+", "python = 9999, c = 7890, c++ = 12345")
print(ret)

執行:

['9999', '7890', '
12345']

需求:將匹配到的閱讀次數加1

方法1:

#coding=utf-8
import re

ret = re.sub(r"\d+", '998', "python = 997")
print(ret)

執行:

python = 998

方法2:

#coding=utf-8
import re

def add(temp):
    strNum = temp.group()
    num = int(strNum) + 1
    return str(num)

ret = re.sub(r"\d+", add, "python = 997"
) print(ret) ret = re.sub(r"\d+", add, "python = 99") print(ret)

執行:

python = 998
python = 100

練習

從下面的字串中取出文字

<div>
        <p>崗位職責:</p>
<p>完成推薦演算法、資料統計、介面、後臺等伺服器端相關工作</p>
<p><br></p>
<p>必備要求:</p>
<p>良好的自我驅動力和職業素養,工作積極主動、結果導向</p>
<p>&nbsp;<br></p>
<p>技術要求:</p>
<p>1、一年以上 Python 開發經驗,掌握面向物件分析和設計,瞭解設計模式</p>
<p>2、掌握HTTP協議,熟悉MVC、MVVM等概念以及相關WEB開發框架</p>
<p>3、掌握關係資料庫開發設計,掌握 SQL,熟練使用 MySQL/PostgreSQL 中的一種<br></p>
<p>4、掌握NoSQL、MQ,熟練使用對應技術解決方案</p>
<p>5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js</p>
<p>&nbsp;<br></p>
<p>加分項:</p>
<p>大資料,數理統計,機器學習,sklearn,高效能,大併發。</p>

        </div>

參考答案:

re.sub(r"<[^>]*>|&nbsp;|\n", "", test_str)

split 根據匹配進行切割字串,並返回一個列表

需求:切割字串“info:xiaoZhang 33 shandong”

#coding=utf-8
import re

ret = re.split(r":| ","info:xiaoZhang 33 shandong")
print(ret)

執行:

['info', 'xiaoZhang', '33', 'shandong']