1. 程式人生 > >Python爬蟲--正則表示式

Python爬蟲--正則表示式

什麼是正則表示式?
正則表示式,又稱規則表示式。(英語:Regular Expression,在程式碼中常簡寫為regex、regexp或RE),電腦科學的一個概念。正則表示式通常被用來檢索、替換那些符合某個模式(規則)的文字。
Python交流群:942913325
概念
正則表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成一個“規則字串”,這個“規則字串”用來表達對字串的一種過濾邏輯。
在這裡插入圖片描述
正則表示式的特點是:

  1. 靈活性、邏輯性和功能性非常強;
  2. 可以迅速地用極簡單的方式達到字串的複雜控制。
  3. 對於剛接觸的人來說,比較晦澀難懂。

為什麼要用正則表示式?

  1. 給定的字串是否符合正則表示式的過濾邏輯(稱作“匹配”):
  2. 可以通過正則表示式,從字串中獲取我們想要特定部分。
    在這裡插入圖片描述
    第一個正則表示式:
    在這裡插入圖片描述
    語法:
    在這裡插入圖片描述在這裡插入圖片描述在這裡插入圖片描述在這裡插入圖片描述
    正則表示式在python中的用法:
    在這裡插入圖片描述
    課程:https://www.imooc.com/learn/550(PS:以上圖片內容均來自該課程)