1. 程式人生 > 實用技巧 >PHP正則表示式核心技術完全詳解 第11節 貪婪匹配與禁止貪婪

PHP正則表示式核心技術完全詳解 第11節 貪婪匹配與禁止貪婪

作者:極客小俊 一個專注於web技術的80後
我不用拼過聰明人,我只需要拼過那些懶人 我就一定會超越大部分人!
CSDN@極客小俊,原創文章, B站技術分享
個人部落格: cnblogs.com
前端html+css+javascript技術討論交流群: 281499395
後端php+mysql+Linux技術交流群: 855256321

PHP正則表示式中的貪婪匹配與 (禁止貪婪)


貪婪匹配

什麼是貪婪匹配呢?
廢話不多說 先看一段程式碼案例把 如下:

$string='aaaaaaabbbbbbbbbbbbccccccc';
//如下
$pattern='/ab+/';
//或者說是如下
$pattern='/ab.+/';
preg_match($pattern, $string,$arr);
show($arr);

php正則表示式預設就是貪婪的 解決貪婪匹配 的辦法就是用 ? 號
所以阻止貪婪一般加? 來解決
程式碼如下:

$string='aaaaaaabbbbbbbbbbbbccccccc';
//如下
$pattern='/ab+?/';
//或者說是如下
$pattern='/ab.+?/';
preg_match($pattern, $string,$arr);
show($arr);

小案例1:
這裡跟加不加s 視為單行字元有關係, 因為加了s 視為單行以後會產生貪婪匹配、所以阻止貪婪後 在進行全域性搜尋匹配!
程式碼如下:

$string='test test http://www.163.com test test <a href="http://www.baidu.com">百度</a>
 test test test <a href="http://www.sina.com">新浪</a>';

//匹配網址
$pattern='/http:\/\/(ftp|www)\.\w+.(com|org|net)/';
//匹配href的內容  這裡不加? 就會出現貪婪匹配
$pattern='/href="(.+?)"/s';

preg_match_all($pattern, $string,$arr);
show($arr);


小案例2:
刪除某一個class檔案中的所有註釋 例如:Car.class.php檔案
內容如下:

<?php

/**
* @description
* @author 3#
*/
interface Car{
   function run();
}


/**
* 
* @description 寶馬車類
*
*/
class Bmw implements Car{
   public function run(){
       echo '寶馬車子在跑!!';
   }
}


/**
* @description 賓士車類
*
*/
class Bz implements Car{
   public function run(){
       echo '賓士車子在跑!!';
   }
}


// $Bmw=new Bmw();
// $Bmw->run();
// echo '<br>';
// $Bz=new Bz();
// $Bz->run();

?>

然後處理這個Car.class.php中的註釋,把裡面的註釋都刪掉
通常我們是如下處理的

//載入檔案
$file='./Car.class.php';
$content=file_get_contents($file);
//正則匹配
$pattern='/\/\*\*.*\*\//s';
//替換為空
$result=preg_replace($pattern, '', $content);
//最後把處理好的字元重新寫入帶檔案中
file_put_contents($file, $result);

以上這樣處理看似沒什麼問題,但是當你開啟Car.class.php這個檔案的時候你要大吃一驚的!! 現在Car.class.php裡面應該只剩下 下面這個類了 其他的都不見了!!

class Bz implements Car{
    public function run(){
        echo '賓士車子在跑!!';
    }
}

原因:如果這樣替換會產生如下情況: 原因是;貪婪匹配 .* 匹配了/* 開始一直到 /結尾、 中間無論什麼內容都被視為 . 的範疇之內了!

禁止貪婪

正確的做法是加上? 號 阻止貪婪匹配
程式碼如下:

//載入檔案
$file='./Car.class.php';
$content=file_get_contents($file);
//正則匹配 並且禁止貪婪
$pattern='/\/\*\*.*?\*\//s';
//替換為空
$result=preg_replace($pattern, '', $content);
//最後把處理好的字元重新寫入帶檔案中
file_put_contents($file, $result);

結果Car.class.php檔案中的註釋就全部刪除了 ,Car.class.php檔案中的程式碼如下:

interface Car{
    function run();
}



class Bmw implements Car{
    public function run(){
        echo '寶馬車子在跑!!';
    }
}



class Bz implements Car{
    public function run(){
        echo '賓士車子在跑!!';
    }
}

小案例3:
查詢a出現1次到5次, 也包含之間的, 這種預設也是貪婪的,因為它會取出最大匹配的那一次! 也就是5次
如下程式碼:

$string='cbaaaaaa';
$pattern='/ba{1,5}/is';
preg_match($pattern, $string,$arr);
show($arr);

加上 ? 號 以後 就可以阻止貪婪匹配 並且取出最小匹配次數
如下程式碼:

$string='cbaaaaaa';
$pattern='/ba{1,5}?/is';
preg_match($pattern, $string,$arr);
show($arr);

小提示: ??兩個 問號就是完全取最小的
一個? 號表示取 0或者 1
兩個?號就表示禁止貪婪 取完全最小值0,
例如:案例中一個?號表示還是取了1個a ,但是兩個??問號就一定沒有a了 因為兩個?? 號表示0、等同於這樣寫: /ba{0}/
程式碼如下:

$string='cbaaaaaa';
$pattern='/ba??/is';
preg_match($pattern, $string,$arr);
show($arr);

"點贊" "評論" "收藏"

大家的支援就是我堅持下去的動力!

如果以上內容有任何錯誤或者不準確的地方,歡迎在下面