PHP正則表示式核心技術完全詳解 第11節 貪婪匹配與禁止貪婪
作者:極客小俊 一個專注於web技術的80後
我不用拼過聰明人,我只需要拼過那些懶人 我就一定會超越大部分人!
CSDN@極客小俊,原創文章, B站技術分享
個人部落格: cnblogs.com
前端html+css+javascript技術討論交流群: 281499395
後端php+mysql+Linux技術交流群: 855256321
PHP正則表示式中的貪婪匹配與 (禁止貪婪)
貪婪匹配
什麼是貪婪匹配呢?
廢話不多說 先看一段程式碼案例把 如下:
$string='aaaaaaabbbbbbbbbbbbccccccc'; //如下 $pattern='/ab+/'; //或者說是如下 $pattern='/ab.+/'; preg_match($pattern, $string,$arr); show($arr);
php正則表示式預設就是貪婪的 解決貪婪匹配 的辦法就是用 ? 號
所以阻止貪婪一般加? 來解決
程式碼如下:
$string='aaaaaaabbbbbbbbbbbbccccccc';
//如下
$pattern='/ab+?/';
//或者說是如下
$pattern='/ab.+?/';
preg_match($pattern, $string,$arr);
show($arr);
小案例1:
這裡跟加不加s 視為單行字元有關係, 因為加了s 視為單行以後會產生貪婪匹配、所以阻止貪婪後 在進行全域性搜尋匹配!
程式碼如下:
$string='test test http://www.163.com test test <a href="http://www.baidu.com">百度</a> test test test <a href="http://www.sina.com">新浪</a>'; //匹配網址 $pattern='/http:\/\/(ftp|www)\.\w+.(com|org|net)/'; //匹配href的內容 這裡不加? 就會出現貪婪匹配 $pattern='/href="(.+?)"/s'; preg_match_all($pattern, $string,$arr); show($arr);
小案例2:
刪除某一個class檔案中的所有註釋 例如:Car.class.php檔案
內容如下:
<?php /** * @description * @author 3# */ interface Car{ function run(); } /** * * @description 寶馬車類 * */ class Bmw implements Car{ public function run(){ echo '寶馬車子在跑!!'; } } /** * @description 賓士車類 * */ class Bz implements Car{ public function run(){ echo '賓士車子在跑!!'; } } // $Bmw=new Bmw(); // $Bmw->run(); // echo '<br>'; // $Bz=new Bz(); // $Bz->run(); ?>
然後處理這個Car.class.php中的註釋,把裡面的註釋都刪掉
通常我們是如下處理的
//載入檔案
$file='./Car.class.php';
$content=file_get_contents($file);
//正則匹配
$pattern='/\/\*\*.*\*\//s';
//替換為空
$result=preg_replace($pattern, '', $content);
//最後把處理好的字元重新寫入帶檔案中
file_put_contents($file, $result);
以上這樣處理看似沒什麼問題,但是當你開啟Car.class.php這個檔案的時候你要大吃一驚的!! 現在Car.class.php裡面應該只剩下 下面這個類了 其他的都不見了!!
class Bz implements Car{
public function run(){
echo '賓士車子在跑!!';
}
}
原因:如果這樣替換會產生如下情況: 原因是;貪婪匹配 .* 匹配了/* 開始一直到 /結尾、 中間無論什麼內容都被視為 . 的範疇之內了!
禁止貪婪
正確的做法是加上? 號 阻止貪婪匹配
程式碼如下:
//載入檔案
$file='./Car.class.php';
$content=file_get_contents($file);
//正則匹配 並且禁止貪婪
$pattern='/\/\*\*.*?\*\//s';
//替換為空
$result=preg_replace($pattern, '', $content);
//最後把處理好的字元重新寫入帶檔案中
file_put_contents($file, $result);
結果Car.class.php檔案中的註釋就全部刪除了 ,Car.class.php檔案中的程式碼如下:
interface Car{
function run();
}
class Bmw implements Car{
public function run(){
echo '寶馬車子在跑!!';
}
}
class Bz implements Car{
public function run(){
echo '賓士車子在跑!!';
}
}
小案例3:
查詢a出現1次到5次, 也包含之間的, 這種預設也是貪婪的,因為它會取出最大匹配的那一次! 也就是5次
如下程式碼:
$string='cbaaaaaa';
$pattern='/ba{1,5}/is';
preg_match($pattern, $string,$arr);
show($arr);
加上 ? 號 以後 就可以阻止貪婪匹配 並且取出最小匹配次數
如下程式碼:
$string='cbaaaaaa';
$pattern='/ba{1,5}?/is';
preg_match($pattern, $string,$arr);
show($arr);
小提示: ??兩個 問號就是完全取最小的
一個? 號表示取 0或者 1
兩個?號就表示禁止貪婪 取完全最小值0,
例如:案例中一個?號表示還是取了1個a ,但是兩個??問號就一定沒有a了 因為兩個?? 號表示0、等同於這樣寫: /ba{0}/
程式碼如下:
$string='cbaaaaaa';
$pattern='/ba??/is';
preg_match($pattern, $string,$arr);
show($arr);
"點贊" "評論" "收藏"