国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 語言 > PHP > 正文

PHP中的遞歸正則表達式用法

2024-09-04 11:47:26
字體:
來源:轉載
供稿:網友

什么時候會用到遞歸正則表達式呢? 當然是待匹配的字串中遞歸地出現某種模式時(貌似廢話),最經典的例子,就是遞歸正則處理嵌套括號的問題了.

例子如下:假設你的文本中包含了正確配對的嵌套括號,括號的深度可以是無限層,你想捕獲這樣的括號組.

恕我劇透,標準答案是這樣的,代碼如下:

  1. <?php 
  2. $string = "some text (a(b(c)d)e) more text"
  3. if(preg_match("/(([^()]+|(?R))*)/",$string,$matches)) 
  4.     echo "<pre>"; print_r($matches); echo "</pre>"
  5. ?>  
  6. /* 
  7. 其輸出結果是: 
  8.  Array 
  9. ( 
  10.     [0] => (a(b(c)d)e) 
  11.     [1] => e     
  12. ) 
  13. */ 

可見,我們所需要的文本,已經捕獲到$matches[0]中了.

現在思考原理:上面的正則表達式中的關鍵點是(?R).(?R)的作用就是遞歸地替換它所在的整條正則表達式. 在每次迭代時, PHP 語法分析器都會將(?R)替換為”(([^()]+|(?R))*)“.

因此,具體到上述的例子,其正則表達式等價于如下代碼:

"/(([^()]+|(([^()]+|(([^()]+)*))*))*)/"

但是上面的代碼只適合深度為3層的括號,對于未知深度的括號嵌套,就只好使用這種正則了,代碼如下:

"/(([^()]+|(?R))*)/"

它不但能夠匹配無限深度,還簡化了正則表達式的語法,功能強大,語法簡潔,現在來細看一下"/(([^()]+|(?R))*)/"是怎樣匹配"(a(b(c)d)e)"的:

1."(c)"這部分被正則式 "(([^()]+)*)" 匹配. 請注意, (c) 其實就相當于整個遞歸的一個縮影, 麻雀雖小五臟俱全, 因此它用到了整個正則表達式,換言之,下一步中的(c), 可以使用(?R) 來匹配.

2.(b(c)d)的匹配過程為: 

1."("匹配"(";

2."[^()]+"匹配"b";

3. (?R)匹配"(c)";

4."[^()]+"匹配"d";

5.")"匹配")".

根據上面的匹配原理,不難理解為什么數組的第2個元素$matches[1]與'e'等價.子串'e'是在最后一次匹配迭代中被捕獲,匹配過程中,只有最后一次的捕獲結果才會保存到數組中.

rex注:關于這個特性,可以自行嘗試一下,看看使用正則式([a-z]+[0-9]+)+來匹配字串abc123xyz890, 其捕獲結果$1是什么,注意,其結果與 Left Longest 原理并不沖突.

如果我們只需要捕獲 $matches[0],可以這樣做,代碼如下:

  1.  <?php 
  2.     $string = "some text (a(b(c)d)e) more text"
  3.     if(preg_match("/((?:[^()]+|(?R))*)/",$string,$matches)) 
  4.     { 
  5.         echo "<pre>"; print_r($matches); echo "</pre>"
  6.     } 
  7. ?>  
  8. //產生的結果相同: 
  9.  Array 
  10.     ( 
  11.      [0] => (a(b(c)d)e) 
  12.     ) 

所做的改動是捕獲括號()改為非捕獲捕獲括號(?:)了.

還可以進一步完善為如下代碼:

  1.  <?php 
  2.     $string = "some text (a(b(c)d)e) more text"
  3.     if(preg_match("/((?>[^()]+|(?R))*)/",$string,$matches)) 
  4.     { 
  5.         echo "<pre>"; print_r($matches); echo "</pre>"
  6.     } 
  7. ?> 

這里我們用到了所謂的一次性模式(rex注:余晟先生譯的《精通正則表達式v3.0》中,謂之”固化分組”. 可參考該書.) PHP手冊也推薦只要條件允許,就盡可能使用這種模式,以便提升正則表達式的速度.

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 沙雅县| 揭东县| 凤山市| 山西省| 曲水县| 大洼县| 桐庐县| 宽甸| 星子县| 兴和县| 湛江市| 洛川县| 富蕴县| 芦溪县| 宜章县| 洪雅县| 成都市| 同德县| 华阴市| 醴陵市| 克拉玛依市| 思南县| 抚州市| 达尔| 平度市| 纳雍县| 蓝田县| 舟山市| 元氏县| 太仆寺旗| 当雄县| 中江县| 滁州市| 分宜县| 务川| 潢川县| 古蔺县| 勐海县| 宣武区| 沙坪坝区| 建始县|