国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Regex > 正文

正則用(?…)實現固化分組提高效率

2020-03-16 21:09:14
字體:
來源:轉載
供稿:網友
用(?>…)實現固化分組(成功匹配后,回簌時不會考慮這個匹配的字符)
 
 
具體來說,使用「(?>…)」的匹配與正常的匹配并無差別,但是如果匹配進行到此結構之后(也就是,進行到閉括號之后),那么此結構體中的所有備用狀態都會被放棄(不能被回溯)。 
  也就是說,在固化分組匹配結束時,它已經匹配的文本已經固化為一個單元,只能作為整體而保留或放棄。括號內的子表達式中未嘗試過的備用狀態都不復存在了,所以回溯永遠也不能選擇其中的狀態(至少是,當此結構匹配完成時,“鎖定(locked in)”在其中的狀態)。 
例子: 
  比如要處理一批數據,原來格式為123.456,后來因為浮點數顯示問題,部分數據格式變為123.456000000789這種,,要求做到只保留小數點后面2-3位,但是,最后一位不能為0,這個正則如何寫呢?(下面直接考慮小數點后面的數字),寫出正則之后,我們還要用這個正則去匹配數據,把原來的數據替換成匹配的結果。 

正則一、 
復制代碼代碼如下:

$str = preg_replace('/.(/d/d[1-9]?)/d*','//1',$str); 
//匹配結果的group1進行反向引用 

很明顯,這種寫法,對于部分數據格式為123.456的這種格式,白白的處理了一遍,為了提高效率,我們還要對這個正則進行處理。從123.456這個字符串跟其他的比較一下,我們發現,是疑問123.456這個數據后面沒數字了,所以,白白處理一遍。那好辦,我們對這個正則改造一下,把后面的量詞*改成+,這樣對于123.45 小數點后面1,2位數字的,不會去白白處理,而且,對三位以上數字的,處理正常。其PHP代碼為 

正則二、 
復制代碼代碼如下:

$str = preg_replace('/.(/d/d[1-9]?)/d+','//1',$str); 

好了,這個正則真的沒問題嗎??下面,我們也分析一下這個正則的匹配過程吧。 
  字符串"123.456",正則表達式為【/.(/d/d[1-9]?)/d+】,我們來看下 

  首先(小數點前123不說了), 
  【/.】匹配".",匹配成功,把控制權給下一個【/d】,【/d】匹配“4”成功,把控制權給第二個【/d】,這個【/d】匹配“5”成功,然后,把控制權給了【[1-9]?】,由于量詞是【?】,正則表達式遵循“量詞優先匹配”,而且,此處是【?】,還會留下一個回溯點。然后匹配"6"成功,然后把控制權給【/d+】,【/d+】發現后面沒字符了,最遵循“后進先出”規則,回到上一個回溯點,進行匹配,這時,【[1-9]?】會交還出其匹配的字符“6”,【[1-9]?】匹配“6”成功。匹配完成了。大家發現【(/d/d[1-9]?)】匹配的結果確是"45",并不是我們想要的“456”,“6”被【/d+】匹配去了。那么,我們該如何辦呢? 能否讓【[1-9]?】匹配一旦成功,不進行回溯呢?這就用到了我們上面說的"固化分組", PHP(preg_replace函數)中使用的正則引擎支持固化分組,我們根據固化分組的寫法,可以把代碼改成如下方式 

正則三、 
復制代碼代碼如下:

$str = preg_replace('/.(/d/d(?>[1-9]?))/d+','//1',$str); 

改成這樣的話,那字符串“123.456“是不符合要求,不會被匹配的。那我們就可以實現我們的要求了。 

  所以,讓我們來看(/./d/d(?>[1-9]?))/d+。 
  在固化分組內,量詞能夠正常工作,所以如果[1-9]不能匹配,正則表達式會返回? 留下的備用狀態。然后匹配脫離固化分組,繼續前進到「/d+」。在這種情況下,當控制權離開固化分組時,沒有備用狀態需要放棄(因為在固化分組中沒有創建任何備用狀態)。 
  如果[1-9] 能夠匹配,匹配脫離固化分組之后,「? 」保存的備用狀態仍然存在。但是,因為它屬于已經結束的固化分組,所以會被拋棄。 
  匹配‘.625'或者‘.625000'時就會發生這種情況。在后一種情況下,放棄那些狀態不會帶來任何麻煩,因為「/d+」匹配的是‘.625000',到這里正則表達式已經完成匹配。但是對于‘.625'來說,因為「/d+」無法匹配,正則引擎需要回溯,但回溯又無法進行,因為備用狀態已經不存在了。既然沒有能夠回溯的備用狀態,整體匹配也就失敗,‘.625'不需要處理,而這正是我們期望的。
 

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 富裕县| 合肥市| 浦江县| 汉源县| 鲁甸县| 兰考县| 忻城县| 十堰市| 洛阳市| 河池市| 喀喇沁旗| 潍坊市| 克拉玛依市| 安丘市| 揭东县| 蚌埠市| 涞水县| 鄂尔多斯市| 栖霞市| 东辽县| 资兴市| 磐石市| 黔西县| 铁力市| 高雄县| 阿鲁科尔沁旗| 台安县| 巫溪县| 霍城县| 阳泉市| 衡水市| 吴桥县| 绥阳县| 石阡县| 庆安县| 大名县| 永丰县| 河池市| 枣庄市| 花垣县| 阿瓦提县|