溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

正則如何實(shí)現(xiàn)固化分組提高效率

發(fā)布時(shí)間:2021-12-29 17:09:15 來(lái)源:億速云 閱讀:90 作者:小新 欄目:互聯(lián)網(wǎng)科技

這篇文章主要介紹了正則如何實(shí)現(xiàn)固化分組提高效率,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

具體來(lái)說(shuō),使用「(?>…)」的匹配與正常的匹配并無(wú)差別,但是如果匹配進(jìn)行到此結(jié)構(gòu)之后(也就是,進(jìn)行到閉括號(hào)之后),那么此結(jié)構(gòu)體中的所有備用狀態(tài)都會(huì)被放棄(不能被回溯)。
  也就是說(shuō),在固化分組匹配結(jié)束時(shí),它已經(jīng)匹配的文本已經(jīng)固化為一個(gè)單元,只能作為整體而保留或放棄。括號(hào)內(nèi)的子表達(dá)式中未嘗試過(guò)的備用狀態(tài)都不復(fù)存在了,所以回溯永遠(yuǎn)也不能選擇其中的狀態(tài)(至少是,當(dāng)此結(jié)構(gòu)匹配完成時(shí),“鎖定(locked in)”在其中的狀態(tài))。
例子:
  比如要處理一批數(shù)據(jù),原來(lái)格式為123.456,后來(lái)因?yàn)楦↑c(diǎn)數(shù)顯示問(wèn)題,部分?jǐn)?shù)據(jù)格式變?yōu)?23.456000000789這種,,要求做到只保留小數(shù)點(diǎn)后面2-3位,但是,最后一位不能為0,這個(gè)正則如何寫呢?(下面直接考慮小數(shù)點(diǎn)后面的數(shù)字),寫出正則之后,我們還要用這個(gè)正則去匹配數(shù)據(jù),把原來(lái)的數(shù)據(jù)替換成匹配的結(jié)果。

正則一、

代碼如下:


$str = preg_replace('\.(\d\d[1-9]?)\d*','\\1',$str);
//匹配結(jié)果的group1進(jìn)行反向引用


很明顯,這種寫法,對(duì)于部分?jǐn)?shù)據(jù)格式為123.456的這種格式,白白的處理了一遍,為了提高效率,我們還要對(duì)這個(gè)正則進(jìn)行處理。從123.456這個(gè)字符串跟其他的比較一下,我們發(fā)現(xiàn),是疑問(wèn)123.456這個(gè)數(shù)據(jù)后面沒(méi)數(shù)字了,所以,白白處理一遍。那好辦,我們對(duì)這個(gè)正則改造一下,把后面的量詞*改成+,這樣對(duì)于123.45 小數(shù)點(diǎn)后面1,2位數(shù)字的,不會(huì)去白白處理,而且,對(duì)三位以上數(shù)字的,處理正常。其PHP代碼為

正則二、

代碼如下:


$str = preg_replace('\.(\d\d[1-9]?)\d+','\\1',$str);


好了,這個(gè)正則真的沒(méi)問(wèn)題嗎??下面,我們也分析一下這個(gè)正則的匹配過(guò)程吧。
  字符串"123.456",正則表達(dá)式為【\.(\d\d[1-9]?)\d+】,我們來(lái)看下

  首先(小數(shù)點(diǎn)前123不說(shuō)了),
  【\.】匹配".",匹配成功,把控制權(quán)給下一個(gè)【\d】,【\d】匹配“4”成功,把控制權(quán)給第二個(gè)【\d】,這個(gè)【\d】匹配“5”成功,然后,把控制權(quán)給了【[1-9]?】,由于量詞是【?】,正則表達(dá)式遵循“量詞優(yōu)先匹配”,而且,此處是【?】,還會(huì)留下一個(gè)回溯點(diǎn)。然后匹配"6"成功,然后把控制權(quán)給【\d+】,【\d+】發(fā)現(xiàn)后面沒(méi)字符了,最遵循“后進(jìn)先出”規(guī)則,回到上一個(gè)回溯點(diǎn),進(jìn)行匹配,這時(shí),【[1-9]?】會(huì)交還出其匹配的字符“6”,【[1-9]?】匹配“6”成功。匹配完成了。大家發(fā)現(xiàn)【(\d\d[1-9]?)】匹配的結(jié)果確是"45",并不是我們想要的“456”,“6”被【\d+】匹配去了。那么,我們?cè)撊绾无k呢? 能否讓【[1-9]?】匹配一旦成功,不進(jìn)行回溯呢?這就用到了我們上面說(shuō)的"固化分組", PHP(preg_replace函數(shù))中使用的正則引擎支持固化分組,我們根據(jù)固化分組的寫法,可以把代碼改成如下方式

正則三、

代碼如下:


$str = preg_replace('\.(\d\d(?>[1-9]?))\d+','\\1',$str);


改成這樣的話,那字符串“123.456“是不符合要求,不會(huì)被匹配的。那我們就可以實(shí)現(xiàn)我們的要求了。

  所以,讓我們來(lái)看(\.\d\d(?>[1-9]?))\d+。
  在固化分組內(nèi),量詞能夠正常工作,所以如果[1-9]不能匹配,正則表達(dá)式會(huì)返回? 留下的備用狀態(tài)。然后匹配脫離固化分組,繼續(xù)前進(jìn)到「\d+」。在這種情況下,當(dāng)控制權(quán)離開(kāi)固化分組時(shí),沒(méi)有備用狀態(tài)需要放棄(因?yàn)樵诠袒纸M中沒(méi)有創(chuàng)建任何備用狀態(tài))。
  如果[1-9] 能夠匹配,匹配脫離固化分組之后,「? 」保存的備用狀態(tài)仍然存在。但是,因?yàn)樗鼘儆谝呀?jīng)結(jié)束的固化分組,所以會(huì)被拋棄。
  匹配‘.625'或者‘.625000'時(shí)就會(huì)發(fā)生這種情況。在后一種情況下,放棄那些狀態(tài)不會(huì)帶來(lái)任何麻煩,因?yàn)椤竆d+」匹配的是‘.625000',到這里正則表達(dá)式已經(jīng)完成匹配。但是對(duì)于‘.625'來(lái)說(shuō),因?yàn)椤竆d+」無(wú)法匹配,正則引擎需要回溯,但回溯又無(wú)法進(jìn)行,因?yàn)閭溆脿顟B(tài)已經(jīng)不存在了。既然沒(méi)有能夠回溯的備用狀態(tài),整體匹配也就失敗,‘.625'不需要處理,而這正是我們期望的。

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“正則如何實(shí)現(xiàn)固化分組提高效率”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來(lái)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI