溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Java中JDK提供三種匹配模式是什么

發(fā)布時間:2021-12-14 17:32:40 來源:億速云 閱讀:127 作者:小新 欄目:編程語言

小編給大家分享一下Java中JDK提供三種匹配模式是什么,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

匹配模式

JDK提供三種匹配模式,分別是:貪婪模式(greedy),勉強模式(reluctant)和占有模式(possessive),分別對應三種占有量詞,其中貪婪模式是默認的模式,勉強模式通過在表達式后面加一個?來表示。占有模式通過在表達式后面加一個+來表示。

三種模式的含義是什么呢?

貪婪模式的含義是:盡可能多的匹配,同時也盡量滿足整體匹配。

勉強模式的含義是:盡可能少的匹配,同時也盡量滿足整體匹配。

占有模式的含義是:盡可能多的匹配,如果因為匹配多了導致整理無法匹配,那么也不會回溯。

比如有個字符串如下:

/m/t/wd/nl/n/p/m/wd/nl/n/p/m/wd/nl/n/p/m/v/n

貪婪模式的表達式匹配:

/m/t.*/nl/n/p/m

此時匹配結果為 /m/t/wd/nl/n/p/m/wd/nl/n/p/m/wd/nl/n/p/m

勉強模式的表達式匹配:

/m/t/.*?/nl/n/p/m

此時匹配結果為 /m/t/wd/nl/n/p/m

/m/t/wdx+?/nl/n/p/m

如果是這樣,那么就匹配不上了,因為+表示至少要匹配一個,勉強模式,至少也要匹配一個,所以匹配失敗了。

占有模式的表達式匹配:

/m/t.*+/nl/n/p/m 此時無法匹配,因為.*匹配了過多的字符,導致后面無法匹配是上了。

注意:只能對可變的匹配規(guī)則使用勉強量詞或者占有量詞。比如X??表示盡量少匹配字符X,而X?卻是默認的貪婪模式,此時是盡量多匹配的含義。再如:X{n}的含義是必須準備匹配n個X  ,則此時加上其他量詞均不起作用

環(huán)視(預測)

環(huán)視是一個比較高級的主題,但是用起來卻是那么自然。

環(huán)視適用于這樣的場景:做正則匹配時,需要了解被匹配部分的前面或者后面,有或者沒有,特定的表達式,而又不因此捕獲(消耗)這些特定的表達式。

如果不使用環(huán)視,而是直接使用表達式來判斷,那么必然會導致這些被匹配的表達式被消耗掉。

舉個例子:假設我要給ILoveYou這句話斷句,原則是出現(xiàn)大寫字母則認為是一個新的單詞。

如果使用這個匹配規(guī)則:

\p{Upper}\p{Lower}*[\p{Upper}]?

的話,那么會消耗掉被匹配的大寫字母。匹配結果會是:

IL

You

這并不符合要求。

解決辦法是使用環(huán)視,正則表達式為:

\p{Upper}?\p{Lower}*(?=[\p{Upper}]?)

輸出結果為:

I

Love

You

環(huán)視有四種:

(?=X) 表示后面跟著的是正則表達式X,匹配前面的部分時,不會消耗X這一部分,同時也不會捕獲。零寬度正向肯定預測。

(?<=X) 表示前面的是正則表達式X,匹配后面的部分時,不會消耗X這一部分,同時也不會捕獲。 零寬度反向肯定預測。

(?!X) 表示后面跟著的不是正則表達式X,匹配前面的部分時,不會消耗X這一部分,同時也不會捕獲。零寬度正向否定預測。

(?!=X) 表示前面的不是正則表達式X,匹配后面的部分時,不會消耗X這一部分,同時也不會捕獲。 零寬度反向否定預測。

非捕獲占有型匹配

(?>X) 這個尚未研究清楚。

以上是“Java中JDK提供三種匹配模式是什么”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業(yè)資訊頻道!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI