溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

正則表達式中如何匹配一組字符

發(fā)布時間:2021-08-25 09:50:06 來源:億速云 閱讀:96 作者:小新 欄目:互聯(lián)網(wǎng)科技

這篇文章主要為大家展示了“正則表達式中如何匹配一組字符”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“正則表達式中如何匹配一組字符”這篇文章吧。

具體如下:

注:在所有例子中正則表達式匹配結(jié)果包含在源文本中的【和】之間,有的例子會使用Java來實現(xiàn),如果是java本身正則表達式的用法,會在相應(yīng)的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

一、匹配多個字符中的某一個

匹配以na或sa開頭的文本文件例子中,使用的正則表達式是.a.\.txt。如果還有一個文件是cal.txt,那么也將會被匹配到。如果只想要匹配na或sa開頭的文件,該怎么辦呢?

既然只想找出n或s,使用可以匹配任何字符的.顯然是不行的。在正則表達式中,我們可以使用[和]來定義一個字符集合,在使用[和]來定義的字符集合里,這兩個元字符之間的所有字符都是該集合的組成部分,字符集合的匹配結(jié)果是能夠與該集合里的任何一個成員相匹配的的文本。

文本:

sales.txt

na1.txt

na2.txt

sa1.txt

sanatxt.txt

cal.txt

正則表達式:[ns]a.\.txt

結(jié)果:

sales.txt

【na1.txt】

【na2.txt】

【sa1.txt】

sanatxt.txt

cal.txt

分析:這里使用的正則表達式是以[na]開頭,這個集合將匹配字符n或s,不會匹配其他任何字符。[和]不匹配任何字符,它們只負責(zé)定義一個字符集合。接下來a匹配一個字符a,\.將匹配一個.字符本身,txt匹配txt字符本身,匹配結(jié)果與我們預(yù)期的一致。

但是,如果文件中如果有一個文件是usa1.txt,那么它也會被匹配出來。這是位置匹配的問題,在后面將會討論到。

二、使用字符集合區(qū)間

上面的例子中,如果我們只想匹配以na或sa開頭,后面跟一個數(shù)字的文件怎么辦?正則表達式[ns]a.\.txt中,.將會匹配到任意一個字符,包括數(shù)字。這個問題可以使用字符集合來解決:

sales.txt

na1.txt

na2.txt

sa1.txt

san.txt

sanatxt.txt

cal.txt

正則表達式:[ns]a[0123456789]\.txt

結(jié)果:

sales.txt

【na1.txt】

【na2.txt】

【sa1.txt】

san.txt

sanatxt.txt

cal.txt

分析:從結(jié)果可以看到,我們只匹配出來以na或sa開頭,后面跟一個數(shù)字的文件,而san.txt沒有被匹配出來,因為使用了字符集合[0123456789]來限定第三個字符只能是數(shù)字。

在正則表達式中,會很頻繁的使用到一些字符區(qū)間,比如0-9,a-z等等,為了簡化字符區(qū)間的定義,正則表達式提供了一個特殊的元字符-來定義字符區(qū)間。像上面這個例子,我們可以使用正則表達式來匹配:[ns]a[0-9]\.txt,結(jié)果與上面完全一樣。

字符區(qū)間不僅限于數(shù)字,像下面這些都是合法的字符區(qū)間:

[A-F]:匹配從A到F的所有大寫字母。

[A-Z]:匹配從A到Z的所有大寫字母。

[A-z]:匹配從ASCII字符A到ASCII字符z的所有字母。但這個區(qū)間一般不會用到,只是舉例說明。因為它們之間還包含著[和^等在ASCII中排列在Z和a之間的字符。

字符區(qū)間的首尾字符可以是ASCII字符列表中的任意字符。但在實際使用中,最常用的還是數(shù)字和字母字符區(qū)間。

注意:在定義字符區(qū)間的時候,不能讓區(qū)間的尾字符小于首字符(如[9-0]),這是不允許的。-作為元字符只能出現(xiàn)在[和]之間,如果在[和]之外的任何地方,它只是一個普通的字符,只會與-本身匹配。

在同一個字符集合中可以給出多個字符區(qū)間,比如:[0-9a-zA-Z]將匹配任意一個大小寫字母和數(shù)字。

來看一下匹配網(wǎng)頁中顏色的例子:

文本:

<span >測試</span>

正則表達式:#[0-9A-Fa-f] [0-9A-Fa-f] [0-9A-Fa-f] [0-9A-Fa-f] [0-9A-Fa-f] [0-9A-Fa-f]

結(jié)果:<span style="background-color:【#3636FF】;height:30px; width:60px;">測試</span>

分析:在網(wǎng)頁中,顏色一般表示為一個以#開頭的RGB值,R代表紅色,G代表綠色,B代表藍色,任何一種顏色都可以通過RGB的不同組合調(diào)和出來。RGB值用16進值表示,如#000000代表白色,#FFFFFF代表黑色,#FF0000代表紅色。所以網(wǎng)頁中匹配顏色的正則表達式是以#開頭,后面跟6個相同的[0-9A-Fa-f]字符集合(這可以簡寫成#[0-9A-Fa-f]{6},會在后面的重復(fù)匹配中討論到)。

三、取非匹配

字符集合通常用來指定一組必須匹配其中之一的字符,但在某些場合,我們需要反過來做,給出一組不需要得到的字符,換句話說,除了在那個字符集合中的字符,其他的任意字符都可以匹配。

比如,要匹配以na或sa開頭,后面跟的不是數(shù)字的文件:

文本:

sales.txt

na1.txt

na2.txt

sa1.txt

sanatxt.txt

san.txt

正則表達式:[ns]a[^0-9]\.txt

結(jié)果:

sales.txt

na1.txt

na2.txt

sa1.txt

sanatxt.txt

【san.txt】

分析:這個例子使用的模式正好與前面的相反,前面[0-9]只匹配數(shù)字,而這里[^0-9]匹配的是非數(shù)字。

注意:^在[和]之間表示取非,如果出現(xiàn)在正則表達式的開頭,表示位置匹配匹配了,這將在后面討論到。同時,^的效果將作用于給定字符集合里的所有字符或字符區(qū)間,而不僅限于緊跟在^字符后面的那一個字符或字符區(qū)間。如[^0-9a-z]表示不匹配任何數(shù)字或小寫字母。

以上是“正則表達式中如何匹配一組字符”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI