溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

正則表達式匹配不包含某些字符串的技巧有哪些

發(fā)布時間:2021-09-29 14:25:54 來源:億速云 閱讀:480 作者:小新 欄目:互聯(lián)網(wǎng)科技

這篇文章主要介紹了正則表達式匹配不包含某些字符串的技巧有哪些,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

經(jīng)常我們會遇到想找出不包含某個字符串的文本,程序員最容易想到的是在正則表達式里使用,^(hede)來過濾”hede”字串,但這種寫法是錯誤的。我們可以這樣寫:[^hede],但這樣的正則表達式完全是另外一個意思,它的意思是字符串里不能包含‘h',‘e',‘d'三個但字符。那什么樣的正則表達式能過濾出不包含完整“hello”字串的信息呢?

事實上,說正則表達式里不支持逆向匹配并不是百分之百的正確。就像這個問題,我們就可以使用否定式查找來模擬出逆向匹配,從而解決我們的問題:

^((?!hede).)*$

上面這個表達式就能過濾出不包含‘hede'字串的信息。我上面也說了,這種寫法并不是正則表達式“擅長”的用法,但它是可以這樣用的。

解釋

一個字符串是由n個字符組成的。在每個字符之前和之后,都有一個空字符。這樣,一個由n個字符組成的字符串就有n+1個空字符串。我們來看一下“ABhedeCD”這個字符串:

正則表達式匹配不包含某些字符串的技巧有哪些

所有的e編號的位置都是空字符。表達式(?!hede).會往前查找,看看前面是不是沒有“hede”字串,如果沒有(是其它字符),那么.(點號)就會匹配這些其它字符。這種正則表達式的“查找”也叫做“zero-width-assertions”(零寬度斷言),因為它不會捕獲任何的字符,只是判斷。

在上面的例子里,每個空字符都會檢查其前面的字符串是否不是‘hede',如果不是,這.(點號)就是匹配捕捉這個字符。表達式(?!hede).只執(zhí)行一次,所以,我們將這個表達式用括號包裹成組(group),然后用*(星號)修飾——匹配0次或多次:

((?!hede).)*。


你可以理解,正則表達式((?!hede).)*匹配字符串"ABhedeCD"的結(jié)果false,因為在e3位置,(?!hede)匹配不合格,它之前有"hede"字符串,也就是包含了指定的字符串。

在正則表達式里, ?! 是否定式向前查找,它幫我們解決了字符串“不包含”匹配的問題。

以下是一些補充:

分享下php生成隨機數(shù)的三種方法,生成1-10之間的不重復(fù)隨機數(shù),php生成不重復(fù)隨機數(shù)的例子,需要的朋友參考下。

在hacker news上看到regex golf,幾道很有趣的正則表達式的題,有的需要用到不匹配這種匹配,比如需要匹配不包含某個單詞的串。

開始正題之前,先來看看正則表達式的語法:

[abc] a或b或c . 任意單個字符 a? 零個或一個a
[^abc] 任意不是abc的字符 \s 空格 a* 零個或多個a
[a-z] a-z的任意字符 \S 非空格 a+ 一個或多個a
[a-zA-Z] a-z或A-Z \d 任意數(shù)字 a{n} 正好出現(xiàn)n次a
^ 一行開頭 \D 任意非數(shù)字 a{n,} 至少出現(xiàn)n次a
$ 一行末尾 \w 任意字母數(shù)字或下劃線 a{n,m} 出現(xiàn)n-m次a
(...) 括號用于分組 \W 任意非字母數(shù)字或下劃線 a*? 零個或多個a(非貪婪)
(a|b) a或b \b 單詞邊界 (a)...\1 引用分組
(?=a) 前面有a (?!a) 前面沒有a \B 非單詞邊界

正則表達式中有(?=a)和(?!a)來表示我們是否需要匹配某個東西。

所以,有需要不匹配某樣內(nèi)容時,就可以用(?!a)了。比如要匹配不含hello的字符串就可以這樣寫。


^(?!.*hello)

這里.*用來表示hello之前可能有其他的字符,為什么還要加^呢,因為如果不加的話,可能匹配到h之后的這個位置上了。

現(xiàn)在就可以解決regex golf上的abba這道題了。
這道題是去匹配不含abba這種形式的單詞,比如abba,anallagmatic就不應(yīng)該匹配上。

正則表達式代碼:

^(?!.*(.)(.)\2\1)

然后利用不匹配,還可以解決prime這道題,這道題匹配有素數(shù)個x的串,先看正則。
 

^(?!(xx+)\1+$)

(xx+)是匹配2個及2個以上的x,(xx+)\1+就是匹配重復(fù)出現(xiàn)2個及以上的串,所以(xx+)\1+就表示了那些非素數(shù)的串,那么素數(shù)串就是除去這些非素數(shù)串,即是以上的正則表達式了。

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“正則表達式匹配不包含某些字符串的技巧有哪些”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI