溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

有哪些Java方便的正則表達(dá)式

發(fā)布時(shí)間:2021-11-02 16:40:12 來源:億速云 閱讀:120 作者:iii 欄目:web開發(fā)

這篇文章主要講解了“有哪些Java方便的正則表達(dá)式”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“有哪些Java方便的正則表達(dá)式”吧!

查找包含特定單詞的句子

假設(shè)我們想要匹配文本中包含特定單詞的所有句子。因?yàn)樾枰谒阉鹘Y(jié)果中顯示這些句子,或者想從文本中刪除它們。正則表達(dá)式/[^.!?]*\bword\b[^.!?]*.?/gi可以幫我們做到這一點(diǎn)。如下所示:

const str = "The apple tree originated in Central Asia. It is cultivated worldwide. Apple matures in late summer or autumn."  // 查找包含單詞“ apple”的句子 str.match(/[^.!?]*\bapple\b[^.!?]*.?/gi)  // 輸出結(jié)果 // => ["The apple tree originated in Central Asia.", "Apple matures in late summer or autumn."]

接著,我們來看此正則表達(dá)式含義:

  • [^.!?] 表示匹配任務(wù)字符,除了 ., !和?

  • *匹配[^.!?]結(jié)果的 0 次或者多次

  • \b 匹配單詞的邊界

  • apple 就是匹配apple(因?yàn)樗鼌^(qū)分大小寫,我們在正則表達(dá)式的末尾添加i標(biāo)志)

  • \b 匹配單詞的邊界

  • [^.!?] 表示匹配任務(wù)字符,除了 ., !和?

  • *匹配[^.!?]結(jié)果的 0 次或者多次

  • .匹配任何字符,除了換行

  • ?匹配.所匹配到的結(jié)果的 0 次或者 1 次

  • g 告訴正則表達(dá)式引擎匹配所有匹配項(xiàng),而不是在第一次匹配后停止

  • i 使搜索不區(qū)分大小寫

從文件名中去除無效字符

下載的文件時(shí),其名稱中不應(yīng)包含某些字符。例如,在 Windows 中,以下字符在文件名中無效,應(yīng)將其刪除:

  • <

  • >

  • :

  • /

  • \

  • |

  • ?

  • *

使用正則表達(dá)式,去除無效字符非常簡單。讓我們看一個(gè)例子

const str = "https://en.wikipedia.org/"  str.replace(/[<>|:"*?\\/]+/g, '') // => "httpsen.wikipedia.org"

[] 稱為字符類,JS 會把字符串與方括號之間的字符之一匹配,在配合全局(g)標(biāo)志,我們可以有效地從字符串中去除方括號內(nèi)的字符。

注意,在字符類中,反斜杠有特殊含義,必須用另一個(gè)反斜杠進(jìn)行轉(zhuǎn)義:\\。+操作符表示重復(fù)字符類,以便同時(shí)替換一系列無效字符,這有利于提高性能。當(dāng)然可以省略,對結(jié)果也沒有影響。

請記住,除非希望將無效字符替換為另一個(gè)字符,否則replace()方法的第二個(gè)參數(shù)必須為空字符串。

Windows 內(nèi)部還使用了幾個(gè)保留名稱來執(zhí)行各種任務(wù),并且這些保留名稱不允許用作文件名,保留名稱如下:

CON, PRN, AUX, NUL, COM1, COM2, COM3, COM4, COM5, COM6, COM7, COM8, COM9,  LPT1, LPT2, LPT3, LPT4, LPT5, LPT6, LPT7, LPT8, 和 LPT9

如果您想了解更多信息,Microsoft的Windows開發(fā)中心提供了有關(guān)有效文件名的詳盡文章。

要排除保留名稱,可以使用以下代碼:

str.replace(/^(CON|PRN|AUX|NUL|COM1|COM2|COM3|COM4|COM5|COM6|COM7|COM8|COM9|LPT1|LPT2|LPT3|LPT4|LPT5|LPT6|LPT7|LPT8|LPT9)$/i, 'file')

上面代碼主要是將保留字替換成指定的字符。

請注意,如果字符串包含非保留字其他字符,則不會替換。例如,會把“con”替換掉,但不會替換“concord”,所以 這是有效的文件名。

其中 ,^匹配字符串的開頭。它確保沒有其他字符出現(xiàn)在我們要匹配的字符串之前,$則匹配字符串的結(jié)尾。

我們還可以通過使用字符類以更簡單方式來簡化該正則:

str.replace(/^(CON|PRN|AUX|NUL|COM[1-9]|LPT[1-9])$/i, 'file')

[1&ndash;9]匹配 1 到 9 之間的數(shù)字。

用單個(gè)空格替換多個(gè)空格

當(dāng)網(wǎng)頁渲染時(shí),重復(fù)的空格字符被顯示為單個(gè)空格。但是,有時(shí)我們希望用戶輸入或其他數(shù)據(jù)中包含的多個(gè)空格,我們只想用用單個(gè)空格來表示。使用正則表達(dá)式可以很簡單的做到這點(diǎn):

const str = "  My    opinions may  have changed,    but not the fact that I'm right."  str.replace(/\s\s+/g, ' ') // => " My opinions may have changed, but not the fact that I'm right."

此正則表達(dá)式僅包含兩個(gè)元字符,一個(gè)運(yùn)算符和一個(gè)標(biāo)志位:

  • \s匹配單個(gè)空格字符,包括ASCII空格,制表符,換行符,回車符,垂直制表符和換頁符

  • \s 再次匹配一個(gè)空格字符

  • +與上一項(xiàng)匹配一次或多次,也就是匹配一個(gè)或多個(gè)空格

  • g 告訴正則表達(dá)式引擎匹配所有匹配項(xiàng),而不是在第一次匹配后停止

上面的結(jié)果是替換了至少重復(fù)兩次的所有空白字符。請注意,上面示例中的結(jié)果在開始時(shí)仍具有空白字符,應(yīng)將其刪除。為此,只需將trim()函數(shù)添加到語句的末尾:

str.replace(/\s\s+/g, ' ').trim()  // => "My opinions may have changed, but not the fact that I'm right."

請記住,此代碼用空格(U +  0020)字符替換任何類型的空格字符,包括ASCII空格,制表符,換行符,回車符,垂直制表符和換頁符。因此,如果回車符緊跟在制表符之后,它們將被空格替換。如果這不是我們的意圖,并且只想替換相同類型的空格,請改用以下代碼:

str.replace(/(\s)\1+/g, '$1').trim();

\1是一個(gè)反向引用,與在第一對括號(\s)中匹配的相同字符匹配。要替換它們,我們在replace()的第二個(gè)參數(shù)中使用$1,該參數(shù)將在括號中插入匹配的字符。

限制用戶只能輸入數(shù)字或字母

Web開發(fā)過程中的一項(xiàng)常見表單操作就是限制用戶輸入。比如,我們想將用戶限制為數(shù)字或者字母。同樣,使用正則,很簡單就能做到:使用字符類定義允許的字符范圍,然后在其后附加一個(gè)量詞以指定可以重復(fù)的字符數(shù):

const input1 = "John543"; const input2 = ":-)"; /^[A-Z0-9]+$/i.test(input1);    // &rarr; true /^[A-Z0-9]+$/i.test(input2);    // &rarr; false

運(yùn)作方式如下:

  • ^匹配字符串的開頭,它確保沒有其他字符出現(xiàn)在我們要匹配的字符串之前。

  • [A-Z0&ndash;9]匹配介于A和Z之間或介于0和9之間的字符。由于這是區(qū)分大小寫的,因此我們將i標(biāo)志,表示忽略大小寫?;蛘撸覀円部梢允褂肹A-Za-z0&ndash;9]來代替。

  • +  匹配一次或多次。因此,輸入必須至少包含一個(gè)非空白的字母數(shù)字字符;否則,匹配失敗。如果要使該字段為可選字段,則可以使用*量詞,該量詞與前面的項(xiàng)匹配零次或多次。

  • $匹配字符串的結(jié)尾。

將網(wǎng)址變成鏈接

假設(shè)我們在文本中有一個(gè)或多個(gè)不是 HTML 錨元素的網(wǎng)址,因此無法點(diǎn)擊。我們希望將 URL 自動轉(zhuǎn)換為鏈接。為此,我們首先需要找到 URL,然后將每個(gè)  URL 包裹在&hellip;標(biāo)記中,并使用的href屬性指向該URL:

const str = "Visit https://en.wikipedia.org/ for more info."; str.replace(/\b(https?|ftp|file):\/\/\S+[\/\w]/g, '<a href="$&">$&</a>')  // => "Visit <a href="https://en.wikipedia.org/">https://en.wikipedia.org/</a> for more info."

來看看這段代碼是如何工作的:

  • \b匹配單詞邊界的位置

  • (https?|ftp|file) 匹配字符https,http,ftp或file。

  • : 從字面上匹配冒號

  • \/ 從字面上匹配正斜杠字符

  • \S 匹配任何非空格的單個(gè)字符

  • + 匹配上一項(xiàng)一次或多次

  • [\/\w] 匹配正斜杠或單詞字符。如果沒有這個(gè),則正則表達(dá)式將匹配URL末尾的所有標(biāo)點(diǎn)符號

  • g告訴正則表達(dá)式引擎匹配所有匹配項(xiàng),而不是在第一次匹配后停止

  • $& 在 replace() 的第二個(gè)參數(shù)中,將匹配的子字符串插入替換字符串中

刪除重復(fù)的單詞

有時(shí),我們會發(fā)現(xiàn)有的文章單詞重復(fù)了,如果通過遍歷來去重,就很麻煩。幸運(yùn)的是,正則僅用一行代碼就能解決此問題:

const str = "This this sentence has has double words."  str.replace(/\b(\w+)\s+\1\b/gi, '$1')  // => "This sentence has double words."
  • \b 匹配單詞的邊界

  • \w 匹配單詞字符

  • + 匹配上一項(xiàng)的一次或多次

  • \1 是一個(gè)反向引用,它表示在第一對括號中所匹配的文本

  • \b 匹配單詞邊界

  • g 告訴正則表達(dá)式引擎匹配所有匹配項(xiàng),而不是在第一次匹配后停止

  • i 忽略大小寫

  • $1表示分組的第一個(gè)文本內(nèi)容

感謝各位的閱讀,以上就是“有哪些Java方便的正則表達(dá)式”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對有哪些Java方便的正則表達(dá)式這一問題有了更深刻的體會,具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云,小編將為大家推送更多相關(guān)知識點(diǎn)的文章,歡迎關(guān)注!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI