溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

如何操作linux 正則表達(dá)式grep

發(fā)布時(shí)間:2021-03-08 17:10:31 來(lái)源:億速云 閱讀:233 作者:TREX 欄目:互聯(lián)網(wǎng)科技

本篇內(nèi)容介紹了“如何操作linux 正則表達(dá)式grep”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

在很多技術(shù)領(lǐng)域(如:自然語(yǔ)言處理,數(shù)據(jù)存儲(chǔ)等),正則表達(dá)式可以很方便的提取我們想要的信息,所以正則表達(dá)式是一個(gè)很重要的知識(shí)點(diǎn)!

一、概念

正則表達(dá)式(Regular Expression)是用于描述一組字符串特征的模式,用來(lái)匹配特定的字符串。通過(guò)特殊字符+普通字符來(lái)進(jìn)行模式描述,從而達(dá)到文本匹配目的工具。

正則表達(dá)式目前被集成到了各種文本編輯器/文本處理工具當(dāng)中

二、應(yīng)用場(chǎng)景

(1)驗(yàn)證:表單提交時(shí),進(jìn)行用戶(hù)名密碼的驗(yàn)證。

(2)查找:從大量信息中快速提取指定內(nèi)容,在一批url中,查找指定url。

(3)替換:將指定格式的文本進(jìn)行正則匹配查找,找到之后進(jìn)行特定替換。

三、基本要素

(1)字符類(lèi)

(2)數(shù)量限定符

(3)位置限定符

(4)特殊符號(hào)

注意:正則表達(dá)式基本是與語(yǔ)言無(wú)關(guān)的,我們可以結(jié)合語(yǔ)言/工具與正則表達(dá)式進(jìn)行文本處理,在后面的博客中,我將使用grep來(lái)進(jìn)行驗(yàn)證。(grep是一款Linux下按行匹配文本的工具,如下,使我們常使用的兩個(gè)選項(xiàng))

-E:使用擴(kuò)展正則匹配

--color:將匹配得到的內(nèi)容進(jìn)行語(yǔ)法高亮

1.字符類(lèi)

如何操作linux 正則表達(dá)式grep

舉例如下:

例1:

如何操作linux 正則表達(dá)式grep

注意:1.grep采用的貪心匹配,它會(huì)匹配當(dāng)前行中的所有匹配內(nèi)容

2.echo $?表示是否匹配成功(如果成功返回值為0,不成功返回值為1)

例2:

如何操作linux 正則表達(dá)式grep

例3:

如何操作linux 正則表達(dá)式grep

例4:

如何操作linux 正則表達(dá)式grep

例5:

如何操作linux 正則表達(dá)式grep

2.數(shù)量限定符

如何操作linux 正則表達(dá)式grep

舉例如下:

例1:

如何操作linux 正則表達(dá)式grep

例2:

如何操作linux 正則表達(dá)式grep

由此,我們可以看出,“前面的單元”默認(rèn)是指?或+前面的字符

例3:

如何操作linux 正則表達(dá)式grep

例4:

如何操作linux 正則表達(dá)式grep

例5:

如何操作linux 正則表達(dá)式grep

例6:

如何操作linux 正則表達(dá)式grep

注意:該結(jié)果為匹配失敗,在相關(guān)文檔中并未出現(xiàn),應(yīng)該啊是錯(cuò)誤或者廢棄的用法

例7:

如何操作linux 正則表達(dá)式grep

3.位置限定符

如何操作linux 正則表達(dá)式grep

舉例如下:

例1:

如何操作linux 正則表達(dá)式grep

例2:

如何操作linux 正則表達(dá)式grep

例3:

如何操作linux 正則表達(dá)式grep

例4:

如何操作linux 正則表達(dá)式grep

例5:

如何操作linux 正則表達(dá)式grep

例6:

如何操作linux 正則表達(dá)式grep

4.特殊符號(hào)

如何操作linux 正則表達(dá)式grep

舉例如下:

如何操作linux 正則表達(dá)式grep

假如我們?nèi)サ?E選項(xiàng),會(huì)有什么現(xiàn)象呢?

如何操作linux 正則表達(dá)式grep

此時(shí),不難發(fā)現(xiàn),去掉-E選項(xiàng)之后沒(méi)有進(jìn)行正常的正則匹配,這種現(xiàn)象需要我們引入如下的兩個(gè)概念!

5.基本正則表達(dá)式&擴(kuò)展正則表達(dá)式

區(qū)別:正則表達(dá)式的擴(kuò)展正則(Extended規(guī)范)和基本正則(Basic規(guī)范)下,有些字符如何操作linux 正則表達(dá)式grep應(yīng)該解釋為普通字符,要表示上述特殊含義則需要加“\”轉(zhuǎn)義字符。反之,在擴(kuò)展規(guī)范下,如何操作linux 正則表達(dá)式grep應(yīng)被理解為特殊含義,要取其字面值,也要對(duì)其進(jìn)行“\”轉(zhuǎn)義。

因此,grep工具帶上-E選項(xiàng),表示使用擴(kuò)展正則來(lái)進(jìn)行匹配,若沒(méi)有該選項(xiàng),則表示使用基準(zhǔn)正則來(lái)進(jìn)行匹配。

對(duì)于上述的問(wèn)題,我們舉例如下:

例1:

如何操作linux 正則表達(dá)式grep

例2:當(dāng)目標(biāo)字符串當(dāng)中本身就包含了如何操作linux 正則表達(dá)式grep字符,要想進(jìn)行正則匹配,應(yīng)該這樣做:

如何操作linux 正則表達(dá)式grep

例3:

如何操作linux 正則表達(dá)式grep

5.其他普通字符集及其替換

如何操作linux 正則表達(dá)式grep

舉個(gè)例子:

如何操作linux 正則表達(dá)式grep

綜上,正則表達(dá)式有以下三個(gè)分類(lèi):

(1)基本正則表達(dá)式:Basic即BPEs

(2)擴(kuò)展正則表達(dá)式:Extended即EREs

(3)Perl的正則表達(dá)式:PREs

因此,當(dāng)grep指令不跟任何參數(shù)時(shí),表示要使用BREs,后面跟“-E”表示使用EREs,后面跟“-P”參數(shù),表示使用PREs

四、貪婪模式與非貪婪模式

1.貪婪模式:正則表達(dá)式匹配時(shí),會(huì)盡量多的匹配符合條件的內(nèi)容

舉例如下:

如何操作linux 正則表達(dá)式grep

注意:grep默認(rèn)采用貪婪匹配,可能會(huì)對(duì)我們的測(cè)試結(jié)果造成干擾,大家可以上網(wǎng)使用“正則在線轉(zhuǎn)換工具”進(jìn)行測(cè)試

2.非貪婪模式:正則表達(dá)式匹配時(shí),會(huì)盡量少的匹配符合條件的內(nèi)容,也就是說(shuō),一旦發(fā)現(xiàn)匹配符合要求,立馬就匹配成功,而不會(huì)繼續(xù)匹配下去(除非有g(shù),開(kāi)啟下一組匹配)

舉例如下:

如何操作linux 正則表達(dá)式grep

五、零寬斷言

1.所謂斷言,是用來(lái)聲明一個(gè)應(yīng)該為真的事實(shí)。在正則表達(dá)式中,只有當(dāng)斷言為真時(shí)才會(huì)繼續(xù)進(jìn)行匹配。

2.零寬斷言:像用于查找某些內(nèi)容之前或者之后的東西,其中一些特殊字符如“\b、^、$”等用于指定一個(gè)位置,這個(gè)位置應(yīng)滿(mǎn)足一定的條件。

3.分類(lèi):

(1)零寬度正預(yù)測(cè)先行斷言(?=exp)

它斷言自身出現(xiàn)的位置之后能匹配的表達(dá)式exp。如:\b\w+(?=ing\b),表示匹配以ing結(jié)尾的單詞的前面的部分(除ing以外的部分)。當(dāng)我們要查找“I'm singing while you're dancing.”時(shí),它會(huì)匹配sing和danc

舉例如下:

如何操作linux 正則表達(dá)式grep

(2)零寬度正回顧后發(fā)斷言(?>=exp)

它斷言自身出現(xiàn)的位置的前面能匹配的表達(dá)式exp。如:(?<=\bre)\w+\b會(huì)匹配以re開(kāi)頭的單詞的后半部分(除er以外的部分),例如:在查找“reading a book”時(shí),它匹配ading

舉例如下:

如何操作linux 正則表達(dá)式grep

六、簡(jiǎn)單練習(xí)

1.手機(jī)號(hào)碼

如何操作linux 正則表達(dá)式grep

2.非零的正整數(shù)

如何操作linux 正則表達(dá)式grep

3.非零開(kāi)頭的最多帶兩位小數(shù)的數(shù)字

如何操作linux 正則表達(dá)式grep

4.由數(shù)字和26位字母組成的字符串

如何操作linux 正則表達(dá)式grep

5.QQ號(hào),從10000開(kāi)始

如何操作linux 正則表達(dá)式grep

6.IP地址

\d+\.\d+\.\d+\.\d+

7.判斷賬號(hào)是否合法

^[a-zA-Z0-9][a-zA-Z0-9_]{4,15}$

8.日期格式

^\d{4}-\d{1,2}-\d{1,2}

“如何操作linux 正則表達(dá)式grep”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI