您好,登錄后才能下訂單哦!
本篇文章為大家展示了如何在Linux中使用正則表達(dá)式搜索文件中的文本,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。
正則表達(dá)式是一種符號(hào)表示法,用于識(shí)別文本模式。Linux處理正則表達(dá)式的主要程序是grep。grep搜索與正則表達(dá)式匹配的行,并將結(jié)果輸送至標(biāo)準(zhǔn)輸出。
1. grep匹配模式
grep按下述方式接受選項(xiàng)和參數(shù)(其中,regex表示正則表達(dá)式)
復(fù)制代碼 代碼如下:
grep [options] regex [files]
其中options主要為下表:
選項(xiàng) | 含義 | 功能描述 |
-i | ignore case | 忽略大小寫 |
-v | invert match | 不匹配匹配的 |
-l | file-with-match | 輸出匹配的文件名 |
-L | file-without-match | 輸出不匹配的文件名 |
-c | count | 輸出匹配的數(shù)目(行數(shù)) |
-n | number | 輸出匹配行的同時(shí)在前面加上文件名及在文件名中的行數(shù) |
-h | no-filename | 抑制文件名的輸出 |
作為一個(gè)Linux管理員,您需要對(duì)文本文件進(jìn)行處理。您可以使用不同的工具如grep、awk以及sed去查找包含特定文本串的文件。這里,我將介紹一種使用正則表達(dá)式,以靈活的方式,去搜索文件中的文本的方法。
讓我們考慮一個(gè)正則表達(dá)式發(fā)揮作用的例子。比如,當(dāng)你嘗試使用命令grep –r host /時(shí),其返回的結(jié)果會(huì)很龐大。因?yàn)槊恳粋€(gè)包含host這個(gè)文本串的字(像ghostscript這樣的字)都會(huì)匹配。采用正則表達(dá)式,你可以更好地定制你要查找什么。例如,你可以使用正則表達(dá)式'^host',告訴grep僅僅查找以host開始的行。
正則表達(dá)式并不是在所有命令中都可用,您使用的命令必須已經(jīng)事先編好程序,以便能夠使用正則表達(dá)式。這些命令中最普遍使用的命令是grep、tr以及vi。其它的工具,像sed和awk,也可以使用正則表達(dá)式。
使用正則表達(dá)式的一個(gè)例子為:
復(fù)制代碼 代碼如下:
grep 'lin.x' *
正則表達(dá)式'lin.x'中的點(diǎn)有特殊的含義。它會(huì)匹配處于該位置的任意字符。為了防止解釋性的問題,我建議您總是將正則表達(dá)式置于單引號(hào)間,這樣就可以防止shell對(duì)正則表達(dá)式進(jìn)行解釋。
使用正則表達(dá)式
您可以使用正則表達(dá)式做很多事情。在以下的列表中,您可以找到一些最普通、最常用的正則表達(dá)式的例子。
* ^:表示文本串必須在一行的開頭。所以,當(dāng)查找行的開頭只為“hosts”的行,可以使用命令:grep -ls '^hosts'
* $:代表了一行的結(jié)尾。所以,當(dāng)查找行的結(jié)尾只為“hosts”的行,可以使用命令:grep -ls 'hosts$'
* 你可以在一個(gè)正則表達(dá)式中結(jié)合^和$,去查找僅僅包含"yes"的行,使用的命令為grep -ls '^yes$'
* .: 一個(gè)可以指代除了換行符以外任意字符的通配符。為了查找包含tex、tux、tox或者tix的行,可以使用:grep -ls 't.x'
* [ ]:表示在一個(gè)正則表達(dá)式中,方括號(hào)之間的字符是可選的。為了查找名字為pinda或者linda的用戶,可以使用命令:grep -ls '[pl]inda'
* [^ ]:忽略掉方括號(hào)中^之后的所有字符。為了查找包含文本linda的行,并忽略掉其中僅包含linda或者pinda的行,命令為:grep -ls '[^pl]inda'
* -:代表一類或者一個(gè)范圍內(nèi)的字符。在像tr這樣的命令中,這是非常有用的。以下的命令可以將所有的小寫字母轉(zhuǎn)為大寫字母:tr a-z A-Z < mytext。同樣地,你可以使用正則表達(dá)式grep -ls '^0-9'去查找其中有一些行是以數(shù)字開頭的文件。
* \< 和 \>:查找一個(gè)字的開頭或者結(jié)尾的模式。查找行的開頭的字以"san"為起始的命令為: grep \<SAN< code>。這些正則表達(dá)式有兩個(gè)缺點(diǎn)—他們并不查找以指定的正則表達(dá)式開頭的行,并且他們并不被所有的工具所支持。但是,vi和grep是支持這種用法的。
* \:確保在正則表達(dá)式中有特殊含義的字符不被解釋。查找以任何字符開始,后面跟著文本"host"的文本串的命令為grep -ls '.host'。而如果你需要查找以點(diǎn)為第一個(gè)字符,緊接著為"host"的文本串,可以用命令:grep -ls '\.host'
這些正則表達(dá)式可以幫助您找到包含特定文本串的字。您也可以使用正則表達(dá)式去指定,在一個(gè)字中,該字符串出現(xiàn)的頻率。比如,您可以使用正則表達(dá)式去搜索剛好包含用戶名"linda"三次的文件。為了達(dá)到這一目的,您需要使用正則表達(dá)式的重復(fù)算子,并保證整個(gè)正則表達(dá)式位于引號(hào)中。沒有引號(hào)的話,您可能會(huì)導(dǎo)致shell去解釋您的重復(fù)算子。
最重要的重復(fù)算子的列表如下:
* *:表示前述的正則表達(dá)式可能出現(xiàn)一次、多次或者根本不出現(xiàn)。注意:不要和shell中的*混淆—在shell中,*表示任意字符,而在正則表達(dá)式中,*表示之前的正則表達(dá)式可能存在。
* ?:表示在該位置可能是一個(gè)字符(但并不是必須是)。例如,同時(shí)查找color和colour的命令為:grep -ls 'colo.r'
* +:表示之前的字符或者正則表達(dá)式至少要出現(xiàn)一次
* \{n\}:表示之前的字符或者正則表達(dá)式至少要出現(xiàn)n次。當(dāng)你查找一個(gè)介于100到999之間的數(shù)字時(shí),這是很有用的:grep -ls '0-9\{3\}'
上述內(nèi)容就是如何在Linux中使用正則表達(dá)式搜索文件中的文本,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。