<big id="ngmpz"></big>

<address id="ngmpz"><samp id="ngmpz"><thead id="ngmpz"></thead></samp></address>

<small id="ngmpz"></small><mark id="ngmpz"><ins id="ngmpz"><optgroup id="ngmpz"></optgroup></ins></mark>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

正則表達(dá)式詳細(xì)介紹

發(fā)布時間：2020-06-29 13:25:59 來源：網(wǎng)絡(luò) 閱讀：344 作者：wx5d3a7feeb53cc 欄目：云計算

Shell 編程之正則表達(dá)式與文件處理器

技能展示：

-基礎(chǔ)正則表達(dá)式
-擴(kuò)展正則表達(dá)式
-sed 工具使用方法
-awk 工具使用方法

正則表達(dá)式

之前學(xué)習(xí)了 Shell 腳本的基礎(chǔ)用法，已經(jīng)可以利用條件判斷、循環(huán)等語句編輯 Shell 腳本。接下來我們將開始介紹一個很重要的概念——正則表達(dá)式（RegularExpression，RE）。

1正則表達(dá)式概述

下面先來了解一下正則表達(dá)式的定義及用途。

1.正則表達(dá)式的定義

 正則表達(dá)式又稱正規(guī)表達(dá)式、常規(guī)表達(dá)式。在代碼中常簡寫為 regex、regexp 或 RE。正則表達(dá)式是使用單個字符串來描述、匹配一系列符合某個句法規(guī)則的字符串，簡單來說， 是一種匹配字符串的方法，通過一些特殊符號，實現(xiàn)快速查找、刪除、替換某個特定字符串。
正則表達(dá)式是由普通字符與元字符組成的文字模式。模式用于描述在搜索文本時要匹配的一個或多個字符串。正則表達(dá)式作為一個模板，將某個字符模式與所搜索的字符串進(jìn)行匹配。其中普通字符包括大小寫字母、數(shù)字、標(biāo)點符號及一些其他符號，元字符則是指那些在正則表達(dá)式中具有特殊意義的專用字符，可以用來規(guī)定其前導(dǎo)字符（即位于元字符前面的字符）在目標(biāo)對象中的出現(xiàn)模式。
正則表達(dá)式一般用于腳本編程與文本編輯器中。很多文本處理器與程序設(shè)計語言均支持正則表達(dá)式，如前面提到的 Perl、Linux 系統(tǒng)中常見的文本處理器（grep、egrep、sed、awk）。正則表達(dá)式具備很強(qiáng)大的文本匹配功能，能夠在文本海洋中快速高效地處理文本。

2.正則表達(dá)式用途

對于一般計算機(jī)用戶來說，由于使用到正則表達(dá)式的機(jī)會不多，所以無法體會正則表達(dá)式的魅力，而對于系統(tǒng)管理員來說，正則表達(dá)式則是必備技能之一。
正則表達(dá)式對于系統(tǒng)管理員來說是非常重要的，系統(tǒng)運(yùn)行過程中會產(chǎn)生大量的信息，這些信息有些是非常重要的，有些則僅是告知的信息。身為系統(tǒng)管理員如果直接看這么多的信息數(shù)據(jù)，無法快速定位到重要的信息，如“用戶賬號登錄失敗”“服務(wù)啟動失敗”等信息。這時可以通過正則表達(dá)式快速提取“有問題”的信息。如此一來，可以將運(yùn)維工作變得更加簡單、方便。
目前很多軟件也支持正則表達(dá)式，最常見的就是郵件服務(wù)器。在 Internet 中，垃圾/

廣告郵件經(jīng)常會造成網(wǎng)絡(luò)塞車，如果在服務(wù)器端就將這些問題郵件提前剔除的話，客戶端就會減少很多不必要的帶寬消耗。而目前常用的郵件服務(wù)器 postfix 以及支持郵件服務(wù)器的相關(guān)分析軟件都支持正則表達(dá)式的比對功能。將來信的標(biāo)題和內(nèi)容與特殊字符串進(jìn)行對比，發(fā)現(xiàn)問題郵件就過濾掉。
除郵件服務(wù)器之外，很多服務(wù)器軟件都支持正則表達(dá)式。雖然這些軟件都支持正則表達(dá)式，不過字符串的對比規(guī)則還需要系統(tǒng)管理員來添加，所以作為系統(tǒng)管理員，正則表達(dá)式是必須掌握的技能之一。

3基礎(chǔ)正則表達(dá)式

正則表達(dá)式的字符串表達(dá)方法根據(jù)不同的嚴(yán)謹(jǐn)程度與功能分為基本正則表達(dá)式與擴(kuò)展正則表達(dá)式?；A(chǔ)正則表達(dá)式是常用的正則表達(dá)式的最基礎(chǔ)的部分。在 Linux 系統(tǒng)中常見的文件處理工具中 grep 與 sed 支持基礎(chǔ)正則表達(dá)式，而 egrep 與 awk 支持?jǐn)U展正則表達(dá)式。掌握基礎(chǔ)正則表達(dá)式的使用方法，首先必須了解基本正則表達(dá)式所包含的元字符的含義，下面通過 grep 命令以舉例的方式逐個介紹。

基礎(chǔ)正則表達(dá)式示例
下面的操作需要提前準(zhǔn)備一個名為 test.txt 的測試文件，文件具體內(nèi)容如下所示。

[root@localhost ~]# cat test.txt he was short and fat.

查找特定字符
查找特定字符非常簡單，如執(zhí)行以下命令即可從 test.txt 文件中查找出特定字符“the” 所在位置。其中“-n”表示顯示行號、“-i”表示不區(qū)分大小寫。命令執(zhí)行后，符合匹配標(biāo)準(zhǔn)的字符，字體顏色會變?yōu)榧t色（本章中全部通過加粗顯示代替）。

[root@localhost ~]# grep -n 'the' test.txt .

 若反向選擇，如查找不包含“the”字符的行，則需要通過 grep 命令的“-vn”選項實現(xiàn)。


[root@localhost ~]# grep -vn 'the' test.txt

利用中括號“[]”來查找集合字符
想要查找“shirt”與“short”這兩個字符串時，可以發(fā)現(xiàn)這兩個字符串均包含“sh” 與“rt”。此時執(zhí)行以下命令即可同時查找到“shirt”與“short”這兩個字符串?！癧]”中無論有幾個字符，都僅代表一個字符，也就是說“[io]”表示匹配“i”或者“o”。

[root@localhost ~]# grep -n 'sh[io]rt' test.txt

 若要查找包含重復(fù)單個字符“oo”時，只需要執(zhí)行以下命令即可。

[root@localhost ~]# grep -n 'oo' test.txt

 若查找“oo”前面不是“w”的字符串，只需要通過集合字符的反向選擇“[^]”來實現(xiàn)該目的，如執(zhí)行“grep –n‘[^w]oo’test.txt”命令表示在 test.txt 文本中查找“oo” 前面不是“w”的字符串。

[root@localhost ~]# grep -n '[^w]oo' test.txt

在上述命令的執(zhí)行結(jié)果中發(fā)現(xiàn)“woood”與“wooooood”也符合匹配規(guī)則，二者均包含“w”。其實通過執(zhí)行結(jié)果就可以看出，符合匹配標(biāo)準(zhǔn)的字符加粗顯示，而上述結(jié)果中可以得知，“#woood #”中加粗顯示的是“ooo”，而“oo”前面的“o”是符合匹配規(guī)則的。同理 “#woooooood #”也符合匹配規(guī)則。
若不希望“oo”前面存在小寫字母，可以使用“grep –n‘[^a-z]oo’test.txt”命令實現(xiàn)，其中“a-z”表示小寫字母，大寫字母則通過“A-Z”表示。

[root@localhost ~]# grep -n '[^a-z]oo' test.txt

查找包含數(shù)字的行可以通過“grep –n‘[0-9]’test.txt”命令來實現(xiàn)。

[root@localhost ~]# grep -n '[0-9]' test.txt

查找行首“^”與行尾字符“$”

基礎(chǔ)正則表達(dá)式包含兩個定位元字符：“^”（行首）與“$”（行尾）。在上面的示例中，查詢“the”字符串時出現(xiàn)了很多包含“the”的行，如果想要查詢以“the”字符串為行首的行，則可以通過“^”元字符來實現(xiàn)。

[root@localhost ~]# grep -n '^the' test.txt

 查詢以小寫字母開頭的行可以通過“^[a-z]”規(guī)則來過濾，查詢大寫字母開頭的行則使用“^[A-Z]”規(guī)則，若查詢不以字母開頭的行則使用“^[^a-zA-Z]”規(guī)則。

[root@localhost ~]# grep -n '^[a-z]' test.txt 
[root@localhost ~]# grep -n '^[^a-zA-Z]' test.txt

 “^”符號在元字符集合“[]”符號內(nèi)外的作用是不一樣的，在“[]”符號內(nèi)表示反向選擇，在“[]”符號外則代表定位行首。反之，若想查找以某一特定字符結(jié)尾的行則可以使用“$”定位符。例如，執(zhí)行以下命令即可實現(xiàn)查詢以小數(shù)點（.）結(jié)尾的行。因為小數(shù)點（.） 在正則表達(dá)式中也是一個元字符（后面會講到），所以在這里需要用轉(zhuǎn)義字符“\”將具有特 殊意義的字符轉(zhuǎn)化成普通字符。

[root@localhost ~]# grep -n '\.$' test.txt

 當(dāng)查詢空白行時，執(zhí)行“grep –n‘^$’test.txt”命令即可。

[root@localhost ~]# grep -n '^$' test.txt

查找任意一個字符“.”與重復(fù)字符“*”

前面提到，在正則表達(dá)式中小數(shù)點（.）也是一個元字符，代表任意一個字符。例如，執(zhí)行以下命令就可以查找“w??d”的字符串，即共有四個字符，以 w 開頭 d 結(jié)尾。

[root@localhost ~]# grep -n 'w..d' test.txt

 在上述結(jié)果中，“wood”字符串“w..d”匹配規(guī)則。若想要查詢 oo、ooo、ooooo 等資料，則需要使用星號（*）元字符。但需要注意的是，“*”代表的是重復(fù)零個或多個前面的單字符?！皁*”表示擁有零個（即為空字符）或大于等于一個“o”的字符，因為允許空字符，所以執(zhí)行“grep –n‘o*’test.txt”命令會將文本中所有的內(nèi)容都輸出打印。如果是“oo*”， 則第一個 o 必須存在，第二個 o 則是零個或多個 o，所以凡是包含 o、oo、ooo、ooo，等的資料都符合標(biāo)準(zhǔn)。同理，若查詢包含至少兩個 o 以上的字符串，則執(zhí)行“grep –n‘ooo*’ test.txt”命令即可。

[root@localhost ~]# grep -n 'ooo*' test.txt

查詢以 w 開頭 d 結(jié)尾，中間包含至少一個 o 的字符串，執(zhí)行以下命令即可實現(xiàn)。

[root@localhost ~]# grep -n 'woo*d' test.txt

 查詢以 w 開頭 d 結(jié)尾，中間的字符可有可無的字符串。

[root@localhost ~]# grep -n 'w.*d' test.txt

 查詢?nèi)我鈹?shù)字所在行。


[root@localhost ~]# grep -n '[0-9][0-9]*' test.txt

查找連續(xù)字符范圍“{}”

在上面的示例中，我們使用“.”與“*”來設(shè)定零個到無限多個重復(fù)的字符，如果想要限制一個范圍內(nèi)的重復(fù)的字符串該如何實現(xiàn)呢？例如，查找三到五個 o 的連續(xù)字符，這個時候就需要使用基礎(chǔ)正則表達(dá)式中的限定范圍的字符“{}”。因為“{}”在 Shell 中具有特殊意義，所以在使用“{}”字符時，需要利用轉(zhuǎn)義字符“\”，將“{}”字符轉(zhuǎn)換成普通字符。 “{}”字符的使用方法如下所示。
(1）查詢兩個 o 的字符。

[root@localhost ~]# grep -n 'o\{2\}' test.txt

(2）查詢以 w 開頭以 d 結(jié)尾，中間包含 2～5 個 o 的字符串。

[root@localhost ~]# grep -n 'wo\{2,5\}d' test.txt

(3）查詢以 w 開頭以 d 結(jié)尾，中間包含 2 以上 o 的字符串。

[root@localhost ~]# grep -n 'wo\{2,\}d' test.txt

元字符總結(jié)

 通過上面幾個簡單的示例，我們可以了解到常見的基礎(chǔ)正則表達(dá)式的元字符主要包括以下幾個，如表所示。

元字符	作用
^	匹配輸入字符串的開始位置。在方括號表達(dá)式中使用，表示不包含該字符集合。
$	匹配輸入字符串的結(jié)尾位置。
.	匹配除“\r\n”之外的任何單個字符
\	將下一個字符標(biāo)記為特殊字符、原義字符、向后引用、八進(jìn)制轉(zhuǎn)義符。
*	匹配前面的子表達(dá)式零次或多次。要匹配“”字符，請使用“\”
[ ]	字符集合。匹配所包含的任意一個字符。例如，“[abc]”可以匹配“plain”中的“a”
[^ ]	賦值字符集合。匹配未包含的一個任意字符。
[n1-n2]	字符范圍。匹配指定范圍內(nèi)的任意一個字符。
{n}	n 是一個非負(fù)整數(shù)，匹配確定的 n 次
{n,}	n 是一個非負(fù)整數(shù)，至少匹配 n 次。
n,m	m 和n 均為非負(fù)整數(shù)，其中 n<=m，最少匹配 n 次且最多匹配 m 次

擴(kuò)展正則表達(dá)式

通常情況下會使用基礎(chǔ)正則表達(dá)式就已經(jīng)足夠了，但有時為了簡化整個指令，需要使用范圍更廣的擴(kuò)展正則表達(dá)式。例如，使用基礎(chǔ)正則表達(dá)式查詢除文件中空白行與行首為“#” 之外的行（通常用于查看生效的配置文件），執(zhí)行“grep –v‘^$’test.txt | grep –v ‘^#’”即可實現(xiàn)。這里需要使用管道命令來搜索兩次。如果使用擴(kuò)展正則表達(dá)式，可以簡化為“egrep –v‘^$|^#’test.txt”，其中，單引號內(nèi)的管道符號表示或者（or）。
此外，grep 命令僅支持基礎(chǔ)正則表達(dá)式，如果使用擴(kuò)展正則表達(dá)式，需要使用 egrep 或 awk 命令。awk 命令在后面的小節(jié)進(jìn)行講解，這里我們直接使用 egrep 命令。egrep 命令與 grep 命令的用法基本相似。egrep 命令是一個搜索文件獲得模式，使用該命令可以搜索文件中的任意字符串和符號，也可以搜索一個或多個文件的字符串，一個提示符可以是單個字符、一個字符串、一個字或一個句子。
與基礎(chǔ)正則表達(dá)式類型相同，擴(kuò)展正則表達(dá)式也包含多個元字符，常見的擴(kuò)展正則表達(dá)式的元字符主要包括以下幾個，如表  所示。

Column 1	Column 2
+	重復(fù)一個或者一個以上的前一個字符
?	零個或者一個的前一個字符
l	使用或者（or）的方式找出多個字符
()	查找“組”字符串
()+	辨別多個重復(fù)的組

文本處理器

在 Linux/UNIX 系統(tǒng)中包含很多種文本處理器或文本編輯器,其中包括我們之前學(xué)習(xí)過的VIM 編輯器與 grep 等。而 grep，sed，awk 更是 shell 編程中經(jīng)常用到的文本處理工具，被稱之為 Shell 編程三劍客。

sed 工具

sed（Stream EDitor）是一個強(qiáng)大而簡單的文本解析轉(zhuǎn)換工具，可以讀取文本，并根據(jù)指定的條件對文本內(nèi)容進(jìn)行編輯（刪除、替換、添加、移動等），最后輸出所有行或者僅輸出處理的某些行。sed 也可以在無交互的情況下實現(xiàn)相當(dāng)復(fù)雜的文本處理操作，被廣泛應(yīng)用于 Shell 腳本中，用以完成各種自動化處理任務(wù)。
 sed 的工作流程主要包括讀取、執(zhí)行和顯示三個過程。

* 讀?。簊ed 從輸入流（文件、管道、標(biāo)準(zhǔn)輸入）中讀取一行內(nèi)容并存儲到臨時的緩

沖區(qū)中（又稱模式空間，pattern space）。
* 執(zhí)行：默認(rèn)情況下，所有的 sed 命令都在模式空間中順序地執(zhí)行，除非指定了行的地址，否則 sed 命令將會在所有的行上依次執(zhí)行。
* 顯示：發(fā)送修改后的內(nèi)容到輸出流。再發(fā)送數(shù)據(jù)后，模式空間將會被清空。
在所有的文件內(nèi)容都被處理完成之前，上述過程將重復(fù)執(zhí)行，直至所有內(nèi)容被處理完。

注意：默認(rèn)情況下,所有的 sed 命令都是在模式空間內(nèi)執(zhí)行的，因此輸入的文件并不會發(fā)生任何變化，除非是用重定向存儲輸出。

1.sed 命令常見用法

 通常情況下調(diào)用 sed 命令有兩種格式，如下所示。其中，“參數(shù)”是指操作的目標(biāo)文件，當(dāng)存在多個操作對象時用，文件之間用逗號“，”分隔；而 scriptfile 表示腳本文件，需要用“-f”選項指定，當(dāng)腳本文件出現(xiàn)在目標(biāo)文件之前時，表示通過指定的腳本文件來處理輸入的目標(biāo)文件。

sed[選項] '操作' 參數(shù)
sed [選項] -f scriptfile 參數(shù)

常見的 sed 命令選項主要包含以下幾種。
* -e 或--expression=：表示用指定命令或者腳本來處理輸入的文本文件。
* -f 或--file=：表示用指定的腳本文件來處理輸入的文本文件。
* -h 或--help：顯示幫助。
* -n、--quiet 或 silent：表示僅顯示處理后的結(jié)果。
* -i：直接編輯文本文件。

    “操作”用于指定對文件操作的動作行為，也就是 sed 的命令。通常情況下是采用的“[n1[,n2]]”操作參數(shù)的格式。n1、n2 是可選的，不一定會存在，代表選擇進(jìn)行操作的行數(shù)，如操作需要在 5～20 行之間進(jìn)行，則表示為“5，20 動作行為”。常見的操作包括以下幾種。

* a：增加，在當(dāng)前行下面增加一行指定內(nèi)容。
* c：替換，將選定行替換為指定內(nèi)容。
* d：刪除，刪除選定的行。
* i：插入，在選定行上面插入一行指定內(nèi)容。

* p：打印，如果同時指定行，表示打印指定行；如果不指定行，則表示打印所有內(nèi)容；如果有非打印字符，則以 ASCII 碼輸出。其通常與“-n”選項一起使用。
* s：替換，替換指定字符。
* y：字符轉(zhuǎn)換。

2.用法示例

在本小節(jié)中依舊以 test.txt 文件為例進(jìn)行演示。1）輸出符合條件的文本（p 表示正常輸出）

[root@localhost ~]# sed -n 'p' test.txt

he was short and fat.

//輸出所有內(nèi)容,等同于 cat test.txt

He was wearing a blue polo shirt with black pants. The home of Football on BBC Sport online.
??//省略部分內(nèi)容
[root@localhost ~]# sed -n '3p' test.txt    //輸出第 3 行The home of Football on BBC Sport online.
[root@localhost ~]# sed -n '3,5p' test.txt //輸出 3~5 行The home of Football on BBC Sport online.
the tongue is boneless but it breaks bones.12! google is the best tools for search keyword. [root@localhost ~]# sed -n 'p;n' test.txt
//輸出所有奇數(shù)行,n 表示讀入下一行資料
he was short and fat.
The home of Football on BBC Sport online.
google is the best tools for search keyword.
??//省略部分內(nèi)容
[root@localhost ~]# sed -n 'n;p' test.txt
//輸出所有偶數(shù)行,n 表示讀入下一行資料He was wearing a blue polo shirt with black pants.
the tongue is boneless but it breaks bones.12!
The year ahead will test our political establishment to the limit.
??//省略部分內(nèi)容
[root@localhost ~]# sed -n '1,5{p;n}' test.txt
//輸出第 1~5 行之間的奇數(shù)行(第 1、3、5 行)
he was short and fat.

The home of Football on BBC Sport online. google is the best tools for search keyword. [root@localhost ~]# sed -n '10,${n;p}' test.txt
//輸出第 10 行至文件尾之間的偶數(shù)行
#woood # AxyzxyzxyzxyzC
Misfortunes never come alone/single.

    在執(zhí)行“sed –n‘10,${n;p}’test.txt”命令時，讀取的第 1 行是文件的第 10 行，讀取的第 2 行是文件的第 11 行，依此類推，所以輸出的偶數(shù)行是文件的第 11 行、13 行直至文件結(jié)尾，其中包括空行。
    以上是 sed 命令的基本用法，sed 命令結(jié)合正則表達(dá)式時，格式略有不同，正則表達(dá)式以“/”包圍。例如，以下操作是 sed 命令與正則表達(dá)式結(jié)合使用的示例。

[root@localhost ~]# sed -n '/the/p' test.txt    //輸出包含the 的行. 
[root@localhost ~]# sed -n '4,/the/p' test.txt   //輸出從第 4 行至第一個包含 the 的行.
[root@localhost ~]# sed -n '/the/=' test.txt//輸出包含the 的行所在的行號,等號(=)用來輸出行號
[root@localhost ~]# sed -n '/^PI/p' test.txt    //輸出以PI 開頭的行
[root@localhost ~]# sed -n '/\<wood\>/p' test.txt  //輸出包含單詞wood 的行,\<、\>代表單詞邊界

2）刪除符合條件的文本（d）

    因為后面的示例還需要使用測試文件 test.txt，所以在執(zhí)行刪除操作之前需要先將測試文件備份。以下示例分別演示了 sed 命令的幾種常用刪除用法。
  下面命令中 nl 命令用于計算文件的行數(shù)，結(jié)合該命令可以更加直觀地查看到命令執(zhí)行的結(jié)果。

[root@localhost ~]# nl test.txt | sed '3d'  //刪除第 3 行

[root@localhost ~]# nl test.txt | sed '3,5d'    //刪除第 3~5 行

[root@localhost ~]# nl test.txt |sed '/cross/d'
//刪除包含cross 的行,原本的第 8 行被刪除
//刪除不包含cross 的行,用!符號表示取反操作,如'/cross/！d'

[root@localhost ~]# sed '/^[a-z]/d' test.txt    //刪除以小寫字母開頭的行

[root@localhost ~]# sed '/\.$/d' test.txt   //刪除以"."結(jié)尾的行

[root@localhost ~]# sed '/^$/d' test.txt    //刪除所有空行

      注意： 若是刪除重復(fù)的空行，即連續(xù)的空行只保留一個， 執(zhí)行“ sed –e ‘/^$/{n;/^$/d}’test.txt”命令即可實現(xiàn)。其效果與“cat -s test.txt”相同，n 表示讀下一行數(shù)據(jù)。
### 3）替換符合條件的文本
      在使用 sed 命令進(jìn)行替換操作時需要用到 s（字符串替換）、c（整行/整塊替換）、y（字符轉(zhuǎn)換）命令選項，常見的用法如下所示。

sed 's/the/THE/' test.txt   //將每行中的第一個the 替換為 THE sed 's/l/L/2' test.txt    //將每行中的第 3 個l 替換為L sed 's/the/THE/g' test.txt   //將文件中的所有the 替換為THE
sed 's/o//g' test.txt   //將文件中的所有o 刪除(替換為空串)
sed 's/^/#/' test.txt   //在每行行首插入#號
sed '/the/s/^/#/' test.txt      //在包含the 的每行行首插入#號sed 's/$/EOF/' test.txt       //在每行行尾插入字符串EOF sed '3,5s/the/THE/g' test.txt   //將第 3~5 行中的所有the 替換為 THE
sed '/the/s/o/O/g' test.txt //將包含the 的所有行中的o 都替換為 O

4）遷移符合條件的文本

 其中，H，復(fù)制到剪貼板；g、G，將剪貼板中的數(shù)據(jù)覆蓋/追加至指定行；w，保存為文件；r，讀取指定文件；a，追加指定內(nèi)容。

sed '/the/{H;d};$G' test.txt    //將包含the 的行遷移至文件末尾,{;}用于多個操作sed '1,5{H;d};17G' test.txt //將第 1~5 行內(nèi)容轉(zhuǎn)移至第 17 行后
sed '/the/w out.file' test.txt  //將包含the 的行另存為文件out.file sed '/the/r /etc/hostname' test.txt    //將文件/etc/hostname 的內(nèi)容添加到
//包含the 的每行以后
sed '3aNew' test.txt        //在第 3 行后插入一個新行,內(nèi)容為 New sed '/the/aNew' test.txt    //在包含the 的每行后插入一個新行,內(nèi)容為 New sed '3aNew1\nNew2' test.txt //在第 3 行后插入多行內(nèi)容,中間的\n 表示換行

5）使用腳本編輯文件

  使用 sed 腳本，將多個編輯指令存放到文件中（每行一條編輯指令），通過“-f”選項來調(diào)用。例如：

sed '1,5{H;d};17G' test.txt //將第 1~5 行內(nèi)容轉(zhuǎn)移至第 17 行后

 以上操作可以改用腳本文件方式：

[root@localhost ~]# vi opt.list 1,5H

#woood # #woooooood # AxyzxyzxyzxyzC

6）sed 直接操作文件示例

編寫一個腳本，用來調(diào)整 vsftpd 服務(wù)配置：禁止匿名用戶，但允許本地用戶（也允許寫入）。

[root@localhost ~]# vim local_only_ftp.sh #!/bin/bash
#指定樣本文件路徑、配置文件路徑
SAMPLE="/usr/share/doc/vsftpd-3.0.2/EXAMPLE/INTERNET_SITE/vsftpd.conf " CONFIG="/etc/vsftpd/vsftpd.conf"

#備份原來的配置文件,檢測文件名為/etc/vsftpd/vsftpd.conf.bak 備份文件是否存在, 若不存在則使用 cp 命令進(jìn)行文件備份
[ ! -e "$CONFIG.bak" ] && cp $CONFIG $CONFIG.bak # 基于樣本配置進(jìn)行調(diào)整,覆蓋現(xiàn)有文件
sed -e '/^anonymous_enable/s/YES/NO/g' $SAMPLE > $CONFIG
sed -i -e '/^local_enable/s/NO/YES/g' -e '/^write_enable/s/NO/YES/g' $CONFIG grep "listen" $CONFIG || sed -i '$alisten=YES' $CONFIG
#啟動vsftpd 服務(wù),并設(shè)為開機(jī)后自動運(yùn)行systemctl restart vsftpd
systemctl enable vsftpd
[root@localhost ~]# chmod +x local_only_ftp.sh

awk 工具

 在 Linux/UNIX 系統(tǒng)中，awk 是一個功能強(qiáng)大的編輯工具，逐行讀取輸入文本，并根據(jù)指定的匹配模式進(jìn)行查找，對符合條件的內(nèi)容進(jìn)行格式化輸出或者過濾處理，可以在無交互的情況下實現(xiàn)相當(dāng)復(fù)雜的文本操作，被廣泛應(yīng)用于 Shell 腳本，完成各種自動化配置任務(wù)。

1.awk 常見用法

 通常情況下 awk 所使用的命令格式如下所示，其中，單引號加上大括號“{}”用于設(shè)置對數(shù)據(jù)進(jìn)行的處理動作。awk 可以直接處理目標(biāo)文件，也可以通過“-f”讀取腳本對目標(biāo)文件進(jìn)行處理。

 awk 選項 '模式或條件 {編輯指令}' 文件 1 文件 2 ?  //過濾并輸出文件符條件的內(nèi)容awk -f 腳本文件 文件 1 文件 2 ?  //從腳本中調(diào)用編輯指令,過濾并輸出內(nèi)容

 前面提到 sed 命令常用于一整行的處理,而 awk 比較傾向于將一行分成多個“字段”然后再進(jìn)行處理，且默認(rèn)情況下字段的分隔符為空格或者 tab 鍵。awk 執(zhí)行結(jié)果可以通過 print 的功能將字段數(shù)據(jù)打印顯示。在使用 awk 命令的過程中,可以使用邏輯操作符“&&”，表示“與”， “||”表示“或”，“！”表示“非”；還可以進(jìn)行簡單的數(shù)學(xué)運(yùn)算，如+、-、*、/、%、^分別 表示加、減、乘、除、取余和乘方。
 在 Linux 系統(tǒng)中/etc/passwd 是一個非常典型的格式化文件，各字段間使用“：”作為分隔符隔開，Linux 系統(tǒng)中的大部分日志文件也是格式化文件，從這些文件中提取相關(guān)信息是運(yùn)維的日常工作內(nèi)容之一。若需要查找出/etc/passwd 的用戶名、用戶 ID、組 ID 等列， 執(zhí)行以下 awk 命令即可。

[root@localhost ~]# awk -F ':' '{print $1,$3,$4}' /etc/passwd root 0 0

 awk 從輸入文件或者標(biāo)準(zhǔn)輸入中讀入信息，與 sed 一樣，信息的讀入也是逐行讀取的。不同的是 awk 將文本文件中的一行視為一個記錄，而將一行中的某一部分（列）作為記錄中的一個字段（域）。為了操作這些不同的字段，awk 借用 shell 中類似于位置變量的方法， 用$1、$2、$3?順序地表示行（記錄）中的不同字段。另外 awk 用$0 表示整個行（記錄）。不同的字段之間是通過指定的字符分隔。awk 默認(rèn)的分隔符是空格。awk 允許在命令行中用“-F 分隔符”的形式來指定分隔符。因此，上述示例中，awk 命令對/etc/passwd 文件的處理過程如圖 4.1 所示。

awk 工作原理圖

awk 包含幾個特殊的內(nèi)建變量（可直接用）如下所示：

* FS：指定每行文本的字段分隔符，默認(rèn)為空格或制表位。

* NF：當(dāng)前處理的行的字段個數(shù)。
* NR：當(dāng)前處理的行的行號（序數(shù)）。
* $0：當(dāng)前處理的行的整行內(nèi)容。
* $n：當(dāng)前處理行的第 n 個字段（第 n 列）。
* FILENAME：被處理的文件名。
* RS：數(shù)據(jù)記錄分隔，默認(rèn)為\n，即每行為一條記錄。

2.用法示例

1）按行輸出文本

awk
awk '{print}' test.txt
'{print $0}' test.txt   //輸出所有內(nèi)容,等同于 cat test.txt
//輸出所有內(nèi)容,等同于 cat test.txt
awk 'NR==1,NR==3{print}' test.txt   //輸出第 1~3 行內(nèi)容
awk '(NR>=1)&&(NR<=3){print}' test.txt  //輸出第 1~3 行內(nèi)容
awk 'NR==1||NR==3{print}' test.txt  //輸出第 1 行、第 3 行內(nèi)容
awk '(NR%2)==1{print}' test.txt //輸出所有奇數(shù)行的內(nèi)容
awk '(NR%2)==0{print}' test.txt //輸出所有偶數(shù)行的內(nèi)容
awk '/^root/{print}' /etc/passwd    //輸出以root 開頭的行
awk '/nologin$/{print}' /etc/passwd//輸出以 nologin 結(jié)尾的行
awk 'BEGIN {x=0} ; /\/bin\/bash$/{x++};END {print x}' /etc/passwd
//統(tǒng)計以/bin/bash 結(jié)尾的行數(shù),等同于 grep -c "/bin/bash$" /etc/passwd awk 'BEGIN{RS=""};END{print NR}' /etc/squid/squid.conf
//統(tǒng)計以空行分隔的文本段落數(shù)

2）按字段輸出文本

awk '{print $3}' test.txt   //輸出每行中(以空格或制表位分隔)的第 3 個字段awk '{print $1,$3}' test.txt  //輸出每行中的第 1、3 個字段
awk -F ":" '$2==""{print}' /etc/shadow //輸出密碼為空的用戶的shadow 記錄awk 'BEGIN {FS=":"}; $2==""{print}' /etc/shadow
//輸出密碼為空的用戶的shadow 記錄
awk -F ":" '$7~"/bash"{print $1}' /etc/passwd
//輸出以冒號分隔且第 7 個字段中包含/bash 的行的第 1 個字段awk '($1~"nfs")&&(NF==8){print $1,$2}' /etc/services

//輸出包含 8 個字段且第 1 個字段中包含 nfs 的行的第 1、2 個字段awk -F ":" '($7!="/bin/bash")&&($7!="/sbin/nologin"){print}'
/etc/passwd
//輸出第 7 個字段既不為/bin/bash 也不為/sbin/nologin 的所有行

3）通過管道、雙引號調(diào)用 Shell 命令

awk -F: '/bash$/{print | "wc -l"}' /etc/passwd
//調(diào)用wc -l 命令統(tǒng)計使用bash 的用戶個數(shù),等同于 grep -c "bash$" /etc/passwd awk 'BEGIN {while ("w" | getline) n++ ; {print n-2}}'
//調(diào)用w 命令,并用來統(tǒng)計在線用戶數(shù)
awk 'BEGIN { "hostname" | getline ; print $0}'
//調(diào)用hostname,并輸出當(dāng)前的主機(jī)名

sort 工具

  在 Linux 系統(tǒng)中，常用的文件排序工具有三種：sort、uniq、wc 。本章將介紹前兩種工具的用法。
  sort 是一個以行為單位對文件內(nèi)容進(jìn)行排序的工具，也可以根據(jù)不同的數(shù)據(jù)類型來排序。例如數(shù)據(jù)和字符的牌局就不一樣。sort 命令的語法為“sort [選項] 參數(shù)”，其中常用的選項包括以下幾種。

* -f：忽略大小寫；
* -b：忽略每行前面的空格；
* -M：按照月份進(jìn)行排序；
* -n：按照數(shù)字進(jìn)行排序；
* -r：反向排序；
* -u：等同于 uniq，表示相同的數(shù)據(jù)僅顯示一行；
* -t：指定分隔符，默認(rèn)使用[Tab]鍵分隔；
* -o <輸出文件>：將排序后的結(jié)果轉(zhuǎn)存至指定文件；
* -k：指定排序區(qū)域。

  示例 1：將/etc/passwd 文件中的賬號進(jìn)行排序。

[root@localhost ~]# sort /etc/passwd

 示例 2：將/etc/passwd 文件中第三列進(jìn)行反向排序。

[root@localhost ~]# sort -t ':' -rk 3 /etc/passwd nobody:x:99:99:Nobody:/:/sbin/nologin n/nologin

  示例3：將/etc/passwd 文件中第三列進(jìn)行排序，并將輸出內(nèi)容保存至user.txt 文件中。

[root@localhost ~]# sort -t ':' -k 3 /etc/passwd -o user.txt [root@localhost ~]# cat user.txt

uniq 工具

 Uniq 工具在 Linux 系統(tǒng)中通常與 sort 命令結(jié)合使用，用于報告或者忽略文件中的重復(fù)行。具體的命令語法格式為：uniq [選項] 參數(shù)。其中常用選項包括以下幾種。

* -c：進(jìn)行計數(shù)；
* -d：僅顯示重復(fù)行；

* -u：僅顯示出現(xiàn)一次的行；

 示例 1：刪除 testfile 文件中的重復(fù)行。

[root@localhost ~]# cat testfile Linux 10
Linux 20
Linux 30
Linux 30
Linux 30
CentOS 6.5
CentOS 6.5
CentOS 6.5
CentOS 7.3
CentOS 7.3
CentOS 7.3
[root@localhost ~]# uniq testfile Linux 10
Linux 20
Linux 30
CentOS 6.5
CentOS 7.3

  示例 2：刪除 testfile 文件中的重復(fù)行，并在行首顯示該行重復(fù)出現(xiàn)的次數(shù)。

[root@localhost ~]# uniq -c testfile 1 Linux 10
1 Linux 20
3 Linux 30
3 CentOS 6.5
3 CentOS 7.3

  示例 3：查找 testfile 文件中的重復(fù)行。

[root@localhost ~]# uniq -d testfile Linux 30
CentOS 6.5
CentOS 7.3

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
一門殺人于無形的藝術(shù)——>社會工程
下一篇新聞：
虛擬機(jī)安裝oracle RAC

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼

<abbr id="jjwyg"></abbr>