溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

shell字符串匹配的實(shí)現(xiàn)方法

發(fā)布時(shí)間：2021-03-16 15:06:03 來源：億速云閱讀：827 作者：小新欄目：開發(fā)技術(shù)

這篇文章主要介紹了shell字符串匹配的實(shí)現(xiàn)方法，具有一定借鑒價(jià)值，感興趣的朋友可以參考下，希望大家閱讀完這篇文章之后大有收獲，下面讓小編帶著大家一起了解一下。

一、簡介

Bash Shell提供了很多字符串和文件處理的命令。如awk、expr、grep、sed等命令，還有文件的排序、合并和分割等一系列的操作命令。grep、sed和awk內(nèi)容比較多故單獨(dú)列出，本文只涉及字符串的處理和部分文本處理命令。

二、字符串處理

1、expr命令

expr引出通用求值表達(dá)式，可以實(shí)現(xiàn)算術(shù)操作、比較操作、字符串操作和邏輯操作等功能。

（1）計(jì)算字符串長度

字符串名為string，可以使用命令${#string}或expr length $string兩種方法來計(jì)算字符串的長度。若string包括空格，需用雙引號引起來（expr length后面只能跟一個(gè)參數(shù)，string有空格會當(dāng)作多個(gè)參數(shù)處理）。

shell字符串匹配的實(shí)現(xiàn)方法

（2）子串匹配索引

expr的索引命令格式為：expr index $string $substring（子串），在字符串$string上匹配$substring中字符第一次出現(xiàn)的位置，匹配不到，expr index返回0。

shell字符串匹配的實(shí)現(xiàn)方法

"wo"在字符串string中雖然出現(xiàn)在第7，但還是返回o首次出現(xiàn)的位置5。

（3）子串匹配的長度

expr match $string $substring，在string的開頭匹配substring字符串，返回匹配到的substring字符串的長度，若string開頭匹配不到則返回0，其中substring可以是字符串也可以是正則表達(dá)式。

shell字符串匹配的實(shí)現(xiàn)方法

"world"盡管在string中出現(xiàn)，但是未出現(xiàn)在string的開頭處，因此返回0。

（4）抽取子串

Bash Shell提供兩種命令#{...}和expr實(shí)現(xiàn)抽取子串功能。

其中#{...}有兩種格式。

格式一：#{string:position}從名稱為$string的字符串的第$position個(gè)位置開始抽取子串，從0開始標(biāo)號。

格式二：#{string:position:length}增加$length變量，表示從$string字符串的第$position個(gè)位置開始抽取長度為$length的子串。

（都是從string的左邊開始計(jì)數(shù)抽取子串）

shell字符串匹配的實(shí)現(xiàn)方法

#{...}還提供了從string右邊開始計(jì)數(shù)抽取子串的功能。

格式一：#{string: -position}，冒號與橫杠間有一個(gè)空格

格式二：#{string:(position)}

shell字符串匹配的實(shí)現(xiàn)方法

expr substr也能夠?qū)崿F(xiàn)抽取子串功能，命令格式：expr substr $string $position $length，與#{...}最大不同是expr substr命令從1開始進(jìn)行標(biāo)號。

shell字符串匹配的實(shí)現(xiàn)方法

接著使用正則表達(dá)式抽取子串的命令，但只能抽取string開頭處或結(jié)尾處的子串。

抽取字符串開頭處的子串，格式一：expr match $string ' $substring '。格式二：expr $string : ' $substring '，其中冒號前后都有一個(gè)空格。

抽取字符串結(jié)尾處的子串，格式一：expr match $string '.* $substring '。格式二：expr $string : '.* $substring '。.*表示任意字符的任意重復(fù)。

shell字符串匹配的實(shí)現(xiàn)方法

（5）刪除子串

刪除字串是指將原字符串中符合條件的子串刪除，命令只有${...}格式。

從string開頭處刪除子串，格式一：${string#substring}，刪除開頭處與substring匹配的最短子串。格式二：${string##substring}刪除開頭處與substring匹配的最長子串。其中substring并非是正則表達(dá)式而是通配符。

shell字符串匹配的實(shí)現(xiàn)方法

從string結(jié)尾處開始刪除，格式一：${string%substring}，刪除結(jié)尾處與substring匹配的最短子串。格式二：${string%%substring}刪除結(jié)尾處與substring匹配的最長子串。與上述命令僅在#和%之間不同。

（5）替換子串

替換子串命令都是${...}，可以在任意處、開頭處、結(jié)尾處替換滿足條件的子串。其中的substring都不是正則表達(dá)式而是通配符。

在任意處替換子串命令，格式一：${string/substring/replacement}，僅替換第一次與substring相匹配的子串。格式二：${string//substring/replacement}，替換所有與substring相匹配的子串。

shell字符串匹配的實(shí)現(xiàn)方法

在開頭處替換與substring相匹配的子串，格式為：${string/#substring/replacement}。

在結(jié)尾除替換與substring相匹配的子串，格式為：${string/%substring/replacement}。

shell字符串匹配的實(shí)現(xiàn)方法

三、對文件的排序、合并和分割

文本處理命令包括sort命令、uniq命令、join命令、cut命令、paste命令、split命令、tr命令和tar命令，它們實(shí)現(xiàn)對文件記錄排序、統(tǒng)計(jì)、合并、提取、粘貼、分割、過濾、壓縮和解壓縮等功能，它們與sed和awk構(gòu)成了Linux文本處理的所有命令和工具。

（1）sort命令

sort命令是一種對文本排序的工具，它將輸入文件看做由多條記錄組成的數(shù)據(jù)流，而記錄由可變寬度的字段組成，以換行符作為定界符。sort命令格式：sort [選項(xiàng)] [輸入文件]

shell字符串匹配的實(shí)現(xiàn)方法

sort命令默認(rèn)的域分隔符是空格符，-t選項(xiàng)可用于設(shè)置分隔符。sort -t: test中-t與":"之間是沒有空格的。未指定-t分隔符是空格符，這時(shí)記錄內(nèi)開頭與結(jié)尾的空格都將被忽略，如（空格）:root:（空格）則只有一個(gè)域，-t:指定冒號則這條記錄就包含了三個(gè)域。

sort命令默認(rèn)是按第1個(gè)域進(jìn)行排序的，也可以通過-k選項(xiàng)指定某個(gè)域進(jìn)行排序。例如：sort -t: -k3 test。

sort命令-n選項(xiàng)可以指定根據(jù)數(shù)字大小進(jìn)行排序（不按字母順序排序）。

sort命令-r選項(xiàng)用于將排序結(jié)果逆向顯示，如使用-n按數(shù)字從小到大排序后，使用-r選項(xiàng)將結(jié)果逆向顯示。

sort命令-u選項(xiàng)去掉排序結(jié)果中的重復(fù)行。

sort命令-o選項(xiàng)加上文件名將結(jié)果保存到另一個(gè)文件中（sort默認(rèn)將排序后的結(jié)果輸出到屏幕上）。

sort命令-m選項(xiàng)將兩個(gè)排好序的文件合并成一個(gè)排好序的文件，在文件合并前它們必須已經(jīng)排好序。-m選項(xiàng)對未排序的文件合并是沒有任何意義的。

sort和awk都是分域處理文件的工具，兩者結(jié)合起來可以有效地對文本塊進(jìn)行排序。

（2）uniq命令

uniq命令用于去除文本文件中的重復(fù)行，類似sort -u，但uniq命令去除的重復(fù)行必須是連續(xù)重復(fù)出現(xiàn)的行，中間不能夾雜任何其他文本行，而sort -u命令使所有的重復(fù)記錄都被去掉。

uniq命令有3個(gè)選項(xiàng)：

shell字符串匹配的實(shí)現(xiàn)方法

uniq -c test，打印每行在文本中重復(fù)出現(xiàn)的次數(shù)。

（3）join命令

join命令用于實(shí)現(xiàn)兩個(gè)文件中記錄的連接操作，將兩個(gè)文件中具有相通域的記錄選擇出來，再將這些記錄所有的域放在一行（包含來自兩個(gè)文件的所有域）。如join -t: a.txt b.txt，將a.txt和b.txt具有共同域的記錄連接到一起。

shell字符串匹配的實(shí)現(xiàn)方法

join命令的結(jié)果默認(rèn)是不顯示這些未進(jìn)行連接的記錄，-a和-v選項(xiàng)用于顯示這些未進(jìn)行連接的記錄，-a1和-v1指顯示文件1中未連接的記錄，而-a2和-v2指顯示文件2中的未連接記錄。-a與-v的區(qū)別是：-a顯示以共同域進(jìn)行連接的結(jié)果和未進(jìn)行連接的記錄，而-v則不顯示以共同域進(jìn)行連接的記錄。

join命令默認(rèn)顯示連接記錄在兩個(gè)文件中的所有域，而且按順序。-o選項(xiàng)用于改變結(jié)果顯示的格式，可以指定顯示哪幾個(gè)域、按什么順序顯示這些域。例如：join -t: -o1.1 2.2 1.2 a.txt b.txt，其中-o1.1 2.2 1.2表示顯示格式依次顯示第1個(gè)文件中的第1個(gè)域、第2個(gè)文件中的第2個(gè)域、第1個(gè)文件中的第2個(gè)域，結(jié)果顯示三個(gè)域。

join -t: -i -1 3 -2 1 a.txt b.txt，文件1的第3個(gè)域和文件2的第1個(gè)域進(jìn)行連接，-i忽略大小寫。join命令在對兩個(gè)文件進(jìn)行連接時(shí)，兩個(gè)文件必須都是按照連接域排好序的。

（4）cut命令

cut命令用于從標(biāo)準(zhǔn)輸入或文本文件中按域或行提取文本，cut [選項(xiàng)] 文件，cut的選項(xiàng)如下：

shell字符串匹配的實(shí)現(xiàn)方法

cut -c1-5 a.txt，提取a.txt的第1～5個(gè)字符。-c有三種表示方式：-cn表示第n個(gè)字符、-cn,m表示第n個(gè)字符和第m個(gè)字符、-cn-m表示第n個(gè)字符到第m個(gè)字符。-c是按字符提取文本的，無須使用-d改變域分隔符，-f按域提取文本時(shí)就需要使用-d設(shè)置域分隔符了。-f同樣也可以用三種方式指定域數(shù)或域范圍。

cut可以靈活提取文本文件中的內(nèi)容，默認(rèn)將提取內(nèi)容放在標(biāo)準(zhǔn)輸出上，也可以使用文件重定向來將內(nèi)容保存到文件。

（5）paste命令

paste命令用于將文本文件或標(biāo)準(zhǔn)輸出中的內(nèi)容粘貼到新的文件，它可以將來自不同文件的數(shù)據(jù)粘貼到一起，形成新的文件。paste命令格式：paste [選項(xiàng)] file1 file2，其選項(xiàng)如下：

shell字符串匹配的實(shí)現(xiàn)方法

paste FILE1 FILE2，粘貼FILE1和FILE2，F(xiàn)ILE1在前，將FILE1的內(nèi)容作為每行記錄的第1域、FILE2的內(nèi)容作為第2域。可以使用-d設(shè)置域分隔符paste -d: FILE1 FILE2。

paste命令默認(rèn)是將一個(gè)文件按列粘貼的，-s選項(xiàng)可以實(shí)現(xiàn)將一個(gè)文件按行粘貼。

ls | paste -d" " - - - -，從標(biāo)準(zhǔn)輸入中讀取數(shù)據(jù)時(shí)"-"選項(xiàng)才起作用，"-"表示讀取1次標(biāo)準(zhǔn)輸入數(shù)據(jù)即讀取到標(biāo)準(zhǔn)輸入數(shù)據(jù)中的一個(gè)域，- - - - 每行顯示4個(gè)文件名。

（6）split命令

split命令用于將大文件切割成小文件，split可以按照文件的行數(shù)、字節(jié)數(shù)切割文件，并能在輸出的多個(gè)小文件中自動加上編號。split命令格式：splite [選項(xiàng)] 待切割的大文件輸出的小文件。

shell字符串匹配的實(shí)現(xiàn)方法

split -2 a.txt final.txt，按2行對a.txt進(jìn)行切割，每2行記錄切割成1個(gè)文件。split命令在final.txt后面自動加上編號以區(qū)分不同的小文件，編號為aa~zz。

split -b100 a.txt，-b選項(xiàng)在切割文件時(shí)僅考慮了文件大小并未考慮記錄的完整性。split -C100 a.txt，按100B切割a.txt，按-C并不嚴(yán)格按照100B的大小進(jìn)行切割，而是在切割時(shí)盡量維持每行的完整性。

（7）tr命令

tr命令實(shí)現(xiàn)字符轉(zhuǎn)換功能，類似于sed命令，tr能實(shí)現(xiàn)的功能sed命令都可以實(shí)現(xiàn)。tr [選項(xiàng)] buffer1 buffer2 < outputfile，其選項(xiàng)有三個(gè)，它只能從標(biāo)準(zhǔn)輸入讀取數(shù)據(jù)。

shell字符串匹配的實(shí)現(xiàn)方法

tr -d A-Z < a.txt，刪除a.txt文件中所有的大寫字母。

tr -d "[\n]" < a.txt，刪除a.txt文件中所有的換行符。

tr -s "[\n]" < a.txt，將重復(fù)出現(xiàn)的換行符壓縮成一個(gè)換行符。

tr命令也可以加上buffer1和buffer2，將buffer1用buffer2來替換，tr "[a-z]" "[A-Z]" < a.txt，將a.txt中的小寫字母替換成大寫字母。

（8）tar命令

tar命令是linux的歸檔命令，實(shí)現(xiàn)linux系統(tǒng)文件的壓縮和解壓縮。tar [選項(xiàng)] 文件名或目錄名，tar的常用選項(xiàng)如下：

shell字符串匹配的實(shí)現(xiàn)方法

tar -cf a.tar *.txt，將所有的.txt結(jié)尾的文件放入壓縮包a.tar。-c表示創(chuàng)建新的包，-f通常是必選選項(xiàng)。

tar -tf a.tar，查看a.tar壓縮包的內(nèi)容。-t列出包內(nèi)容。

tar -rf a.tar log*，將以log開頭的文件添加到a.tar中，-u選項(xiàng)也可用于為包添加新的文件，-u選項(xiàng)完全能代替-r選項(xiàng)。

解壓非gzip格式的壓縮包：tar -xvf 壓縮包名稱

解壓gzip格式的壓縮包：tar -zxvf 壓縮包名稱

感謝你能夠認(rèn)真閱讀完這篇文章，希望小編分享的“shell字符串匹配的實(shí)現(xiàn)方法”這篇文章對大家有幫助，同時(shí)也希望大家多多支持億速云，關(guān)注億速云行業(yè)資訊頻道，更多相關(guān)知識等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
html5+css3中怎么樣制作header
下一篇新聞：
SpringBoot擴(kuò)展外部化配置的原理是什么

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼