溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Shell 腳本編程的實(shí)踐是怎樣的

發(fā)布時(shí)間:2022-01-21 09:56:28 來(lái)源:億速云 閱讀:121 作者:柒染 欄目:開(kāi)發(fā)技術(shù)

這篇文章跟大家分析一下“Shell 腳本編程的實(shí)踐是怎樣的”。內(nèi)容詳細(xì)易懂,對(duì)“Shell 腳本編程的實(shí)踐是怎樣的”感興趣的朋友可以跟著小編的思路慢慢深入來(lái)閱讀一下,希望閱讀后能夠?qū)Υ蠹矣兴鶐椭O旅娓【幰黄鹕钊雽W(xué)習(xí)“Shell 腳本編程的實(shí)踐是怎樣的”的知識(shí)吧。

代碼風(fēng)格規(guī)范

開(kāi)頭有“蛇棒”

所謂shebang其實(shí)就是在很多腳本的第一行出現(xiàn)的以#!開(kāi)頭的注釋,他指明了當(dāng)我們沒(méi)有指定解釋器的時(shí)候默認(rèn)的解釋器,一般可能是下面這樣:

#!/bin/bash

當(dāng)然,解釋器有很多種,除了bash之外,我們可以用下面的命令查看本機(jī)支持的解釋器:

$ cat /etc/shells#/etc/shells: valid login shells/bin/sh/bin/dash/bin/bash/bin/rbash/usr/bin/screen

當(dāng)我們直接使用./a.sh來(lái)執(zhí)行這個(gè)腳本的時(shí)候,如果沒(méi)有shebang,那么它就會(huì)默認(rèn)用$SHELL指定的解釋器,否則就會(huì)用shebang指定的解釋器。

這種方式是我們推薦的使用方式。

代碼有注釋

注釋,顯然是一個(gè)常識(shí),不過(guò)這里還是要再?gòu)?qiáng)調(diào)一下,這個(gè)在shell腳本里尤為重要。因?yàn)楹芏鄦涡械膕hell命令不是那么淺顯易懂,沒(méi)有注釋的話在維護(hù)起來(lái)會(huì)讓人尤其的頭大。

注釋的意義不僅在于解釋用途,而在于告訴我們注意事項(xiàng),就像是一個(gè)README。

具體的來(lái)說(shuō),對(duì)于shell腳本,注釋一般包括下面幾個(gè)部分:

  • shebang
  • 腳本的參數(shù)
  • 腳本的用途
  • 腳本的注意事項(xiàng)
  • 腳本的寫(xiě)作時(shí)間,作者,版權(quán)等
  • 各個(gè)函數(shù)前的說(shuō)明注釋
  • 一些較復(fù)雜的單行命令注釋
參數(shù)要規(guī)范

這一點(diǎn)很重要,當(dāng)我們的腳本需要接受參數(shù)的時(shí)候,我們一定要先判斷參數(shù)是否合乎規(guī)范,并給出合適的回顯,方便使用者了解參數(shù)的使用。

最少,最少,我們至少得判斷下參數(shù)的個(gè)數(shù)吧:

if [[ $# != 2 ]];then    echo "Parameter incorrect."    exit 1fi
變量和魔數(shù)

一般情況下我們會(huì)將一些重要的環(huán)境變量定義在開(kāi)頭,確保這些變量的存在。

source /etc/profileexport PATH=”/usr/local/bin:/usr/bin:/bin:/usr/local/sbin:/usr/sbin:/sbin:/apps/bin/”

這種定義方式有一個(gè)很常見(jiàn)的用途,最典型的應(yīng)用就是,當(dāng)我們本地安裝了很多java版本時(shí),我們可能需要指定一個(gè)java來(lái)用。那么這時(shí)我們就會(huì)在腳本開(kāi)頭重新定義JAVA_HOME以及PATH變量來(lái)進(jìn)行控制。同時(shí),一段好的代碼通常是不會(huì)有很多硬編碼在代碼里的“魔數(shù)”的。如果一定要有,通常是用一個(gè)變量的形式定義在開(kāi)頭,然后調(diào)用的時(shí)候直接調(diào)用這個(gè)變量,這樣方便日后的修改。

縮進(jìn)有規(guī)矩

對(duì)于shell腳本,縮進(jìn)是個(gè)大問(wèn)題。因?yàn)楹芏嘈枰s進(jìn)的地方(比如if,for語(yǔ)句)都不長(zhǎng),所有很多人都懶得去縮進(jìn),而且很多人不習(xí)慣用函數(shù),導(dǎo)致縮進(jìn)功能被弱化。

其實(shí)正確的縮進(jìn)是很重要的,尤其是在寫(xiě)函數(shù)的時(shí)候,否則我們?cè)陂喿x的時(shí)候很容易把函數(shù)體跟直接執(zhí)行的命令搞混。

常見(jiàn)的縮進(jìn)方法主要有”soft tab”和”hard tab”兩種。

  • 所謂soft tab就是使用n個(gè)空格進(jìn)行縮進(jìn)(n通常是2或4)
  • 所謂hard tab當(dāng)然就是指真實(shí)的\t字符
  • 這里不去撕哪種方式最好,只能說(shuō)各有各的優(yōu)劣。反正我習(xí)慣用hard tab。
  • 對(duì)于if和for語(yǔ)句之類的,我們最好不要把then,do這些關(guān)鍵字單獨(dú)寫(xiě)一行,這樣看上去比較丑。。。
命名有標(biāo)準(zhǔn)

所謂命名規(guī)范,基本包含下面這幾點(diǎn):

  • 文件名規(guī)范,以.sh結(jié)尾,方便識(shí)別
  • 變量名字要有含義,不要拼錯(cuò)
  • 統(tǒng)一命名風(fēng)格,寫(xiě)shell一般用小寫(xiě)字母加下劃線
編碼要統(tǒng)一

在寫(xiě)腳本的時(shí)候盡量使用UTF-8編碼,能夠支持中文等一些奇奇怪怪的字符。不過(guò)雖然能寫(xiě)中文,但是在寫(xiě)注釋以及打log的時(shí)候還是盡量英文,畢竟很多機(jī)器還是沒(méi)有直接支持中文的,打出來(lái)可能會(huì)有亂碼。這里還尤其需要注意一點(diǎn),就是當(dāng)我們是在windows下用utf-8編碼來(lái)寫(xiě)shell腳本的時(shí)候,一定要注意這個(gè)utf-8是否是有BOM的。默認(rèn)情況下windows判斷utf-8格式是通過(guò)在文件開(kāi)頭加上三個(gè)EF BB BF字節(jié)來(lái)判斷的,但是在Linux中默認(rèn)是無(wú)BOM的。因此如果我們是在windows下寫(xiě)腳本的時(shí)候,一定要注意將編碼改成Utf-8無(wú)BOM,一般用notepad++之類的編輯器都能改。否則,在Linux下運(yùn)行的時(shí)候就會(huì)識(shí)別到開(kāi)頭的三個(gè)字符,從而報(bào)一些無(wú)法識(shí)別命令的錯(cuò)。當(dāng)然,對(duì)于跨平臺(tái)寫(xiě)腳本還有一個(gè)比較常見(jiàn)的問(wèn)題就是換行符不同。windows默認(rèn)是\r\n而unix下是\n。不過(guò)有兩個(gè)小工具可以非常方便的解決這個(gè)問(wèn)題:dos2unix,unix2dos。

權(quán)限記得加

這一點(diǎn)雖然很小,但是我個(gè)人卻經(jīng)常忘記,不加執(zhí)行權(quán)限會(huì)導(dǎo)致無(wú)法直接執(zhí)行,有點(diǎn)討厭。。。

日志和回顯

日志的重要性不必多說(shuō),能夠方便我們回頭糾錯(cuò),在大型的項(xiàng)目里是非常重要的。

如果這個(gè)腳本是供用戶直接在命令行使用的,那么我們最好還要能夠在執(zhí)行時(shí)實(shí)時(shí)回顯執(zhí)行過(guò)程,方便用戶掌控。

有時(shí)候?yàn)榱颂岣哂脩趔w驗(yàn),我們會(huì)在回顯中添加一些特效,比如顏色啊,閃爍啊之類的,具體可以參考ANSI/VT100 Control sequences這篇文章的介紹。

密碼要移除

不要把密碼硬編碼在腳本里,不要把密碼硬編碼在腳本里,不要把密碼硬編碼在腳本里。

重要的事情說(shuō)三遍,尤其是當(dāng)腳本托管在類似Github這類平臺(tái)中時(shí)。。。

太長(zhǎng)要分行

在調(diào)用某些程序的時(shí)候,參數(shù)可能會(huì)很長(zhǎng),這時(shí)候?yàn)榱吮WC較好的閱讀體驗(yàn),我們可以用反斜杠來(lái)分行:

./configure \–prefix=/usr \–sbin-path=/usr/sbin/nginx \–conf-path=/etc/nginx/nginx.conf \

注意在反斜杠前有個(gè)空格。

編碼細(xì)節(jié)規(guī)范

代碼有效率

在使用命令的時(shí)候要了解命令的具體做法,尤其當(dāng)數(shù)據(jù)處理量大的時(shí)候,要時(shí)刻考慮該命令是否會(huì)影響效率。

比如下面的兩個(gè)sed命令:

sed -n '1p' filesed -n '1p;1q' file

他們的作用一樣,都是獲取文件的第一行。但是第一條命令會(huì)讀取整個(gè)文件,而第二條命令只讀取第一行。當(dāng)文件很大的時(shí)候,僅僅是這樣一條命令不一樣就會(huì)造成巨大的效率差異。

當(dāng)然,這里只是為了舉一個(gè)例子,這個(gè)例子真正正確的用法應(yīng)該是使用head -n1 file命令。。。

勤用雙引號(hào)

幾乎所有的大佬都推薦在使用”$”來(lái)獲取變量的時(shí)候最好加上雙引號(hào)。

不加上雙引號(hào)在很多情況下都會(huì)造成很大的麻煩,為什么呢?舉一個(gè)例子:

#!/bin/sh#已知當(dāng)前文件夾有一個(gè)a.sh的文件var="*.sh"echo $varecho "$var"

他的運(yùn)行結(jié)果如下:

a.sh*.sh

為啥會(huì)這樣呢?其實(shí)可以解釋為他執(zhí)行了下面的命令:

echo *.shecho "*.sh"

在很多情況下,在將變量作為參數(shù)的時(shí)候,一定要注意上面這一點(diǎn),仔細(xì)體會(huì)其中的差異。上面只是一個(gè)非常小的例子,實(shí)際應(yīng)用的時(shí)候由于這個(gè)細(xì)節(jié)導(dǎo)致的問(wèn)題實(shí)在是太多了。。。

巧用main函數(shù)

我們知道,像java,C這樣的編譯型語(yǔ)言都會(huì)有一個(gè)函數(shù)入口,這種結(jié)構(gòu)使得代碼可讀性很強(qiáng),我們知道哪些直接執(zhí)行,那些是函數(shù)。但是腳本不一樣,腳本屬于解釋性語(yǔ)言,從第一行直接執(zhí)行到最后一行,如果在這當(dāng)中命令與函數(shù)糅雜在一起,那就非常難讀了。

用python的朋友都知道,一個(gè)合乎標(biāo)準(zhǔn)的python腳本大體上至少是這樣的:

#!/usr/bin/env pythondef func1():    passdef func2():    passif __name__=='__main__':    func1()    func2()

他用一個(gè)很巧妙的方法實(shí)現(xiàn)了我們習(xí)慣的main函數(shù),使得代碼可讀性更強(qiáng)。

在shell中,我們也有類似的小技巧:

#!/usr/bin/env bashfunc1(){    #do sth}func2(){    #do sth}main(){    func1    func2}main "$@"

我們可以采用這種寫(xiě)法,同樣實(shí)現(xiàn)類似的main函數(shù),使得腳本的結(jié)構(gòu)化程度更好。

考慮作用域

shell中默認(rèn)的變量作用域都是全局的,比如下面的腳本:

#!/usr/bin/env bashvar=1func(){    var=2}funcecho $var

他的輸出結(jié)果就是2而不是1,這樣顯然不符合我們的編碼習(xí)慣,很容易造成一些問(wèn)題。

因此,相比直接使用全局變量,我們最好使用local readonly這類的命令,其次我們可以使用declare來(lái)聲明變量。這些方式都比使用全局方式定義要好。

函數(shù)返回值

在使用函數(shù)的時(shí)候一定要注意,shell中函數(shù)的返回值只能是整數(shù),估計(jì)是因?yàn)橐话闱闆r下一個(gè)函數(shù)的返回值通常表示這個(gè)函數(shù)的運(yùn)行狀態(tài),所以一般都是0或者是1就夠了,因此就設(shè)計(jì)成了這樣。不過(guò),如果非得想傳遞字符串,也可以通過(guò)下面變通的方法:

func(){    echo "2333"}res=$(func)echo "This is from $res."

這樣,通過(guò)echo或者print之類的就可以做到傳一些額外參數(shù)的目的。

間接引用值

什么叫間接引用?比如下面這個(gè)場(chǎng)景:

VAR1="2323232"VAR2="VAR1"

我們有一個(gè)變量VAR1,又有一個(gè)變量VAR2,這個(gè)VAR2的值是VAR1的名字,那么我們現(xiàn)在想通過(guò)VAR2來(lái)獲取VAR1的值,這時(shí)候應(yīng)該怎么辦呢?

比較土鱉的方法是這樣:

eval echo \$$VAR2

啥意思呢?其實(shí)就是構(gòu)造了一個(gè)字符串echo XXX,這個(gè)XXX就是XXX”,這個(gè)XXX就是VAR2的值VAR1,然后再用eval強(qiáng)制解析,這樣就做到了變相取值。

這個(gè)用法的確可行,但是看起來(lái)十分的不舒服,很難直觀的去理解,我們并不推薦。而且事實(shí)上我們本身就不推薦使用eval這個(gè)命令。

比較舒服的寫(xiě)法是下面這樣:

echo ${!VAR1}

通過(guò)在變量名前加一個(gè)!就可以做到簡(jiǎn)單的間接引用了。

不過(guò)需要注意的是,用上面的方法,我們只能夠做到取值,而不能做到賦值。如果想要做到賦值,還要老老實(shí)實(shí)的用eval來(lái)處理:

VAR1=VAR2eval $VAR1=233echo $VAR2
巧用heredocs

所謂heredocs,也可以算是一種多行輸入的方法,即在”

使用heredocs,我們可以非常方便的生成一些模板文件:

cat>>/etc/rsyncd.conf local/logs/rsyncd.logtransfer logging = yeslog format = %t %a %m %f %bsyslog facility = local3EOF
學(xué)會(huì)查路徑

很多情況下,我們會(huì)先獲取當(dāng)前腳本的路徑,然后一這個(gè)路徑為基準(zhǔn),去找其他的路徑。通常我們是直接用pwd以期獲得腳本的路徑。

不過(guò)其實(shí)這樣是不嚴(yán)謹(jǐn)?shù)?,pwd獲得的是當(dāng)前shell的執(zhí)行路徑,而不是當(dāng)前腳本的執(zhí)行路徑。

正確的做法應(yīng)該是下面這兩種:

script_dir=$(cd $(dirname $0) && pwd)script_dir=$(dirname $(readlink -f $0 ))

應(yīng)當(dāng)先cd進(jìn)當(dāng)前腳本的目錄然后再pwd,或者直接讀取當(dāng)前腳本的所在路徑。

代碼要簡(jiǎn)短

這里的簡(jiǎn)短不單單是指代碼長(zhǎng)度,而是只用到的命令數(shù)。原則上我們應(yīng)當(dāng)做到,能一條命令解決的問(wèn)題絕不用兩條命令解決。這不僅牽涉到代碼的可讀性,而且也關(guān)乎代碼的執(zhí)行效率。

最最經(jīng)典的例子如下:

cat /etc/passwd | grep rootgrep root /etc/passwd

cat命令最為人不齒的用法就是這樣,用的沒(méi)有任何意義,明明一條命令可以解決,他非得加根管道。。。

其實(shí)代碼簡(jiǎn)短在還能某種程度上能保證效率的提升,比如下面的例子:

#method1find . -name '*.txt' |xargs sed -i s/233/666/gfind . -name '*.txt' |xargs sed -i s/235/626/gfind . -name '*.txt' |xargs sed -i s/333/616/gfind . -name '*.txt' |xargs sed -i s/233/664/g#method1find . -name '*.txt' |xargs sed -i "s/233/666/g;s/235/626/g;s/333/616/g;s/233/664/g"

這兩種方法做的事情都一樣,就是查找所有的.txt后綴的文件并做一系列替換。前者是多次執(zhí)行find,后者是執(zhí)行一次find,但是增加了sed的模式串。第一種更直觀一點(diǎn),但是當(dāng)替換的量變大的時(shí)候,第二種的速度就會(huì)比第一種快很多。這里效率提升的原因,就是第二種只要執(zhí)行一次命令,而第一種要執(zhí)行多次。并且,巧用xargs命令,我們還可以十分方便的進(jìn)行并行化處理:

find . -name '*.txt' |xargs -P $(nproc) sed -i "s/233/666/g;s/235/626/g;s/333/616/g;s/233/664/g"

通過(guò)-P參數(shù)指定并行度,可以進(jìn)一步加快執(zhí)行效率。

命令并行化

當(dāng)我們需要充分考慮執(zhí)行效率時(shí),我們可能需要在執(zhí)行命令的時(shí)候考慮并行化。shell中最簡(jiǎn)單的并行化是通過(guò)”&”以及”wait”命令來(lái)做:

func(){    #do sth}for((i=0;i

當(dāng)然,這里并行的次數(shù)不能太多,否則機(jī)器會(huì)卡死。稍微正確的做法比較復(fù)雜,以后再討論,如果圖省事可以使用parallel命令來(lái)做,或者是用上面提到的xargs來(lái)處理。

全文本檢索

我們知道,當(dāng)我們想在文件夾下所有的txt文件中檢索某一個(gè)字符串(比如233)的時(shí)候,我們可能會(huì)用類似這樣的命令:

find . -name '*.txt' -type f | xargs grep 2333

很多情況下,這個(gè)命令會(huì)想我們所想的找到對(duì)應(yīng)的匹配行,但是我們需要注意兩個(gè)小問(wèn)題。

find命令會(huì)符合要求的匹配文件名,但是如果文件名包含空格,這時(shí)候?qū)⑽募麄鹘ogrep的時(shí)候就會(huì)有問(wèn)題,這個(gè)文件就會(huì)被當(dāng)成兩個(gè)參數(shù),這時(shí)候就要加一層處理,保證用空格分開(kāi)的文件名不會(huì)被當(dāng)成兩個(gè)參數(shù):

find . -type f|xargs -i echo '"{}"'|xargs grep 2333

有時(shí)候,文件的字符集可能跟終端的字符集不一致,這時(shí)候就會(huì)導(dǎo)致grep在搜索時(shí)將文件當(dāng)成二進(jìn)制文件從而報(bào)binary file matches之類的問(wèn)題。這時(shí)候要么用iconv之類的字符集轉(zhuǎn)換工具將字符集進(jìn)行切換,要么就在不影響查找的情況下對(duì)grep加-a參數(shù),將所有文件看成文本文件:

find . -type f|xargs grep -a 2333
使用新寫(xiě)法

這里的新寫(xiě)法不是指有多厲害,而是指我們可能更希望使用較新引入的一些語(yǔ)法,更多是偏向代碼風(fēng)格的,比如

盡量使用func(){}來(lái)定義函數(shù),而不是func{}

盡量使用[[]]來(lái)代替[]

盡量使用$()將命令的結(jié)果賦給變量,而不是反引號(hào)

在復(fù)雜的場(chǎng)景下盡量使用printf代替echo進(jìn)行回顯

事實(shí)上,這些新寫(xiě)法很多功能都比舊的寫(xiě)法要強(qiáng)大,用的時(shí)候就知道了。

其他小tip

考慮到還有很多零碎的點(diǎn),就不一一展開(kāi)了,這里簡(jiǎn)單提一提。

路徑盡量保持絕對(duì)路徑,絕多路徑不容易出錯(cuò),如果非要用相對(duì)路徑,最好用./修飾

優(yōu)先使用bash的變量替換代替awk sed,這樣更加簡(jiǎn)短

簡(jiǎn)單的if盡量使用&& ||,寫(xiě)成單行。

比如[[ x > 2]] && echo x

當(dāng)export變量時(shí),盡量加上子腳本的namespace,保證變量不沖突

會(huì)使用trap捕獲信號(hào),并在接受到終止信號(hào)時(shí)執(zhí)行一些收尾工作

使用mktemp生成臨時(shí)文件或文件夾

利用/dev/null過(guò)濾不友好的輸出信息

會(huì)利用命令的返回值判斷命令的執(zhí)行情況

使用文件前要判斷文件是否存在,否則做好異常處理

不要處理ls后的數(shù)據(jù)(比如ls -l | awk ‘{ print $8 }’),ls的結(jié)果非常不確定,并且平臺(tái)有關(guān)

讀取文件時(shí)不要使用for loop而要使用while read

使用cp -r命令復(fù)制文件夾的時(shí)候要注意如果目的文件夾不存在則會(huì)創(chuàng)建,如果存在則會(huì)復(fù)制到該文件的子文件夾下

靜態(tài)檢查工具shellcheck
概述

為了從制度上保證腳本的質(zhì)量,我們最簡(jiǎn)單的想法大概就是搞一個(gè)靜態(tài)檢查工具,通過(guò)引入工具來(lái)彌補(bǔ)開(kāi)發(fā)者可能存在的知識(shí)盲點(diǎn)。

市面上對(duì)于shell的靜態(tài)檢查工具還真不多,找來(lái)找去就找到一個(gè)叫shellcheck的工具,開(kāi)源在github上,有8K多的star,看上去還是十分靠譜的。我們可以去他的主頁(yè)了解具體的安裝和使用信息。

安裝

這個(gè)工具的對(duì)不同平臺(tái)的支持力度都很大,他至少支持了Debian,Arch,Gentoo,EPEL,Fedora,OS X,openSUSE等等各種的平臺(tái)的主流包管理工具。安裝方便。具體可以參照安裝文檔

集成

既然是靜態(tài)檢查工具,就一定可以集成在CI框架里,shellcheck可以非常方便的集成在Travis CI中,供以shell腳本為主語(yǔ)言的項(xiàng)目進(jìn)行靜態(tài)檢查。

樣例

在文檔的Gallery of bad code里,也提供了非常詳細(xì)的“壞代碼”的標(biāo)準(zhǔn),具有非常不錯(cuò)的參考價(jià)值,可以在閑下來(lái)的時(shí)候當(dāng)成”Java Puzzlers“之類的書(shū)來(lái)讀讀還是很愜意的。

關(guān)于Shell 腳本編程的實(shí)踐是怎樣的就分享到這里啦,希望上述內(nèi)容能夠讓大家有所提升。如果想要學(xué)習(xí)更多知識(shí),請(qǐng)大家多多留意小編的更新。謝謝大家關(guān)注一下億速云網(wǎng)站!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI