如何理解awk編程及相關(guān)命令

發(fā)布時(shí)間：2021-09-30 11:43:34 來(lái)源：億速云閱讀：109 作者：iii 欄目：開(kāi)發(fā)技術(shù)

這篇文章主要講解了“如何理解awk編程及相關(guān)命令”，文中的講解內(nèi)容簡(jiǎn)單清晰，易于學(xué)習(xí)與理解，下面請(qǐng)大家跟著小編的思路慢慢深入，一起來(lái)研究和學(xué)習(xí)“如何理解awk編程及相關(guān)命令”吧！

一，什么是awk

awk是linux下的一個(gè)命令，他對(duì)其他命令的輸出，對(duì)文件的處理都十分強(qiáng)大，其實(shí)他更像一門(mén)編程語(yǔ)言，他可以自定義變量，有條件語(yǔ)句，有循環(huán)，有數(shù)組，有正則，有函數(shù)等。他讀取輸出，或者文件的方式是一行，一行的讀，根據(jù)你給出的條件進(jìn)行查找，并在找出來(lái)的行中進(jìn)行操作，感覺(jué)他的設(shè)計(jì)思想，真的很簡(jiǎn)單，但是結(jié)合實(shí)際情況，具體操作起來(lái)就沒(méi)有那么簡(jiǎn)單了。他有三種形勢(shì)，awk，gawk，nawk，平時(shí)所說(shuō)的awk其實(shí)就是gawk。

二，awk中的記錄，域，分割符

當(dāng)我們讀取輸出時(shí)，或者讀取文件時(shí)，讀取一行就是一個(gè)記錄。記錄分割符是默認(rèn)是回車(chē)符，保存在RS，ORS中。
我們從記錄中分割出我們要單詞，或者是詞組等，我們稱(chēng)他為域，域分割符，默認(rèn)的是空格和TAB銉，保存在內(nèi)建變
量ORS中。舉個(gè)例子：
aaaa:bbbb:ccccccc
1111:2343:5t43343
上面有二行，這二行就是二個(gè)記錄，每行后面的回車(chē)呢，就是記錄分割符，里面冒號(hào)呢，就是域分割符，分割出來(lái)的，aaaa,1111這類(lèi)東西就是域了。
awk -F: '{print $1}' testfile

三，awk的內(nèi)建變量和運(yùn)算符

1，變量

變量	描述
$n	當(dāng)前記錄的第n個(gè)字段，字段間由 FS分隔。
$0	完整的輸入記錄。
ARGC	命令行參數(shù)的數(shù)目。
ARGIND	命令行中當(dāng)前文件的位置(從0開(kāi)始算)。
ARGV	包含命令行參數(shù)的數(shù)組。
CONVFMT	數(shù)字轉(zhuǎn)換格式(默認(rèn)值為%.6g)
ENVIRON	環(huán) 境變量關(guān)聯(lián)數(shù)組。
ERRNO	最后一個(gè)系統(tǒng)錯(cuò)誤的描述。
FIELDWIDTHS	字段寬度列表(用空格鍵分隔)。
FILENAME	當(dāng)前文件名。
FNR	同 NR，但相對(duì)于當(dāng)前文件。
FS	字段分隔符(默認(rèn)是任何空格)。
IGNORECASE	如果為真，則進(jìn)行忽略大小寫(xiě)的匹配。
NF	當(dāng)前記錄中的字段數(shù)。
NR	當(dāng) 前記錄數(shù)。
OFMT	數(shù)字的輸出格式(默認(rèn)值是%.6g)。
OFS	輸出字段分隔符(默認(rèn)值是一個(gè)空格)。
ORS	輸出記錄分隔符(默認(rèn)值是一個(gè)換行符)。
RLENGTH	由 match函數(shù)所匹配的字符串的長(zhǎng)度。
RS	記錄分隔符(默認(rèn)是一個(gè)換行符)。
RSTART	由 match函數(shù)所匹配的字符串的第一個(gè)位置。
SUBSEP	數(shù)組下標(biāo)分隔符(默認(rèn)值是\034)。

2，運(yùn)算符

運(yùn)算符	描述
= += -= = /= %= ^= *=	賦值
?:	C條件表達(dá)式
\|\|	邏輯或
&&	邏輯與
~ ~!	匹配正則表達(dá)式和不匹配正則表達(dá)式
< <= > >= != ==	關(guān) 系運(yùn)算符
空格	連接
+ -	加，減
* / &	乘，除與求余
+ - !	一元加，減和邏輯非
^ ***	求冪
++ --	增加或減少，作為前綴或后綴
$	字段引用
in	數(shù)組成員

四，awk的正則

匹配符	描述
\Y	匹配一個(gè)單詞開(kāi)頭或者末尾的空字符串
\B	匹配單詞內(nèi)的空字符串
\<	匹配一個(gè)單詞的開(kāi)頭的空字符串，錨定開(kāi)始
\>	匹配一個(gè)單詞的末尾的空字符串，錨定末尾
\W	匹配一個(gè)非字母數(shù)字組成的單詞
\w	匹配一個(gè)字母數(shù)字組成的單詞
\'	匹配字符串末尾的一個(gè)空字符串
\‘	匹配字符串開(kāi)頭的一個(gè)空字符串

五，awk的函數(shù)

1，字符串函數(shù)

函數(shù)名	描述
sub	匹配記錄中最大、最靠左邊的子字符串的正則表達(dá)式，并用替換字符串替換這些字符串。如果沒(méi)有指定目標(biāo)字符串就默認(rèn)使用整個(gè)記錄。替換只發(fā)生在第一次匹配的時(shí)候
gsub	整個(gè)文檔中進(jìn)行匹配
index	返回子字符串第一次被匹配的位置，偏移量從位置1開(kāi)始
substr	返回從位置1開(kāi)始的子字符串，如果指定長(zhǎng)度超過(guò)實(shí)際長(zhǎng)度，就返回整個(gè)字符串
split	可按給定的分隔符把字符串分割為一個(gè)數(shù)組。如果分隔符沒(méi)提供，則按當(dāng)前FS值進(jìn)行分割
length	返回記錄的字符數(shù)
match	返回在字符串中正則表達(dá)式位置的索引，如果找不到指定的正則表達(dá)式則返回0。match函數(shù)會(huì)設(shè)置內(nèi)建變量RSTART為字符串中子字符串的開(kāi)始位置，RLENGTH為到子字符串末尾的字符個(gè)數(shù)。substr可利于這些變量來(lái)截取字符串
toupper和tolower	可用于字符串大小間的轉(zhuǎn)換，該功能只在gawk中有效

2，數(shù)學(xué)函數(shù)

函數(shù)名	返回值
atan2(x,y)	y,x 范圍內(nèi)的余切
cos(x)	余弦函數(shù)
exp(x)	求冪
int(x)	取整
log(x)	自然對(duì) 數(shù)
rand()	隨機(jī)數(shù)
sin(x)	正弦
sqrt(x)	平方根
srand(x)	x是rand()函數(shù)的種子
int(x)	取整，過(guò)程沒(méi)有舍入
rand()	產(chǎn)生一個(gè)大于等于0而小于1的隨機(jī)數(shù)

六，實(shí)例

學(xué)習(xí)awk的時(shí)候，做了一個(gè)例子，學(xué)東西，不要光看，光看是記不住東西的。光看的話，也許你知道怎么回事，真正實(shí)際操作，不是這兒有問(wèn)題，就是那兒有問(wèn)題。所以一定要?jiǎng)邮钟H自操作一下。

1，測(cè)試文件test

代碼如下:

root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/bin/false
daemon:x:2:2:daemon:/sbin:/bin/false
mail:x:8:12:mail:/var/spool/mail:/bin/false
ftp:x:14:11:ftp:/home/ftp:/bin/false
&nobody:$:99:99:nobody:/:/bin/false
zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
http:x:33:33::/srv/http:/bin/false
dbus:x:81:81:System message bus:/:/bin/false
hal:x:82:82:HAL daemon:/:/bin/false
mysql:x:89:89::/var/lib/mysql:/bin/false
aaa:x:1001:1001::/home/aaa:/bin/bash
ba:x:1002:1002::/home/zhangy:/bin/bash
test:x:1003:1003::/home/test:/bin/bash
@zhangying:*:1004:1004::/home/test:/bin/bash
policykit:x:102:1005:Po

例1：

代碼如下:

cat test | awk -F: '{\
if ($1 == "root"){\
print $1;\
}else if($1 == "bin"){\
print $2;\
}else{\
print $3;\
} \
}'

例2：

代碼如下:

awk '{\
for(i=0;i<NF;i++){\
if ($i ~/^root/){\
print $i;\
}else if($i ~/zhangy/){\
print $i;continue;\
}else if($i ~/mysql/){\
print $i;next;\
}else if($i ~/^test/){\
print $i;break;\
} \
}\
}' test

例3：

代碼如下:

tail test | awk 'BEGIN{while(getline d){ split(d,test);for(i in test){\
print test[i]\
}}}'

例4：

代碼如下:

ls -al /home/zhangy/mytest | awk 'BEGIN{while(getline d){ split(d,test);\
print test[9] ;}
}'

例5：

代碼如下:

echo "32:34" |awk -F: '{print "max = ",max($1,$2)}\
function max(one,two){
if(one > two){
return one;
}else{
return two;
}
}
'

例6：

代碼如下:

#awk 'BEGIN{print "what is your name"; getline name < "/dev/tty"}$1 ~name{print
#"found name on line" NR}END{print "see you" name}' test
#awk '{sub(/daemon/,"tankzhang");print}' test
#awk '{{sub(/zhangy/,"tankzhang");$1};print}' test

#awk '{{gsub(/zhangy/,"tankzhang");$1};print}' test
#awk -F: '{print index("zhangy",$1)}' test
#awk -F: '{print substr($1,1,2)}' test
awk -F: '{mat=match($1,/^[a-zA-Z]+$/);print mat,RSTART,RLENGTH}' test

例7：

代碼如下:

cat test |awk -F: '\
NF != 7{\
printf("line %d,does not have 7 fields:%s\n",NR,$0)}\
$1 !~ /^[A-Za-z0-9]/{printf("line %d,non alpha and numeric user id:%s: %s\n",NR,$1,$0)}\
$2 == "*" {printf("lind %d,no password:%s\n",NR,$0)}'

感謝各位的閱讀，以上就是“如何理解awk編程及相關(guān)命令”的內(nèi)容了，經(jīng)過(guò)本文的學(xué)習(xí)后，相信大家對(duì)如何理解awk編程及相關(guān)命令這一問(wèn)題有了更深刻的體會(huì)，具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云，小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章，歡迎關(guān)注！

向AI問(wèn)一下細(xì)節(jié)

如何理解awk編程及相關(guān)命令

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽