溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

如何理解awk編程及相關(guān)命令

發(fā)布時(shí)間:2021-09-30 11:43:34 來(lái)源:億速云 閱讀:109 作者:iii 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要講解了“如何理解awk編程及相關(guān)命令”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“如何理解awk編程及相關(guān)命令”吧!

一,什么是awk

awk是linux下的一個(gè)命令,他對(duì)其他命令的輸出,對(duì)文件的處理都十分強(qiáng)大,其實(shí)他更像一門(mén)編程語(yǔ)言,他可以自定義變量,有條件語(yǔ)句,有循環(huán),有數(shù)組,有正則,有函數(shù)等。他讀取輸出,或者文件的方式是一行,一行的讀,根據(jù)你給出的條件進(jìn)行查找,并在找出來(lái)的行中進(jìn)行操作,感覺(jué)他的設(shè)計(jì)思想,真的很簡(jiǎn)單,但是結(jié)合實(shí)際情況,具體操作起來(lái)就沒(méi)有那么簡(jiǎn)單了。他有三種形勢(shì),awk,gawk,nawk,平時(shí)所說(shuō)的awk其實(shí)就是gawk。

二,awk中的記錄,域,分割符

當(dāng)我們讀取輸出時(shí),或者讀取文件時(shí),讀取一行就是一個(gè)記錄。記錄分割符是默認(rèn)是回車(chē)符,保存在RS,ORS中。
我們從記錄中分割出我們要單詞,或者是詞組等,我們稱(chēng)他為域,域分割符,默認(rèn)的是空格和TAB銉,保存在內(nèi)建變
量ORS中。舉個(gè)例子:
aaaa:bbbb:ccccccc
1111:2343:5t43343
上面有二行,這二行就是二個(gè)記錄,每行后面的回車(chē)呢,就是記錄分割符,里面冒號(hào)呢,就是域分割符,分割出來(lái)的,aaaa,1111這類(lèi)東西就是域了。
awk -F: '{print $1}' testfile

三,awk的內(nèi)建變量和運(yùn)算符

1,變量

變 量描述
$n當(dāng)前記錄的第n個(gè)字段,字段間由 FS分隔。
$0完整的輸入記錄。
ARGC命 令行參數(shù)的數(shù)目。
ARGIND命令行中當(dāng)前文件的位置(從0開(kāi)始算)。
ARGV包 含命令行參數(shù)的數(shù)組。
CONVFMT數(shù)字轉(zhuǎn)換格式(默認(rèn)值為%.6g)
ENVIRON環(huán) 境變量關(guān)聯(lián)數(shù)組。
ERRNO最后一個(gè)系統(tǒng)錯(cuò)誤的描述。
FIELDWIDTHS字 段寬度列表(用空格鍵分隔)。
FILENAME當(dāng)前文件名。
FNR同 NR,但相對(duì)于當(dāng)前文件。
FS字段分隔符(默認(rèn)是任何空格)。
IGNORECASE如 果為真,則進(jìn)行忽略大小寫(xiě)的匹配。
NF當(dāng)前記錄中的字段數(shù)。
NR當(dāng) 前記錄數(shù)。
OFMT數(shù)字的輸出格式(默認(rèn)值是%.6g)。
OFS輸 出字段分隔符(默認(rèn)值是一個(gè)空格)。
ORS輸出記錄分隔符(默認(rèn)值是一個(gè)換行符)。
RLENGTH由 match函數(shù)所匹配的字符串的長(zhǎng)度。
RS記錄分隔符(默認(rèn)是一個(gè)換行符)。
RSTART由 match函數(shù)所匹配的字符串的第一個(gè)位置。
SUBSEP數(shù)組下標(biāo)分隔符(默認(rèn)值是\034)。

2,運(yùn)算符

運(yùn)算符描述
= += -= *= /= %= ^= **=賦值
?:C條件表達(dá)式
||邏 輯或
&&邏輯與
~ ~!匹 配正則表達(dá)式和不匹配正則表達(dá)式
< <= > >= != ==關(guān) 系運(yùn)算符
空格連接
+ -加,減
* / &乘,除與求余
+ - !一元加,減和邏輯非
^ ***求冪
++ --增加或減少,作為前綴或后綴
$字 段引用
in數(shù)組成員

四,awk的正則

匹配符描述
\Y匹配一個(gè)單詞開(kāi)頭或者末尾的空字符串
\B匹配單詞內(nèi)的空字符串
\<匹配一個(gè)單詞的開(kāi)頭的空字符串,錨定開(kāi)始
\>匹配一個(gè)單詞的末尾的空字符串,錨定末尾
\W匹配一個(gè)非字母數(shù)字組成的單詞
\w匹配一個(gè)字母數(shù)字組成的單詞
\'匹配字符串末尾的一個(gè)空字符串
\‘匹配字符串開(kāi)頭的一個(gè)空字符串

五,awk的函數(shù)

1,字符串函數(shù)

函數(shù)名描述
sub匹配記錄中最大、最靠左邊的子字符串的正則表達(dá)式,并用替換字符串替換這些字符串。如果沒(méi)有指定目標(biāo)字符串就默認(rèn)使用整個(gè)記錄。替換只發(fā)生在第一次匹配的 時(shí)候
gsub整個(gè)文檔中進(jìn)行匹配
index返回子字符串第一次被匹配的位置,偏移量從位置1開(kāi)始
substr返回從位置1開(kāi)始的子字符串,如果指定長(zhǎng)度超過(guò)實(shí)際長(zhǎng)度,就返回整個(gè)字符串
split可按給定的分隔符把字符串分割為一個(gè)數(shù)組。如果分隔符沒(méi)提供,則按當(dāng)前FS值進(jìn)行分割
length返回記錄的字符數(shù)
match返回在字符串中正則表達(dá)式位置的索引,如果找不到指定的正則表達(dá)式則返回0。match函數(shù)會(huì)設(shè)置內(nèi)建變量RSTART為字符串中子字符串的開(kāi)始位 置,RLENGTH為到子字符串末尾的字符個(gè)數(shù)。substr可利于這些變量來(lái)截取字符串
toupper和tolower可用于字符串大小間的轉(zhuǎn)換,該功能只在gawk中有效

2,數(shù)學(xué)函數(shù)

函數(shù)名返回值
atan2(x,y)y,x 范圍內(nèi)的余切
cos(x)余弦函數(shù)
exp(x)求 冪
int(x)取整
log(x)自然對(duì) 數(shù)
rand()隨機(jī)數(shù)
sin(x)正弦
sqrt(x)平 方根
srand(x)x是rand()函數(shù)的種子
int(x)取 整,過(guò)程沒(méi)有舍入
rand()產(chǎn)生一個(gè)大于等于0而小于1的隨機(jī)數(shù)

六,實(shí)例

學(xué)習(xí)awk的時(shí)候,做了一個(gè)例子,學(xué)東西,不要光看,光看是記不住東西的。光看的話,也許你知道怎么回事,真正實(shí)際操作,不是這兒有問(wèn)題,就是那兒有問(wèn)題。所以一定要?jiǎng)邮钟H自操作一下。

1,測(cè)試文件test

代碼如下:

root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/bin/false
daemon:x:2:2:daemon:/sbin:/bin/false
mail:x:8:12:mail:/var/spool/mail:/bin/false
ftp:x:14:11:ftp:/home/ftp:/bin/false
&nobody:$:99:99:nobody:/:/bin/false
zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
http:x:33:33::/srv/http:/bin/false
dbus:x:81:81:System message bus:/:/bin/false
hal:x:82:82:HAL daemon:/:/bin/false
mysql:x:89:89::/var/lib/mysql:/bin/false
aaa:x:1001:1001::/home/aaa:/bin/bash
ba:x:1002:1002::/home/zhangy:/bin/bash
test:x:1003:1003::/home/test:/bin/bash
@zhangying:*:1004:1004::/home/test:/bin/bash
policykit:x:102:1005:Po

例1:

代碼如下:

cat test | awk -F: '{\
 if ($1 == "root"){\
 print $1;\
 }else if($1 == "bin"){\
 print $2;\
 }else{\
 print $3;\
 } \
}'

例2:

代碼如下:

awk '{\
 for(i=0;i<NF;i++){\
 if ($i ~/^root/){\
 print $i;\
 }else if($i ~/zhangy/){\
 print $i;continue;\
 }else if($i ~/mysql/){\
 print $i;next;\
 }else if($i ~/^test/){\
 print $i;break;\
 } \
 }\
}' test

例3:

代碼如下:

tail test | awk 'BEGIN{while(getline d){ split(d,test);for(i in test){\
 print test[i]\
}}}'

例4:

代碼如下:

ls -al /home/zhangy/mytest | awk 'BEGIN{while(getline d){ split(d,test);\
 print test[9] ;}
}'

例5:

代碼如下:

echo "32:34" |awk -F: '{print "max = ",max($1,$2)}\
function max(one,two){
if(one > two){
 return one;
}else{
 return two;
}
}
'

例6:

代碼如下:

#awk 'BEGIN{print "what is your name"; getline name < "/dev/tty"}$1 ~name{print
#"found name on line" NR}END{print "see you" name}' test
#awk '{sub(/daemon/,"tankzhang");print}' test
#awk '{{sub(/zhangy/,"tankzhang");$1};print}' test

#awk '{{gsub(/zhangy/,"tankzhang");$1};print}' test
#awk -F: '{print index("zhangy",$1)}' test
#awk -F: '{print substr($1,1,2)}' test
awk -F: '{mat=match($1,/^[a-zA-Z]+$/);print mat,RSTART,RLENGTH}' test

例7:

代碼如下:

cat test |awk -F: '\
 NF != 7{\
printf("line %d,does not have 7 fields:%s\n",NR,$0)}\
$1 !~ /^[A-Za-z0-9]/{printf("line %d,non alpha and numeric user id:%s: %s\n",NR,$1,$0)}\
$2 == "*" {printf("lind %d,no password:%s\n",NR,$0)}'

感謝各位的閱讀,以上就是“如何理解awk編程及相關(guān)命令”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)如何理解awk編程及相關(guān)命令這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云,小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

awk
AI