溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Linux系統(tǒng)中的awk該怎么使用

發(fā)布時(shí)間:2022-01-26 09:14:17 來源:億速云 閱讀:116 作者:kk 欄目:開發(fā)技術(shù)

本篇文章給大家分享的是有關(guān)Linux系統(tǒng)中的awk該怎么使用,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

Linux系統(tǒng)中awk 是一種處理文本文件的語言,是一個(gè)強(qiáng)大的文本分析工具。和grep、sed有著三劍客之稱,下面小編和大家詳細(xì)講解一下Linux系統(tǒng)三劍客awk的詳細(xì)使用方法。

之所以叫 AWK 是因?yàn)槠淙×巳粍?chuàng)始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符。

語法

 awk [選項(xiàng)參數(shù)] 'script' var=value file(s)
 或
 awk [選項(xiàng)參數(shù)] -f scriptfile var=value file(s)

選項(xiàng)參數(shù)說明:

  • -F fs or –field-separator fs 指定輸入文件折分隔符,fs是一個(gè)字符串或者是一個(gè)正則表達(dá)式,如-F:。

  • -v var=value or –asign var=value 賦值一個(gè)用戶定義變量。

  • -f scripfile or –file scriptfile 從腳本文件中讀取awk命令。

  • -mf nnn and -mr nnn 對(duì)nnn值設(shè)置內(nèi)在限制,-mf選項(xiàng)限制分配給nnn的最大塊數(shù)目;-mr選項(xiàng)限制記錄的最大數(shù)目。這兩個(gè)功能是Bell實(shí)驗(yàn)室版awk的擴(kuò)展功能,在標(biāo)準(zhǔn)awk中不適用。

  • -W compact or –compat, -W traditional or –traditional 在兼容模式下運(yùn)行awk。所以gawk的行為和標(biāo)準(zhǔn)的awk完全一樣,所有的awk擴(kuò)展都被忽略。

  • -W copyleft or –copyleft, -W copyright or –copyright 打印簡(jiǎn)短的版權(quán)信息。

  • -W help or –help, -W usage or –usage 打印全部awk選項(xiàng)和每個(gè)選項(xiàng)的簡(jiǎn)短說明。

  • -W lint or –lint 打印不能向傳統(tǒng)unix平臺(tái)移植的結(jié)構(gòu)的警告。

  • -W lint-old or –lint-old 打印關(guān)于不能向傳統(tǒng)unix平臺(tái)移植的結(jié)構(gòu)的警告。

  • -W posix 打開兼容模式。但有以下限制,不識(shí)別:/x、函數(shù)關(guān)鍵字、func、換碼序列以及當(dāng)fs是一個(gè)空格時(shí),將新行作為一個(gè)域分隔符;操作符=不能代替和=;fflush無效。

  • -W re-interval or –re-inerval 允許間隔正則表達(dá)式的使用,參考(grep中的Posix字符類),如括號(hào)表達(dá)式[[:alpha:]]。

  • -W source program-text or –source program-text 使用program-text作為源代碼,可與-f命令混用。

  • -W version or –version 打印bug報(bào)告信息的版本。


基本用法

log.txt文本內(nèi)容如下:

 2 this is a test
 3 Are you like awk
 This's a test
 10 There are orange,apple,mongo

用法一:

 awk '{[pattern] action}' {filenames}   # 行匹配語句 awk '' 只能用單引號(hào)

實(shí)例:

 # 每行按空格或TAB分割,輸出文本中的1、4項(xiàng)
  $ awk '{print $1,$4}' log.txt
  ---------------------------------------------
  2 a
  3 like
  This's
  10 orange,apple,mongo
  # 格式化輸出
  $ awk '{printf "%-8s %-10s\n",$1,$4}' log.txt
  ---------------------------------------------
  2        a
  3        like
  This's
  10       orange,apple,mongo

用法二:

 awk -F  #-F相當(dāng)于內(nèi)置變量FS, 指定分割字符

實(shí)例:

 # 使用","分割
  $  awk -F, '{print $1,$2}'   log.txt
  ---------------------------------------------
  2 this is a test
  3 Are you like awk
  This's a test
  10 There are orange apple
  # 或者使用內(nèi)建變量
  $ awk 'BEGIN{FS=","} {print $1,$2}'     log.txt
  ---------------------------------------------
  2 this is a test
  3 Are you like awk
  This's a test
  10 There are orange apple
  # 使用多個(gè)分隔符.先使用空格分割,然后對(duì)分割結(jié)果再使用","分割
  $ awk -F '[ ,]'  '{print $1,$2,$5}'   log.txt
  ---------------------------------------------
  2 this test
  3 Are awk
  This's a
  10 There apple

用法三:

 awk -v  # 設(shè)置變量

實(shí)例:

  $ awk -va=1 '{print $1,$1+a}' log.txt
  ---------------------------------------------
  2 3
  3 4
  This's 1
  10 11
  $ awk -va=1 -vb=s '{print $1,$1+a,$1b}' log.txt
  ---------------------------------------------
  2 3 2s
  3 4 3s
  This's 1 This'ss
  10 11 10s

用法四:

 awk -f {awk腳本} {文件名}

實(shí)例:

  $ awk -f cal.awk log.txt

運(yùn)算符

運(yùn)算符描述
= += -= *= /= %= ^= **=賦值
?:C條件表達(dá)式
||邏輯或
&&邏輯與
~ 和 !~匹配正則表達(dá)式和不匹配正則表達(dá)式
>= != ==關(guān)系運(yùn)算符
空格連接
+ –加,減
* / %乘,除與求余
+ – !一元加,減和邏輯非
^ ***求冪
++ —增加或減少,作為前綴或后綴
$字段引用
in數(shù)組成員

過濾第一列大于2的行

 $ awk '$1>2' log.txt    #命令
 #輸出
 3 Are you like awk
 This's a test
 10 There are orange,apple,mongo

過濾第一列等于2的行

 $ awk '$1==2 {print $1,$3}' log.txt    #命令
 #輸出
 2 is

過濾第一列大于2并且第二列等于’Are’的行

 $ awk '$1>2 && $2=="Are" {print $1,$2,$3}' log.txt    #命令
 #輸出
 3 Are you

內(nèi)建變量

變量描述
$n當(dāng)前記錄的第n個(gè)字段,字段間由FS分隔
$0完整的輸入記錄
ARGC命令行參數(shù)的數(shù)目
ARGIND命令行中當(dāng)前文件的位置(從0開始算)
ARGV包含命令行參數(shù)的數(shù)組
CONVFMT數(shù)字轉(zhuǎn)換格式(默認(rèn)值為%.6g)ENVIRON環(huán)境變量關(guān)聯(lián)數(shù)組
ERRNO最后一個(gè)系統(tǒng)錯(cuò)誤的描述
FIELDWIDTHS字段寬度列表(用空格鍵分隔)
FILENAME當(dāng)前文件名
FNR各文件分別計(jì)數(shù)的行號(hào)
FS字段分隔符(默認(rèn)是任何空格)
IGNORECASE如果為真,則進(jìn)行忽略大小寫的匹配
NF一條記錄的字段的數(shù)目
NR已經(jīng)讀出的記錄數(shù),就是行號(hào),從1開始
OFMT數(shù)字的輸出格式(默認(rèn)值是%.6g)
OFS輸出字段分隔符,默認(rèn)值與輸入字段分隔符一致。
ORS輸出記錄分隔符(默認(rèn)值是一個(gè)換行符)
RLENGTH由match函數(shù)所匹配的字符串的長(zhǎng)度
RS記錄分隔符(默認(rèn)是一個(gè)換行符)
RSTART由match函數(shù)所匹配的字符串的第一個(gè)位置
SUBSEP數(shù)組下標(biāo)分隔符(默認(rèn)值是/034)
 $ awk 'BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}'  log.txt
 FILENAME ARGC  FNR   FS   NF   NR  OFS  ORS   RS
 ---------------------------------------------
 log.txt    2    1         5    1
 log.txt    2    2         5    2
 log.txt    2    3         3    3
 log.txt    2    4         4    4
 $ awk -F\' 'BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}'  log.txt
 FILENAME ARGC  FNR   FS   NF   NR  OFS  ORS   RS
 ---------------------------------------------
 log.txt    2    1    '    1    1
 log.txt    2    2    '    1    2
 log.txt    2    3    '    2    3
 log.txt    2    4    '    1    4
 # 輸出順序號(hào) NR, 匹配文本行號(hào)
 $ awk '{print NR,FNR,$1,$2,$3}' log.txt
 ---------------------------------------------
 1 1 2 this is
 2 2 3 Are you
 3 3 This's a test
 4 4 10 There are
 # 指定輸出分割符
 $  awk '{print $1,$2,$5}' OFS=" $ "  log.txt
 ---------------------------------------------
 2 $ this $ test
 3 $ Are $ awk
 This's $ a $
 10 $ There $

使用正則,字符串匹配

 # 輸出第二列包含 "th",并打印第二列與第四列
 $ awk '$2 ~ /th/ {print $2,$4}' log.txt
 ---------------------------------------------
 this a

~ 表示模式開始。// 中是模式。

 # 輸出包含 "re" 的行
 $ awk '/re/ ' log.txt
 ---------------------------------------------
 3 Are you like awk
 10 There are orange,apple,mongo

忽略大小寫

 $ awk 'BEGIN{IGNORECASE=1} /this/' log.txt
 ---------------------------------------------
 2 this is a test
 This's a test

模式取反

 $ awk '$2 !~ /th/ {print $2,$4}' log.txt
 ---------------------------------------------
 Are like
 a
 There orange,apple,mongo
 $ awk '!/th/ {print $2,$4}' log.txt
 ---------------------------------------------
 Are like
 a
 There orange,apple,mongo

awk腳本

關(guān)于 awk 腳本,我們需要注意兩個(gè)關(guān)鍵詞 BEGIN 和 END。

  • BEGIN{ 這里面放的是執(zhí)行前的語句 }

  • END {這里面放的是處理完所有的行后要執(zhí)行的語句 }

  • {這里面放的是處理每一行時(shí)要執(zhí)行的語句}

假設(shè)有這么一個(gè)文件(學(xué)生成績(jī)表):

 $ cat score.txt
 Marry   2143 78 84 77
 Jack    2321 66 78 45
 Tom     2122 48 77 71
 Mike    2537 87 97 95
 Bob     2415 40 57 62

我們的 awk 腳本如下:

 $ cat cal.awk
 #!/bin/awk -f
 #運(yùn)行前
 BEGIN {
     math = 0
     english = 0
     computer = 0
 
     printf "NAME    NO.   MATH  ENGLISH  COMPUTER   TOTAL\n"
     printf "---------------------------------------------\n"
 }
 #運(yùn)行中
 {
     math+=$3
     english+=$4
     computer+=$5
     printf "%-6s %-6s %4d %8d %8d %8d\n", $1, $2, $3,$4,$5, $3+$4+$5
 }
 #運(yùn)行后
 END {
     printf "---------------------------------------------\n"
     printf "  TOTAL:%10d %8d %8d \n", math, english, computer
     printf "AVERAGE:%10.2f %8.2f %8.2f\n", math/NR, english/NR, computer/NR
 }

我們來看一下執(zhí)行結(jié)果:

 $ awk -f cal.awk score.txt
 NAME    NO.   MATH  ENGLISH  COMPUTER   TOTAL
 ---------------------------------------------
 Marry  2143     78       84       77      239
 Jack   2321     66       78       45      189
 Tom    2122     48       77       71      196
 Mike   2537     87       97       95      279
 Bob    2415     40       57       62      159
 ---------------------------------------------
   TOTAL:       319      393      350
 AVERAGE:     63.80    78.60    70.00

另外一些實(shí)例

AWK 的 hello world 程序?yàn)椋?/p>

 BEGIN { print "Hello, world!" }

計(jì)算文件大小

 $ ls -l *.txt | awk '{sum+=$5} END {print sum}'
 --------------------------------------------------
 666581

從文件中找出長(zhǎng)度大于 80 的行:

 awk 'length>80' log.txt

打印九九乘法表

 seq 9 | sed 'H;g' | awk -v RS='' '{for(i=1;i.baidu.com/album/c275f6ba07e269e33d756714.html?picindex=50)關(guān)于Linux系統(tǒng)三劍客awk的使用到此結(jié)束,想要過去更多awk的相關(guān)知識(shí)請(qǐng)繼續(xù)關(guān)注我們。以上就是良許教程網(wǎng)為各位朋友分享的Linux系統(tǒng)相關(guān)內(nèi)容。想要了解更多Linux相關(guān)知識(shí)記得關(guān)注公眾號(hào)“良許Linux”,或掃描下方二維碼進(jìn)行關(guān)注,更多干貨等著你!

什么是Linux系統(tǒng)

Linux是一種免費(fèi)使用和自由傳播的類UNIX操作系統(tǒng),是一個(gè)基于POSIX的多用戶、多任務(wù)、支持多線程和多CPU的操作系統(tǒng),使用Linux能運(yùn)行主要的Unix工具軟件、應(yīng)用程序和網(wǎng)絡(luò)協(xié)議。

以上就是Linux系統(tǒng)中的awk該怎么使用,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI