溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

linux如何去重統(tǒng)計

發(fā)布時間:2020-09-21 13:47:22 來源:億速云 閱讀:165 作者:小新 欄目:建站服務(wù)器

這篇文章給大家分享的是有關(guān)linux如何去重統(tǒng)計的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考。一起跟隨小編過來看看吧。

linux命令行提供了非常強大的文本處理功能,組合利用linux命令能實現(xiàn)好多強大的功能。本文這里舉例說明如何利用Linux命令行進(jìn)行文本按行去重并按重復(fù)次數(shù)排序。主要用到的命令有sort,uniq和cut。其中,sort主要功能是排序,uniq主要功能是實現(xiàn)相鄰文本行的去重,cut可以從文本行中提取相應(yīng)的文本列(簡單地說,就是按列操作文本行)。

文本行去重并按重復(fù)次數(shù)排序

例:

首先,對文本行進(jìn)行去重并統(tǒng)計重復(fù)次數(shù)(uniq命令加-c選項可以實現(xiàn)對重復(fù)次數(shù)進(jìn)行統(tǒng)計)。

$ sort test.txt | uniq -c 
2 Apple and Nokia. 
4 Hello World. 
1 I wanna buy an Apple device. 
1 My name is Friendfish. 
2 The Iphone of Apple company.

對文本行按重復(fù)次數(shù)進(jìn)行排序。

sort -n可以識別每行開頭的數(shù)字,并按其大小對文本行進(jìn)行排序。默認(rèn)是按升序排列,如果想要按降序要加-r選項(sort -rn)。

$ sort test.txt | uniq -c | sort -rn 
4 Hello World. 
2 The Iphone of Apple company. 
2 Apple and Nokia. 
1 My name is Friendfish.

每行前面的刪除重復(fù)次數(shù)。

cut命令可以按列操作文本行??梢钥闯銮懊娴闹貜?fù)次數(shù)占8個字符,因此,可以用命令cut -c 9- 取出每行第9個及其以后的字符。

$ sort test.txt | uniq -c | sort -rn | cut -c 9- 
Hello World. 
The Iphone of Apple company. 
Apple and Nokia. 
My name is Friendfish. 
I wanna buy an Apple device.

感謝各位的閱讀!關(guān)于linux如何去重統(tǒng)計就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI