在Linux中,可以使用wordcount
命令或結(jié)合其他工具進行詞頻分析
方法一:使用wordcount
命令
cat input.txt | wc -w
這將輸出文本中的單詞總數(shù)。
cat input.txt | sort | uniq -c | sort -nr
這將輸出按詞頻降序排列的結(jié)果,其中每行顯示一個單詞及其出現(xiàn)次數(shù)。
方法二:使用awk
命令
awk '{print $1}' input.txt | sort | uniq -c | sort -nr
這將輸出按詞頻降序排列的結(jié)果,其中每行顯示一個單詞及其出現(xiàn)次數(shù)。
在這兩種方法中,你可以根據(jù)需要修改輸入文件名、排序選項等。這些命令適用于基本的詞頻分析任務(wù)。如果你需要更復(fù)雜的詞頻分析,可以考慮使用Python、Perl或其他編程語言編寫自定義腳本。