溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Linux如何查找大文件并安全清除

發(fā)布時(shí)間:2022-03-21 10:41:42 來源:億速云 閱讀:358 作者:iii 欄目:建站服務(wù)器

這篇文章主要介紹“Linux如何查找大文件并安全清除”,在日常操作中,相信很多人在Linux如何查找大文件并安全清除問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Linux如何查找大文件并安全清除”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!

Linux如何查找大文件并安全清除

1 案例描述?

  • 服務(wù)線上環(huán)境,會(huì)出現(xiàn)一些磁盤使用率過高而告警的情況,可能是某個(gè)日志文件過大,沒有及時(shí)清理回收,如何找到大目錄和大文件?

  • 如何安全的清理大文件?

  • 如何使占用的磁盤空間快速釋放掉?

2 命令一(目錄統(tǒng)計(jì)排序最佳命令)

(這里以當(dāng)前目錄 ./ 為例,統(tǒng)計(jì) top5)

【du -k --max-depth=1 ./ |sort -nr|head -n5】

[root@test-001 /]# du -k --max-depth=1 ./ |sort -nr|head -n5
137450839518./
6785876./data
2182577./usr
1830341./home
446856./var
//du -k # 顯示目錄或文件大小時(shí),以 kB 為單位;
//du --max-depth=1 [目錄] # 只顯示指定目錄下第一層目錄(不含單個(gè)文件)的大小;
//sort -nr # 以行為單位,根據(jù)數(shù)字大小從大到小排序;
//head -n5 # 顯示內(nèi)容的開頭 5 行,這里顯示就是 top5 內(nèi)容;

3 命令二(最實(shí)用,目錄和文件一起統(tǒng)計(jì)排序)

(這里以當(dāng)前目錄 ./ 為例,統(tǒng)計(jì) top5)

(1)命令詳情和說明

【du -sk * ./ | sort -nr | head -n5 | awk -F'\t' '{if(1024 * 1024 * 1024 * 1024 > $1 && $1 >= 1024 * 1024 * 1024) {printf "%.2fT\t\t %s\n", $1/(1024 * 1024 * 1024), $2} else if(1024 * 1024 * 1024 > $1 && $1 >= 1024 * 1024) {printf "%.2fG\t\t %s\n", $1/(1024 * 1024), $2} else if (1024 * 1024 > $1 && $1 >= 1024) {printf "%.2fM\t\t %s\n", $1/1024, $2} else {printf "%sk\t\t %s\n", $1, $2}}' 】

[root@test-001 /]# du -sk * ./ | sort -nr | head -n5 | awk -F'\t' '{if(1024 * 1024 * 1024 * 1024 > $1 && $1 >= 1024 * 1024 * 1024) {printf "%.2fT\t\t %s\n", $1/(1024 * 1024 * 1024), $2} else if(1024 * 1024 * 1024 > $1 && $1 >= 1024 * 1024) {printf "%.2fG\t\t %s\n", $1/(1024 * 1024), $2} else if (1024 * 1024 > $1 && $1 >= 1024) {printf "%.2fM\t\t %s\n", $1/1024, $2} else {printf "%sk\t\t %s\n", $1, $2}}'
7.13G data
2.17G usr
1.75G home
447.04M var
408.50M run
//du -sk * # 顯示當(dāng)前目錄下每個(gè)文件夾和文件的大小以KB為單位(最常用),s表示匯總,k是以KB為統(tǒng)計(jì)單位;
//./ #當(dāng)前目錄下
//sort -nr # 以行為單位,根據(jù)數(shù)字大小從大到小排序;
//awk -F'\t'# 以水平制表符進(jìn)行分割,后面的程序就是進(jìn)行換算單位,格式化輸出成易懂的形式;

(2)du、head、sort、awk 詳細(xì)說明參考已有文章附錄

(3)Linux 中 printf 命令使用參考

// Linux 中 printf 命令使用參考
// https://www.linuxprobe.com/linux-printf-example.html
'{
    if(1024 * 1024 * 1024 * 1024 > $1 && $1 >= 1024 * 1024 * 1024) 
    {
        printf "%.2fT\t\t %s\n", $1/(1024 * 1024 * 1024), $2
    } 
    else if(1024 * 1024 * 1024 > $1 && $1 >= 1024 * 1024) 
    {
        printf "%.2fG\t\t %s\n", $1/(1024 * 1024), $2
    } 
    else if (1024 * 1024 > $1 && $1 >= 1024) 
    {
        printf "%.2fM\t\t %s\n", $1/1024, $2
    } 
    else 
    {
        printf "%sk\t\t %s\n", $1, $2
    }
}'

4 如何安全使用 rm 命令刪除文件?

(1)rm 命令有哪些坑?

  • rm -rf / # 這個(gè)命令絕逼不能操作,刪除根目錄下的文件,就是系統(tǒng)中的所有文件都要被刪除。如果是線上服務(wù)機(jī)器操作了,那就悲劇了!誤操作了怎么辦?趕快ctrl+c、ctrl+z 能保住多少是多少吧。

  • rm -rf / home/apps/logs/ # 這也是個(gè)天坑命令!目的是刪除日志文。結(jié)果書寫時(shí)“多了一個(gè)空格”的 bug,看懂了么?這就變成了 [rm -rf /] !

  • 埋藏隱患的日志清理 shell 腳本!腳本關(guān)鍵內(nèi)容如下。

cd ${log_path}
rm -rf *

目的是:進(jìn)入到日志目錄,然后把日志都刪除。隱患:當(dāng)目錄不存在時(shí),悲劇就發(fā)生了!

(2)如何安全使用 rm 命令?

  • 在生產(chǎn)環(huán)境把 [rm -rf] 命令替換為 [mv],再寫個(gè)腳本程序定期清理,模擬回收站的功能。

  • 把日志清理 shell 腳本,改用邏輯與 && 進(jìn)行連接。

cd ${log_path}
rm -rf *

改用邏輯與 && 進(jìn)行連接,合并成一句,前半句邏輯失敗,后半句命令不執(zhí)行:

```shell

cd ${log_path} && rm -rf *

完整的日志清理 shell 腳本如下:

 ```shell
#!/bin/bash
base_home="/home/apps"
log_path=${base_home}/logs
cd ${log_path} && rm -rf *

5 磁盤使用率報(bào)警,卻查不到具體的大文件?

(1)問題情景

  • 1 磁盤使用率監(jiān)控報(bào)警,進(jìn)入機(jī)器可以 (df -h) 命令看到磁盤使用率確實(shí)超過了報(bào)警閥值。

  • 2 使用命令查看大目錄,并進(jìn)入到目錄下 【du -sk * ./ | sort -nr | head -n5 | awk -F'\t' '{if(1024 * 1024 * 1024 * 1024 > $1 && $1 >= 1024 * 1024 * 1024) {printf "%.2fT\t\t %s\n", $1/(1024 * 1024 * 1024), $2} else if(1024 * 1024 * 1024 > $1 && $1 >= 1024 * 1024) {printf "%.2fG\t\t %s\n", $1/(1024 * 1024), $2} else if (1024 * 1024 > $1 && $1 >= 1024) {printf "%.2fM\t\t %s\n", $1/1024, $2} else {printf "%sk\t\t %s\n", $1, $2}}'

  • 3 依然沒找到大文件,該怎么辦呢?

(2)排查思路

  • 1 思考:是不是有文件已經(jīng)被刪除了,但進(jìn)程還在占用該文件,進(jìn)程未結(jié)束,空間未釋放?

  • 2 使用「lsof |grep -i deleted」命令查看,能查看到已刪除,空間沒有釋放的文件,包含文件大小,進(jìn)程和服務(wù)名等信息。

Linux如何查找大文件并安全清除lsof(List Open Files) 用于查看進(jìn)程打開的文件,打開文件的進(jìn)程,進(jìn)程打開的端口(TCP、UDP),找回/恢復(fù)刪除的文件。是十分方便的系統(tǒng)監(jiān)視工具,因?yàn)?lsof 命令需要訪問核心內(nèi)存和各種文件,所以需要root 用戶權(quán)限執(zhí)行。

(3)占用磁盤空間釋放

重啟下進(jìn)程所指的服務(wù),占用的磁盤空間即可釋放掉。線上生產(chǎn)操作一定要謹(jǐn)慎,不要直接 kill 掉進(jìn)程,評估看是否有進(jìn)程服務(wù)自身的重啟名命令,以及評估服務(wù)是否可以重啟。

(4)備注附錄

  • 1 當(dāng)一個(gè)文件正在被一個(gè)進(jìn)程使用時(shí),用戶刪除此文件,文件只會(huì)從目錄結(jié)構(gòu)中刪除,但并沒有從磁盤刪除。

  • 2 當(dāng)使用這個(gè)文件的進(jìn)程結(jié)束后,文件才會(huì)真正的從磁盤刪除,釋放占有的空間。Linux 打開一個(gè)文件的時(shí)候,內(nèi)核會(huì)為每個(gè)進(jìn)程在 /proc//proc/{nnnn}/fd/文件夾({nnnn} 為 pid)』建立一個(gè)以其 pid 為名的文件夾用來保存進(jìn)程的相關(guān)信息,而其子文件夾 fd 保存的是該進(jìn)程打開的全部文件的 fd(fd:file descriptor)。

  • 3 Ctrl + CCtrl + Z都是中斷命令。Ctrl + C 是強(qiáng)制中斷程序的執(zhí)行,進(jìn)程已經(jīng)終止;Ctrl + Z 是將任務(wù)中止(暫停的意思),他仍然在進(jìn)程中他只是維持掛起的狀態(tài)。

6 生產(chǎn)環(huán)境常用的安全清理大文件命令

  • 生產(chǎn)環(huán)境安全清理大文件的訴求是什么?既要不影響服務(wù)的正常運(yùn)行,又要讓磁盤占用的空間快速釋放掉(讓文件消失掉不是我們的目的,我們的目的是快速釋放掉占用的磁盤空間)。

  • 不要使用 「rm -rf xxx.log」;常用 「echo "" > xxx.log」。

  • 這里假設(shè) xxx.log 為大文件,如這個(gè) xxx.log 有幾十個(gè) GB,「echo "" > xxx.log」是用一個(gè) "" 內(nèi)容覆蓋原文件內(nèi)容,使磁盤空間得到瞬間釋放!

到此,關(guān)于“Linux如何查找大文件并安全清除”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI