溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何實(shí)現(xiàn)Python文件去重

發(fā)布時(shí)間:2021-08-10 11:59:15 來源:億速云 閱讀:164 作者:小新 欄目:開發(fā)技術(shù)

這篇文章將為大家詳細(xì)講解有關(guān)如何實(shí)現(xiàn)Python文件去重,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

代碼ing

導(dǎo)出的文件都是保存在同一文件夾下的,格式也相同。然后,上網(wǎng)查了下 filecmp.cmp() 的用法。

filecmp.cmp(f1, f2, shallow=True)

f1/f2:待比較的兩個(gè)文件路徑。shallow :默認(rèn)為True,即只比較os.stat()獲取的元數(shù)據(jù)(創(chuàng)建時(shí)間,大小等信息)是否相同,設(shè)置為False的話,在對(duì)比文件的時(shí)候還要比較文件內(nèi)容。
from pathlib import Path
import filecmp

path_list = [path for path in Path(r'C:\Users\pc\Desktop\test').iterdir() if path.is_file()]

for front in range(len(path_list) - 1):
    for later in range(front + 1, len(path_list)):
        if filecmp.cmp(path_list[front], path_list[later], shallow=False):
            path_list[front].unlink()    # 刪除文件
            break

為了防止代碼有問題,我先創(chuàng)建了一個(gè) test 文件夾,在文件夾下手動(dòng)創(chuàng)建了6個(gè)文件,1~5中只有1,2,3,4,5對(duì)應(yīng)的數(shù)字內(nèi)容,第6個(gè)為空文件。

如何實(shí)現(xiàn)Python文件去重

之后再將文件全部復(fù)制一份。

如何實(shí)現(xiàn)Python文件去重

??運(yùn)行效果

如何實(shí)現(xiàn)Python文件去重

關(guān)于“如何實(shí)現(xiàn)Python文件去重”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI