您好,登錄后才能下訂單哦!
這篇文章主要介紹“如何解決Python復雜zip文件的解壓問題”,在日常操作中,相信很多人在如何解決Python復雜zip文件的解壓問題問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”如何解決Python復雜zip文件的解壓問題”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
廢話不多說,直接看問題,使用過 Python
中的標準庫 zipfile
解壓過 zip
格式壓縮包的朋友們,可能遇到過,當壓縮文件中的目錄或文件名中包含中文等常見 unicode
字符時,典型如下面的例子:
使用 zipfile
的 extract()
或 extractall()
方法直接解壓時,產(chǎn)生的解壓結(jié)果名充斥著亂碼,這一點我們通過調(diào)用 namelist()
方法就可以看出來:
from zipfile import ZipFile # 讀入壓縮包文件 file = ZipFile('示例壓縮包.zip') # 查看壓縮包內(nèi)目錄、文件名稱 file.namelist()
這是因為 zipfile
中針對壓縮包內(nèi)容的編碼兼容性差,但我們可以通過下面的函數(shù)自行矯正:
def recode(raw: str) -> str: ''' 編碼修正 ''' try: return raw.encode('cp437').decode('gbk') except: return raw.encode('utf-8').decode('utf-8') for file_or_path in file.namelist(): print(file_or_path, ' -------> ' , recode(file_or_path))
解決了文件名亂碼的問題后,接下來我們就可以配合 shutil
與 os
標準庫中的相關(guān)功能,實現(xiàn)將指定任意 zip
壓縮包,完好地解壓到指定的目錄中,代碼如下:
def zip_extract_all(src_zip_file: ZipFile, target_path: str) -> None: # 遍歷壓縮包內(nèi)所有內(nèi)容 for file_or_path in file.namelist(): # 若當前節(jié)點是文件夾 if file_or_path.endswith('/'): try: # 基于當前文件夾節(jié)點創(chuàng)建多層文件夾 os.makedirs(os.path.join(target_path, recode(file_or_path))) except FileExistsError: # 若已存在則跳過創(chuàng)建過程 pass # 否則視作文件進行寫出 else: # 利用shutil.copyfileobj,從壓縮包io流中提取目標文件內(nèi)容寫出到目標路徑 with open(os.path.join(target_path, recode(file_or_path)), 'wb') as z: # 這里基于Zipfile.open()提取文件內(nèi)容時需要使用原始的亂碼文件名 shutil.copyfileobj(src_zip_file.open(file_or_path), z) # 向已存在的指定文件夾完整解壓當前讀入的zip文件 zip_extract_all(file, '解壓測試')
可以看到,效果完美 :
到此,關(guān)于“如何解決Python復雜zip文件的解壓問題”的學習就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續(xù)學習更多相關(guān)知識,請繼續(xù)關(guān)注億速云網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。