您好,登錄后才能下訂單哦!
這篇文章主要介紹怎么用python一步步提取PPT中的圖片,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!
其實(shí)實(shí)現(xiàn)原理很簡(jiǎn)單,我們的pptx文件其實(shí)是一個(gè)壓縮包。我們可以直接修改pptx文件的后綴,改成zip然后解壓,比如下面這個(gè):
這是解壓后的文件。我們可以在ppt目錄下找到一個(gè)media目錄,這個(gè)目錄下就是我們要的圖片的。這個(gè)目錄包含了PPT的所有多媒體文件。
知道這點(diǎn)后,我們就可以選擇用Python來解壓出PPT中的media目錄就可以提取出所有圖片了。
在Python中提供了一個(gè)zipfile模塊用于處理壓縮包文件。我們來看看它的簡(jiǎn)單操作:
from zipfile import ZipFile # 打開壓縮文件 f = ZipFile("test.pptx") # 查看壓縮包所有文件 for file in f.namelist(): print(file) # 關(guān)閉壓縮包文件 f.close()
輸出的部分結(jié)果如下:
[Content_Types].xml _rels/.rels ppt/presentation.xml ppt/slides/_rels/slide2.xml.rels ppt/slides/slide1.xml ppt/slides/slide2.xml ppt/slides/slide3.xml
可以看到我們打印出了壓縮包的文件。
我們還可以通過下面的方式打開壓縮包:
from zipfile import ZipFile with ZipFile("test.pptx") as f: for file in f.namelist(): print(file)
通過with
語句,就可以不顯示地調(diào)用close方法。下面我們看看解壓操作:
from zipfile import ZipFile with ZipFile("test.pptx") as f: for file in f.namelist(): # 解壓文件 f.extract(file, path="unzip")
解壓文件的操作通過f.extract
來實(shí)現(xiàn),這里傳入了兩個(gè)參數(shù),分別是壓縮包文件,和解壓路徑,如果壓縮包有密碼還需要傳入解壓密碼。
然后我們還需要判斷一下,如果是媒體目錄我們才解壓。我們添加一點(diǎn)代碼:
from zipfile import ZipFile with ZipFile("test.pptx") as f: for file in f.namelist(): # 如果是media目錄下的文件就解壓 if file.startswith("ppt/media/"): f.extract(file, path="unzip")
這樣我們就實(shí)現(xiàn)了PPT圖片的提取。
我們把上面代碼再完善一下:
import os from zipfile import ZipFile # 解壓目錄 unzip_path = "unzip" # 如果解壓目錄不存在則創(chuàng)建 if not os.path.exists(unzip_path): os.mkdir(unzip_path) with ZipFile("test1/test.pptx") as f: for file in f.namelist(): if file.startswith("ppt/media/"): f.extract(file, path=unzip_path)
這里我們就是添加了一個(gè)解壓目錄的創(chuàng)建,這樣我們執(zhí)行的時(shí)候就不會(huì)因?yàn)槟夸洸淮嬖诙鴪?bào)錯(cuò)了。
另外,其實(shí)我們手動(dòng)解壓然后提取PPT中的圖片也是很方便的,也并不會(huì)比程序慢。
以上是“怎么用python一步步提取PPT中的圖片”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。