溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么用python一步步提取PPT中的圖片

發(fā)布時(shí)間:2021-09-30 10:45:02 來源:億速云 閱讀:138 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要介紹怎么用python一步步提取PPT中的圖片,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

    一、實(shí)現(xiàn)原理

    其實(shí)實(shí)現(xiàn)原理很簡(jiǎn)單,我們的pptx文件其實(shí)是一個(gè)壓縮包。我們可以直接修改pptx文件的后綴,改成zip然后解壓,比如下面這個(gè):

    怎么用python一步步提取PPT中的圖片

    這是解壓后的文件。我們可以在ppt目錄下找到一個(gè)media目錄,這個(gè)目錄下就是我們要的圖片的。這個(gè)目錄包含了PPT的所有多媒體文件。

    知道這點(diǎn)后,我們就可以選擇用Python來解壓出PPT中的media目錄就可以提取出所有圖片了。

    二、提取PPT中的圖片

    1、打開壓縮包

    在Python中提供了一個(gè)zipfile模塊用于處理壓縮包文件。我們來看看它的簡(jiǎn)單操作:

    from zipfile import ZipFile
    # 打開壓縮文件
    f = ZipFile("test.pptx")
    # 查看壓縮包所有文件
    for file in f.namelist():
        print(file)
    # 關(guān)閉壓縮包文件
    f.close()

    輸出的部分結(jié)果如下:

    [Content_Types].xml
    _rels/.rels
    ppt/presentation.xml
    ppt/slides/_rels/slide2.xml.rels
    ppt/slides/slide1.xml
    ppt/slides/slide2.xml
    ppt/slides/slide3.xml

    可以看到我們打印出了壓縮包的文件。

    2、解壓文件

    我們還可以通過下面的方式打開壓縮包:

    from zipfile import ZipFile
    with ZipFile("test.pptx") as f:
        for file in f.namelist():
            print(file)

    通過with語句,就可以不顯示地調(diào)用close方法。下面我們看看解壓操作:

    from zipfile import ZipFile
    with ZipFile("test.pptx") as f:
        for file in f.namelist():
            # 解壓文件
            f.extract(file, path="unzip")

    解壓文件的操作通過f.extract來實(shí)現(xiàn),這里傳入了兩個(gè)參數(shù),分別是壓縮包文件,和解壓路徑,如果壓縮包有密碼還需要傳入解壓密碼。

    然后我們還需要判斷一下,如果是媒體目錄我們才解壓。我們添加一點(diǎn)代碼:

    from zipfile import ZipFile
    with ZipFile("test.pptx") as f:
        for file in f.namelist():
            # 如果是media目錄下的文件就解壓
            if file.startswith("ppt/media/"):
                f.extract(file, path="unzip")

    這樣我們就實(shí)現(xiàn)了PPT圖片的提取。

    三、提取PPT中的圖片

    我們把上面代碼再完善一下:

    import os
    from zipfile import ZipFile
    # 解壓目錄
    unzip_path = "unzip"
    # 如果解壓目錄不存在則創(chuàng)建
    if not os.path.exists(unzip_path):
        os.mkdir(unzip_path)
    with ZipFile("test1/test.pptx") as f:
        for file in f.namelist():
            if file.startswith("ppt/media/"):
                f.extract(file, path=unzip_path)

    這里我們就是添加了一個(gè)解壓目錄的創(chuàng)建,這樣我們執(zhí)行的時(shí)候就不會(huì)因?yàn)槟夸洸淮嬖诙鴪?bào)錯(cuò)了。

    另外,其實(shí)我們手動(dòng)解壓然后提取PPT中的圖片也是很方便的,也并不會(huì)比程序慢。

    以上是“怎么用python一步步提取PPT中的圖片”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

    向AI問一下細(xì)節(jié)

    免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

    AI