溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

使用Python將PDF轉(zhuǎn)換成圖片

發(fā)布時間:2020-07-31 15:50:23 來源:網(wǎng)絡 閱讀:9973 作者:正經(jīng)的青年 欄目:編程語言

    必須在Linux環(huán)境下,使用到的環(huán)境和工具:CentOS7+Python3.6+pdf2image+poppler

        首先要在系統(tǒng)中安裝poppler,這是一個用于呈現(xiàn)可移植文檔格式(PDF)文檔的免費軟件實用程序庫

一、安裝poppler

    直接用下面的命令進行安裝:

yum install poppler poppler-cpp-devel poppler-utils

注意:在這里如果沒有安裝“poppler-utils”就會出現(xiàn)如下所示的錯誤:

    Exception: Unable to get page count. Is poppler installed and in PATH?

二、安裝pdf2image

    直接用下面的命令進行安裝

pip install pdf2image

三、書寫腳本

    安裝完成之后,將以下內(nèi)容寫為python腳本,并將需要轉(zhuǎn)換的pdf文件更名為“source.pdf”,放到同一目錄下即可,并在同級目錄下創(chuàng)建“pdfimage”文件夾用于保存生成的圖片

from pdf2image import convert_from_path
import tempfile
def main(filename, outputDir):
    print('filename=', filename)
    print('outputDir=', outputDir)
    with tempfile.TemporaryDirectory() as path:
        images = convert_from_path(filename)
        for index, img in enumerate(images):
            img.save('%s/page_%s.png' % (outputDir, index))
if __name__ == "__main__":
    main('source.pdf', 'pdfimage/')

    上邊代碼中的這兩個個函數(shù)的詳細使用方法如下:

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm')
convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm')

    其中:

thread_count :允許設置用于轉(zhuǎn)換的線程數(shù);
first_page :允許設置由pdftoppm處理的第一個頁面;
last_page:允許設置最后一頁由pdftoppm處理;
fmt:允許指定輸出格式。目前支持的格式是jpg、png和ppm;




向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI