您好,登錄后才能下訂單哦!
必須在Linux環(huán)境下,使用到的環(huán)境和工具:CentOS7+Python3.6+pdf2image+poppler
首先要在系統(tǒng)中安裝poppler,這是一個用于呈現(xiàn)可移植文檔格式(PDF)文檔的免費軟件實用程序庫
一、安裝poppler
直接用下面的命令進行安裝:
yum install poppler poppler-cpp-devel poppler-utils
注意:在這里如果沒有安裝“poppler-utils”就會出現(xiàn)如下所示的錯誤:
Exception: Unable to get page count. Is poppler installed and in PATH?
二、安裝pdf2image
直接用下面的命令進行安裝
pip install pdf2image
三、書寫腳本
安裝完成之后,將以下內(nèi)容寫為python腳本,并將需要轉(zhuǎn)換的pdf文件更名為“source.pdf”,放到同一目錄下即可,并在同級目錄下創(chuàng)建“pdfimage”文件夾用于保存生成的圖片
from pdf2image import convert_from_path import tempfile def main(filename, outputDir): print('filename=', filename) print('outputDir=', outputDir) with tempfile.TemporaryDirectory() as path: images = convert_from_path(filename) for index, img in enumerate(images): img.save('%s/page_%s.png' % (outputDir, index)) if __name__ == "__main__": main('source.pdf', 'pdfimage/')
上邊代碼中的這兩個個函數(shù)的詳細使用方法如下:
convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm') convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm')
其中:
thread_count :允許設置用于轉(zhuǎn)換的線程數(shù); first_page :允許設置由pdftoppm處理的第一個頁面; last_page:允許設置最后一頁由pdftoppm處理; fmt:允許指定輸出格式。目前支持的格式是jpg、png和ppm;
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。