溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何將Python字符串生成PDF

發(fā)布時間:2021-06-24 13:55:15 來源:億速云 閱讀:279 作者:小新 欄目:開發(fā)技術(shù)

這篇文章將為大家詳細講解有關(guān)如何將Python字符串生成PDF,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

如何將Python字符串生成PDF

??該問題的解決思路還是利用將Python字符串嵌入到HTML代碼中解決,注意換行需要用<br>標(biāo)簽,示例代碼如下:

import pdfkit
# PDF中包含的文字
content = '這是一個測試文件。' + '<br>' + 'Hello from Python!'
html = '<html><head><meta charset="UTF-8"></head>' \
 '<body><div align="center"><p>%s</p></div></body></html>'%content
# 轉(zhuǎn)換為PDF
pdfkit.from_string(html, './test.pdf')

輸出的結(jié)果如下:

Loading pages (1/6)
 Counting pages (2/6)
 Resolving links (4/6)
 Loading headers and footers (5/6)
 Printing pages (6/6)
 Done

生成的test.pdf如下:

如何將Python字符串生成PDF

如何生成PDF中的表格

??接下來我們考慮如何將csv文件轉(zhuǎn)換為PDF中的表格,思路還是利用HTML代碼。示例的iris.csv文件(部分)如下:

?如何將Python字符串生成PDF

?將csv文件轉(zhuǎn)換為PDF中的表格的Python代碼如下:

import pdfkit
# 讀取csv文件
with open('iris.csv', 'r') as f:
 lines = [_.strip() for _ in f.readlines()]
# 轉(zhuǎn)化為html中的表格樣式
td_width = 100
content = '<table width="%s" border="1" cellspacing="0px" >' % (td_width*len(lines[0].split(',')))
for i in range(len(lines)):
 tr = '<tr>'+''.join(['<td width="%d">%s</td>'%(td_width, _) for _ in lines[i].split(',')])+'</tr>'
 content += tr
content += '</table>'
html = '<html><head><meta charset="UTF-8"></head>' \
 '<body><div align="center">%s</div></body></html>' % content
# 轉(zhuǎn)換為PDF
pdfkit.from_string(html, './iris.pdf')

??生成的PDF文件為iris.pdf,部分內(nèi)容如下:

如何將Python字符串生成PDF

解決PDF生成速度慢的問題

??用pdfkit生成PDF文件雖然方便,但有一個比較大的缺點,那就是生成PDF的速度比較慢,這里我們可以做個簡單的測試,比如生成100份PDF文件,里面的文字為“這是第*份測試文件!”。Python代碼如下:

import pdfkit
import time
start_time = time.time()
for i in range(100):
 content = '這是第%d份測試文件!'%(i+1)
 html = '<html><head><meta charset="UTF-8"></head>' \
  '<body><div align="center">%s</div></body></html>' % content
 # 轉(zhuǎn)換為PDF
 pdfkit.from_string(html, './test/%s.pdf'%(i+1))
end_time = time.time()
print('一共耗時:%s 秒.' %(end_time-start_time))

在這個程序中,生成100份PDF文件一共耗時約192秒。輸出結(jié)果如下:

......
Loading pages (1/6)
Counting pages (2/6)                                              
Resolving links (4/6)                                                      
Loading headers and footers (5/6)                                          
Printing pages (6/6)
Done                                                                     
一共耗時:191.9226369857788 秒.

??如果想要加快生成的速度,我們可以使用多線程來實現(xiàn),主要使用concurrent.futures模塊,完整的Python代碼如下:

import pdfkit
import time
from concurrent.futures import ThreadPoolExecutor, wait, ALL_COMPLETED
start_time = time.time()
# 函數(shù): 生成PDF
def convert_2_pdf(i):
 content = '這是第%d份測試文件!'%(i+1)
 html = '<html><head><meta charset="UTF-8"></head>' \
  '<body><div align="center">%s</div></body></html>' % content
 # 轉(zhuǎn)換為PDF
 pdfkit.from_string(html, './test/%s.pdf'%(i+1))
# 利用多線程生成PDF
executor = ThreadPoolExecutor(max_workers=10) # 可以自己調(diào)整max_workers,即線程的個數(shù)
# submit()的參數(shù): 第一個為函數(shù), 之后為該函數(shù)的傳入?yún)?shù),允許有多個
future_tasks = [executor.submit(convert_2_pdf, i) for i in range(100)]
# 等待所有的線程完成,才進入后續(xù)的執(zhí)行
wait(future_tasks, return_when=ALL_COMPLETED)
end_time = time.time()
print('一共耗時:%s 秒.' %(end_time-start_time))

在這個程序中,生成100份PDF文件一共耗時約41秒,明顯快了很多~

關(guān)于“如何將Python字符串生成PDF”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI