如何將Python字符串生成PDF

發(fā)布時間：2021-06-24 13:55:15 來源：億速云閱讀：279 作者：小新欄目：開發(fā)技術(shù)

這篇文章將為大家詳細講解有關(guān)如何將Python字符串生成PDF，小編覺得挺實用的，因此分享給大家做個參考，希望大家閱讀完這篇文章后可以有所收獲。

如何將Python字符串生成PDF

??該問題的解決思路還是利用將Python字符串嵌入到HTML代碼中解決，注意換行需要用<br>標(biāo)簽，示例代碼如下：

import pdfkit
# PDF中包含的文字
content = '這是一個測試文件。' + '<br>' + 'Hello from Python!'
html = '<html><head><meta charset="UTF-8"></head>' \
 '<body><div align="center"><p>%s</p></div></body></html>'%content
# 轉(zhuǎn)換為PDF
pdfkit.from_string(html, './test.pdf')

輸出的結(jié)果如下：

Loading pages (1/6)
Counting pages (2/6)
Resolving links (4/6)
Loading headers and footers (5/6)
Printing pages (6/6)
Done

生成的test.pdf如下：

如何將Python字符串生成PDF

如何生成PDF中的表格

??接下來我們考慮如何將csv文件轉(zhuǎn)換為PDF中的表格，思路還是利用HTML代碼。示例的iris.csv文件（部分）如下：

? 如何將Python字符串生成PDF

?將csv文件轉(zhuǎn)換為PDF中的表格的Python代碼如下：

import pdfkit
# 讀取csv文件
with open('iris.csv', 'r') as f:
 lines = [_.strip() for _ in f.readlines()]
# 轉(zhuǎn)化為html中的表格樣式
td_width = 100
content = '<table width="%s" border="1" cellspacing="0px" >' % (td_width*len(lines[0].split(',')))
for i in range(len(lines)):
 tr = '<tr>'+''.join(['<td width="%d">%s</td>'%(td_width, _) for _ in lines[i].split(',')])+'</tr>'
 content += tr
content += '</table>'
html = '<html><head><meta charset="UTF-8"></head>' \
 '<body><div align="center">%s</div></body></html>' % content
# 轉(zhuǎn)換為PDF
pdfkit.from_string(html, './iris.pdf')

??生成的PDF文件為iris.pdf，部分內(nèi)容如下：

如何將Python字符串生成PDF

解決PDF生成速度慢的問題

??用pdfkit生成PDF文件雖然方便，但有一個比較大的缺點，那就是生成PDF的速度比較慢，這里我們可以做個簡單的測試，比如生成100份PDF文件，里面的文字為“這是第*份測試文件！”。Python代碼如下：

import pdfkit
import time
start_time = time.time()
for i in range(100):
 content = '這是第%d份測試文件！'%(i+1)
 html = '<html><head><meta charset="UTF-8"></head>' \
  '<body><div align="center">%s</div></body></html>' % content
 # 轉(zhuǎn)換為PDF
 pdfkit.from_string(html, './test/%s.pdf'%(i+1))
end_time = time.time()
print('一共耗時：%s 秒.' %(end_time-start_time))

在這個程序中，生成100份PDF文件一共耗時約192秒。輸出結(jié)果如下：

......
Loading pages (1/6)
Counting pages (2/6)
Resolving links (4/6)
Loading headers and footers (5/6)
Printing pages (6/6)
Done
一共耗時：191.9226369857788 秒.

??如果想要加快生成的速度，我們可以使用多線程來實現(xiàn)，主要使用concurrent.futures模塊，完整的Python代碼如下：

import pdfkit
import time
from concurrent.futures import ThreadPoolExecutor, wait, ALL_COMPLETED
start_time = time.time()
# 函數(shù): 生成PDF
def convert_2_pdf(i):
 content = '這是第%d份測試文件！'%(i+1)
 html = '<html><head><meta charset="UTF-8"></head>' \
  '<body><div align="center">%s</div></body></html>' % content
 # 轉(zhuǎn)換為PDF
 pdfkit.from_string(html, './test/%s.pdf'%(i+1))
# 利用多線程生成PDF
executor = ThreadPoolExecutor(max_workers=10) # 可以自己調(diào)整max_workers,即線程的個數(shù)
# submit()的參數(shù)： 第一個為函數(shù)， 之后為該函數(shù)的傳入?yún)?shù)，允許有多個
future_tasks = [executor.submit(convert_2_pdf, i) for i in range(100)]
# 等待所有的線程完成，才進入后續(xù)的執(zhí)行
wait(future_tasks, return_when=ALL_COMPLETED)
end_time = time.time()
print('一共耗時：%s 秒.' %(end_time-start_time))

在這個程序中，生成100份PDF文件一共耗時約41秒，明顯快了很多～

關(guān)于“如何將Python字符串生成PDF”這篇文章就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，使各位可以學(xué)到更多知識，如果覺得文章不錯，請把它分享出去讓更多的人看到。

向AI問一下細節(jié)

如何將Python字符串生成PDF

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽