您好,登錄后才能下訂單哦!
小編給大家分享一下Python中把html網(wǎng)頁轉(zhuǎn)換成pdf的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
Python里面有個模塊是pdfkit,他可以幫咱們把一個html(也就是一個網(wǎng)頁)變成一個pdf文件。
pdfkit是Python對wkhtmltopdf這個把網(wǎng)頁轉(zhuǎn)成pdf工具的一個封裝,所以咱們必須得先安裝一個wkhtmltopdf,這個工具的下載網(wǎng)站是:https://wkhtmltopdf.org/downloads.html,根據(jù)自己的操作系統(tǒng)下載對應(yīng)的版本即可。
ps:這里要記住安裝目錄啊,下面要用到它,不要忘記它的安裝目錄~
上面說到了pdfkit這個模塊,這個是第三方模塊,需要安裝,使用pip安裝即可。
pip install pdfkit
pdfkit它給咱們提供了很多功能,可以給它一個 url,他會自動獲取 url 里面的內(nèi)容,幫你保存好,也可以給他一個 html 文件,也可以保存,也可以給他一個字符串,也可以保存成 pdf。
下面是代碼:
import pdfkit url='https://www.cnblogs.com/sriba/p/8043294.html'#一篇博客的url confg = pdfkit.configuration(wkhtmltopdf='C:\Python35\wkhtmltopdf.exe') #這里指定一下wkhtmltopdf的路徑,這就是我為啥在前面讓記住這個路徑 pdfkit.from_url(url, 'jmeter_下載文件.pdf',configuration=confg) # from_url這個函數(shù)是從url里面獲取內(nèi)容 # 這有3個參數(shù),第一個是url,第二個是文件名,第三個就是khtmltopdf的路徑 #pdfkit.from_file('my.html', 'jmeter_下載文件2.pdf',configuration=confg) # from_file這個函數(shù)是從文件里面獲取內(nèi)容 # 這有3個參數(shù),第一個是一個html文件,第二個是文生成的pdf的名字,第三個就是khtmltopdf的路徑 html='''title
content
'''#這個html是我從一個頁面上拷下來的一段,也可以 #pdfkit.from_string(html, 'jmeter_下載文件3.pdf',configuration=confg) # from_file這個函數(shù)是從一個字符串里面獲取內(nèi)容 # 這有3個參數(shù),第一個是一個字符串,第二個是文生成的pdf的名字,第三個就是khtmltopdf的路徑
看完了這篇文章,相信你對Python中把html網(wǎng)頁轉(zhuǎn)換成pdf的方法有了一定的了解,想了解更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。