溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么用Pandas制作pdf報(bào)告

發(fā)布時(shí)間:2021-08-26 14:29:01 來源:億速云 閱讀:217 作者:chen 欄目:編程語言

本篇內(nèi)容主要講解“怎么用Pandas制作pdf報(bào)告”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“怎么用Pandas制作pdf報(bào)告”吧!

前言

Pandas非常善于處理大規(guī)模數(shù)據(jù),支持將結(jié)果導(dǎo)出到CSV,Excel,HTML,json等文件中。 如果您想將 多種信息(excel、圖片等)組合 到一個(gè)文檔中,那么事情變得更加困難。今天我們介紹如何將excel更好看的輸出到pdf中,然后使用Jinja模板和WeasyPrint 再將其轉(zhuǎn)換為獨(dú)立的PDF文檔。

操作流程

使用Pandas將數(shù)據(jù)輸出到Excel文件中的多個(gè)工作表或者用DataFrames創(chuàng)建多個(gè)Excel文件非常方便。 但是,如果您想將 多種信息(excel、圖片等)組合 輸出到一個(gè)文件中,那么直接從Pandas進(jìn)行操作的方法并不多。 幸運(yùn)的是,萬能的python有很多選項(xiàng)可以幫助我們。

在本文中,我將采用以下流程來創(chuàng)建多頁P(yáng)DF文檔。

怎么用Pandas制作pdf報(bào)告

工具

我決定使用HTML作為模板語言,因?yàn)樗赡苁巧山Y(jié)構(gòu)化數(shù)據(jù)最便捷的方法,支持各種格式數(shù)據(jù)(如圖片、excel表)。我也認(rèn)為每個(gè)人都知道(或可以弄清楚)足夠的HTML知識來生成一個(gè)簡單的報(bào)告。

這個(gè)工作流程中最困難的部分是弄清楚如何將HTML呈現(xiàn)為PDF。我覺得還沒有最佳的解決方案,但我選擇了 WeasyPrint ,因?yàn)樗匀辉诜e極維護(hù),我發(fā)現(xiàn)我可以相對容易地使它工作。作為替代方案,我過去使用過xhtml2pdf,它的效果也很好,遺憾的是該庫缺乏文檔說明,但它已存在一段時(shí)間,并且確實(shí)可以從HTML生成PDF。

數(shù)據(jù)

如上所述,我們將使用之前文章中的相同數(shù)據(jù)集。 為了使這一切成為一個(gè)獨(dú)立的文章,下面是我如何導(dǎo)入數(shù)據(jù),做描述性統(tǒng)計(jì),及并生成關(guān)于CPU和軟件銷售的 數(shù)據(jù)透1視表 。

導(dǎo)入模塊,并讀入銷售渠道信息。

怎么用Pandas制作pdf報(bào)告

對數(shù)據(jù)做透1視表

sales_report = pd.pivot_table(df, index=["Manager", "Rep", "Product"], 
                              values=["Price", "Quantity"],
                              aggfunc=[np.sum, np.mean], 
                              fill_value=0)
sales_report.head()

怎么用Pandas制作pdf報(bào)告

模板

DataFrame擁有to_html()的方法,可以將dataframe數(shù)據(jù)轉(zhuǎn)化為含有HTML格式的字符串。

但是隨著您的報(bào)告變得越來越復(fù)雜或您選擇將Jinja模板用于您的網(wǎng)絡(luò)應(yīng)用,jinja的這些功能將為您提供良好的服務(wù)。Jinja的另一個(gè)不錯(cuò)的功能是它包含多個(gè)內(nèi)置過濾器,這些過濾器允許我們以Pandas中難以做到的方式格式化我們的一些數(shù)據(jù)。

為了在我們的應(yīng)用程序中使用Jinja,我們需要做三件事:

  1. 創(chuàng)建一個(gè)模板

  2. 將變量添加到模板上下文中

  3. 將模板渲染為HTML

這是一個(gè)非常簡單的模板,我們稱之為myreport.html:

<!DOCTYPE html><html><head lang="en">
    <meta charset="UTF-8">
    <title>{{ title }}    </title></head><body>
    <h3>Sales Funnel Report - National</h3>
     {{ national_pivot_table }}</body></html>

上面html代碼中擁有 {{title}} 和 {{national_pivot_table }} 這兩個(gè)關(guān)鍵詞。這兩個(gè)關(guān)鍵詞用來接收需要渲染的數(shù)據(jù),比如圖片對象、dataframe對象等。

要填充這些變量,我們需要?jiǎng)?chuàng)建一個(gè)Jinja環(huán)境并獲取我們的模板對象:

from jinja2 import Environment, FileSystemLoader
env = Environment(loader=FileSystemLoader('.'))
template = env.get_template('myreport.html')

在上面的示例中,我假設(shè)模板位于當(dāng)前目錄中,但您可以將完整路徑放到模板位置。

另一個(gè)關(guān)鍵組件是 env 的創(chuàng)建。 這個(gè)變量是我們將數(shù)據(jù)(或?qū)ο螅┨畛浣o模板的方式。 我們創(chuàng)建了一個(gè)名為 template_var 的字典,其中包含我們想要傳遞給模板的所有變量。

請注意變量的名稱如何與我們的模板匹配。即名稱要與myreport.html中的{{}}夾住的關(guān)鍵詞一樣。

template_vars = {"title" : "Sales Funnel Report - National",                 "national_pivot_table": sales_report.to_html()}

最后一步是將 template_vars 渲染到html模板中,并輸出為html字符串,最終我們將使用該html字符串來生成pdf報(bào)告。

html_out = template.render(template_vars)

為簡潔起見,我不會(huì)顯示完整的HTML,但您應(yīng)該明白這一點(diǎn)。

生成pdf

pdf報(bào)告的生成部分相當(dāng)簡單,這里用到weasyprint庫

from weasyprint import HTML
HTML(string=html_out).write_pdf("report.pdf")

怎么用Pandas制作pdf報(bào)告

但是打開的pdf樣式很簡單,白底黑字并不美觀。之所以這樣是因?yàn)槲覀儧]有使用自定義樣式表css,但是咱們不熟悉css,有一種簡單的辦法就是用成熟的css,這里我用的typography.css 作為填充表格時(shí)的樣式表。這個(gè)css的優(yōu)點(diǎn)有:

  1. 相對較小且易于理解

  2. 可以在PDF引擎中運(yùn)行而不會(huì)拋出錯(cuò)誤和警告

  3. 能讓表格表格看起來很美觀

讓我們嘗試使用我們更新的樣式表重新渲染它:

HTML(string=html_out).write_pdf('beautiful_report.pdf', stylesheets=["typography.css"])

怎么用Pandas制作pdf報(bào)告

到此,相信大家對“怎么用Pandas制作pdf報(bào)告”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI