溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何利用Python做數據篩選

發(fā)布時間:2021-07-16 09:14:55 來源:億速云 閱讀:945 作者:chen 欄目:大數據

本篇內容主要講解“如何利用Python做數據篩選”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“如何利用Python做數據篩選”吧!

EXCEL篩選

我們回顧一下上一篇文章里的數據需求,第一個是根據訂單日期篩選2010年的訂單,第二個是根據訂單等級去篩選高級的訂單,這一次我們把篩選條件進行升級,增加一個條件:在原先兩個篩選條件的基礎上,篩選出利潤金額前10的訂單。如果在EXCEL里操作的話,可以利用公式或者自身的篩選功能去實現(xiàn),但是在python又是怎樣實現(xiàn)的呢?

如何利用Python做數據篩選

我們可以在pycharm等軟件上寫python腳本去實現(xiàn),但是我推薦大家用Smartbi智分析的ETL功能去實現(xiàn),Smartbi智分析的ETL界面里也提供了python腳本的編寫頁面,并且很多簡單的需求通過ETL就能實現(xiàn),無需撰寫復雜的代碼,非常適合編程小白。

加載數據

打開Smartbi智分析里ETL界面,我們先連接好數據源,我已經提前把EXCEL文件導入到了Smartbi智分析的系統(tǒng)里,然后把關系數據源拉拽到展示區(qū)里,并在右邊找到數據源存放的路徑:

如何利用Python做數據篩選

加載完成后,我們可以對數據源進行預覽:

如何利用Python做數據篩選

條件過濾

當完成了數據連接后,接下來就可以利用Smartbi智分析ETL里自帶的python腳本對數據進行各種處理,我們先把python的組件拉拽到中間的展示區(qū),并與上面的關系數據源進行相連:

如何利用Python做數據篩選

以下腳本是Smartbi智分析自帶的腳本,已經提前安裝好了pandas和numpy的庫,后面的函數也寫好了一部分代碼,只要根據以下腳本進行擴展,便可以在ETL上利用python進行數據清洗:

如何利用Python做數據篩選 

在輸入python腳本之前,我們再明確一下要實現(xiàn)的需求,其中前面兩個條件是和上次一樣的,我們無需進行改動,直接復制腳本過來即可,如果不懂的可以查看我前一篇文章。第三個條件需要做的是篩選利潤額前10的訂單,這里我們引用pandas中的sort_values函數進行排序,原理類似于SQL中的order by,可以將數據集依照某個字段中的數據進行排序,后面接ascending=False,即對數據進行降序排列,head(10)代表的是取前10的值:

如何利用Python做數據篩選

我們看一下python腳本執(zhí)行后的效果,年份這一列把2010年給篩選出來了,訂單這一列篩選的是高級的訂單,訂單利潤這一列的數據按照降序把前10的數據給篩選出來了:

如何利用Python做數據篩選

數據輸出

完成python的篩選程序后,我們把執(zhí)行篩選后的表格進行保存,可以選擇保存在數據庫中,也可以保存在數據集里,這里我依舊選擇數據集的保存方式,因為方便在EXCEL里進行調用:

如何利用Python做數據篩選

回到EXCEL里,點擊EXCEL插件里的“視圖”,在右邊會出現(xiàn)Smartbi智分析的數據集面板界面,點擊下拉菜單,便可以找到保存在云端的數據集,也可以直接輸入文件名進行搜索:

如何利用Python做數據篩選

點擊EXCEL工具欄上的“刷新”,數據集里的字段便會顯示在EXCEL里,我們就可以利用這些數據在EXCEL里進行數據分析了:

如何利用Python做數據篩選 

到此,相信大家對“如何利用Python做數據篩選”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續(xù)學習!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI