您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關(guān)如何用Python熱力圖可視化表格缺失數(shù)據(jù),可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
Python熱力圖尋找缺失數(shù)據(jù)
你有沒有遇到一種情況,處理一張很大的csv表格的時候很難找到表格中每一列的缺失數(shù)據(jù),或者說處理速度非常慢?當(dāng)然如果你的excel水平非常高,這些可能不會成為你的問題。但如果你想可視化出每一列缺失數(shù)據(jù)的分布和數(shù)量怎么辦?這時候就需要用Python繪制熱力圖了!
在開始之前我們需要安裝以下Python包(庫),打開你的CMD(Windows系統(tǒng))/Terminal(macOS系統(tǒng))輸入以下指令即可:
pip install seaborn
pip install pandas
pip install matplotlib
其中pandas是用于數(shù)據(jù)操作與處理的,matplotlib和seaborn主要用于Python數(shù)據(jù)可視化,也就是繪制我們所需要的熱力圖。
好了,廢話不多說,讓我們現(xiàn)在就開始使用panda加載數(shù)據(jù):
沒錯,pandas的使用就這么簡單,讀取csv文件直接使用read_csv函數(shù),你可以使用自己需要的csv文件,也可以使用我們提供的:Python推特機器人分類數(shù)據(jù)集:
https://pythondict.com/download/python-twitter-bot-classify-dataset-download/
中的training_data.csv,只需要你移動到當(dāng)前代碼的文件夾下即可。
使用Python構(gòu)造熱力圖識別表格的缺失數(shù)據(jù):
Python熱力圖尋找缺失數(shù)據(jù)
seaborn.heatmap用于生成熱力圖,其會檢查data中的每個單元格,如果為空則標(biāo)記為黃色,cmap為顏色圖譜,viridis即藍-綠-黃. 此外,matplotlib.pyplot主要用于負(fù)責(zé)展示圖片。如果你需要知道seaborn更詳細(xì)的參數(shù)文檔,可以閱讀這篇文章:
https://seaborn.pydata.org/api.html
整體代碼如下(一共只用了7行)
看完上述內(nèi)容,你們對如何用Python熱力圖可視化表格缺失數(shù)據(jù)有進一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。