您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“Python數(shù)據(jù)挖掘中常用的AutoEDA工具有哪些”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Python數(shù)據(jù)挖掘中常用的AutoEDA工具有哪些”吧!
Pandas Profiling
是款比較成熟的工具,可以直接傳入DataFrame即可完成分析過程,將結(jié)果展示為HTML格式,同時分析功能也比較強大。
功能:字段類型分析、變量分布分析、相關(guān)性分析、缺失值分析、重復行分析
耗時:較少
https://github.com/AutoViML/AutoViz
AutoViz
是款美觀的數(shù)據(jù)分析工具,在進行可視化的同時將結(jié)果保存為圖片格式。
功能:相關(guān)性分析、數(shù)值變量箱線圖、數(shù)值變量分布圖
耗時:較多
https://dataprep.ai/
Dataprep
是款比較靈活也比較強大的工具,也是筆者最喜歡的。它可以指定列進行分析,同時也可以在Notebook中進行交互式分析。
功能:字段類型分析、變量分布分析、相關(guān)性分析、缺失值分析、交互式分析。
耗時:較多
https://github.com/fbdesignpro/sweetviz
SweetViz
是款強大的數(shù)據(jù)分析工具,可以很好的分析訓練集和測試集,以及目標標簽與特征之間的關(guān)系。
功能:數(shù)據(jù)集對比分析、字段類型分析、變量分布分析、目標變量分析
耗時:中等
https://github.com/man-group/dtale
D-Tale
是款功能最為強大的數(shù)據(jù)分析工具,對單變量的分析過程支持比較好。
功能:字段類型分析、變量分布分析、相關(guān)性分析、缺失值分析、交互式分析。
耗時:中等
到此,相信大家對“Python數(shù)據(jù)挖掘中常用的AutoEDA工具有哪些”有了更深的了解,不妨來實際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學習!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。