Pandas如何實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)

發(fā)布時(shí)間：2022-03-11 11:09:09 來(lái)源：億速云閱讀：189 作者：小新欄目：開發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)Pandas如何實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)的內(nèi)容。小編覺得挺實(shí)用的，因此分享給大家做個(gè)參考，一起跟隨小編過來(lái)看看吧。

數(shù)據(jù)的存儲(chǔ)

數(shù)據(jù)可以有兩種類型-連續(xù)的和離散的，這取決于我們的分析要求。有時(shí)我們不需要連續(xù)變量中的精確值，但需要它所屬的群體。

例如，你的數(shù)據(jù)中有一個(gè)連續(xù)變量，年齡。但你需要一個(gè)年齡組來(lái)進(jìn)行分析，比如兒童、青少年、成人、老年人。實(shí)際上，Binning非常適合解決我們這里的問題。

為了執(zhí)行Binning，我們使用cut()函數(shù)。這對(duì)于從連續(xù)變量到離散變量非常有用。

import pandas as pd


df = pd.read_csv('titanic.csv')
from sklearn.utils import shuffle


# 隨機(jī)化
df = shuffle(df, random_state = 42)


df.head()


bins = [0,4,17,65,99]
labels =['Toddler','Child','Adult','Elderly']


category = pd.cut(df['Age'], bins = bins, labels = labels)


df.insert(2, 'Age Group', category)


df.head()


df['Age Group'].value_counts()


df.isnull().sum()

感謝各位的閱讀！關(guān)于“Pandas如何實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)”這篇文章就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，讓大家可以學(xué)到更多知識(shí)，如果覺得文章不錯(cuò)，可以把它分享出去讓更多的人看到吧！

向AI問一下細(xì)節(jié)

Pandas如何實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)

數(shù)據(jù)的存儲(chǔ)

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽