在Python的pandas庫中,fillna()
函數(shù)用于填充缺失值(NaN)
使用常數(shù)值填充: 可以使用一個(gè)指定的常數(shù)值來填充缺失值。例如,將所有缺失值替換為0:
df.fillna(0, inplace=True)
使用前一個(gè)值填充(前向填充): 可以使用缺失值之前的那個(gè)值來填充缺失值。這種方法也稱為前向填充(forward fill)。例如:
df.fillna(method='ffill', inplace=True)
使用后一個(gè)值填充(后向填充): 可以使用缺失值之后的那個(gè)值來填充缺失值。這種方法也稱為后向填充(backward fill)。例如:
df.fillna(method='bfill', inplace=True)
使用平均值填充: 可以使用缺失值所在列的平均值來填充缺失值。例如:
df.fillna(df.mean(), inplace=True)
使用中位數(shù)填充: 可以使用缺失值所在列的中位數(shù)來填充缺失值。例如:
df.fillna(df.median(), inplace=True)
使用眾數(shù)填充: 可以使用缺失值所在列的眾數(shù)來填充缺失值。例如:
df.fillna(df.mode().iloc[0], inplace=True)
使用插值填充: 可以使用插值方法來填充缺失值。例如,使用線性插值:
df.interpolate(method='linear', inplace=True)
在使用fillna()
函數(shù)時(shí),可以根據(jù)實(shí)際需求選擇合適的填充策略。注意,填充缺失值是數(shù)據(jù)預(yù)處理的一部分,應(yīng)該根據(jù)數(shù)據(jù)的特點(diǎn)和分析目標(biāo)來選擇合適的方法。