溫馨提示×

python dropna()和notnull()的用法有哪些

小億
96
2023-08-01 13:30:38
欄目: 編程語言

  1. dropna() 函數(shù)用于刪除含有缺失值的行或列。它有以下常用參數(shù):
  • axis:指定是刪除行(axis=0)還是刪除列(axis=1)。

  • how:指定刪除行或列的條件,默認為 any,表示只要存在一個缺失值就刪除,也可以設置為 all,表示全部缺失值才刪除。

  • subset:指定刪除行或列的范圍,默認為None,表示刪除所有含有缺失值的行或列。

示例:

import pandas as pd
data = {'Name': ['Tom', 'John', 'Amy', 'Emily', 'Mike'],
'Age': [20, 25, None, 30, 35],
'Gender': ['M', 'M', 'F', None, 'M']}
df = pd.DataFrame(data)
# 刪除所有含有缺失值的行
df.dropna()
# 刪除所有含有缺失值的列
df.dropna(axis=1)
# 刪除Age列中含有缺失值的行
df.dropna(subset=['Age'])
  1. notnull() 函數(shù)用于判斷每個元素是否為缺失值,返回一個布爾值的 Series。它可以用于過濾數(shù)據(jù)集中含有缺失值的行或列。

示例:

import pandas as pd
data = {'Name': ['Tom', 'John', 'Amy', 'Emily', 'Mike'],
'Age': [20, 25, None, 30, 35],
'Gender': ['M', 'M', 'F', None, 'M']}
df = pd.DataFrame(data)
# 過濾掉所有含有缺失值的行
df = df[df.notnull().all(axis=1)]
# 過濾掉所有含有缺失值的列
df = df[df.notnull().all(axis=0)]

0