溫馨提示×

在Python的Pandas庫中怎樣模擬CASE WHEN功能

小樊
89
2024-10-10 02:34:42
欄目: 編程語言

在Python的Pandas庫中,可以使用np.where()函數(shù)或者pd.cut()函數(shù)來模擬CASE WHEN功能。

  1. 使用np.where()函數(shù):

np.where()函數(shù)可以根據(jù)指定的條件返回不同的值。其語法格式為:np.where(condition, value_if_true, value_if_false)。其中,condition是要測試的條件,value_if_true是條件為真時返回的值,value_if_false是條件為假時返回的值。

例如,下面的代碼將根據(jù)列A中的值生成一個新列B,如果A的值大于10,則B的值為"大于10",否則為"小于等于10":

import pandas as pd
import numpy as np

# 創(chuàng)建一個示例DataFrame
df = pd.DataFrame({'A': [5, 12, 7, 15, 3]})

# 使用np.where()函數(shù)模擬CASE WHEN功能
df['B'] = np.where(df['A'] > 10, '大于10', '小于等于10')

print(df)
  1. 使用pd.cut()函數(shù):

pd.cut()函數(shù)可以將連續(xù)型數(shù)據(jù)劃分為多個區(qū)間,并返回每個數(shù)據(jù)屬于哪個區(qū)間。其語法格式為:pd.cut(x, bins, labels=None, right=True, include_lowest=False)。其中,x是要劃分的數(shù)據(jù)列,bins是劃分區(qū)間的列表,labels是每個區(qū)間的標(biāo)簽(可選),right表示區(qū)間的右側(cè)是否包含(默認(rèn)為True),include_lowest表示是否將最小值包含在第一個區(qū)間內(nèi)(默認(rèn)為False)。

雖然pd.cut()函數(shù)主要用于劃分區(qū)間,但可以通過一些技巧來模擬CASE WHEN功能。例如,下面的代碼將根據(jù)列A中的值生成一個新列B,如果A的值大于10,則B的值為"大于10",否則為"小于等于10":

import pandas as pd

# 創(chuàng)建一個示例DataFrame
df = pd.DataFrame({'A': [5, 12, 7, 15, 3]})

# 使用pd.cut()函數(shù)模擬CASE WHEN功能
df['B'] = pd.cut(df['A'], bins=[0, 10, np.inf], labels=['小于等于10', '大于10'])

print(df)

請注意,pd.cut()函數(shù)返回的是區(qū)間標(biāo)簽,而不是具體的值。如果需要返回具體的值,可以使用map()函數(shù)將區(qū)間標(biāo)簽映射到具體的值。例如,可以將上面的代碼修改為:

import pandas as pd

# 創(chuàng)建一個示例DataFrame
df = pd.DataFrame({'A': [5, 12, 7, 15, 3]})

# 使用pd.cut()函數(shù)獲取區(qū)間標(biāo)簽
labels = pd.cut(df['A'], bins=[0, 10, np.inf], labels=['小于等于10', '大于10'])

# 使用map()函數(shù)將區(qū)間標(biāo)簽映射到具體的值
df['B'] = labels.map({'小于等于10': '小于等于10', '大于10': '大于10'})

print(df)

0