要自定義編碼方案,可以使用map()
函數(shù)來(lái)實(shí)現(xiàn)。首先創(chuàng)建一個(gè)字典,將原始數(shù)據(jù)和自定義編碼進(jìn)行映射,然后使用map()
函數(shù)將原始數(shù)據(jù)映射為自定義編碼。以下是一個(gè)示例:
import pandas as pd
# 創(chuàng)建一個(gè)包含原始數(shù)據(jù)的DataFrame
data = {'A': ['apple', 'banana', 'cherry', 'apple', 'banana']}
df = pd.DataFrame(data)
# 創(chuàng)建自定義編碼字典
encoding = {'apple': 1, 'banana': 2, 'cherry': 3}
# 使用map函數(shù)將原始數(shù)據(jù)映射為自定義編碼
df['A_encoded'] = df['A'].map(encoding)
print(df)
輸出結(jié)果為:
A A_encoded
0 apple 1
1 banana 2
2 cherry 3
3 apple 1
4 banana 2
這樣就實(shí)現(xiàn)了自定義的編碼方案。