溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何在pandas中使用get_dummies對one-hot進(jìn)行編碼

發(fā)布時(shí)間:2021-05-20 15:53:24 來源:億速云 閱讀:203 作者:Leah 欄目:開發(fā)技術(shù)

這篇文章將為大家詳細(xì)講解有關(guān)如何在pandas中使用get_dummies對one-hot進(jìn)行編碼,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對相關(guān)知識(shí)有一定的了解。

離散特征的編碼分為兩種情況:

1、離散特征的取值之間沒有大小的意義,比如color:[red,blue],那么就使用one-hot編碼

2、離散特征的取值有大小的意義,比如size:[X,XL,XXL],那么就使用數(shù)值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的對離散型特征進(jìn)行one-hot編碼

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

說明:對于有大小意義的離散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

如何在pandas中使用get_dummies對one-hot進(jìn)行編碼

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies進(jìn)行one-hot編碼
pd.get_dummies(df)

如何在pandas中使用get_dummies對one-hot進(jìn)行編碼

關(guān)于如何在pandas中使用get_dummies對one-hot進(jìn)行編碼就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI