溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

python特征生成是什么意思

發(fā)布時(shí)間:2021-05-07 09:38:53 來源:億速云 閱讀:144 作者:小新 欄目:編程語(yǔ)言

這篇文章給大家分享的是有關(guān)python特征生成是什么意思的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

python是什么意思

Python是一種跨平臺(tái)的、具有解釋性、編譯性、互動(dòng)性和面向?qū)ο蟮哪_本語(yǔ)言,其最初的設(shè)計(jì)是用于編寫自動(dòng)化腳本,隨著版本的不斷更新和新功能的添加,常用于用于開發(fā)獨(dú)立的項(xiàng)目和大型項(xiàng)目。

業(yè)內(nèi)常說數(shù)據(jù)決定了模型效果的上限,機(jī)械學(xué)習(xí)算法通過數(shù)據(jù)特征進(jìn)行預(yù)測(cè),良好的特征可以顯著提高模型效果。這意味著通過特征生成(即從數(shù)據(jù)設(shè)計(jì)中加工模型的可用特征)是特征工程的重要一步。

一、特征生成作用

1、增加特征的表達(dá)能力,提升模型效果;

(如體重除以身高就是表達(dá)健康情況的重要特征,而單純看身高或體重對(duì)健康情況表達(dá)就有限。)

2、可以融入業(yè)務(wù)上的理解設(shè)計(jì)特征,增加模型的可解釋性。

二、特征生成方法

1、聚合方式

對(duì)存在一對(duì)多的字段,將其對(duì)應(yīng)多條記錄分組聚合后統(tǒng)計(jì)平均值、計(jì)數(shù)、最大值等數(shù)據(jù)特征。

# 自定義分組聚合統(tǒng)計(jì)函數(shù)
def x2_sum(group):
    return sum(group**2)

df.groupby('cust_no').C1.apply(x2_sum)

2、轉(zhuǎn)換方式

對(duì)字段間做加減乘除等運(yùn)算生成數(shù)據(jù)特征的過程,對(duì)不同字段類型有不同轉(zhuǎn)換方式。

感謝各位的閱讀!關(guān)于“python特征生成是什么意思”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI