您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關(guān)python特征生成是什么意思的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。
Python是一種跨平臺(tái)的、具有解釋性、編譯性、互動(dòng)性和面向?qū)ο蟮哪_本語(yǔ)言,其最初的設(shè)計(jì)是用于編寫自動(dòng)化腳本,隨著版本的不斷更新和新功能的添加,常用于用于開發(fā)獨(dú)立的項(xiàng)目和大型項(xiàng)目。
業(yè)內(nèi)常說數(shù)據(jù)決定了模型效果的上限,機(jī)械學(xué)習(xí)算法通過數(shù)據(jù)特征進(jìn)行預(yù)測(cè),良好的特征可以顯著提高模型效果。這意味著通過特征生成(即從數(shù)據(jù)設(shè)計(jì)中加工模型的可用特征)是特征工程的重要一步。
一、特征生成作用
1、增加特征的表達(dá)能力,提升模型效果;
(如體重除以身高就是表達(dá)健康情況的重要特征,而單純看身高或體重對(duì)健康情況表達(dá)就有限。)
2、可以融入業(yè)務(wù)上的理解設(shè)計(jì)特征,增加模型的可解釋性。
二、特征生成方法
1、聚合方式
對(duì)存在一對(duì)多的字段,將其對(duì)應(yīng)多條記錄分組聚合后統(tǒng)計(jì)平均值、計(jì)數(shù)、最大值等數(shù)據(jù)特征。
# 自定義分組聚合統(tǒng)計(jì)函數(shù) def x2_sum(group): return sum(group**2) df.groupby('cust_no').C1.apply(x2_sum)
2、轉(zhuǎn)換方式
對(duì)字段間做加減乘除等運(yùn)算生成數(shù)據(jù)特征的過程,對(duì)不同字段類型有不同轉(zhuǎn)換方式。
感謝各位的閱讀!關(guān)于“python特征生成是什么意思”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。