溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

Keras中fit()和fit_generator()的區(qū)別及參數(shù)有哪些

發(fā)布時(shí)間：2022-03-01 10:13:59 來源：億速云閱讀：609 作者：iii 欄目：開發(fā)技術(shù)

本文小編為大家詳細(xì)介紹“Keras中fit()和fit_generator()的區(qū)別及參數(shù)有哪些”，內(nèi)容詳細(xì)，步驟清晰，細(xì)節(jié)處理妥當(dāng)，希望這篇“Keras中fit()和fit_generator()的區(qū)別及參數(shù)有哪些”文章能幫助大家解決疑惑，下面跟著小編的思路慢慢深入，一起來學(xué)習(xí)新知識(shí)吧。

1、fit和fit_generator的區(qū)別

首先Keras中的fit()函數(shù)傳入的x_train和y_train是被完整的加載進(jìn)內(nèi)存的,當(dāng)然用起來很方便，但是如果我們數(shù)據(jù)量很大，那么是不可能將所有數(shù)據(jù)載入內(nèi)存的，必將導(dǎo)致內(nèi)存泄漏，這時(shí)候我們可以用fit_generator函數(shù)來進(jìn)行訓(xùn)練。

下面是fit傳參的例子：

history = model.fit(x_train, y_train, epochs=10,batch_size=32, 
                    validation_split=0.2)

這里需要給出epochs和batch_size，epoch是這個(gè)數(shù)據(jù)集要被輪多少次，batch_size是指這個(gè)數(shù)據(jù)集被分成多少個(gè)batch進(jìn)行處理。

最后可以給出交叉驗(yàn)證集的大小，這里的0.2是指在訓(xùn)練集上占比20%。

fit_generator函數(shù)必須傳入一個(gè)生成器，我們的訓(xùn)練數(shù)據(jù)也是通過生成器產(chǎn)生的，下面給出一個(gè)簡(jiǎn)單的生成器函數(shù)：

batch_size = 128
def generator():
    while 1:
        row = np.random.randint(0,len(x_train),size=batch_size)
        x = np.zeros((batch_size,x_train.shape[-1]))
        y = np.zeros((batch_size,))
        x = x_train[row]
        y = y_train[row]
        yield x,y

這里的生成器函數(shù)我產(chǎn)生的是一個(gè)batch_size為128大小的數(shù)據(jù)，這只是一個(gè)demo。如果我在生成器里沒有規(guī)定batch_size的大小，就是每次產(chǎn)生一個(gè)數(shù)據(jù)，那么在用fit_generator時(shí)候里面的參數(shù)steps_per_epoch是不一樣的。

這里的坑我困惑了好久，雖然不是什么大問題

下面是fit_generator函數(shù)的傳參：

history = model.fit_generator(generator(),epochs=epochs,steps_per_epoch=len(x_train)//(batch_size*epochs))

2、batch_size和steps_per_epoch的區(qū)別

首先batch_size = 數(shù)據(jù)集大小/steps_per_epoch的，如果我們?cè)谏珊瘮?shù)里設(shè)置了batch_size的大小，那么在fit_generator傳參的時(shí)候，,steps_per_epoch=len(x_train)//(batch_size*epochs)

我得完整demo代碼：

from keras.datasets import imdb
from keras.preprocessing.sequence import pad_sequences
from keras.models import Sequential
from keras import layers
import numpy as np
import random
from sklearn.metrics import f1_score,accuracy_score
max_features = 10000
maxlen = 500
batch_size = 32
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)
x_train = pad_sequences(x_train,maxlen=maxlen)
x_test = pad_sequences(x_test,maxlen=maxlen)
 
def generator():
    while 1:
        row = np.random.randint(0,len(x_train),size=batch_size)
        x = np.zeros((batch_size,x_train.shape[-1]))
        y = np.zeros((batch_size,))
        x = x_train[row]
        y = y_train[row]
        yield x,y
# generator()
 
model = Sequential()
model.add(layers.Embedding(max_features,32,input_length=maxlen))
model.add(layers.GRU(64,return_sequences=True))
model.add(layers.GRU(32))
# model.add(layers.Flatten())
# model.add(layers.Dense(32,activation='relu'))
 
model.add(layers.Dense(1,activation='sigmoid'))
model.compile(optimizer='rmsprop',loss='binary_crossentropy',metrics=['acc'])
print(model.summary())
 
# history = model.fit(x_train, y_train, epochs=1,batch_size=32, validation_split=0.2)
history = model.fit_generator(generator(),epochs=1,steps_per_epoch=len(x_train)//(batch_size)) 
 
print(model.evaluate(x_test,y_test))
y = model.predict_classes(x_test) 
print(accuracy_score(y_test,y))

補(bǔ)充：model.fit_generator()詳細(xì)解讀

如下所示：

from keras import models
model = models.Sequential()

首先

利用keras，搭建順序模型，具體搭建步驟省略。完成搭建后，我們需要將數(shù)據(jù)送入模型進(jìn)行訓(xùn)練，送入數(shù)據(jù)的方式有很多種，models.fit_generator()是其中一種方式。

具體說，model.fit_generator()是利用生成器，分批次向模型送入數(shù)據(jù)的方式，可以有效節(jié)省單次內(nèi)存的消耗。

具體函數(shù)形式如下：

fit_generator(self, generator, steps_per_epoch, epochs=1, verbose=1, 
callbacks=None, validation_data=None, validation_steps=None,
 class_weight=None, max_q_size=10, workers=1, pickle_safe=False, initial_epoch=0)

參數(shù)解釋：

generator:一般是一個(gè)生成器函數(shù)；

steps_per_epochs:是指在每個(gè)epoch中生成器執(zhí)行生成數(shù)據(jù)的次數(shù)，若設(shè)定steps_per_epochs=100,這情況如下圖所示；

epochs:指訓(xùn)練過程中需要迭代的次數(shù)；

verbose:默認(rèn)值為1，是指在訓(xùn)練過程中日志的顯示模式，取 1 時(shí)表示“進(jìn)度條模式”，取2時(shí)表示“每輪一行”，取0時(shí)表示“安靜模式”；

validation_data, validation_steps指驗(yàn)證集的情況，使用方式和generator, steps_per_epoch相同；

models.fit_generator()會(huì)返回一個(gè)history對(duì)象，history.history 屬性記錄訓(xùn)練過程中，連續(xù) epoch 訓(xùn)練損失和評(píng)估值，以及驗(yàn)證集損失和評(píng)估值，可以通過以下方式調(diào)取這些值！

acc = history.history["acc"]
val_acc = history.history["val_acc"]
loss = history.history["loss"]
val_loss = history.history["val_loss"]

讀到這里，這篇“Keras中fit()和fit_generator()的區(qū)別及參數(shù)有哪些”文章已經(jīng)介紹完畢，想要掌握這篇文章的知識(shí)點(diǎn)還需要大家自己動(dòng)手實(shí)踐使用過才能領(lǐng)會(huì)，如果想了解更多相關(guān)內(nèi)容的文章，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
基于Keras的擴(kuò)展性如何自定義keras
下一篇新聞：
如何實(shí)現(xiàn)textarea自適應(yīng)高度

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼