溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

在keras中model如何實(shí)現(xiàn)固定部分layer,訓(xùn)練部分layer操作

發(fā)布時(shí)間:2020-06-28 18:00:59 來(lái)源:億速云 閱讀:556 作者:清晨 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要介紹在keras中model如何實(shí)現(xiàn)固定部分layer,訓(xùn)練部分layer操作,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

需求:Resnet50做調(diào)優(yōu)訓(xùn)練,將最后分類數(shù)目由1000改為500。

問(wèn)題:網(wǎng)上下載了resnet50_weights_tf_dim_ordering_tf_kernels_notop.h6,更改了Resnet50后,由于所有層均參加訓(xùn)練,導(dǎo)致訓(xùn)練速度慢。實(shí)際上只需要訓(xùn)練最后3層,前面的層都不需要訓(xùn)練。

解決辦法:

①將模型拆分為兩個(gè)模型,一個(gè)為前面的notop部分,一個(gè)為最后三層,然后利用model的trainable屬性設(shè)置只有后一個(gè)model訓(xùn)練,最后將兩個(gè)模型合并起來(lái)。

②不用拆分,遍歷模型的所有層,將前面層的trainable設(shè)置為False即可。代碼如下:

for layer in model.layers[:-3]:
 print(layer.trainable)
 layer.trainable = False

注意事項(xiàng):

①盡量不要這樣:

layers.Conv2D(filters1, (1, 1), trainable=False)(input_tensor)

因?yàn)槿菀壮鲥e(cuò)。。。

②加載notop參數(shù)時(shí)注意by_name=True.

補(bǔ)充知識(shí):Keras關(guān)于訓(xùn)練凍結(jié)部分層

設(shè)置凍結(jié)層有兩種方式。

(不推薦)是在搭建網(wǎng)絡(luò)時(shí),直接將某層的trainable設(shè)置為false,例如:

layers.Conv2D(filters1, (1, 1), trainable=False)(input_tensor)

在網(wǎng)絡(luò)搭建完成時(shí),遍歷model.layer,然后將layer.trainable設(shè)置為False:

# 凍結(jié)網(wǎng)絡(luò)倒數(shù)的3層
for layer in model.layers[:-3]:
 print(layer.trainable)
 layer.trainable = False

也可以根據(jù)layer.name來(lái)確定哪些層需要凍結(jié),例如凍結(jié)最后一層和RNN層:

for layer in model.layers:
 layerName=str(layer.name)
 if layerName.startswith("RNN_") or layerName.startswith("Final_"):
 layer.trainable=False

可以在實(shí)例化之后將網(wǎng)絡(luò)層的 trainable 屬性設(shè)置為 True 或 False。為了使之生效,在修改 trainable 屬性之后,需要在模型上調(diào)用 compile()。

這是一個(gè)例子

x = Input(shape=(32,))
layer = Dense(32)
layer.trainable = False
y = layer(x)
 
frozen_model = Model(x, y)
# 在下面的模型中,訓(xùn)練期間不會(huì)更新層的權(quán)重
frozen_model.compile(optimizer='rmsprop', loss='mse')
 
layer.trainable = True
trainable_model = Model(x, y)
# 使用這個(gè)模型,訓(xùn)練期間 `layer` 的權(quán)重將被更新
# (這也會(huì)影響上面的模型,因?yàn)樗褂昧送粋€(gè)網(wǎng)絡(luò)層實(shí)例)
trainable_model.compile(optimizer='rmsprop', loss='mse')
 
frozen_model.fit(data, labels) # 這不會(huì)更新 `layer` 的權(quán)重
trainable_model.fit(data, labels) # 這會(huì)更新 `layer` 的權(quán)重

在網(wǎng)絡(luò)搭建時(shí),可以考慮最后一個(gè)分類層命名和分類數(shù)量關(guān)聯(lián),這樣當(dāng)費(fèi)雷數(shù)量方式變化時(shí),model.load_weight(“weight.h6”,by_name=True)不會(huì)加載最后一層

以上是在keras中model如何實(shí)現(xiàn)固定部分layer,訓(xùn)練部分layer操作的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI