溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

常見優(yōu)化器的PyTorch實(shí)現(xiàn)是怎樣的

發(fā)布時(shí)間:2021-11-15 15:09:16 來源:億速云 閱讀:123 作者:柒染 欄目:大數(shù)據(jù)

這篇文章將為大家詳細(xì)講解有關(guān)常見優(yōu)化器的PyTorch實(shí)現(xiàn)是怎樣的,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。

這里主要講不同常見優(yōu)化器代碼的實(shí)現(xiàn),以及在一個(gè)小數(shù)據(jù)集上做一個(gè)簡(jiǎn)單的比較。

其中,SGD和SGDM,還有Adam是pytorch自帶的優(yōu)化器,而RAdam是最近提出的一個(gè)說是Adam更強(qiáng)的優(yōu)化器,但是一般情況下真正的大佬還在用SGDM來做優(yōu)化器。

導(dǎo)入必要庫:

import torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimimport matplotlib.pyplot as pltimport torch.utils.data as Datafrom torch.optim.optimizer import Optimizerimport math

主程序部分:

LR = 0.01BATCH_SIZE = 32EPOCH = 12
# fake datasetx = torch.unsqueeze(torch.linspace(-1, 1, 300), dim=1)y = x.pow(2) + 0.1 * torch.normal(torch.zeros(*x.size()))
torch_dataset = Data.TensorDataset(x, y)loader = Data.DataLoader(    dataset=torch_dataset,    batch_size=BATCH_SIZE,    shuffle=True,    num_workers=2)

class Net(nn.Module):    def __init__(self):        super(Net, self).__init__()        self.hidden = nn.Linear(1, 20)        self.prediction = nn.Linear(20, 1)
   def forward(self, x):        x = F.relu(self.hidden(x))        x = self.prediction(x)        return x

def main():    net_SGD = Net()    net_Momentum = Net()    net_Adam = Net()    net_RAdam = Net()    nets = [net_SGD, net_Momentum, net_Adam, net_RAdam]    opt_SGD = optim.SGD(net_SGD.parameters(), lr=LR)    opt_Momentum = optim.SGD(net_Momentum.parameters(), lr=LR, momentum=0.9)    opt_Adam = optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99))    opt_RAdam = RAdam(net_RAdam.parameters(),lr=LR,weight_decay=0)    optimizers = [opt_SGD, opt_Momentum, opt_Adam, opt_RAdam]    loss_func = nn.MSELoss()    losses_his = [[], [], [], []]    # training    for epoch in range(EPOCH):        print('EPOCH:', epoch)        for step, (batch_x, batch_y) in enumerate(loader):            b_x = batch_x            b_y = batch_y            for net, opt, l_his in zip(nets, optimizers, losses_his):                out = net(b_x)                loss = loss_func(out, b_y)                opt.zero_grad()                loss.backward()                opt.step()                l_his.append(loss.item())    labels = ['SGD', 'Momentum', 'Adam','RAdam']    for i, l_his in enumerate(losses_his):        plt.plot(l_his, label=labels[i])    plt.legend(loc='best')    plt.xlabel('Steps')    plt.ylabel('Loss')    plt.ylim((0, 0.2))    plt.show()

if __name__ == '__main__':    main()

下圖是優(yōu)化器的對(duì)比:

常見優(yōu)化器的PyTorch實(shí)現(xiàn)是怎樣的

可以看出來,Adam的效果可以說是非常好的。然后SGDM其次,SGDM是大佬們經(jīng)常會(huì)使用的,所以在這里雖然看起來SGDM效果不如Adam,但是依然推薦在項(xiàng)目中,嘗試一下SGDM的效果。

關(guān)于常見優(yōu)化器的PyTorch實(shí)現(xiàn)是怎樣的就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI