^{<tbody id="koqcu"></tbody>}

<tbody id="koqcu"></tbody>^{<rt id="koqcu"></rt>}

<option id="koqcu"></option>

<table id="koqcu"></table>

<table id="koqcu"><xmp id="koqcu"></xmp></table>

<option id="koqcu"><strong id="koqcu"></strong></option>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

發(fā)布時間：2020-09-05 14:07:13 來源：腳本之家閱讀：217 作者：GQ17-kawaler 欄目：開發(fā)技術(shù)

數(shù)據(jù)增強

卷積神經(jīng)網(wǎng)絡(luò)非常容易出現(xiàn)過擬合的問題，而數(shù)據(jù)增強的方法是對抗過擬合問題的一個重要方法。

2012 年 AlexNet 在 ImageNet 上大獲全勝，圖片增強方法功不可沒，因為有了圖片增強，使得訓(xùn)練的數(shù)據(jù)集比實際數(shù)據(jù)集多了很多'新'樣本，減少了過擬合的問題，下面我們來具體解釋一下。

常用的數(shù)據(jù)增強方法

常用的數(shù)據(jù)增強方法如下：
1.對圖片進行一定比例縮放
2.對圖片進行隨機位置的截取
3.對圖片進行隨機的水平和豎直翻轉(zhuǎn)
4.對圖片進行隨機角度的旋轉(zhuǎn)
5.對圖片進行亮度、對比度和顏色的隨機變化

這些方法 pytorch 都已經(jīng)為我們內(nèi)置在了 torchvision 里面，我們在安裝 pytorch 的時候也安裝了 torchvision，下面我們來依次展示一下這些數(shù)據(jù)增強方法。

import sys
sys.path.append('..')

from PIL import Image
from torchvision import transforms as tfs

# 讀入一張圖片
im = Image.open('./cat.png')
im

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

隨機比例放縮

隨機比例縮放主要使用的是 torchvision.transforms.Resize() 這個函數(shù)，第一個參數(shù)可以是一個整數(shù)，那么圖片會保存現(xiàn)在的寬和高的比例，并將更短的邊縮放到這個整數(shù)的大小，第一個參數(shù)也可以是一個 tuple，那么圖片會直接把寬和高縮放到這個大??；第二個參數(shù)表示放縮圖片使用的方法，比如最鄰近法，或者雙線性差值等，一般雙線性差值能夠保留圖片更多的信息，所以 pytorch 默認使用的是雙線性差值，你可以手動去改這個參數(shù)，更多的信息可以看看文檔

# 比例縮放
print('before scale, shape: {}'.format(im.size))
new_im = tfs.Resize((100, 200))(im)
print('after scale, shape: {}'.format(new_im.size))
new_im

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

隨機位置截取

隨機位置截取能夠提取出圖片中局部的信息，使得網(wǎng)絡(luò)接受的輸入具有多尺度的特征，所以能夠有較好的效果。在 torchvision 中主要有下面兩種方式，一個是 torchvision.transforms.RandomCrop()，傳入的參數(shù)就是截取出的圖片的長和寬，對圖片在隨機位置進行截?。坏诙€是 torchvision.transforms.CenterCrop()，同樣傳入介曲初的圖片的大小作為參數(shù)，會在圖片的中心進行截取

# 隨機裁剪出 100 x 100 的區(qū)域
random_im1 = tfs.RandomCrop(100)(im)
random_im1

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

# 中心裁剪出 100 x 100 的區(qū)域
center_im = tfs.CenterCrop(100)(im)
center_im

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

隨機的水平和豎直方向翻轉(zhuǎn)

對于上面這一張貓的圖片，如果我們將它翻轉(zhuǎn)一下，它仍然是一張貓，但是圖片就有了更多的多樣性，所以隨機翻轉(zhuǎn)也是一種非常有效的手段。在 torchvision 中，隨機翻轉(zhuǎn)使用的是 torchvision.transforms.RandomHorizontalFlip() 和 torchvision.transforms.RandomVerticalFlip()

# 隨機水平翻轉(zhuǎn)
h_filp = tfs.RandomHorizontalFlip()(im)
h_filp

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

# 隨機豎直翻轉(zhuǎn)
v_flip = tfs.RandomVerticalFlip()(im)
v_flip

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

隨機角度旋轉(zhuǎn)

一些角度的旋轉(zhuǎn)仍然是非常有用的數(shù)據(jù)增強方式，在 torchvision 中，使用 torchvision.transforms.RandomRotation() 來實現(xiàn)，其中第一個參數(shù)就是隨機旋轉(zhuǎn)的角度，比如填入 10，那么每次圖片就會在 -10 ~ 10 度之間隨機旋轉(zhuǎn)

rot_im = tfs.RandomRotation(45)(im)
rot_im

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

亮度、對比度和顏色的變化

除了形狀變化外，顏色變化又是另外一種增強方式，其中可以設(shè)置亮度變化，對比度變化和顏色變化等，在 torchvision 中主要使用 torchvision.transforms.ColorJitter() 來實現(xiàn)的，第一個參數(shù)就是亮度的比例，第二個是對比度，第三個是飽和度，第四個是顏色

# 亮度
bright_im = tfs.ColorJitter(brightness=1)(im) # 隨機從 0 ~ 2 之間亮度變化，1 表示原圖
bright_im

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

# 對比度
contrast_im = tfs.ColorJitter(contrast=1)(im) # 隨機從 0 ~ 2 之間對比度變化，1 表示原圖
contrast_im

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

# 顏色
color_im = tfs.ColorJitter(hue=0.5)(im) # 隨機從 -0.5 ~ 0.5 之間對顏色變化
color_im

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

上面我們講了這么圖片增強的方法，其實這些方法都不是孤立起來用的，可以聯(lián)合起來用，比如先做隨機翻轉(zhuǎn)，然后隨機截取，再做對比度增強等等，torchvision 里面有個非常方便的函數(shù)能夠?qū)⑦@些變化合起來，就是 torchvision.transforms.Compose()，下面我們舉個例子

im_aug = tfs.Compose([
  tfs.Resize(120),
  tfs.RandomHorizontalFlip(),
  tfs.RandomCrop(96),
  tfs.ColorJitter(brightness=0.5, contrast=0.5, hue=0.5)
])

import matplotlib.pyplot as plt
%matplotlib inline
nrows = 3
ncols = 3
figsize = (8, 8)
_, figs = plt.subplots(nrows, ncols, figsize=figsize)
for i in range(nrows):
  for j in range(ncols):
    figs[i][j].imshow(im_aug(im))
    figs[i][j].axes.get_xaxis().set_visible(False)
    figs[i][j].axes.get_yaxis().set_visible(False)
plt.show()

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

可以看到每次做完增強之后的圖片都有一些變化，所以這就是我們前面講的，增加了一些'新'數(shù)據(jù)
下面我們使用圖像增強進行訓(xùn)練網(wǎng)絡(luò)，看看具體的提升究竟在什么地方，使用 ResNet 進行訓(xùn)練

使用數(shù)據(jù)增強

import numpy as np
import torch
from torch import nn
import torch.nn.functional as F
from torch.autograd import Variable
from torchvision.datasets import CIFAR10
from utils import train, resnet
from torchvision import transforms as tfs
# 使用數(shù)據(jù)增強
def train_tf(x):
  im_aug = tfs.Compose([
    tfs.Resize(120),
    tfs.RandomHorizontalFlip(),
    tfs.RandomCrop(96),
    tfs.ColorJitter(brightness=0.5, contrast=0.5, hue=0.5),
    tfs.ToTensor(),
    tfs.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
  ])
  x = im_aug(x)
  return x

def test_tf(x):
  im_aug = tfs.Compose([
    tfs.Resize(96),
    tfs.ToTensor(),
    tfs.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
  ])
  x = im_aug(x)
  return x

train_set = CIFAR10('./data', train=True, transform=train_tf)
train_data = torch.utils.data.DataLoader(train_set, batch_size=64, shuffle=True)
test_set = CIFAR10('./data', train=False, transform=test_tf)
test_data = torch.utils.data.DataLoader(test_set, batch_size=128, shuffle=False)

net = resnet(3, 10)
optimizer = torch.optim.SGD(net.parameters(), lr=0.01)
criterion = nn.CrossEntropyLoss()
train(net, train_data, test_data, 10, optimizer, criterion)

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

不使用數(shù)據(jù)增強

# 不使用數(shù)據(jù)增強
def data_tf(x):
  im_aug = tfs.Compose([
    tfs.Resize(96),
    tfs.ToTensor(),
    tfs.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
  ])
  x = im_aug(x)
  return x

train_set = CIFAR10('./data', train=True, transform=data_tf)
train_data = torch.utils.data.DataLoader(train_set, batch_size=64, shuffle=True)
test_set = CIFAR10('./data', train=False, transform=data_tf)
test_data = torch.utils.data.DataLoader(test_set, batch_size=128, shuffle=False)

net = resnet(3, 10)
optimizer = torch.optim.SGD(net.parameters(), lr=0.01)
criterion = nn.CrossEntropyLoss()
train(net, train_data, test_data, 10, optimizer, criterion)

深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)

從上面可以看出，對于訓(xùn)練集，不做數(shù)據(jù)增強跑 10 次，準確率已經(jīng)到了 95%，而使用了數(shù)據(jù)增強，跑 10 次準確率只有 75%，說明數(shù)據(jù)增強之后變得更難了。

而對于測試集，使用數(shù)據(jù)增強進行訓(xùn)練的時候，準確率會比不使用更高，因為數(shù)據(jù)增強提高了模型應(yīng)對于更多的不同數(shù)據(jù)集的泛化能力，所以有更好的效果。

以上就是深度學(xué)習(xí)入門之Pytorch 數(shù)據(jù)增強的實現(xiàn)的詳細內(nèi)容，更多關(guān)于Pytorch 數(shù)據(jù)增強的資料請關(guān)注億速云其它相關(guān)文章！

向AI問一下細節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
vue + vuex todolist的實現(xiàn)示例代碼
下一篇新聞：
Java多邊形重心計算

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

<strong id="ekakw"></strong>

<table id="ekakw"><th id="ekakw"></th></table>

<tbody id="ekakw"></tbody>