溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

PyTorch中的padding(邊緣填充)操作方式

發(fā)布時(shí)間:2020-09-11 02:17:22 來(lái)源:腳本之家 閱讀:453 作者:hyk_1996 欄目:開(kāi)發(fā)技術(shù)

簡(jiǎn)介

我們知道,在對(duì)圖像執(zhí)行卷積操作時(shí),如果不對(duì)圖像邊緣進(jìn)行填充,卷積核將無(wú)法到達(dá)圖像邊緣的像素,而且卷積前后圖像的尺寸也會(huì)發(fā)生變化,這會(huì)造成許多麻煩。

因此現(xiàn)在各大深度學(xué)習(xí)框架的卷積層實(shí)現(xiàn)上基本都配備了padding操作,以保證圖像輸入輸出前后的尺寸大小不變。例如,若卷積核大小為3x3,那么就應(yīng)該設(shè)定padding=1,即填充1層邊緣像素;若卷積核大小為7x7,那么就應(yīng)該設(shè)定padding=3,填充3層邊緣像素;也就是padding大小一般設(shè)定為核大小的一半。在pytorch的卷積層定義中,默認(rèn)的padding為零填充。

self.conv = nn.Conv2d(in_channels=3, out_channels=3, kernel_size=7, padding=3)

padding的種類及其pytorch定義

padding,即邊緣填充,可以分為四類:零填充,常數(shù)填充,鏡像填充,重復(fù)填充。

1.零填充

對(duì)圖像或者張量的邊緣進(jìn)行補(bǔ)零填充操作:

class ZeroPad2d(ConstantPad2d):
 # Pads the input tensor boundaries with zero.
 def __init__(self, padding):
  super(ZeroPad2d, self).__init__(padding, 0)

2.常數(shù)填充

定義一個(gè)常數(shù)來(lái)對(duì)圖像或者張量的邊緣進(jìn)行填充,若該常數(shù)等于0則等價(jià)于零填充。

class ConstantPad2d(_ConstantPadNd):
 # Pads the input tensor boundaries with a constant value.
 def __init__(self, padding, value):
  super(ConstantPad2d, self).__init__(value)
  self.padding = _quadruple(padding)

3.鏡像填充

對(duì)圖像或者張量的邊緣進(jìn)行鏡像對(duì)稱的填充,示例如下:

>>> m = nn.ReflectionPad2d(2)
>>> input = torch.arange(9).reshape(1, 1, 3, 3)
>>> input
 
(0 ,0 ,.,.) =
 0 1 2
 3 4 5
 6 7 8
[torch.FloatTensor of size (1,1,3,3)]
 
>>> m(input)
 
(0 ,0 ,.,.) =
 8 7 6 7 8 7 6
 5 4 3 4 5 4 3
 2 1 0 1 2 1 0
 5 4 3 4 5 4 3
 8 7 6 7 8 7 6
 5 4 3 4 5 4 3
 2 1 0 1 2 1 0
class ReflectionPad2d(_ReflectionPadNd):
 # Pads the input tensor using the reflection of the input boundary.
 
 def __init__(self, padding):
  super(ReflectionPad2d, self).__init__()
  self.padding = _quadruple(padding)

4.重復(fù)填充

對(duì)圖像或者張量的邊緣進(jìn)行重復(fù)填充,就是說(shuō)直接用邊緣的像素值來(lái)填充。示例如下:

>>> m = nn.ReplicationPad2d(2)
>>> input = torch.arange(9).reshape(1, 1, 3, 3)
>>> input
 
(0 ,0 ,.,.) =
 0 1 2
 3 4 5
 6 7 8
[torch.FloatTensor of size (1,1,3,3)]
 
>>> m(input)
 
(0 ,0 ,.,.) =
 0 0 0 1 2 2 2
 0 0 0 1 2 2 2
 0 0 0 1 2 2 2
 3 3 3 4 5 5 5
 6 6 6 7 8 8 8
 6 6 6 7 8 8 8
 6 6 6 7 8 8 8
[torch.FloatTensor of size (1,1,7,7)]
class ReplicationPad2d(_ReplicationPadNd):
 # Pads the input tensor using replication of the input boundary.
 
 def __init__(self, padding):
  super(ReplicationPad2d, self).__init__()
  self.padding = _quadruple(padding)

實(shí)際應(yīng)用

在許多計(jì)算機(jī)視覺(jué)任務(wù)中,例如圖像分類,zero padding已經(jīng)能夠滿足要求。但是不結(jié)合實(shí)際地亂用也是不行的。比方說(shuō),在圖像增強(qiáng)/圖像生成領(lǐng)域,zero padding可能會(huì)導(dǎo)致邊緣出現(xiàn)偽影,如下所示:

PyTorch中的padding(邊緣填充)操作方式

這時(shí)候,可以改用鏡像填充來(lái)代替零填充操作。我們定義一個(gè)新的padding層,然后把卷積層里的padding參數(shù)置為0.

具體寫(xiě)法如下:

class DEMO(nn.Module):
 
 def __init__(self):
  super(DEMO, self).__init__()
  self.pad = nn.ReflectionPad2d(1)
  self.conv = nn.Conv2d(in_channels=3, out_channels=3, kernel_size=3, padding=0)
 
 def forward(self, x):
  x = self.pad(x)
  x = self.conv(x)
  return F.relu(x)

以低光照增強(qiáng)任務(wù)為例,最終對(duì)比效果如下圖。零填充會(huì)產(chǎn)生邊緣偽影,而鏡像填充很好地緩解了這一效應(yīng)。

PyTorch中的padding(邊緣填充)操作方式

以上這篇PyTorch中的padding(邊緣填充)操作方式就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持億速云。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI