溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

tensorflow如何對(duì)圖像進(jìn)行拼接

發(fā)布時(shí)間:2021-07-26 14:07:44 來源:億速云 閱讀:126 作者:小新 欄目:開發(fā)技術(shù)

小編給大家分享一下tensorflow如何對(duì)圖像進(jìn)行拼接,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

tensorflow對(duì)圖像進(jìn)行多個(gè)塊的行列拼接tf.concat(), tf.stack()

在深度學(xué)習(xí)過程中,通過卷積得到的圖像塊大小是8×8×1024的圖像塊,對(duì)得到的圖像塊進(jìn)行reshape得到[8×8]×[32×32],其中[8×8]是圖像塊的個(gè)數(shù),[32×32]是小圖像的大小。通過tf.concat對(duì)小塊的圖像進(jìn)行拼接。

-在做圖像卷積的過程中,做了這樣一個(gè)比較麻煩的拼接,現(xiàn)在還沒想到更好的拼接方法,因?yàn)槭菈K拼接,開始的時(shí)候使用了reshape,但是得到的結(jié)果不對(duì),需要確定清楚數(shù)據(jù)的維度,對(duì)于數(shù)據(jù)的維度很是問題。

import tensorflow as tf
def tensor_concat(f, axis):
 x1 = f[0, :, :]
 for i in range(1, 8):
  x1 = tf.concat([x1, f[i, :, :]], axis=axis)
 return x1

def block_to_image(f): 
 x1 = tf.reshape(f, [64, 1024])
 x1 = tf.reshape(x1, [64, 32, 32])
 m2 = tensor_concat(x1[0:8, :, :], axis=1)
 for i in range(1, 8):
  m1 = tensor_concat(x1[i*8:(i+1)*8, :, :], axis=1)
  m2 = tf.concat([m2, m1], axis=0)
 x2 = tf.reshape(m2, [256, 256, 1])
 return x2

x = tf.random_normal([ 8, 8, 1024])
with tf.Session() as sess:
 m = sess.run(x)
 m1 = sess.run(block_to_image(m))

最后通過行拼接和列拼接得到圖像大小為256×256×1大小的圖像。

對(duì)[batch_size, height, weight, channel] 的圖像進(jìn)行1一樣的圖像塊拼接:

在深度神經(jīng)網(wǎng)絡(luò)中,會(huì)有batch_size個(gè)圖像大小[256×256×1]的圖像進(jìn)行塊的拼接,對(duì)于多了一個(gè)維度的圖像拼接起來,由[batch_size, 8, 8, 1024]拼接為[batch_size,256, 256, 1]。在做著部分時(shí)batch_size這部分實(shí)在是不知道怎么處理,所以還是用了本辦法,使用的函數(shù)是append和tf.stack()

def tensor_concat(f, axis):
 x1 = f[0, :, :]
 for i in range(1, 8):
  x1 = tf.concat([x1, f[i, :, :]], axis=axis)
 return x1

def block_to_image(f):
 x3 =[]
 for k in range(f.shape[0]):
  x = f[k, :, :, :]
  x1 = tf.reshape(x, [64, 1024])
  x1 = tf.reshape(x1, [64, 32, 32])
  m2 = tensor_concat(x1[0:8, :, :], axis=1)
  for i in range(1, 8):
   m1 = tensor_concat(x1[i*8:(i+1)*8, :, :], axis=1)
   m2 = tf.concat([m2, m1], axis=0)
  x2 = tf.reshape(m2, [256, 256, 1])
  x3.append(x2)
  x4 = tf.stack(x3)
 return x4 
x = tf.random_normal([10, 8, 8, 1024])
with tf.Session() as sess:
 m = sess.run(x)
 m1 = sess.run(block_to_image1(m))

在學(xué)習(xí)過程中對(duì)tensor不能直接賦值,比如不能寫:

x2 = tf.reshape(m2, [256, 256, 1]) 

x3[k, :, :, 1] = x2

這樣的代碼,會(huì)出現(xiàn)錯(cuò)誤:'Tensor' object does not support item assignment

對(duì)于帶有類似索引的賦值,參考的辦法是:

x3 = [] 

x3.append(x2)

這時(shí)候得到的是list的格式,所以接下來將list轉(zhuǎn)化為array,使用的是tf.stack(x3)

以上是“tensorflow如何對(duì)圖像進(jìn)行拼接”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI