您好,登錄后才能下訂單哦!
小編給大家分享一下tensorflow如何對(duì)圖像進(jìn)行拼接,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
tensorflow對(duì)圖像進(jìn)行多個(gè)塊的行列拼接tf.concat(), tf.stack()
在深度學(xué)習(xí)過程中,通過卷積得到的圖像塊大小是8×8×1024的圖像塊,對(duì)得到的圖像塊進(jìn)行reshape得到[8×8]×[32×32],其中[8×8]是圖像塊的個(gè)數(shù),[32×32]是小圖像的大小。通過tf.concat對(duì)小塊的圖像進(jìn)行拼接。
-在做圖像卷積的過程中,做了這樣一個(gè)比較麻煩的拼接,現(xiàn)在還沒想到更好的拼接方法,因?yàn)槭菈K拼接,開始的時(shí)候使用了reshape,但是得到的結(jié)果不對(duì),需要確定清楚數(shù)據(jù)的維度,對(duì)于數(shù)據(jù)的維度很是問題。
import tensorflow as tf def tensor_concat(f, axis): x1 = f[0, :, :] for i in range(1, 8): x1 = tf.concat([x1, f[i, :, :]], axis=axis) return x1 def block_to_image(f): x1 = tf.reshape(f, [64, 1024]) x1 = tf.reshape(x1, [64, 32, 32]) m2 = tensor_concat(x1[0:8, :, :], axis=1) for i in range(1, 8): m1 = tensor_concat(x1[i*8:(i+1)*8, :, :], axis=1) m2 = tf.concat([m2, m1], axis=0) x2 = tf.reshape(m2, [256, 256, 1]) return x2 x = tf.random_normal([ 8, 8, 1024]) with tf.Session() as sess: m = sess.run(x) m1 = sess.run(block_to_image(m))
最后通過行拼接和列拼接得到圖像大小為256×256×1大小的圖像。
對(duì)[batch_size, height, weight, channel] 的圖像進(jìn)行1一樣的圖像塊拼接:
在深度神經(jīng)網(wǎng)絡(luò)中,會(huì)有batch_size個(gè)圖像大小[256×256×1]的圖像進(jìn)行塊的拼接,對(duì)于多了一個(gè)維度的圖像拼接起來,由[batch_size, 8, 8, 1024]拼接為[batch_size,256, 256, 1]。在做著部分時(shí)batch_size這部分實(shí)在是不知道怎么處理,所以還是用了本辦法,使用的函數(shù)是append和tf.stack()
def tensor_concat(f, axis): x1 = f[0, :, :] for i in range(1, 8): x1 = tf.concat([x1, f[i, :, :]], axis=axis) return x1 def block_to_image(f): x3 =[] for k in range(f.shape[0]): x = f[k, :, :, :] x1 = tf.reshape(x, [64, 1024]) x1 = tf.reshape(x1, [64, 32, 32]) m2 = tensor_concat(x1[0:8, :, :], axis=1) for i in range(1, 8): m1 = tensor_concat(x1[i*8:(i+1)*8, :, :], axis=1) m2 = tf.concat([m2, m1], axis=0) x2 = tf.reshape(m2, [256, 256, 1]) x3.append(x2) x4 = tf.stack(x3) return x4 x = tf.random_normal([10, 8, 8, 1024]) with tf.Session() as sess: m = sess.run(x) m1 = sess.run(block_to_image1(m))
在學(xué)習(xí)過程中對(duì)tensor不能直接賦值,比如不能寫:
x2 = tf.reshape(m2, [256, 256, 1]) x3[k, :, :, 1] = x2
這樣的代碼,會(huì)出現(xiàn)錯(cuò)誤:'Tensor' object does not support item assignment
對(duì)于帶有類似索引的賦值,參考的辦法是:
x3 = [] x3.append(x2)
這時(shí)候得到的是list的格式,所以接下來將list轉(zhuǎn)化為array,使用的是tf.stack(x3)
以上是“tensorflow如何對(duì)圖像進(jìn)行拼接”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。