Python基于Tensor FLow進(jìn)行圖像處理操作的示例分析

發(fā)布時(shí)間：2021-04-25 12:01:13 來源：億速云閱讀：358 作者：小新欄目：開發(fā)技術(shù)

小編給大家分享一下Python基于Tensor FLow進(jìn)行圖像處理操作的示例分析，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

Python主要用來做什么

Python主要應(yīng)用于：1、Web開發(fā)；2、數(shù)據(jù)科學(xué)研究；3、網(wǎng)絡(luò)爬蟲；4、嵌入式應(yīng)用開發(fā)；5、游戲開發(fā)；6、桌面應(yīng)用開發(fā)。

具體如下：

在對(duì)圖像進(jìn)行深度學(xué)習(xí)時(shí)，有時(shí)可能圖片的數(shù)量不足，或者希望網(wǎng)絡(luò)進(jìn)行更多的學(xué)習(xí)，這時(shí)可以對(duì)現(xiàn)有的圖片數(shù)據(jù)進(jìn)行處理使其變成一張新的圖片，在此基礎(chǔ)上進(jìn)行學(xué)習(xí)，從而提高網(wǎng)絡(luò)識(shí)別的準(zhǔn)確率。

1、圖像解碼顯示

利用matplot庫可以方便簡潔地在jupyter內(nèi)對(duì)圖片進(jìn)行繪制與輸出，首先通過tf.gfile打開圖片文件，并利用函數(shù)tf.image.decode_jpeg將jpeg圖片解碼為三位矩陣，之后便可以通過matplot繪制與顯示圖片信息了

import matplotlib.pyplot as plt
import tensorflow as tf
import numpy as np
 
#讀取圖像文件
image_raw=tf.gfile.GFile('D:\Temp\MachineLearning\data\cat.jpeg','rb').read()
 
with tf.Session() as sess:
  #對(duì)jpeg圖像解碼得到圖像的三位矩陣數(shù)據(jù)
  image_data=tf.image.decode_jpeg(image_raw)
  print(image_data.eval())
  plt.imshow(image_data.eval())
  plt.show()

可以看到打印的圖片三維矩陣信息和顯示的圖片：

Python基于Tensor FLow進(jìn)行圖像處理操作的示例分析

2、圖像縮放

tensorflow還自帶了許多圖像處理函數(shù)，比如resize_image對(duì)圖片進(jìn)行大小的縮放。其中第一個(gè)參數(shù)代表圖片數(shù)據(jù)源，第二個(gè)數(shù)組代表縮放后的大小，第三個(gè)method代表采用的縮放方法，默認(rèn)0是雙線性插值法，1代表最近鄰插值法，2代表雙立方插值法，3代表像素區(qū)域插值法。

  #對(duì)圖片大小進(jìn)行縮放
  image_resize=tf.image.resize_images(image_data,[500,500],method=0)
  #tensorflow處理后的圖片是float32格式的，需要轉(zhuǎn)化為uint8才能正確輸出
  image_resize=np.asarray(image_resize.eval(),dtype='uint8')
  plt.imshow(image_resize)
  plt.show()

3、圖像裁切

函數(shù)tf.image.resize_image_with_crop_or_pad可以在保證圖片原始比例的條件下對(duì)圖片進(jìn)行裁切或填充。

函數(shù)tf.image.random_crop是隨機(jī)對(duì)圖片進(jìn)行選取裁剪，而不是以中心。

  #圖片裁剪
  image_crop=tf.image.resize_image_with_crop_or_pad(image_data,500,500)
  plt.imshow(image_crop.eval())
  plt.show()
  #隨機(jī)裁剪
  img_random=tf.image.random_crop(image_data,[300,300,3])
  plt.imshow(img_random.eval())
  plt.show()

Python基于Tensor FLow進(jìn)行圖像處理操作的示例分析

resize_image_with_crop_or_pad第一個(gè)參數(shù)是圖片資源，后兩個(gè)參數(shù)是裁切后的圖片大小，當(dāng)原始圖片大于目標(biāo)值時(shí)將裁去兩邊多余部分，當(dāng)圖片小于目標(biāo)值時(shí)將用黑色填充，例如上圖左右被裁剪，上下用黑色填充。

random_crop第一個(gè)參數(shù)是圖片資源，第二個(gè)參數(shù)是一個(gè)三位張量，代表目標(biāo)圖像大小。

4、圖像翻轉(zhuǎn)

通過函數(shù)實(shí)現(xiàn)圖片的上下、左右翻轉(zhuǎn)，在模型訓(xùn)練時(shí)，可以將原本的樣本圖片進(jìn)行反轉(zhuǎn)，作為新的特征值進(jìn)行輸入供模型訓(xùn)練。

  #上下翻轉(zhuǎn)
  img_down=tf.image.flip_up_down(image_data)
  plt.imshow(img_down.eval())
  plt.show()
  
  #左右翻轉(zhuǎn)
  img_left=tf.image.flip_left_right(image_data)
  plt.imshow(img_left.eval())
  plt.show()

5、調(diào)整對(duì)比度、明度、飽和度

通過tf.image.adjust_contrast可以對(duì)圖像對(duì)比度進(jìn)行調(diào)整，當(dāng)參數(shù)大于1代表加深，小于1代表減淡

tf.image.random_contrast可以在指定范圍內(nèi)隨即調(diào)整對(duì)比度

類似的還有adjust_brightness、adjust_saturation、adjust_hue對(duì)明度、飽和度、色相進(jìn)行調(diào)整

  #加深對(duì)比度
  img_deep=tf.image.adjust_contrast(image_data,2)
  plt.imshow(img_deep.eval())
  plt.show()
  #降低對(duì)比度
  img_fade=tf.image.adjust_contrast(image_data,0.5)
  plt.imshow(img_fade.eval())
  plt.show()
  #隨機(jī)對(duì)比度
  img_contrast=tf.image.random_contrast(image_data,0.5,2)
  plt.imshow(img_contrast.eval())
  plt.show()

6、對(duì)VGG網(wǎng)絡(luò)的輸入圖片進(jìn)行處理

Vgg網(wǎng)絡(luò)訓(xùn)練中傳入的圖片參數(shù)x_img是以batch_size為單位的四維數(shù)據(jù)，例如傳入20張32×32的3通道圖片，其數(shù)據(jù)為[20,32,32,3]。但是tensorflow的圖片處理函數(shù)只可以處理三維的單張圖片。因此需要首先通過split()函數(shù)將20張圖片拆分成單張[1,32,32,3]，再通過reshape()函數(shù)轉(zhuǎn)化為三維數(shù)據(jù)[32,32,3]，之后再調(diào)用圖片處理函數(shù)對(duì)圖片進(jìn)行處理，將處理后的圖片恢復(fù)成四維，然后放在數(shù)組res_arr中，拼接成原來的一組20×32×32×3的數(shù)據(jù)。

# 將一批batch_size張圖片在第一維上切分為單張圖片
img_arr=tf.split(x_img,batch_size,axis=0)
res_arr=[]
# 遍歷每個(gè)圖片對(duì)其進(jìn)行處理
for img in img_arr:
  # 將單張四維的圖片[1,32,32,3]處理成三維[32,32,3]
  img=tf.reshape(img,[32,32,3])
  # 對(duì)單張圖片進(jìn)行圖像增強(qiáng)
  img_flip=tf.image.random_flip_left_right(img)   # 翻轉(zhuǎn)圖片
  img_bright=tf.image.random_brightness(img_flip,max_delta=63)  # 隨機(jī)調(diào)整亮度
  img_contrast=tf.image.random_contrast(img_bright,lower=0.2, upper=1.8) # 調(diào)整對(duì)比度
  # 將增強(qiáng)后的圖片再變回原來的四維格式
  img=tf.reshape(img_contrast,[1,32,32,3])
  # 將每個(gè)處理后的圖片放在一個(gè)數(shù)組
  res_arr.append(img)
# 將處理后的單個(gè)圖片重新拼接在一起  
img_aug=tf.concat(res_arr,axis=0)

以上是“Python基于Tensor FLow進(jìn)行圖像處理操作的示例分析”這篇文章的所有內(nèi)容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內(nèi)容對(duì)大家有所幫助，如果還想學(xué)習(xí)更多知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問一下細(xì)節(jié)

Python基于Tensor FLow進(jìn)行圖像處理操作的示例分析

Python主要用來做什么

1、圖像解碼顯示

2、圖像縮放

3、圖像裁切

4、圖像翻轉(zhuǎn)

5、調(diào)整對(duì)比度、明度、飽和度

6、對(duì)VGG網(wǎng)絡(luò)的輸入圖片進(jìn)行處理

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽

4、圖像翻轉(zhuǎn)

5、調(diào)整對(duì)比度、明度、飽和度

6、對(duì)VGG網(wǎng)絡(luò)的輸入圖片進(jìn)行處理