溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

使用python與caffe怎么改變通道順序

發(fā)布時(shí)間:2021-05-19 17:33:21 來源:億速云 閱讀:392 作者:Leah 欄目:開發(fā)技術(shù)

使用python與caffe怎么改變通道順序?相信很多沒有經(jīng)驗(yàn)的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。

把通道放在前面:

image = cv2.imread(path + file)

image = cv2.resize(image, (48, 48), interpolation=cv2.INTER_CUBIC) aaaa= np.transpose(image,(2, 0, 1)) print(aaaa)

圖像原來shape:(48, 48, 3),改之后shape:(3,48,48)

注意:reshape不能解決通道轉(zhuǎn)換問題

pycaffe做識別時(shí)通道轉(zhuǎn)換問題:

要注意一點(diǎn)的就是:Caffe中彩色圖像的通道是BGR格式,圖像存儲是【0,255】

1.caffe.io.load_image方式 view plai cop

image = caffe.io.load_image(image_file) #加載圖片

使用caffe.io.load_image()讀進(jìn)來的是RGB格式和0~1(float)

所以在進(jìn)行識別之前要在transformer中設(shè)置transformer.set_raw_scale('data',255)(縮放至0~255)

以及transformer.set_channel_swap('data',(2,1,0)(將RGB變換到BGR)

# python中將圖片存儲為[0, 1],而caffe中將圖片存儲為[0, 255],所以需要一個(gè)轉(zhuǎn)換 
transformer.set_raw_scale('data', 255)  # 縮放到[0,255]之間 
transformer.set_channel_swap('data', (2,1,0)) #交換通道,將圖片由RGB變?yōu)锽GR(caffe中圖片是BGR格式,而原始格式是RGB,所以要轉(zhuǎn)化)

2.使用cv2.imread()來讀取圖片

cv2.imread()接口讀圖像,讀進(jìn)來直接是BGR 格式and 0~255

所以不需要再縮放到【0,255】和通道變換【2,1,0】,不需要transformer.set_raw_scale('data',255)和transformer.set_channel_swap('data',(2,1,0))

3.使用PIL來讀取圖片

對于彩色圖像,不管其圖像格式是PNG,還是BMP,或者JPG,在PIL中,使用Image模塊的open()函數(shù)打開后,返回的圖像對象的模式都是“RGB”。而對于灰度圖像,不管其圖像格式是PNG,還是BMP,或者JPG,打開后,其模式為“L”。所以需要轉(zhuǎn)換格式,但不需要縮放到[0,255]

data = np.array(Image.open(self.dataRoot+img_list)) 
data = np.transpose(data,(2,0,1))#轉(zhuǎn)換通道 
data[[0,2],...] = data[[2,0],...] #RGB→BGR

4.對于matlab來說

Caffe中的blobs格式是N*C*H*W,分別是數(shù)量Number,通道數(shù)Channel,以及寬度Height和寬度Width

而matlab中是先寬后高,即[w,h],圖像的通道是RGB

所以需要進(jìn)行相應(yīng)的轉(zhuǎn)換:

im_data = im (:,:,[3,2,1]) ; %RGB to BGR

im_data = permute(im_data, [2,1,3]); %旋轉(zhuǎn)高度和寬度

最后,分享一個(gè)Caffe的典型python識別代碼:

# -*- coding: utf-8 -*- 
""" 
Created on Sun May 28 16:00:47 2017 
@author: fancp,#windows下CPU模式 
""" 
import numpy as np 
import caffe 
import sys 
caffe_root = 'F:/Caffe' #########你自己的Caffe路徑 
sys.path.insert(0, caffe_root + '/python') 
 
size = 227 #訓(xùn)練的圖片尺寸 
image_file = 'F:/.../.../nihao.jpg'#圖片路徑 
model_def = 'F:/.../.../deploy.prototxt'#deploy模型文件位置 
model_weights = 'F:/.../.../_iter_20000.caffemodel'#訓(xùn)練完的模型位置 
net = caffe.Net(model_def, model_weights, caffe.TEST)  
 
# 加載均值文件 
mu = np.load(caffe_root + '/python/caffe/imagenet/ilsvrc_2012_mean.npy') ###caffe 自帶的文件 
mu = mu.mean(1).mean(1) # average over pixels to obtain the mean (BGR) pixel values 
###########################下面這5句等同與上面兩句,選擇其一################# 
#blob = caffe.proto.caffe_pb2.BlobProto() 
#mean_data = open( 'mean.binaryproto' , 'rb' ).read() 
#blob.ParseFromString(mean_data) 
#mu = np.array(caffe.io.blobproto_to_array(blob)) 
#mu = mu.mean(1).mean(1).mean(1) 
############################################################################## 
#圖片預(yù)處理 
transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape}) ##設(shè)定圖片的shape格式(1,3,227,227),大小由deploy 文件指定 
# python讀取的圖片文件格式為H×W×K,需轉(zhuǎn)化為K×H×W 
transformer.set_transpose('data', (2,0,1)) #改變維度的順序,由原始圖片(227,227,3)變?yōu)?3,227,227) 
transformer.set_mean('data', mu)   # 每個(gè)通道減去均值 
 
# python中將圖片存儲為[0, 1],而caffe中將圖片存儲為[0, 255],所以需要一個(gè)轉(zhuǎn)換 
transformer.set_raw_scale('data', 255)  # 縮放到【0,255】之間 
transformer.set_channel_swap('data', (2,1,0)) #交換通道,將圖片由RGB變?yōu)锽GR(caffe中圖片是BGR格式,而原始格式是RGB,所以要轉(zhuǎn)化) 
net.blobs['data'].reshape(1,3,size, size) # 將輸入圖片格式轉(zhuǎn)化為合適格式(與deploy文件相同) 
#上面這句,第一參數(shù):圖片數(shù)量 第二個(gè)參數(shù) :通道數(shù) 第三個(gè)參數(shù):圖片高度 第四個(gè)參數(shù):圖片寬度 
 
image = caffe.io.load_image(image_file) #加載圖片 
# 用上面的transformer.preprocess來處理剛剛加載圖片 
net.blobs['data'].data[...] = transformer.preprocess('data', image)  
 
### perform classification 
caffe.set_mode_cpu() 
output = net.forward() 
#print output 
output_prob = output['prob'][0].argmax() # 給出概率最高的是第幾類,需要自己對應(yīng)到我們約定的類別去

Python的優(yōu)點(diǎn)有哪些

1、簡單易用,與C/C++、Java、C# 等傳統(tǒng)語言相比,Python對代碼格式的要求沒有那么嚴(yán)格;2、Python屬于開源的,所有人都可以看到源代碼,并且可以被移植在許多平臺上使用;3、Python面向?qū)ο?,能夠支持面向過程編程,也支持面向?qū)ο缶幊蹋?、Python是一種解釋性語言,Python寫的程序不需要編譯成二進(jìn)制代碼,可以直接從源代碼運(yùn)行程序;5、Python功能強(qiáng)大,擁有的模塊眾多,基本能夠?qū)崿F(xiàn)所有的常見功能。

看完上述內(nèi)容,你們掌握使用python與caffe怎么改變通道順序的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI