Python+OpenCV實(shí)現(xiàn)車(chē)牌字符分割和識(shí)別

發(fā)布時(shí)間：2020-09-30 14:47:27 來(lái)源：腳本之家閱讀：296 作者：Jdfohewk 欄目：開(kāi)發(fā)技術(shù)

最近做一個(gè)車(chē)牌識(shí)別項(xiàng)目，入門(mén)級(jí)別的，十分簡(jiǎn)單。

車(chē)牌識(shí)別總體分成兩個(gè)大的步驟：

一、車(chē)牌定位：從照片中圈出車(chē)牌

二、車(chē)牌字符識(shí)別

這里只說(shuō)第二個(gè)步驟，字符識(shí)別包括兩個(gè)步驟：

1、圖像處理

原本的圖像每個(gè)像素點(diǎn)都是RGB定義的，或者稱為有R/G/B三個(gè)通道。在這種情況下，很難區(qū)分誰(shuí)是背景，誰(shuí)是字符，所以需要對(duì)圖像進(jìn)行一些處理，把每個(gè)RGB定義的像素點(diǎn)都轉(zhuǎn)化成一個(gè)bit位（即0-1代碼），具體方法如下：

①將圖片灰度化

名字拗口，但是意思很好理解，就是把每個(gè)像素的RGB都變成灰色的RGB值，而灰色的RGB值是R=G=B的。具體怎么改變暫且忽略，因?yàn)镺penCV有封裝好的函數(shù)。

②將灰度圖片二值化

我們做第一步的目的就是為了讓每個(gè)像素都可以轉(zhuǎn)變成0或1。再解釋一下，既然每個(gè)像素的RGB值都相等了，那么將這個(gè)值稱為灰度值，假設(shè)一張灰度車(chē)牌圖片中，背景的灰度值集中在180（十進(jìn)制）左右，而字符的灰度值集中在20左右，那么我們規(guī)定一個(gè)中間值100，小于100的像素點(diǎn)就可以全部變成0，大于100的像素點(diǎn)可以全部變成1，這樣就實(shí)現(xiàn)了二值化。

③旋轉(zhuǎn)調(diào)平

這個(gè)就不說(shuō)了。

④去燥

這個(gè)涉及另外一些方法，以后有時(shí)間再補(bǔ)充，入門(mén)項(xiàng)目不作要求。

2、圖像切割和識(shí)別

①圖像切割

切割可以很簡(jiǎn)單，也可以很難，關(guān)鍵是方法的選擇。

在這就用最弱智的方法進(jìn)行切割吧。

圖片現(xiàn)在已經(jīng)成為一個(gè)0-1矩陣了，其中要么0是背景而1是字符，或者1是背景而0是字符，那就簡(jiǎn)單粗暴地用每一列的0-1數(shù)來(lái)切割。

我先在這里假設(shè)圖片幾乎水平，而且?guī)缀鯖](méi)有噪點(diǎn)，具體方法如下：

a.將每一列的1值和0值分別統(tǒng)計(jì)起來(lái)。

b.根據(jù)每一列的0-1總和變換來(lái)切割字符

②圖像識(shí)別

將每一個(gè)字符的圖片分割出來(lái)后，就可以根據(jù)模板來(lái)判斷是哪個(gè)字符了。

簡(jiǎn)單的方法有兩種：

a.逐個(gè)像素比對(duì)，如果一致則count加一，最后根據(jù)count值確定匹配結(jié)果。

b.投影匹配：將每行、每列的像素位統(tǒng)計(jì)起來(lái)，根據(jù)差值大小來(lái)確定匹配結(jié)果。

兩種方法結(jié)合效果很好。

具體的識(shí)別之后再補(bǔ)充。

下面是字符分割的代碼。

import cv2 
 
# 1、讀取圖像，并把圖像轉(zhuǎn)換為灰度圖像并顯示 
img = cv2.imread("chepai/6.png") # 讀取圖片 
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 轉(zhuǎn)換了灰度化 
cv2.imshow('gray', img_gray) # 顯示圖片 
cv2.waitKey(0) 
 
# 2、將灰度圖像二值化，設(shè)定閾值是100 
img_thre = img_gray 
cv2.threshold(img_gray, 100, 255, cv2.THRESH_BINARY_INV, img_thre) 
cv2.imshow('threshold', img_thre) 
cv2.waitKey(0) 
 
# 3、保存黑白圖片 
cv2.imwrite('thre_res.png', img_thre) 
 
# 4、分割字符 
white = [] # 記錄每一列的白色像素總和 
black = [] # ..........黑色....... 
height = img_thre.shape[0] 
width = img_thre.shape[1] 
white_max = 0 
black_max = 0 
# 計(jì)算每一列的黑白色像素總和 
for i in range(width): 
 s = 0 # 這一列白色總數(shù) 
 t = 0 # 這一列黑色總數(shù) 
 for j in range(height): 
 if img_thre[j][i] == 255: 
  s += 1 
 if img_thre[j][i] == 0: 
  t += 1 
 white_max = max(white_max, s) 
 black_max = max(black_max, t) 
 white.append(s) 
 black.append(t) 
 print(s) 
 print(t) 
 
arg = False # False表示白底黑字；True表示黑底白字 
if black_max > white_max: 
 arg = True 
 
# 分割圖像 
def find_end(start_): 
 end_ = start_+1 
 for m in range(start_+1, width-1): 
 if (black[m] if arg else white[m]) > (0.95 * black_max if arg else 0.95 * white_max): # 0.95這個(gè)參數(shù)請(qǐng)多調(diào)整，對(duì)應(yīng)下面的0.05 
  end_ = m 
  break 
 return end_ 
 
n = 1 
start = 1 
end = 2 
while n < width-2: 
 n += 1 
 if (white[n] if arg else black[n]) > (0.05 * white_max if arg else 0.05 * black_max): 
 # 上面這些判斷用來(lái)辨別是白底黑字還是黑底白字 
 # 0.05這個(gè)參數(shù)請(qǐng)多調(diào)整，對(duì)應(yīng)上面的0.95 
 start = n 
 end = find_end(start) 
 n = end 
 if end-start > 5: 
  cj = img_thre[1:height, start:end] 
  cv2.imshow('caijian', cj) 
  cv2.waitKey(0)

源程序中沒(méi)有將圖片輸出，而只是顯示出來(lái)，下面是執(zhí)行結(jié)果

原圖片：

Python+OpenCV實(shí)現(xiàn)車(chē)牌字符分割和識(shí)別

灰度圖片：

Python+OpenCV實(shí)現(xiàn)車(chē)牌字符分割和識(shí)別

二值圖片：（白底黑字）

Python+OpenCV實(shí)現(xiàn)車(chē)牌字符分割和識(shí)別

分割后：

Python+OpenCV實(shí)現(xiàn)車(chē)牌字符分割和識(shí)別

總體分割效果還是補(bǔ)充。但是遇到干擾較多的圖片，比如左右邊框太大、噪點(diǎn)太多，這樣就不能分割出來(lái)，各位可以試一下不同的照片。

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持億速云。

向AI問(wèn)一下細(xì)節(jié)

Python+OpenCV實(shí)現(xiàn)車(chē)牌字符分割和識(shí)別

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽