您好,登錄后才能下訂單哦!
最近做一個(gè)車(chē)牌識(shí)別項(xiàng)目,入門(mén)級(jí)別的,十分簡(jiǎn)單。
車(chē)牌識(shí)別總體分成兩個(gè)大的步驟:
一、車(chē)牌定位:從照片中圈出車(chē)牌
二、車(chē)牌字符識(shí)別
這里只說(shuō)第二個(gè)步驟,字符識(shí)別包括兩個(gè)步驟:
1、圖像處理
原本的圖像每個(gè)像素點(diǎn)都是RGB定義的,或者稱為有R/G/B三個(gè)通道。在這種情況下,很難區(qū)分誰(shuí)是背景,誰(shuí)是字符,所以需要對(duì)圖像進(jìn)行一些處理,把每個(gè)RGB定義的像素點(diǎn)都轉(zhuǎn)化成一個(gè)bit位(即0-1代碼),具體方法如下:
①將圖片灰度化
名字拗口,但是意思很好理解,就是把每個(gè)像素的RGB都變成灰色的RGB值,而灰色的RGB值是R=G=B的。具體怎么改變暫且忽略,因?yàn)镺penCV有封裝好的函數(shù)。
②將灰度圖片二值化
我們做第一步的目的就是為了讓每個(gè)像素都可以轉(zhuǎn)變成0或1。再解釋一下,既然每個(gè)像素的RGB值都相等了,那么將這個(gè)值稱為灰度值,假設(shè)一張灰度車(chē)牌圖片中,背景的灰度值集中在180(十進(jìn)制)左右,而字符的灰度值集中在20左右,那么我們規(guī)定一個(gè)中間值100,小于100的像素點(diǎn)就可以全部變成0,大于100的像素點(diǎn)可以全部變成1,這樣就實(shí)現(xiàn)了二值化。
③旋轉(zhuǎn)調(diào)平
這個(gè)就不說(shuō)了。
④去燥
這個(gè)涉及另外一些方法,以后有時(shí)間再補(bǔ)充,入門(mén)項(xiàng)目不作要求。
2、圖像切割和識(shí)別
①圖像切割
切割可以很簡(jiǎn)單,也可以很難,關(guān)鍵是方法的選擇。
在這就用最弱智的方法進(jìn)行切割吧。
圖片現(xiàn)在已經(jīng)成為一個(gè)0-1矩陣了,其中要么0是背景而1是字符,或者1是背景而0是字符,那就簡(jiǎn)單粗暴地用每一列的0-1數(shù)來(lái)切割。
我先在這里假設(shè)圖片幾乎水平,而且?guī)缀鯖](méi)有噪點(diǎn),具體方法如下:
a.將每一列的1值和0值分別統(tǒng)計(jì)起來(lái)。
b.根據(jù)每一列的0-1總和變換來(lái)切割字符
②圖像識(shí)別
將每一個(gè)字符的圖片分割出來(lái)后,就可以根據(jù)模板來(lái)判斷是哪個(gè)字符了。
簡(jiǎn)單的方法有兩種:
a.逐個(gè)像素比對(duì),如果一致則count加一,最后根據(jù)count值確定匹配結(jié)果。
b.投影匹配:將每行、每列的像素位統(tǒng)計(jì)起來(lái),根據(jù)差值大小來(lái)確定匹配結(jié)果。
兩種方法結(jié)合效果很好。
具體的識(shí)別之后再補(bǔ)充。
下面是字符分割的代碼。
import cv2 # 1、讀取圖像,并把圖像轉(zhuǎn)換為灰度圖像并顯示 img = cv2.imread("chepai/6.png") # 讀取圖片 img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 轉(zhuǎn)換了灰度化 cv2.imshow('gray', img_gray) # 顯示圖片 cv2.waitKey(0) # 2、將灰度圖像二值化,設(shè)定閾值是100 img_thre = img_gray cv2.threshold(img_gray, 100, 255, cv2.THRESH_BINARY_INV, img_thre) cv2.imshow('threshold', img_thre) cv2.waitKey(0) # 3、保存黑白圖片 cv2.imwrite('thre_res.png', img_thre) # 4、分割字符 white = [] # 記錄每一列的白色像素總和 black = [] # ..........黑色....... height = img_thre.shape[0] width = img_thre.shape[1] white_max = 0 black_max = 0 # 計(jì)算每一列的黑白色像素總和 for i in range(width): s = 0 # 這一列白色總數(shù) t = 0 # 這一列黑色總數(shù) for j in range(height): if img_thre[j][i] == 255: s += 1 if img_thre[j][i] == 0: t += 1 white_max = max(white_max, s) black_max = max(black_max, t) white.append(s) black.append(t) print(s) print(t) arg = False # False表示白底黑字;True表示黑底白字 if black_max > white_max: arg = True # 分割圖像 def find_end(start_): end_ = start_+1 for m in range(start_+1, width-1): if (black[m] if arg else white[m]) > (0.95 * black_max if arg else 0.95 * white_max): # 0.95這個(gè)參數(shù)請(qǐng)多調(diào)整,對(duì)應(yīng)下面的0.05 end_ = m break return end_ n = 1 start = 1 end = 2 while n < width-2: n += 1 if (white[n] if arg else black[n]) > (0.05 * white_max if arg else 0.05 * black_max): # 上面這些判斷用來(lái)辨別是白底黑字還是黑底白字 # 0.05這個(gè)參數(shù)請(qǐng)多調(diào)整,對(duì)應(yīng)上面的0.95 start = n end = find_end(start) n = end if end-start > 5: cj = img_thre[1:height, start:end] cv2.imshow('caijian', cj) cv2.waitKey(0)
源程序中沒(méi)有將圖片輸出,而只是顯示出來(lái),下面是執(zhí)行結(jié)果
原圖片:
灰度圖片:
二值圖片:(白底黑字)
分割后:
總體分割效果還是補(bǔ)充。但是遇到干擾較多的圖片,比如左右邊框太大、噪點(diǎn)太多,這樣就不能分割出來(lái),各位可以試一下不同的照片。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。