溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python?OpenCV圖像識(shí)別的示例分析

發(fā)布時(shí)間:2022-03-04 10:17:37 來源:億速云 閱讀:387 作者:小新 欄目:開發(fā)技術(shù)

小編給大家分享一下Python OpenCV圖像識(shí)別的示例分析,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

一、人臉識(shí)別

主要有以下兩種實(shí)現(xiàn)方法:

1、哈爾(Haar)級(jí)聯(lián)法:專門解決人臉識(shí)別而推出的傳統(tǒng)算法;

實(shí)現(xiàn)步驟:

創(chuàng)建Haar級(jí)聯(lián)器;

導(dǎo)入圖片并將其灰度化;

調(diào)用函數(shù)接口進(jìn)行人臉識(shí)別;

函數(shù)原型:

detectMultiScale(img,scaleFactor,minNeighbors)

scaleFactor:縮放尺寸;

minNeighbors:最小像素值;

代碼案例:

# 創(chuàng)建Haar級(jí)聯(lián)器
facer = cv2.CascadeClassifier('./haarcascades/haarcascade_frontalface_default.xml')
# 導(dǎo)入人臉圖片并灰度化
img = cv2.imread('p3.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 調(diào)用接口
faces = facer.detectMultiScale(gray, 1.1, 5)

for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)

cv2.imshow('img', img)
cv2.waitKey()

Python?OpenCV圖像識(shí)別的示例分析

結(jié)論:Haar級(jí)聯(lián)法對(duì)于完整臉部的檢測(cè)效果還是不錯(cuò)的,但對(duì)于不完整臉部識(shí)別效果差,這可能也是傳統(tǒng)算法的一個(gè)缺陷所在,泛化能力比較差;

拓展:Haar級(jí)聯(lián)器還可以對(duì)臉部中細(xì)節(jié)特征進(jìn)行識(shí)別

代碼如下:

# 創(chuàng)建Haar級(jí)聯(lián)器
facer = cv2.CascadeClassifier('./haarcascades/haarcascade_frontalface_default.xml')
eyer = cv2.CascadeClassifier('./haarcascades/haarcascade_eye.xml')
# 導(dǎo)入人臉圖片并灰度化
img = cv2.imread('p3.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 調(diào)用接口
faces = facer.detectMultiScale(gray, 1.1, 5)
i = 0
for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
    ROI_img = img[y:y+h, x:x+w]
    eyes = eyer.detectMultiScale(ROI_img, 1.1, 5)
    for (x,y,w,h) in eyes:
        cv2.rectangle(ROI_img, (x,y), (x+w, y+h), (0,255,0), 2)
    i += 1
    name = 'img'+str(i)
    cv2.imshow(name, ROI_img)
cv2.waitKey()

Python?OpenCV圖像識(shí)別的示例分析

總結(jié):Haar級(jí)聯(lián)器提供了多種臉部屬性的識(shí)別,眼睛鼻子嘴巴都可以,但效果不一定那么準(zhǔn)確;

二、車牌識(shí)別

結(jié)構(gòu):Haar+Tesseract車牌識(shí)別;

說明:Haar級(jí)聯(lián)器僅用于定位車牌的位置,Tesseract用于提取其中的內(nèi)容;

實(shí)現(xiàn)步驟:

1、Haar級(jí)聯(lián)器定位車牌位置;

2、車牌預(yù)處理操作(二值化、形態(tài)學(xué)、濾波去噪、縮放);

3、調(diào)用Tesseract進(jìn)行文字識(shí)別;

注意:這里需要預(yù)先安裝Tesseract;

代碼案例:

import pytesseract
# 創(chuàng)建Haar級(jí)聯(lián)器
carer = cv2.CascadeClassifier('./haarcascades/haarcascade_russian_plate_number.xml')
# 導(dǎo)入人臉圖片并灰度化
img = cv2.imread('chinacar.jpeg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 調(diào)用接口 
cars = carer.detectMultiScale(gray, 1.1, 3)
for (x,y,w,h) in cars:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
# 提取ROI
roi = gray[y:y+h, x:x+w]
# 二值化
ret, roi_bin = cv2.threshold(roi, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# 文字識(shí)別
pytesseract.pytesseract.tesseract_cmd = r"D:\Tesseract_OCR\tesseract.exe"
text = pytesseract.image_to_string(roi, lang='chi_sim+eng',config='--psm 8 --oem 3')
print(text)
cv2.putText(img, text, (20,100), cv2.FONT_HERSHEY_SIMPLEX, 2, (0,0,255), 3)
cv2.imshow('img', img)
cv2.waitKey()

Python?OpenCV圖像識(shí)別的示例分析

結(jié)論:車牌的位置檢測(cè)比較準(zhǔn)確,但Tesseract的識(shí)別并不那么準(zhǔn)確,可能用ORC識(shí)別會(huì)準(zhǔn)確一些;當(dāng)然識(shí)別的準(zhǔn)確率也和圖像處理后比較模糊有關(guān),做一些處理能夠提升文字的識(shí)別率;

三、DNN圖像分類

DNN為深度神經(jīng)網(wǎng)絡(luò),并且是全連接的形式;

注意:OpenCV能夠使用DNN模型,但并不能訓(xùn)練;

DNN使用步驟:

讀取模型,得到網(wǎng)絡(luò)結(jié)構(gòu);

讀取數(shù)據(jù)(圖片或視頻)

將圖片轉(zhuǎn)成張量,送入網(wǎng)絡(luò);

模型輸出結(jié)果;

函數(shù)原型:

導(dǎo)入模型:readNet(model,[config])

圖像轉(zhuǎn)張量:blobFromImage(image,scalefactor,size,mean,swapRB,crop)

送入網(wǎng)絡(luò):net.setInput(blob)

模型推理:net.forward()

代碼案例:

# 導(dǎo)入模型
config = "./model/bvlc_googlenet.prototxt"
model = "./model/bvlc_googlenet.caffemodel"
net = dnn.readNetFromCaffe(config, model)

# 加載圖片,轉(zhuǎn)成張量
img = cv2.imread('./smallcat.jpeg')
blob = dnn.blobFromImage(img, 1.0, (224,224), (104,117,123))

# 模型推理
net.setInput(blob)
r = net.forward()
idxs = np.argsort(r[0])[::-1][:5]

# 分類結(jié)果展示
path = './model/synset_words.txt'
with open(path, 'rt') as f:
    classes = [x[x.find(" ")+1:]for x in f]
for (i, idx) in enumerate(idxs):
# 將結(jié)果展示在圖像上
    if i == 0:
        text = "Label: {}, {:.2f}%".format(classes[idx],
            r[0][idx] * 100)
        cv2.putText(img, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX,
            0.7, (0, 0, 255), 2)
# 顯示圖像
cv2.imshow("Image", img)
cv2.waitKey(0)

Python?OpenCV圖像識(shí)別的示例分析

看完了這篇文章,相信你對(duì)“Python OpenCV圖像識(shí)別的示例分析”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI