溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

OpenCV如何實(shí)現(xiàn)對象跟蹤

發(fā)布時(shí)間:2021-10-19 09:08:42 來源:億速云 閱讀:143 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要介紹了OpenCV如何實(shí)現(xiàn)對象跟蹤,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

對象跟蹤

對象跟蹤是在視頻中定位移動對象的過程。你可以考慮一個(gè)足球比賽的例子。

你有正在進(jìn)行的比賽的實(shí)時(shí)饋送,你的任務(wù)是隨時(shí)跟蹤球的位置。對于普通人來說,這項(xiàng)任務(wù)似乎很簡單,但即使是最聰明的機(jī)器,它還是太復(fù)雜了。

你可能知道,計(jì)算機(jī)只能理解數(shù)字。它不了解圖像是什么,但了解與圖像相關(guān)聯(lián)的像素值。在人眼看來完全相同的兩個(gè)圖像在計(jì)算機(jī)看來可能并不相同,因?yàn)榧词瓜袼氐奈⑿∽兓矔?dǎo)致圖片之間的差異。因?yàn)閷ο蟾櫛徽J(rèn)為是計(jì)算機(jī)視覺中最復(fù)雜的任務(wù)之一。雖然復(fù)雜,但也不是無法實(shí)現(xiàn)的。

可以使用機(jī)器學(xué)習(xí)以及基于深度學(xué)習(xí)的方法來執(zhí)行對象跟蹤。

一方面,深度學(xué)習(xí)方法在復(fù)雜任務(wù)上提供了更好的結(jié)果,并且非常通用,需要大量的訓(xùn)練數(shù)據(jù)。而基于 ML 的方法非常簡單,但不是通用的。

在本文中,我們將使用基于 ML 的方法以及我們將在本文后面討論的各種計(jì)算機(jī)視覺技術(shù)。

該技術(shù)廣泛應(yīng)用于監(jiān)控、安全、交通監(jiān)控、機(jī)器人視覺、視頻通信等領(lǐng)域。此外,對象跟蹤有幾個(gè)用例,例如人群計(jì)數(shù)、自動駕駛汽車、人臉檢測等。你能想出更多可以在日常生活中使用對象跟蹤的示例嗎?

由于現(xiàn)實(shí)生活中有如此多的應(yīng)用,因此該領(lǐng)域正在進(jìn)行不斷的研究,以實(shí)現(xiàn)更高的準(zhǔn)確性并使模型更加穩(wěn)健。

對于本文,我們將使用此視頻(https://drive.google.com/file/d/1N6NcFpveLQLc_DnFjfuMMvfuCMTAJRFm/view?usp=sharing)。

正如你將看到的,有一個(gè)紅色的球在迷宮中移動,我們的任務(wù)是檢測球的位置并找到它的質(zhì)心。你還可以在背景中看到巨大的噪音(人群),使任務(wù)更具挑戰(zhàn)性。

OpenCV如何實(shí)現(xiàn)對象跟蹤

1.首先,我們導(dǎo)入將要使用的所需庫。

import numpy as np
import cv2

2.我們將定義一個(gè)函數(shù)來調(diào)整圖像的大小,以便它們在足夠大的情況下適合我們的屏幕。這一步是完全可選的,可以隨意跳過。

def resize(img):
        return cv2.resize(img,(512,512)) # arg1- input image, arg- output_width, output_height

3.你可能知道,視頻是由幀組成的。幀只不過是構(gòu)成整個(gè)動態(tài)畫面的眾多靜止圖像之一。下一步將使用 OpenCV 中的 VideoCapture() 函數(shù)讀取這些幀,并使用 while 循環(huán),我們可以看到幀在移動。

你可以使用將屏幕暫停 x 毫秒的 cv2.waitKey(x) 來調(diào)整視頻的速度。

cap=cv2.VideoCapture(vid_file_path)
ret,frame=cap.read()
 
while ret==True:
    ret,frame=cap.read()
    cv2.imshow("frame",resize(frame))
    key=cv2.waitKey(1)
    if key==ord('q'):
        break
cv2.waitKey(0)
cv2.destroyAllWindows()

4.現(xiàn)在是時(shí)候執(zhí)行一些閾值和預(yù)處理了。OpenCV 讀取 BGR 格式的圖像,因此我們將把色彩空間從 BGR 轉(zhuǎn)換為 HSV。

為什么是 HSV 而不是 BGR 或任何其他格式?

我們使用 HSV 顏色格式,因?yàn)樗鼘ν獠空彰鞯奈⑿∽兓舾?。因此,它將提供更?zhǔn)確的蒙版,從而獲得更好的結(jié)果。

轉(zhuǎn)換色彩空間后,我們要做的是過濾掉紅色通道并創(chuàng)建一個(gè)蒙版框。

hsv 格式的紅色通道出現(xiàn)在 [0,230,170] 到 [255,255,220] 范圍內(nèi)。

cap=cv2.VideoCapture(vid_file_path)
 
 
ret,frame=cap.read()
l_b=np.array([0,230,170])# lower hsv bound for red
u_b=np.array([255,255,220])# upper hsv bound to red
 
while ret==True:
    ret,frame=cap.read()
 
    hsv=cv2.cvtColor(frame,cv2.COLOR_BGR2HSV)
    mask=cv2.inRange(hsv,l_b,u_b)
 
    cv2.imshow("frame",resize(frame))
 
    cv2.imshow("mask",mask)
 
 
    key=cv2.waitKey(1)
    if key==ord('q'):
        break
cv2.waitKey(0)
cv2.destroyAllWindows()

OpenCV如何實(shí)現(xiàn)對象跟蹤

(此圖已調(diào)整大小)

5.到目前為止,我們已經(jīng)創(chuàng)建了幀的蒙版圖像,并且我們已經(jīng)過濾掉了大部分噪聲。接下來是獲得球的邊界。為此,我們將使用輪廓檢測的概念。

輪廓只不過是圍繞我們球的邊界。值得慶幸的是,我們不必自己找到這些邊界,因?yàn)?OpenCV 允許我們可以將其用于我們的目的的函數(shù) findContours()。它需要一個(gè)蒙版圖像并返回一個(gè)輪廓數(shù)組。

有關(guān)輪廓的更多信息,請?jiān)L問:https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html

理想情況下,在我們的例子中,輪廓的值應(yīng)該是 1,因?yàn)槲覀冎挥幸粋€(gè)球,但由于有些人戴著紅帽子,我們會得到不止一個(gè)。你能想出一些辦法來進(jìn)一步降低這種噪音嗎?

為了解決這個(gè)問題,我們將使用 OpenCV 中的另一個(gè)函數(shù) cv2.contourArea()。我們知道在蒙版圖像中,球的面積最大,它的輪廓也是如此。因此,我們將得到面積最大的輪廓。

我們有球的輪廓,我們可以使用 cv2.drawContours() 函數(shù)直接繪制這些輪廓。但是對于檢測任務(wù),我們一般做的就是用一個(gè)緊密綁定的矩形來表示對象已經(jīng)被檢測到了。

為此,我們將使用 cv2.boundingRect() 函數(shù)。此函數(shù)將返回矩形的坐標(biāo),然后 cv2.rectangle() 函數(shù)將為我們繪制矩形。

cap=cv2.VideoCapture(vid_file_path)
 
 
ret,frame=cap.read()
l_b=np.array([0,230,170])# lower hsv bound for red
u_b=np.array([255,255,220])# upper hsv bound to red
 
while ret==True:
    ret,frame=cap.read()
 
    hsv=cv2.cvtColor(frame,cv2.COLOR_BGR2HSV)
    mask=cv2.inRange(hsv,l_b,u_b)
 
    contours,_= cv2.findContours(mask,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
 
    max_contour = contours[0]
         for contour in contours:
                if cv2.contourArea(contour)>cv2.contourArea(max_contour):
 
                      max_contour=contour
 
         contour=max_contour
         approx=cv2.approxPolyDP(contour, 0.01*cv2.arcLength(contour,True),True)
         x,y,w,h=cv2.boundingRect(approx)
         cv2.rectangle(frame,(x,y),(x+w,y+h),(0,255,0),4)
 
    cv2.imshow("frame",resize(frame))
 
    cv2.imshow("mask",mask)

OpenCV如何實(shí)現(xiàn)對象跟蹤

(此圖已調(diào)整大?。?/p>

6.此外,我們可以做的是同時(shí)檢測球的質(zhì)心。為此,我們將使用 cv2.moments。cv2.moments 計(jì)算輪廓內(nèi)像素強(qiáng)度的加權(quán)平均總和,因此允許從斑點(diǎn)中獲取一些更有用的信息,如其半徑、質(zhì)心等。

確保在使用該函數(shù)之前將圖像轉(zhuǎn)換為二進(jìn)制格式。你可以在這里了解更多關(guān)于時(shí)刻的信息:https://docs.opencv.org/3.4/d0/d49/tutorial_moments.html。

cap=cv2.VideoCapture(vid_file_path)
 
 
ret,frame=cap.read()
l_b=np.array([0,230,170])# lower hsv bound for red
u_b=np.array([255,255,220])# upper hsv bound to red
 
while ret==True:
    ret,frame=cap.read()
 
    hsv=cv2.cvtColor(frame,cv2.COLOR_BGR2HSV)
    mask=cv2.inRange(hsv,l_b,u_b)
 
    contours,_= cv2.findContours(mask,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
 
    max_contour = contours[0]
         for contour in contours:
 
 
                if cv2.contourArea(contour)>cv2.contourArea(max_contour):
 
                  max_contour = contour
 
         approx=cv2.approxPolyDP(contour, 0.01*cv2.arcLength(contour,True),True)
         x,y,w,h=cv2.boundingRect(approx)
         cv2.rectangle(frame,(x,y),(x+w,y+h),(0,255,0),4)
 
         M=cv2.moments(contour)

OpenCV如何實(shí)現(xiàn)對象跟蹤

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“OpenCV如何實(shí)現(xiàn)對象跟蹤”這篇文章對大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI