溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

opencv3及C++HOG特征提取方式是怎樣的

發(fā)布時間:2021-10-13 11:31:34 來源:億速云 閱讀:181 作者:柒染 欄目:編程語言

opencv3及C++HOG特征提取方式是怎樣的,針對這個問題,這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

HOG特征

HOG(Histograms of Oriented Gradients)梯度方向直方圖

通過利用梯度信息能反映圖像目標(biāo)的邊緣信息并通過局部梯度的大小將圖像局部的外觀和形狀特征化.在論文Histograms of Oriented Gradients for Human Detection中被提出.

HOG特征的提取過程為:

Gamma歸一化;

計(jì)算梯度;

劃分cell

組合成block,統(tǒng)計(jì)block直方圖;

梯度直方圖歸一化;

收集HOG特征。

Gamma歸一化:

對圖像顏色進(jìn)行Gamma歸一化處理,降低局部陰影及背景因素的影響.

計(jì)算梯度:

通過差分計(jì)算出圖像在水平方向上及垂直方向上的梯度:

然后得到各個像素點(diǎn)的梯度的幅值及方向:

劃分cell

將整個窗口劃分成大小相同互不重疊的細(xì)胞單元cell(如8×8像素),計(jì)算出每個cell的梯度大小及方向.然后將每像素的梯度方向在0?180o0?180o 區(qū)間內(nèi)(無向:0-180,有向:0-360)平均分為9個bins,每個cell內(nèi)的像素用幅值來表示權(quán)值,為其所在的梯度直方圖進(jìn)行加權(quán)投票.

9bins:

如圖,不同數(shù)量的bins下的錯誤率:

組合成block,統(tǒng)計(jì)block直方圖

將2×2個相鄰的cell組成大小為16×16的像素塊即block.依次將block大小的滑動窗口從左到右從上到下滑動,求其梯度方向直方圖向量.

如圖,不同大小的cell與不同大小的block作用下的效果對比:

梯度直方圖歸一化

作者對比了L2-norm、L1-norm、L1-sqrt等歸一化方法,發(fā)現(xiàn)都比非標(biāo)準(zhǔn)數(shù)據(jù)有顯著的改善.其中L2-norm和L1-sqrt效果最好,而L1-norm檢測效果要比L2-norm和L1-sqrt低5%.

如圖,不同的歸一化方法效果對比:

這樣通過歸一化能夠進(jìn)一步地對光照、陰影和邊緣進(jìn)行壓縮.

收集HOG特征

由于每個cell內(nèi)的梯度方向分成了9個bins,這樣每個細(xì)胞單元的HOG特征向量長度是9.

這樣,對于大小為128×64大小的圖像,采用8*8像素的sell,2×2個cell組成的16×16像素的block,采用8像素的block移動步長,這樣檢測窗口block的數(shù)量有((128-16)/8+1)×((64-16)/8+1)=15×7.則HOG特征描述符的維數(shù)為15×7×4×9.

HOG的缺點(diǎn):

速度慢,實(shí)時性差;難以處理遮擋問題。

OpenCV應(yīng)用

利用HOG進(jìn)行行人檢測時有兩種用法:

1、采用HOG特征+SVM分類器進(jìn)行行人檢測;

2、利用HOG+SVM訓(xùn)練自己的XML文件。

采用第一種方法,使用HOG特征結(jié)合SVM分類器進(jìn)行行人檢測,簡單示例:

#include <opencv2/opencv.hpp>#include <opencv2/objdetect.hpp>using namespace std;using namespace cv;int main(){ Mat src, dst; src = imread("E:/image/image/passerby.jpg",1); if (src.empty()) { printf("can not load the image...\n"); return -1; } dst = src.clone(); vector<Rect> findrects, findrect; HOGDescriptor HOG; //SVM分類器 HOG.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector()); //多尺度檢測 HOG.detectMultiScale(src, findrects, 0, Size(4,4), Size(0,0), 1.05, 2); //若rects有嵌套,則取最外面的矩形存入rect for(int i=0; i < findrects.size(); i++) { Rect rect = findrects[i]; int j=0; for(; j < findrects.size(); j++)  if(j != i && (rect & findrects[j]) == rect)  break; if( j == findrects.size())  findrect.push_back(rect); } //框選出檢測結(jié)果 for(int i=0; i<findrect.size(); i++) { RNG rng(i); Scalar color = Scalar(rng.uniform(0,255), rng.uniform(0,255), rng.uniform(0,255)); rectangle(dst, findrect[i].tl(), findrect[i].br(), color, 2); } imshow("src",src); imshow("dst",dst); waitKey(); return 0;}

關(guān)于opencv3及C++HOG特征提取方式是怎樣的問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI