opencv3及C++HOG特征提取方式是怎樣的

發(fā)布時間：2021-10-13 11:31:34 來源：億速云閱讀：181 作者：柒染欄目：編程語言

opencv3及C++HOG特征提取方式是怎樣的，針對這個問題，這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答，希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

HOG特征

HOG(Histograms of Oriented Gradients)梯度方向直方圖

通過利用梯度信息能反映圖像目標(biāo)的邊緣信息并通過局部梯度的大小將圖像局部的外觀和形狀特征化．在論文Histograms of Oriented Gradients for Human Detection中被提出．

HOG特征的提取過程為:

Gamma歸一化；

計(jì)算梯度；

劃分cell

組合成block，統(tǒng)計(jì)block直方圖；

梯度直方圖歸一化；

收集HOG特征。

Gamma歸一化:

對圖像顏色進(jìn)行Gamma歸一化處理，降低局部陰影及背景因素的影響．

計(jì)算梯度:

通過差分計(jì)算出圖像在水平方向上及垂直方向上的梯度：

然后得到各個像素點(diǎn)的梯度的幅值及方向：

劃分cell

將整個窗口劃分成大小相同互不重疊的細(xì)胞單元cell（如8×8像素），計(jì)算出每個cell的梯度大小及方向．然后將每像素的梯度方向在0?180o0?180o 區(qū)間內(nèi)（無向：0-180，有向：0-360）平均分為9個bins，每個cell內(nèi)的像素用幅值來表示權(quán)值，為其所在的梯度直方圖進(jìn)行加權(quán)投票．

9bins:

如圖，不同數(shù)量的bins下的錯誤率：

組合成block，統(tǒng)計(jì)block直方圖

將2×2個相鄰的cell組成大小為16×16的像素塊即block．依次將block大小的滑動窗口從左到右從上到下滑動，求其梯度方向直方圖向量．

如圖，不同大小的cell與不同大小的block作用下的效果對比：

梯度直方圖歸一化

作者對比了L2-norm、L1-norm、L1-sqrt等歸一化方法，發(fā)現(xiàn)都比非標(biāo)準(zhǔn)數(shù)據(jù)有顯著的改善．其中L2-norm和L1-sqrt效果最好，而L1-norm檢測效果要比L2-norm和L1-sqrt低5%．

如圖，不同的歸一化方法效果對比：

這樣通過歸一化能夠進(jìn)一步地對光照、陰影和邊緣進(jìn)行壓縮．

收集HOG特征

由于每個cell內(nèi)的梯度方向分成了9個bins,這樣每個細(xì)胞單元的HOG特征向量長度是9．

這樣，對于大小為128×64大小的圖像，采用8*8像素的sell，2×2個cell組成的16×16像素的block，采用8像素的block移動步長，這樣檢測窗口block的數(shù)量有((128-16)/8+1)×((64-16)/8+1)=15×7．則HOG特征描述符的維數(shù)為15×7×4×9．

HOG的缺點(diǎn)：

速度慢，實(shí)時性差；難以處理遮擋問題。

OpenCV應(yīng)用

利用HOG進(jìn)行行人檢測時有兩種用法：

1、采用HOG特征+SVM分類器進(jìn)行行人檢測；

2、利用HOG+SVM訓(xùn)練自己的XML文件。

采用第一種方法，使用HOG特征結(jié)合SVM分類器進(jìn)行行人檢測，簡單示例：

#include <opencv2/opencv.hpp>#include <opencv2/objdetect.hpp>using namespace std;using namespace cv;int main(){ Mat src, dst; src = imread("E:/image/image/passerby.jpg",1); if (src.empty()) { printf("can not load the image...\n"); return -1; } dst = src.clone(); vector<Rect> findrects, findrect; HOGDescriptor HOG; //SVM分類器 HOG.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector()); //多尺度檢測 HOG.detectMultiScale(src, findrects, 0, Size(4,4), Size(0,0), 1.05, 2); //若rects有嵌套,則取最外面的矩形存入rect for(int i=0; i < findrects.size(); i++) { Rect rect = findrects[i]; int j=0; for(; j < findrects.size(); j++) if(j != i && (rect & findrects[j]) == rect) break; if( j == findrects.size()) findrect.push_back(rect); } //框選出檢測結(jié)果 for(int i=0; i<findrect.size(); i++) { RNG rng(i); Scalar color = Scalar(rng.uniform(0,255), rng.uniform(0,255), rng.uniform(0,255)); rectangle(dst, findrect[i].tl(), findrect[i].br(), color, 2); } imshow("src",src); imshow("dst",dst); waitKey(); return 0;}

關(guān)于opencv3及C++HOG特征提取方式是怎樣的問題的解答就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，如果你還有很多疑惑沒有解開，可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識。

向AI問一下細(xì)節(jié)

opencv3及C++HOG特征提取方式是怎樣的

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽