如何使用OpenCV進(jìn)行圖像全景拼接

發(fā)布時(shí)間：2021-07-14 14:59:43 來源：億速云閱讀：362 作者：chen 欄目：大數(shù)據(jù)

這篇文章主要講解了“如何使用OpenCV進(jìn)行圖像全景拼接”，文中的講解內(nèi)容簡單清晰，易于學(xué)習(xí)與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“如何使用OpenCV進(jìn)行圖像全景拼接”吧！

圖像拼接是計(jì)算機(jī)視覺中最成功的應(yīng)用之一。如今，很難找到不包含此功能的手機(jī)或圖像處理API。在本文中，我們將討論如何使用Python和OpenCV進(jìn)行圖像拼接。也就是，給定兩張共享某些公共區(qū)域的圖像，目標(biāo)是“縫合”它們并創(chuàng)建一個(gè)全景圖像場景。當(dāng)然也可以是給定多張圖像，但是總會(huì)轉(zhuǎn)換成兩張共享某些公共區(qū)域圖像拼接的問題，因此本文以最簡單的形式進(jìn)行介紹。

本文主要的知識(shí)點(diǎn)包含一下內(nèi)容：

關(guān)鍵點(diǎn)檢測
局部不變描述符（SIFT，SURF等）
特征匹配
使用RANSAC進(jìn)行單應(yīng)性估計(jì)
透視變換

我們需要拼接的兩張圖像如下：

如何使用OpenCV進(jìn)行圖像全景拼接

特征檢測與提取

給定上述一對圖像，我們希望將它們縫合以創(chuàng)建全景場景。重要的是要注意，兩個(gè)圖像都需要有一些公共區(qū)域。當(dāng)然，我們上面給出的兩張圖像時(shí)比較理想的，有時(shí)候兩個(gè)圖像雖然具有公共區(qū)域，但是同樣還可能存在縮放、旋轉(zhuǎn)、來自不同相機(jī)等因素的影響。但是無論哪種情況，我們都需要檢測圖像中的特征點(diǎn)。

關(guān)鍵點(diǎn)檢測

最初的并且可能是幼稚的方法是使用諸如Harris Corners之類的算法來提取關(guān)鍵點(diǎn)。然后，我們可以嘗試基于某種相似性度量（例如歐幾里得距離）來匹配相應(yīng)的關(guān)鍵點(diǎn)。眾所周知，角點(diǎn)具有一個(gè)不錯(cuò)的特性：角點(diǎn)不變。這意味著，一旦檢測到角點(diǎn)，即使旋轉(zhuǎn)圖像，該角點(diǎn)仍將存在。

但是，如果我們旋轉(zhuǎn)然后縮放圖像怎么辦？在這種情況下，我們會(huì)很困難，因?yàn)榻屈c(diǎn)的大小不變。也就是說，如果我們放大圖像，先前檢測到的角可能會(huì)變成一條線！

總而言之，我們需要旋轉(zhuǎn)和縮放不變的特征。那就是更強(qiáng)大的方法（如SIFT，SURF和ORB）。

關(guān)鍵點(diǎn)和描述符

諸如SIFT和SURF之類的方法試圖解決角點(diǎn)檢測算法的局限性。通常，角點(diǎn)檢測器算法使用固定大小的內(nèi)核來檢測圖像上的感興趣區(qū)域（角）。不難看出，當(dāng)我們縮放圖像時(shí)，該內(nèi)核可能變得太小或太大。為了解決此限制，諸如SIFT之類的方法使用高斯差分（DoD）。想法是將DoD應(yīng)用于同一圖像的不同縮放版本。它還使用相鄰像素信息來查找和完善關(guān)鍵點(diǎn)和相應(yīng)的描述符。

首先，我們需要加載2個(gè)圖像，一個(gè)查詢圖像和一個(gè)訓(xùn)練圖像。最初，我們首先從兩者中提取關(guān)鍵點(diǎn)和描述符。通過使用OpenCV detectAndCompute()函數(shù)，我們可以一步完成它。請注意，為了使用detectAndCompute()，我們需要一個(gè)關(guān)鍵點(diǎn)檢測器和描述符對象的實(shí)例。它可以是ORB，SIFT或SURF等。此外，在將圖像輸入給detectAndCompute()之前，我們將其轉(zhuǎn)換為灰度。

def detectAndDescribe(image, method=None):    """    Compute key points and feature descriptors using an specific method    """
    assert method is not None, "You need to define a feature detection method. Values are: 'sift', 'surf'"
    # detect and extract features from the image    if method == 'sift':        descriptor = cv2.xfeatures2d.SIFT_create()    elif method == 'surf':        descriptor = cv2.xfeatures2d.SURF_create()    elif method == 'brisk':        descriptor = cv2.BRISK_create()    elif method == 'orb':        descriptor = cv2.ORB_create()
    # get keypoints and descriptors    (kps, features) = descriptor.detectAndCompute(image, None)
    return (kps, features)

我們?yōu)閮蓚€(gè)圖像都設(shè)置了一組關(guān)鍵點(diǎn)和描述符。如果我們使用SIFT作為特征提取器，它將為每個(gè)關(guān)鍵點(diǎn)返回一個(gè)128維特征向量。如果選擇SURF，我們將獲得64維特征向量。下圖顯示了使用SIFT，SURF，BRISK和ORB得到的結(jié)果。

如何使用OpenCV進(jìn)行圖像全景拼接

使用ORB和漢明距離檢測關(guān)鍵點(diǎn)和描述符

如何使用OpenCV進(jìn)行圖像全景拼接

使用SIFT檢測關(guān)鍵點(diǎn)和描述符

如何使用OpenCV進(jìn)行圖像全景拼接

使用SURF檢測關(guān)鍵點(diǎn)和描述符

如何使用OpenCV進(jìn)行圖像全景拼接

使用BRISK和漢明距離檢測關(guān)鍵點(diǎn)和描述符

特征匹配

如我們所見，兩個(gè)圖像都有大量特征點(diǎn)。現(xiàn)在，我們想比較兩組特征，并盡可能顯示更多相似性的特征點(diǎn)對。使用OpenCV，特征點(diǎn)匹配需要Matcher對象。在這里，我們探索兩種方式：暴力匹配器（BruteForce）和KNN（k最近鄰）。

BruteForce（BF）Matcher的作用恰如其名。給定2組特征（來自圖像A和圖像B），將A組的每個(gè)特征與B組的所有特征進(jìn)行比較。默認(rèn)情況下，BF Matcher計(jì)算兩點(diǎn)之間的歐式距離。因此，對于集合A中的每個(gè)特征，它都會(huì)返回集合B中最接近的特征。對于SIFT和SURF，OpenCV建議使用歐幾里得距離。對于ORB和BRISK等其他特征提取器，建議使用漢明距離。我們要使用OpenCV創(chuàng)建BruteForce Matcher，一般情況下，我們只需要指定2個(gè)參數(shù)即可。第一個(gè)是距離度量。第二個(gè)是是否進(jìn)行交叉檢測的布爾參數(shù)。具體代碼如下：

def createMatcher(method,crossCheck):    "Create and return a Matcher Object"
    if method == 'sift' or method == 'surf':        bf = cv2.BFMatcher(cv2.NORM_L2, crossCheck=crossCheck)    elif method == 'orb' or method == 'brisk':        bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=crossCheck)    return bf

交叉檢查布爾參數(shù)表示這兩個(gè)特征是否具有相互匹配才視為有效。換句話說，對于被認(rèn)為有效的一對特征（f1，f2），f1需要匹配f2，f2也必須匹配f1作為最接近的匹配。此過程可確保提供更強(qiáng)大的匹配功能集，這在原始SIFT論文中進(jìn)行了描述。

但是，對于要考慮多個(gè)候選匹配的情況，可以使用基于KNN的匹配過程。KNN不會(huì)返回給定特征的單個(gè)最佳匹配，而是返回k個(gè)最佳匹配。需要注意的是，k的值必須由用戶預(yù)先定義。如我們所料，KNN提供了更多的候選功能。但是，在進(jìn)一步操作之前，我們需要確保所有這些匹配對都具有魯棒性。

比率測試

為了確保KNN返回的特征具有很好的可比性，SIFT論文的作者提出了一種稱為比率測試的技術(shù)。一般情況下，我們遍歷KNN得到匹配對，之后再執(zhí)行距離測試。對于每對特征（f1，f2），如果f1和f2之間的距離在一定比例之內(nèi)，則將其保留，否則將其丟棄。同樣，必須手動(dòng)選擇比率值。

本質(zhì)上，比率測試與BruteForce Matcher的交叉檢查選項(xiàng)具有相同的作用。兩者都確保一對檢測到的特征確實(shí)足夠接近以至于被認(rèn)為是相似的。下面2個(gè)圖顯示了BF和KNN Matcher在SIFT特征上的匹配結(jié)果。我們選擇僅顯示100個(gè)匹配點(diǎn)以清晰顯示。

如何使用OpenCV進(jìn)行圖像全景拼接

使用KNN和SIFT的定量測試進(jìn)行功能匹配

如何使用OpenCV進(jìn)行圖像全景拼接

在SIFT特征上使用暴力匹配器進(jìn)行特征匹配

需要注意的是，即使做了多種篩選來保證匹配的正確性，也無法完全保證特征點(diǎn)完全正確匹配。盡管如此，Matcher算法仍將為我們提供兩幅圖像中最佳（更相似）的特征集。接下來，我們利用這些點(diǎn)來計(jì)算將兩個(gè)圖像的匹配點(diǎn)拼接在一起的變換矩陣。

這種變換稱為單應(yīng)矩陣。簡而言之，單應(yīng)性是一個(gè)3x3矩陣，可用于許多應(yīng)用中，例如相機(jī)姿態(tài)估計(jì)，透視校正和圖像拼接。它將點(diǎn)從一個(gè)平面（圖像）映射到另一平面。

估計(jì)單應(yīng)性

隨機(jī)采樣一致性（RANSAC）是用于擬合線性模型的迭代算法。與其他線性回歸器不同，RANSAC被設(shè)計(jì)為對異常值具有魯棒性。

像線性回歸這樣的模型使用最小二乘估計(jì)將最佳模型擬合到數(shù)據(jù)。但是，普通最小二乘法對異常值非常敏感。如果異常值數(shù)量很大，則可能會(huì)失敗。RANSAC通過僅使用數(shù)據(jù)中的一組數(shù)據(jù)估計(jì)參數(shù)來解決此問題。下圖顯示了線性回歸和RANSAC之間的比較。需要注意數(shù)據(jù)集包含相當(dāng)多的離群值。

如何使用OpenCV進(jìn)行圖像全景拼接

我們可以看到線性回歸模型很容易受到異常值的影響。那是因?yàn)樗噲D減少平均誤差。因此，它傾向于支持使所有數(shù)據(jù)點(diǎn)到模型本身的總距離最小的模型。包括異常值。相反，RANSAC僅將模型擬合為被識(shí)別為點(diǎn)的點(diǎn)的子集。

這個(gè)特性對我們的用例非常重要。在這里，我們將使用RANSAC來估計(jì)單應(yīng)矩陣。事實(shí)證明，單應(yīng)矩陣對我們傳遞給它的數(shù)據(jù)質(zhì)量非常敏感。因此，重要的是要有一種算法（RANSAC），該算法可以從不屬于數(shù)據(jù)分布的點(diǎn)中篩選出明顯屬于數(shù)據(jù)分布的點(diǎn)。

估計(jì)了單應(yīng)矩陣后，我們需要將其中一張圖像變換到一個(gè)公共平面上。在這里，我們將對其中一張圖像應(yīng)用透視變換。透視變換可以組合一個(gè)或多個(gè)操作，例如旋轉(zhuǎn)，縮放，平移或剪切。我們可以使用OpenCV warpPerspective()函數(shù)。它以圖像和單應(yīng)矩陣作為輸入。

# Apply panorama correctionwidth = trainImg.shape[1] + queryImg.shape[1]height = trainImg.shape[0] + queryImg.shape[0]
result = cv2.warpPerspective(trainImg, H, (width, height))result[0:queryImg.shape[0], 0:queryImg.shape[1]] = queryImg
plt.figure(figsize=(20,10))plt.imshow(result)
plt.axis('off')plt.show()

生成的全景圖像如下所示。如我們所見，結(jié)果中包含了兩個(gè)圖像中的內(nèi)容。另外，我們可以看到一些與照明條件和圖像邊界邊緣效應(yīng)有關(guān)的問題。理想情況下，我們可以執(zhí)行一些處理技術(shù)來標(biāo)準(zhǔn)化亮度，例如直方圖匹配，這會(huì)使結(jié)果看起來更真實(shí)和自然一些。

如何使用OpenCV進(jìn)行圖像全景拼接

感謝各位的閱讀，以上就是“如何使用OpenCV進(jìn)行圖像全景拼接”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對如何使用OpenCV進(jìn)行圖像全景拼接這一問題有了更深刻的體會(huì)，具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云，小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章，歡迎關(guān)注！

向AI問一下細(xì)節(jié)

如何使用OpenCV進(jìn)行圖像全景拼接

關(guān)鍵點(diǎn)和描述符

特征匹配

估計(jì)單應(yīng)性

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽