<pre id="gpfrk"><mark id="gpfrk"><big id="gpfrk"></big></mark></pre>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

達摩院視覺算法黑科技之透明摳圖

發(fā)布時間：2020-08-10 12:29:15 來源：ITPUB博客閱讀：227 作者：視覺計算欄目：互聯(lián)網科技

達摩院視覺算法黑科技之透明摳圖

透明摳圖問題作為摳圖問題的一種，其采用的方法和模型構建與通常的模型有所不同，透明摳圖需要將環(huán)境光，折射率的影響納入計算，而一般的折射光圖又很難獲得，因此透明摳圖的模型在過去一直難以建立，或者說很難達到令人滿意的效果，達摩院視覺算法團隊通過雙分支解碼器（Object Mask 獲取，Opacity 預測），顏色糾正模塊，對圖像實現(xiàn)高精度透明摳圖。

透明摳圖 vs 非透明摳圖

物體的摳圖問題可以定義為求解以下的公式，即給定圖像 I，求解前景顏色 F、背景顏色 B 和 Alpha matte 的線性組合:

達摩院視覺算法黑科技之透明摳圖

對于透明物體而言，它展現(xiàn)在觀察者眼中的顏色是由其前景顏色，背景顏色以及環(huán)境光線經過前景物體自我反射折射混合而成的，因此，它的公式會更加復雜一些：

達摩院視覺算法黑科技之透明摳圖

Φ 表示的是環(huán)境光的影響它是所有光線 E(w) 與反射率方程 R 乘積在所有點上的二重積分，求解很復雜[28]，導致實現(xiàn)精確的透明摳圖是一個非常困難的問題。因此，現(xiàn)有透明摳圖研究的目標也是實現(xiàn)視覺感受“真實”的摳圖而已，并非追求完全真實的摳圖結果。

現(xiàn)有研究

SOTA 的 Matting 算法在同時提供原圖和對應 trimap 的情況下，可以的實現(xiàn)對半透物體的處理（如下圖為GCA-Matting 的效果），但 tripmap 在實際的圖像的處理中難以獲取，限制了這類算法其在業(yè)務中的使用。

達摩院視覺算法黑科技之透明摳圖

TOM-Net 將透明摳圖問題視為折射流的估計問題，網絡支持對單圖輸入,經過三分支的編解碼器網絡，分別預測圖像的 Object Mask，attenuative mask，flow mask (折射流圖)，并可以通過折射流信息進一步在新的背景進行合成。該方法的局限性在于其假設物體必須全部為無色透明物體，并且在訓練過程中需要折射流圖作為 label, 而折射流圖在真實世界是非常難以獲取的，因此該方法的訓練數(shù)只能依賴于圖形學合成，與真實透明圖像的分布無法一致（圖像的語義合理性存疑，例如玻璃杯在山前懸?。?。經過我們在實際數(shù)據(jù)上的測試，該方法在實際圖像的表現(xiàn)并不理想。

達摩院視覺算法黑科技之透明摳圖

Segmenting Transparent Objects in the Wild 提出了基于語義分支和邊緣分支結構的真實世界透明物體分割網絡，通過邊界注意力模塊（Boundary Attention Modeule）增強對透明物體的分割精度，并發(fā)布了目前數(shù)量最大的透明物體分割標注數(shù)據(jù)集 Trans10K。然而，文章提出的算法和發(fā)布的數(shù)據(jù)集都是處理到語義分割層面，并沒有對物體的透明度做進一步處理。

達摩院視覺算法黑科技之透明摳圖

問題簡化

考慮到透明摳圖問題本身難以求解，而且數(shù)據(jù)構建也非常困難，在實際的應用場景中，為保證同時保證算法的泛化能力和摳圖效果，我們對問題進行了簡化，我們假設所需處理的物體的透明部分是無色的，且所在環(huán)境的背景顏色分布相對均勻。在這樣的條件下，背景的自發(fā)光或反射光的顏色可以認為是全局一致的顏色，不會出現(xiàn)多種顏色疊加的情況，Φ 的估計就只是和背景顏色相關了。特別的，如果預知背景的顏色，可以通過將其作為先驗引入 Φ 中，對結果進行背景雜色的抑制及去除。

模型設計

我們的模型輸入為單張圖像，通過編碼器網絡提取其深層特征。解碼器設計為兩個分支，分支一的解碼器采用在非透明物體摳圖的解碼器權重，該分支注重語義級別的分割和提取，力求完整準確地獲得物體所在圖像區(qū)域,即 Object Mask。

分支二則注重對圖像物體不透明度 (Opacity) 的預測。在背景均勻的假設下，該分支預測圖像各像素與背景的相似性，相似度高則說明介質的透明度高（如空氣，玻璃）。而分支二由于在訓練的時候沒有進行語義的約束，容易存在非主體區(qū)域的噪聲影響，因此，將兩者進行融合可以將透明信息約束在主體范圍內。融合模塊的實現(xiàn)，可以將 Opacity 和 ObjectMask 進行圖像級的像素融合，也可以將兩者進行深度維度拼接，通過進一步的網絡進行預測。

最后，對于已知背景顏色先驗的場景（如已知是綠幕），我們可以引入顏色糾正模塊，實現(xiàn)對背景透出的雜色進行去除。對于背景顏色未知，但飽和度低的場景，摳圖結果也依然可用。

達摩院視覺算法黑科技之透明摳圖

結果與應用

在已知背景顏色先驗的情況下，可以通過顏色糾正模塊對背景透出的雜色進行去除（左到右：實拍圖， Opacity, 直接摳圖結果，色偏糾正結果）

達摩院視覺算法黑科技之透明摳圖

達摩院視覺算法黑科技之透明摳圖

對于背景顏色未知，但飽和度低的場景，摳圖結果也依然可用。

達摩院視覺算法黑科技之透明摳圖

更多結果

達摩院視覺算法黑科技之透明摳圖

達摩院視覺算法黑科技之透明摳圖

目前在車輛分割算法上，我們已經實現(xiàn)了基于透明摳圖的思路用于改善半透車窗區(qū)域的效果，使得車輛經過摳圖，能夠更加自然和諧與新背景進行融合。目前車輛分割已經上線阿里云視覺智能開放平臺，歡迎大家體驗試用。

達摩院視覺算法黑科技之透明摳圖

總結與展望

目前的透明摳圖算法，面對更為多樣的真實場景下物體，仍然具有以下不足，需要進一步探索解決：

1.真實透明物體圖像數(shù)據(jù)量嚴重不足，且標注困難；
2.主體不透明度圖（Opacity）的預測容易受到圖像中噪聲的影響；
3.在得到 Opacity 圖后，在未知背景先驗，且背景顏色飽和度高的情況下，如何實現(xiàn)將背景色的去除（如下圖的杯子整體泛藍);

后續(xù)我們會考慮進一步提取背景的特征，將背景先驗知識引入到透明度的估計上，增加 RGB 偏移輸出信息，嘗試對前景物體的顏色進行糾正。

文章來源： https://developer.aliyun.com/article/766602?groupCode=aliyunmit

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內容（圖片、視頻和文字）以原創(chuàng)、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關證據(jù)，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
什么是 EJB?
下一篇新聞：
R1-013 Shell函數(shù)使用規(guī)則

猜你喜歡

AI
助
手

產品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

<strong id="nsgok"><sup id="nsgok"></sup></strong>

<samp id="nsgok"><listing id="nsgok"><dl id="nsgok"></dl></listing></samp>

<table id="nsgok"><legend id="nsgok"><ins id="nsgok"></ins></legend></table>