您好,登錄后才能下訂單哦!
透明摳圖問題作為摳圖問題的一種,其采用的方法和模型構建與通常的模型有所不同,透明摳圖需要將環(huán)境光,折射率的影響納入計算,而一般的折射光圖又很難獲得,因此透明摳圖的模型在過去一直難以建立,或者說很難達到令人滿意的效果,達摩院視覺算法團隊通過雙分支解碼器(Object Mask 獲取,Opacity 預測),顏色糾正模塊,對圖像實現(xiàn)高精度透明摳圖。
物體的摳圖問題可以定義為求解以下的公式,即給定圖像 I,求解前景顏色 F、背景顏色 B 和 Alpha matte 的線性組合:
對于透明物體而言,它展現(xiàn)在觀察者眼中的顏色是由其前景顏色,背景顏色以及環(huán)境光線經過前景物體自我反射折射混合而成的,因此,它的公式會更加復雜一些:
Φ 表示的是環(huán)境光的影響 它是所有光線 E(w) 與反射率方程 R 乘積在所有點上的二重積分,求解很復雜[28],導致實現(xiàn)精確的透明摳圖是一個非常困難的問題。因此,現(xiàn)有透明摳圖研究的目標也是實現(xiàn)視覺感受“真實”的摳圖而已,并非追求完全真實的摳圖結果。
SOTA 的 Matting 算法在同時提供原圖和對應 trimap 的情況下,可以的實現(xiàn)對半透物體的處理(如下圖為GCA-Matting 的效果),但 tripmap 在實際的圖像的處理中難以獲取,限制了這類算法其在業(yè)務中的使用。
TOM-Net 將透明摳圖問題視為折射流的估計問題,網絡支持對單圖輸入,經過三分支的編解碼器網絡,分別預測圖像的 Object Mask,attenuative mask,flow mask (折射流圖),并可以通過折射流信息進一步在新的背景進行合成。該方法的局限性在于其假設物體必須全部為無色透明物體,并且在訓練過程中需要折射流圖作為 label, 而折射流圖在真實世界是非常難以獲取的,因此該方法的訓練數(shù)只能依賴于圖形學合成,與真實透明圖像的分布無法一致(圖像的語義合理性存疑,例如玻璃杯在山前懸?。?。經過我們在實際數(shù)據(jù)上的測試,該方法在實際圖像的表現(xiàn)并不理想。
Segmenting Transparent Objects in the Wild 提出了基于語義分支和邊緣分支結構的真實世界透明物體分割網絡,通過邊界注意力模塊(Boundary Attention Modeule)增強對透明物體的分割精度,并發(fā)布了目前數(shù)量最大的透明物體分割標注數(shù)據(jù)集 Trans10K。然而,文章提出的算法和發(fā)布的數(shù)據(jù)集都是處理到語義分割層面,并沒有對物體的透明度做進一步處理。
考慮到透明摳圖問題本身難以求解,而且數(shù)據(jù)構建也非常困難,在實際的應用場景中,為保證同時保證算法的泛化能力和摳圖效果,我們對問題進行了簡化, 我們假設所需處理的物體的透明部分是無色的,且所在環(huán)境的背景顏色分布相對均勻。在這樣的條件下,背景的自發(fā)光或反射光的顏色可以認為是全局一致的顏色,不會出現(xiàn)多種顏色疊加的情況,Φ 的估計就只是和背景顏色相關了。特別的,如果預知背景的顏色,可以通過將其作為先驗引入 Φ 中,對結果進行背景雜色的抑制及去除。
我們的模型輸入為單張圖像,通過編碼器網絡提取其深層特征。解碼器設計為兩個分支,分支一的解碼器采用在非透明物體摳圖的解碼器權重,該分支注重語義級別的分割和提取,力求完整準確地獲得物體所在圖像區(qū)域,即 Object Mask。
分支二則注重對圖像物體不透明度 (Opacity) 的預測。在背景均勻的假設下,該分支預測圖像各像素與背景的相似性,相似度高則說明介質的透明度高(如空氣,玻璃)。而分支二由于在訓練的時候沒有進行語義的約束,容易存在非主體區(qū)域的噪聲影響,因此,將兩者進行融合可以將透明信息約束在主體范圍內。融合模塊的實現(xiàn),可以將 Opacity 和 ObjectMask 進行圖像級的像素融合,也可以將兩者進行深度維度拼接,通過進一步的網絡進行預測。
最后,對于已知背景顏色先驗的場景(如已知是綠幕),我們可以引入顏色糾正模塊,實現(xiàn)對背景透出的雜色進行去除。對于背景顏色未知,但飽和度低的場景,摳圖結果也依然可用。
在已知背景顏色先驗的情況下,可以通過顏色糾正模塊對背景透出的雜色進行去除(左到右:實拍圖, Opacity, 直接摳圖結果,色偏糾正結果)
對于背景顏色未知,但飽和度低的場景,摳圖結果也依然可用。
更多結果
目前在車輛分割算法上,我們已經實現(xiàn)了基于透明摳圖的思路用于改善半透車窗區(qū)域的效果,使得車輛經過摳圖,能夠更加自然和諧與新背景進行融合。目前車輛分割已經上線 阿里云視覺智能開放平臺,歡迎大家 體驗試用。
目前的透明摳圖算法,面對更為多樣的真實場景下物體,仍然具有以下不足,需要進一步探索解決:
后續(xù)我們會考慮進一步提取背景的特征,將背景先驗知識引入到透明度的估計上,增加 RGB 偏移輸出信息,嘗試對前景物體的顏色進行糾正。
文章來源: https://developer.aliyun.com/article/766602?groupCode=aliyunmit
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。