溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

計算機視覺邁進新征程“玩家”找出哪些新玩法？

發(fā)布時間：2020-08-10 22:00:41 來源：ITPUB博客閱讀：132 作者：dicksonjyl560101 欄目：互聯(lián)網(wǎng)科技

當前，計算機視覺的已經(jīng)成為了一個跨學科的領域，計算機視覺源于1980年左右的神經(jīng)網(wǎng)絡技術，但是直到近幾年才真正實現(xiàn)了大規(guī)模商業(yè)化落地。大規(guī)模的資金進入，促使更多專注于計算機視覺的企業(yè)不斷出現(xiàn)，這些企業(yè)在不同的領域通過計算機視覺技術不斷的改造升級著原有的商業(yè)模式。作為一個靈感來自人類視覺大腦皮層的技術，我們現(xiàn)在是否已經(jīng)處在機器物體探測或分類能力與人類視覺相當，甚至更強的階段了呢？

曠視科技：AI鼻紋識別

計算機視覺邁進新征程“玩家”找出哪些新玩法？

近期，曠視科技推出AI鼻紋識別解決方案，這項解決方案最先應用于犬只身份認證。專用于寵物識別。有別于瞳孔、臉型等其他犬只認證方式，曠視選擇鼻紋作為識別的關鍵特征。與人類指紋類似，犬類鼻紋具有唯一性與穩(wěn)定不變性，即不存在鼻紋完全相同的兩只犬、同一只犬的鼻紋亦不會隨著成長而改變。主人只需對準犬鼻進行簡單的抓拍或者視頻錄像，系統(tǒng)通過犬鼻檢測，定位出鼻紋關鍵點，將提取到的鼻紋深度圖信息匯入后臺數(shù)據(jù)庫，更可為犬只生成一張專屬的身份證。目前，曠視鼻紋識別技術能達到犬只的1：1比對，在誤識率為萬分之一的情況下，試點場景中準確率95%；

極鏈科技：視頻識別

計算機視覺邁進新征程“玩家”找出哪些新玩法？

目前視頻人臉識別還有很多的困難與挑戰(zhàn)，如視頻圖像質量差、人臉圖像小燈問題，極鏈科技提出了以四模塊對場景中的人臉進行識別。

1.視頻結構化，將視頻用鏡頭分割。通常采用全局特征和局部特征相結合的方法。全局特征檢測全局顏色的分布突變，然后借用局部特征獲得的人臉識別的跟蹤結果、跟蹤軌跡的斷續(xù)來判斷視頻是否具有鏡頭切換。跟蹤來判斷鏡頭切換有一個很大的優(yōu)點，因為后續(xù)的步驟也會采用相似的算法，所以這一步驟所需的算法是可以重復使用的。

2.人臉軌跡提取。完成了鏡頭分割以后，就可以分割好的單一鏡頭里進行人臉軌跡提取。在軌跡提取的算法上，同樣要考慮準確率和速度的指標。要實現(xiàn)速度和準確率的平衡，可以有以下兩種途徑：一是間隔采樣or逐幀處理，二是檢測&跟蹤的配合。

3.人臉識別。有了人臉軌跡之后，就可以開始進行人臉的識別了。但是在將人臉數(shù)據(jù)輸入深度網(wǎng)絡之前，還需要對其進行必要的變換和處理。其中一部分變換在針對人臉這一部分非常重要，尤其是在消費級視頻里，那就是人臉的對齊。人臉對齊是利用人臉的特征點檢測定位，將各種姿勢的人臉圖像還原矯正為正臉的過程。在算法框架中，需要加入人臉質量評估的算法，以過濾低質量的人臉圖片，保證人臉數(shù)據(jù)的準確率。在樣本足夠的前提下，可以利用訓練得到的模型對人臉樣本進行特征提取。測試的時候，在視頻中檢測得的人臉后，將其輸入到生成的特征向量里，與人臉互動的特征向量進行匹配，從而找到在特征空間中最接近的一個樣本。

4.識別結果融合。以上提到的人臉識別都是針對單幀識別的圖片而言的，之前說到的系統(tǒng)識別結果都是針對整個人臉軌跡而言。因此，最后需要將人臉識別的結果與整條人臉軌跡融合起來，得到整個軌跡的識別結果。

商湯科技：面部圖片處理

計算機視覺邁進新征程“玩家”找出哪些新玩法？

近日，來自商湯科技，香港中文大學以及香港大學的研究團隊提出了一種稱為MaskGAN的新型框架，可實現(xiàn)多樣化和交互式的面部操作。其主要觀點是語義掩模作為靈活的面部操作的適當中間表示，使其具有保真度。MaskGAN有兩個主要組成部分：

1.密集映射

2.編輯行為模擬訓練

具體而言，密集映射網(wǎng)絡學習自由形式的用戶修改掩碼和目標圖像之間的樣式映射，從而實現(xiàn)不同的生成結果。

以色列魏茨曼科學研究院：圖像分離

本月，以色列魏茨曼科學研究所的研究人員開發(fā)出了一項名為Double-DIP的新技術，該技術能讓系統(tǒng)在沒有大量訓練數(shù)據(jù)的情況下，通過深度學習來對圖像進行編輯，分離人們在圖片中想要的和不想要的部分。該研究基于一項名為DIP（Deep Image Prior）的混合圖像恢復技術，因此研究人員將他們開發(fā)的新分離圖像方法稱為Double-DIP。DIP技術的研究成果已于美國時間2018年7月18日提交在arxiv上，名為《圖像恢復的混合稀疏先驗學習：深度學習與稀疏編碼的結合（Learning Hybrid Sparsity Prior for Image Restoration: Where Deep Learning Meets Sparse Coding）》。

呂貝克大學：醫(yī)學圖像生成新方法

當前，GAN應用于醫(yī)學研究還面臨一項重大挑戰(zhàn)。深度學習算法需要對高分辨率圖像進行訓練，才能產(chǎn)生最佳預測，然而合成這樣的高分辨率圖像，尤其是3D圖像，需要大量的計算能力。來自呂貝克大學醫(yī)學信息學研究所的研究人員提出了一種新方法，可以大大降低硬件的配置要求。研究人員把圖像生成的過程分解為幾個階段：首先利用GAN生成低分辨率圖像，然后在正確的分辨率下每次生成一小部分的細節(jié)圖像。通過實驗，研究人員發(fā)現(xiàn)這種方法不僅生成了逼真的高分辨率2D和3D圖像，而且無論圖像大小，支出費用都保持不變。

小結：

在深度學習技術出現(xiàn)之前，很多應用都遇到了瓶頸，進步很慢，每年只有大概的精確性提升。但隨著深度學習的進步，計算機視覺的發(fā)展經(jīng)歷了一個巨大的飛躍，技術的不斷升級也催生出了一系列跨行業(yè)的應用。隨著主流的科技巨頭入場，計算機視覺領域已經(jīng)熱鬧非凡，但如果想要開創(chuàng)出一些新的應用獲獎應用能力再進行提升，恐怕還有不短的路需要走。

https://www.toutiao.com/a6721532654291780108/

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內容（圖片、視頻和文字）以原創(chuàng)、轉載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
如何在微信訂閱號直接發(fā)外部鏈接？
下一篇新聞：
生產(chǎn)環(huán)境使用 pt-table-checksum 檢查MySQL數(shù)據(jù)一致性

猜你喜歡

AI
助
手

產(chǎn)品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網(wǎng)站二維碼

<th id="idlcb"><dd id="idlcb"><track id="idlcb"></track></dd></th>

<th id="idlcb"><dd id="idlcb"><dfn id="idlcb"></dfn></dd></th>

<strike id="idlcb"></strike>