溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

發(fā)布時間:2020-08-11 00:15:09 來源:ITPUB博客 閱讀:167 作者:AIBigbull2050 欄目:互聯(lián)網(wǎng)科技
2019-10-11 12:38:37

專欄《圖像分類》正式完結啦!我們從數(shù)據(jù)集展開講解,由最基本的多類別圖像分類一步步深入到細粒度圖像分類、多標簽圖像分類,再到更加有難度的無監(jiān)督圖像分類,隨后我們又對圖像分類中面臨的各種問題展開描述,較為全面的匯總了圖像分類領域的相關內容。至此,我們再對整個圖像分類專欄的內容進行一個大總結!

作者 | 郭冰洋 言有三

編輯 | 言有三

1 數(shù)據(jù)集和經(jīng)典網(wǎng)絡的交響曲

深度學習作為數(shù)據(jù)驅動的工具,需要大量優(yōu)質的數(shù)據(jù)集才可以展開相應的工作。我們詳細總結了現(xiàn)階段圖像分類各個領域的數(shù)據(jù),并指出其適用的分類任務,為各位讀者展開相應的工作,提供了指南針。

同時,我們對經(jīng)典的圖像分類網(wǎng)絡進行了總結,詳細介紹了圖像分類發(fā)展史上的重大突破和典型的設計思想。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「圖像分類」分類專欄正式上線啦!初入CV、AI你需要一份指南針

「圖像分類」從數(shù)據(jù)集和經(jīng)典網(wǎng)絡開始

2 多類別圖像分類

多類別圖像分類是圖像分類最基本的一種,即對含有單一類別目標的圖像進行分類。多類別圖像分類現(xiàn)在已經(jīng)融入至生活的方方面面,成功的應用至人臉識別等多個領域。

構建一個完整的圖像分類任務,需要通過選擇開源框架、構建并讀取數(shù)據(jù)集、網(wǎng)絡框架搭建、訓練并調試參數(shù)、測試準確率五個步驟,本文以pytorch開源框架作為工具,白細胞作為數(shù)據(jù)集,完成了一個多類別圖像分類任務。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「圖像分類」 基于Pytorch的多類別圖像分類實戰(zhàn)

3 多標簽圖像分類

現(xiàn)實生活中的圖片中往往包含多個類別的物體,相較于多類別圖像分類,這也更加符合人的認知習慣。

多標簽圖像分類可以告知我們圖像中是否同時包含這些內容,這也能夠更好地解決實際生活中的問題。

在諸多解決方案中,通過標簽轉化的方式能夠快速的將多類別圖像分類的思想遷移到多標簽圖像分類中。在實戰(zhàn)部分,我們借助這個思想,利用ResNet 50作為基礎框架,以pascal voc數(shù)據(jù)集實現(xiàn)了多標簽圖像分類。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「技術綜述」多標簽圖像分類綜述

4 細粒度圖像分類

細粒度圖像分類是在區(qū)分出基本類別的基礎上,進行更精細的子類劃分,如區(qū)分鳥的種類、車的款式、狗的品種等,目前在工業(yè)界和實際生活中有著廣泛的業(yè)務需求和應用場景。

細粒度圖像相較于粗粒度圖像具有更加相似的外觀和特征,加之采集中存在姿態(tài)、視角、光照、遮擋、背景干擾等影響,導致數(shù)據(jù)呈現(xiàn)類間差異性大、類內差異性小的現(xiàn)象,從而使分類更加具有難度。

實戰(zhàn)部分我們通過經(jīng)典的雙線性網(wǎng)絡結構,以CUB數(shù)據(jù)集完成了一個基本的細粒度分類任務。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「圖像分類」細粒度圖像分類是什么,有什么方法,發(fā)展的怎么樣

「圖像分類」 基于Pytorch的細粒度圖像分類實戰(zhàn)

5 無監(jiān)督圖像分類

現(xiàn)階段的圖像分類任務在很大程度上是靠監(jiān)督學習實現(xiàn)的,即每個樣本都有其對應的標簽,通過深度神經(jīng)網(wǎng)絡來不斷學習每個標簽所對應的特征,并最終實現(xiàn)分類。這種情況下,數(shù)據(jù)集的容量、標簽的質量往往對模型的性能起到?jīng)Q定性的作用。

高質量數(shù)據(jù)集自然會帶來標注的困難,耗費大量的人力財力。在這種情況下,如何減少標簽信息同時保證分類精度,也成了進一步的研究目標,這也是無監(jiān)督圖像分類的發(fā)展方向。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「圖像分類」簡述無監(jiān)督圖像分類發(fā)展現(xiàn)狀

6 類別不平衡

類別不平衡是指分類任務中不同類別的訓練樣本數(shù)目相差較大的情況,通常是由于樣本較難采集或樣本示例較少而引起的,經(jīng)常出現(xiàn)在疾病類別診斷、欺詐類型判別等任務中。

本篇文章將對目前涉及到的相關解決方案進行匯總,共分為數(shù)據(jù)層面、算法層面、數(shù)據(jù)和算法混合層面三個方面,列舉具有代表性的方案闡述,以供讀者參考。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「圖像分類」 關于圖像分類中類別不平衡那些事

7 標簽噪聲

在數(shù)據(jù)集制作過程中,由于主觀、客觀的原因,會導致標簽噪聲的出現(xiàn),其存在會對最終的分類模型性能造成一定的影響。因此,在實際應用過程中,總是要對現(xiàn)有的數(shù)據(jù)集進行清洗,以避免標簽噪聲的干擾。

本文介紹了標簽噪聲的解決方式,并通過迭代訓練的方式進行實戰(zhàn)。目前還沒有一個完全高效妥善的方式可以解決這一問題,仍然處于一個研究發(fā)展的階段。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「圖像分類」 標簽噪聲對分類性能會有什么樣的影響?

8 對抗攻擊

基于深度學習的圖像分類網(wǎng)絡,大多是在精心制作的數(shù)據(jù)集下進行訓練,并完成相應的部署,對于數(shù)據(jù)集之外的圖像或稍加改造的圖像,網(wǎng)絡的識別能力往往會受到一定的影響。

在愈發(fā)重視安全信息的今天,如何提升網(wǎng)絡模型對噪聲、干擾等對抗樣本的魯棒性,是圖像分類的進一步研究目標。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「圖像分類」 圖像分類中的對抗攻擊是怎么回事?

9 可視化

覺得深度學習模型像個黑盒子?不能理解它的工作原理?那就可視化做起來,在這里我們給大家總結了圖像分類模型可視化的綜述和實戰(zhàn)案例。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「圖像分類」 實戰(zhàn)圖像分類網(wǎng)絡的可視化

「技術綜述」“看透”神經(jīng)網(wǎng)絡

10 圖像分類綜述

此外,我們還總結了圖像分類的一個綜述,用于幫助大家理解不同層級的的圖像分類的原理,這也是本專欄開設前的一篇總結文章。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「技術綜述」你真的了解圖像分類嗎?

11 圖像分類模型架構

去年我們還總結了12期主流的深度學習模型架構的解讀,其中的大部分內容都是圖像分類模型,供初學者方便進行系統(tǒng)性學習。如果想了解更多的千奇百怪的模型架構,可以申請加入有三AI知識星球,幾百期內容等你來讀。

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「完結」總結12大CNN主流模型架構設計思想

12 主流開源框架分類項目

為了讓大家更加容易上手,有三AI開源了12大深度學習開源框架的圖像分類項目,從數(shù)據(jù)準備,模型定義,可視化,訓練和測試,圖文教程和代碼俱全,你還在等什么呢?

「完結」16篇圖像分類干貨文章總結,從理論到實踐全流程大盤點

「完結」給新手的12大深度學習開源框架快速入門項目

總結

幾個月的時間來,在自己的努力和三哥的指導下,圖像分類專欄終于完結了。希望各位能夠在專欄中有所收獲,得到一點提升。同時,非常感謝大家對我提出的意見和指導,這些都令我受益匪淺。

這段時間對于我自己來說是一個自我提升、不斷突破的階段。不僅鞏固了自己的基礎知識,也收獲了非常多的經(jīng)歷。這些經(jīng)歷讓我明白,踏踏實實做事,向著目標不斷努力,就一定會有收獲。

最后,還是送給大家專欄開始的那段話:

有志者,事竟成,百二秦關終屬楚。

苦心人,天不負,三千越甲可吞吳。

https://www.toutiao.com/i6746400270978122253/

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI