您好,登錄后才能下訂單哦!
這篇文章給大家介紹怎么用Tensorflow完成手寫數(shù)字識(shí)別,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。
深度學(xué)習(xí)最經(jīng)典的任務(wù)問(wèn)題就是分類。通過(guò)分類,我們可以將照片中的數(shù)字,人臉,動(dòng)植物等等分到它屬于的那一類當(dāng)中,完成識(shí)別。接下來(lái),我就帶著大家一起完成一個(gè)簡(jiǎn)單的程序,來(lái)實(shí)現(xiàn)經(jīng)典問(wèn)題手寫數(shù)字識(shí)別。
數(shù)據(jù)集
我們第一步需要收集一堆手寫數(shù)據(jù),并且將每個(gè)手寫數(shù)字都標(biāo)號(hào)類別,用來(lái)做成數(shù)據(jù)集。對(duì)于深度學(xué)習(xí)而言,一般的數(shù)據(jù)集大小至少上萬(wàn)起。所以收集數(shù)據(jù)這個(gè)工作還是比較繁瑣的。不過(guò)呢,有人已經(jīng)幫我們弄好了數(shù)據(jù)集,這就是鼎鼎有名的MNIST數(shù)據(jù)集。
MNIST數(shù)據(jù)集是一個(gè)標(biāo)準(zhǔn)的手寫數(shù)據(jù)集,如上圖所示,數(shù)據(jù)集里面有六萬(wàn)個(gè)手寫數(shù)字且都標(biāo)記完全。其中有五萬(wàn)個(gè)手寫數(shù)字作為訓(xùn)練集,另外一萬(wàn)作為測(cè)試集。
這里有一份傳送門:
http://yann.lecun.com/exdb/mnist/
我們并不需要事先下載MNIST數(shù)據(jù)集,Tensorflow幾行代碼就可以搞定:
搭建網(wǎng)絡(luò)
準(zhǔn)備好了數(shù)據(jù)集之后,我們開始用Tensorflow搭建神經(jīng)網(wǎng)絡(luò)模型:
1.輸入輸出
tf.placeholder是占位符的意思,先把坑填好,之后會(huì)有數(shù)據(jù)填充進(jìn)去。其中y_是輸入對(duì)應(yīng)的正確的數(shù)字標(biāo)簽,x就是手寫數(shù)字照片。
2.網(wǎng)絡(luò)主體
我們建立了一個(gè)四層全連接網(wǎng)絡(luò),每一層的網(wǎng)絡(luò)寬度都是400。因?yàn)镸NIST數(shù)據(jù)集的數(shù)字照片都是28*28的,所以第一層網(wǎng)絡(luò)的權(quán)重的形狀是[784,400],注意到我們使用了Dropout技術(shù),所以代碼中有tf.nn.dropout。對(duì)于最后一層我們用softmax技術(shù),將對(duì)0-9數(shù)字的預(yù)測(cè)歸一化,變成一個(gè)概率。
3.損失函數(shù)和優(yōu)化器
對(duì)于損失函數(shù),我們選擇了平方差函數(shù),其實(shí)就是線性規(guī)劃。而優(yōu)化器我們選擇了Adam,是目前主流的優(yōu)化器。
訓(xùn)練網(wǎng)絡(luò)
1.初始化
我們?cè)谶@里做了兩件事情,一個(gè)是初始化網(wǎng)絡(luò)中變量,第二個(gè)建立一個(gè)存儲(chǔ)器,用來(lái)存儲(chǔ)訓(xùn)練過(guò)程的一些變量。
2.訓(xùn)練
第一行的循環(huán)是控制循環(huán)的次數(shù),我們使用了隨機(jī)梯度訓(xùn)練,就是每次更新參數(shù)的時(shí)候并不是一次性把五萬(wàn)張照片一起塞進(jìn)去,而是從中隨機(jī)選出來(lái)作為一個(gè)batch來(lái)訓(xùn)練,這樣的做的好處是可以大大減輕計(jì)算量。我們需要在每一步都在訓(xùn)練集上面訓(xùn)練來(lái)更新網(wǎng)絡(luò)的參數(shù),接著我們一定步驟后在測(cè)試集上面看看我們的訓(xùn)練效果。
3.執(zhí)行程序
才開始訓(xùn)練集和測(cè)試集上的準(zhǔn)確率是在10%附近,這是因?yàn)樵诰W(wǎng)絡(luò)的參數(shù)沒(méi)有更新的時(shí)候,所有參數(shù)都是隨機(jī)的,相當(dāng)于我們?cè)谙共?。一共有十個(gè)數(shù)字,所以猜對(duì)的概率是十分之一。之后,隨著訓(xùn)練的進(jìn)行,訓(xùn)練集和測(cè)試集上的準(zhǔn)確率都在增加。我們同時(shí)觀察訓(xùn)練集和測(cè)試集上的準(zhǔn)確率,是防止網(wǎng)絡(luò)過(guò)擬合把我們欺騙了。
訓(xùn)練到一定步時(shí),我們發(fā)現(xiàn)訓(xùn)練集的準(zhǔn)確率已經(jīng)接近百分之百了,測(cè)試集上的準(zhǔn)確率也達(dá)到了百分之九十七以上。簡(jiǎn)簡(jiǎn)單單的四層就能做到如此之高的準(zhǔn)確率,可見神經(jīng)網(wǎng)絡(luò)之神奇!
關(guān)于怎么用Tensorflow完成手寫數(shù)字識(shí)別就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。