溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python怎么構(gòu)建和部署字母識別系統(tǒng)

發(fā)布時間:2021-12-27 13:52:56 來源:億速云 閱讀:146 作者:iii 欄目:大數(shù)據(jù)

本篇內(nèi)容介紹了“python怎么構(gòu)建和部署字母識別系統(tǒng)”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

卷積神經(jīng)網(wǎng)絡(luò)

讓我們從理解什么是卷積神經(jīng)網(wǎng)絡(luò)開始。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種廣泛應(yīng)用于圖像識別和分類的神經(jīng)網(wǎng)絡(luò)。

cnn是多層感知器的正則化版本。多層感知器通常是指全連接網(wǎng)絡(luò),即一層中的每個神經(jīng)元都與下一層的所有神經(jīng)元相連。

CNN由以下層組成:

卷積層:一個大小為3X3或5X5的“核”被傳遞到圖像上,并計算原始像素值與內(nèi)核中定義的權(quán)重的點積。然后,該矩陣通過一個激活函數(shù)“ReLu”,該函數(shù)將矩陣中的每個負(fù)值轉(zhuǎn)換為零。

python怎么構(gòu)建和部署字母識別系統(tǒng)

池化層:“池化矩陣”的大小有2X2或4X4,通過池化減小矩陣的大小,從而只突出圖像的重要特征。

共有兩種類型的池操作:

  1. 最大池是一種池類型,池化矩陣中存在的最大值被放入最終矩陣中。

  2. 平均池(Average Pooling)是一種池類型,其中計算池化矩陣中所有值的平均值并將其放入最終矩陣中。

python怎么構(gòu)建和部署字母識別系統(tǒng)

注意:CNN架構(gòu)中可以有多個卷積層和池層的組合,以提高其性能。

全連接層:最后的矩陣被展平成一維向量。然后將該向量輸入神經(jīng)網(wǎng)絡(luò)。最后,輸出層是附加到圖像上的不同標(biāo)簽(例如字母a、b、c)的概率列表。最高概率的標(biāo)簽是分類器的輸出。

python怎么構(gòu)建和部署字母識別系統(tǒng)

CNN實現(xiàn)

讓我們通過導(dǎo)入Jupyter Notebook中的庫開始實現(xiàn),如下所示:

import numpy as np
import matplotlib.pyplot as plt
from keras.preprocessing.image import ImageDataGenerator
from keras.preprocessing import image
import keras
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Activation
import os
import pickle

然后,讓我們從a到z導(dǎo)入包含圖像的2個數(shù)據(jù)集,以訓(xùn)練和測試我們的模型。

train_datagen = ImageDataGenerator(rescale = 1./255,
                                   shear_range = 0.2,
                                   zoom_range = 0.2,
                                   horizontal_flip = True)

test_datagen = ImageDataGenerator(rescale = 1./255)

train_generator = train_datagen.flow_from_directory(
    directory = 'Training',
    target_size = (32,32),
    batch_size = 32,
    class_mode = 'categorical'

)

test_generator = test_datagen.flow_from_directory(
    directory = 'Testing',
    target_size = (32,32),
    batch_size = 32,
    class_mode = 'categorical'

)

ImageDataGenerator生成一批張量圖像數(shù)據(jù),通過使用rescale進(jìn)行縮放,將0-255范圍內(nèi)的RGB系數(shù)轉(zhuǎn)換為0到1之間的目標(biāo)值。

shear_range用于隨機(jī)應(yīng)用剪切變換。

zoom_range用于在圖片內(nèi)部隨機(jī)縮放。

horizontal_flip用于水平隨機(jī)翻轉(zhuǎn)一半圖像。

然后我們使用**.flow_from_directory**從目錄中逐個導(dǎo)入圖像,并對其應(yīng)用ImageDataGenerator。

然后,我們將圖像從原始大小轉(zhuǎn)換為目標(biāo)大小,并聲明batch大小,它是指在一次迭代中使用的訓(xùn)練示例的數(shù)量。

然后我們將class_mode設(shè)置為category,這表示我們有多個類(a到z)可以預(yù)測。

接下來我們構(gòu)建我們的CNN架構(gòu)。

model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape = (32,32,3), activation = 'relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))


model.add(Conv2D(32, (3, 3), activation = 'relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Flatten())
model.add(Dense(units = 128, activation = 'relu'))
model.add(Dense(units = 26, activation = 'softmax'))


model.compile(optimizer = 'adam', loss = 'categorical_crossentropy', metrics = ['accuracy'])

model.summary()

我們首先創(chuàng)建一個Sequential模型,它允許我們使用.add函數(shù)逐層定義CNN架構(gòu)。

我們首先在輸入圖像上添加一個帶有32個3X3大小的濾波器(核)的卷積層,并將其通過“relu”激活函數(shù)。

然后我們使用大小為2X2的池執(zhí)行MaxPooling操作。

然后再次重復(fù)這些層以提高模型的性能。

最后,我們將得到的矩陣展平并通過一個由128個節(jié)點組成的全連接層。然后將其連接到由26個節(jié)點組成的輸出層,每個節(jié)點代表一個字母表。我們使用softmax激活將分?jǐn)?shù)轉(zhuǎn)換成一個正態(tài)化的概率分布,并選擇概率最高的節(jié)點作為輸出。

一旦我們的CNN架構(gòu)被定義,我們就使用adam優(yōu)化器編譯模型。

最后,我們對模型進(jìn)行訓(xùn)練。

model.fit_generator(train_generator,
                         steps_per_epoch = 16,
                         epochs = 3,
                         validation_data = test_generator,
                         validation_steps = 16)

模型訓(xùn)練后的準(zhǔn)確率為:93.42%

現(xiàn)在讓我們來測試我們的模型。但是在我們這樣做之前,我們需要定義一個函數(shù),它給我們與結(jié)果相關(guān)聯(lián)的字母表。

def get_result(result):
    if result[0][0] == 1:
        return('a')
    elif result[0][1] == 1:
        return ('b')
    elif result[0][2] == 1:
        return ('c')
    elif result[0][3] == 1:
        return ('d')
    elif result[0][4] == 1:
        return ('e')
    elif result[0][5] == 1:
        return ('f')
    elif result[0][6] == 1:
        return ('g')
    elif result[0][7] == 1:
        return ('h')
    elif result[0][8] == 1:
        return ('i')
    elif result[0][9] == 1:
        return ('j')
    elif result[0][10] == 1:
        return ('k')
    elif result[0][11] == 1:
        return ('l')
    elif result[0][12] == 1:
        return ('m')
    elif result[0][13] == 1:
        return ('n')
    elif result[0][14] == 1:
        return ('o')
    elif result[0][15] == 1:
        return ('p')
    elif result[0][16] == 1:
        return ('q')
    elif result[0][17] == 1:
        return ('r')
    elif result[0][18] == 1:
        return ('s')
    elif result[0][19] == 1:
        return ('t')
    elif result[0][20] == 1:
        return ('u')
    elif result[0][21] == 1:
        return ('v')
    elif result[0][22] == 1:
        return ('w')
    elif result[0][23] == 1:
        return ('x')
    elif result[0][24] == 1:
        return ('y')
    elif result[0][25] == 1:
        return ('z')

最后,讓我們測試一下我們的模型:

filename = r'Testing\e\25.png'
test_image = image.load_img(filename, target_size = (32,32))
plt.imshow(test_image)

test_image = image.img_to_array(test_image)
test_image = np.expand_dims(test_image, axis = 0)
result = model.predict(test_image)
result = get_result(result)
print ('Predicted Alphabet is: {}'.format(result))

該模型正確地預(yù)測了輸入圖像的字母,結(jié)果為“e”。

Anvil集成

Anvil是一個允許我們使用python構(gòu)建全棧web應(yīng)用程序的平臺。它使我們更容易將機(jī)器學(xué)習(xí)模型從Jupyter Notebook轉(zhuǎn)換成web應(yīng)用程序。

讓我們首先在anvil上創(chuàng)建一個帳戶。完成后,用material design創(chuàng)建一個新的空白應(yīng)用程序。

查看此鏈接,了解如何使用anvil的逐步教程:https://anvil.works/learn

右邊的工具箱包含所有可以拖到網(wǎng)站上的組件。

所需組件:

  • 2個標(biāo)簽(標(biāo)題和子標(biāo)題)

  • 圖像(顯示輸入圖像)

  • FileLoader(上傳輸入圖像)

  • 突出顯示按鈕(用于預(yù)測結(jié)果)

  • 標(biāo)簽(查看結(jié)果)

拖放這些組件并根據(jù)你的要求排列它們。

要添加標(biāo)題和副標(biāo)題,請在右側(cè)的“屬性”部分選擇標(biāo)簽和,然后轉(zhuǎn)到名為“文本”的選項,如下所示(以紅色突出顯示),然后鍵入標(biāo)題/副標(biāo)題。

python怎么構(gòu)建和部署字母識別系統(tǒng)

完成用戶界面后,進(jìn)入上面所示的代碼部分(以綠色突出顯示)并創(chuàng)建一個新函數(shù),如下所示

def primary_color_1_click(self, **event_args):
      file = self.file_loader_1.file
      self.image_1.source = file
      result = anvil.server.call('model_run',file)
      self.label_3.text = result
      pass

當(dāng)我們按下“PREDICT”按鈕時,將執(zhí)行此函數(shù)。它將獲取從文件加載程序上傳的輸入圖像并將其傳遞到Jupyter Notebook的“model_run”函數(shù)。此函數(shù)將返回預(yù)測字母。

現(xiàn)在要做的就是把我們的anvil網(wǎng)站連接到Jupyter Notebook。

這需要執(zhí)行以下兩個步驟:

  1. 導(dǎo)入Anvil上行鏈路(uplink)密鑰:單擊設(shè)置按鈕,然后單擊上行鏈路,單擊啟用上行鏈路密鑰并復(fù)制密鑰。

python怎么構(gòu)建和部署字母識別系統(tǒng)

在Jupyter Notebook內(nèi)粘貼以下內(nèi)容:

import anvil.server
import anvil.media
anvil.server.connect("paste your anvil uplink key here")
  1. 創(chuàng)建一個“model_run”函數(shù)來預(yù)測上傳到網(wǎng)站中的圖像。

    @anvil.server.callable
    def model_run(path):
        with anvil.media.TempFile(path) as filename:
            test_image = image.load_img(filename, target_size = (32,32))
            test_image = image.img_to_array(test_image)
            test_image = np.expand_dims(test_image, axis = 0)
            result = model.predict(test_image)
            result = get_result(result)
            return ('Predicted Alphabet is: {}'.format(result))


現(xiàn)在你可以回到anvil,點擊run按鈕,字母識別系統(tǒng)就完全完成了。

“python怎么構(gòu)建和部署字母識別系統(tǒng)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI