您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關(guān)Python怎么實(shí)現(xiàn)識(shí)別圖片內(nèi)容的內(nèi)容。小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過(guò)來(lái)看看吧。
本文實(shí)例講述了Python實(shí)現(xiàn)識(shí)別圖片內(nèi)容的方法。分享給大家供大家參考,具體如下:
python識(shí)別圖片內(nèi)容。
這里我的環(huán)境為windows64位,python2.7.14
需要用到PIL模塊和tesseract模塊。
首先需要安裝pip包管理,安裝方法可參考附錄windows下安裝python包管理器pip
安裝PIL模塊:
pip install Pillow
tesseract模塊安裝:
pip install pytesseract
安裝識(shí)別引擎和中文語(yǔ)言包,點(diǎn)擊此處本站下載。
下載完成解壓:
1.雙擊tesseract-ocr-setup-3.02.02.exe安裝,安裝完成后,需要指定tesseract模塊識(shí)別引擎的程序路徑,打開python安裝路徑的模塊路徑,我的路徑為:E:\wamp\python\Lib\site-packages\,進(jìn)入pytesseract,編輯pytesseract.py文件,修改 tesseract_cmd = 'tesseract'
的內(nèi)容:
# tesseract_cmd = 'tesseract' # 修改為安裝Tesseract-OCR的真實(shí)路徑
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'
2.進(jìn)入解壓包中的中文語(yǔ)言包,復(fù)制chi_sim.traineddata到Tesseract-OCR安裝目錄下tessdata文件夾下,我的路徑:E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata
環(huán)境配置完成。
python代碼:
# -*- coding: UTF-8 -*- from PIL import Image import pytesseract # 識(shí)別中文 text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim') print text # 識(shí)別英文 text = pytesseract.image_to_string(Image.open('english.png')) print text
附:windows下安裝python包管理器pip
windows下安裝python包管理器pip。
pip下載地址:https://pypi.python.org/pypi/pip#downloads
選擇 pip-9.0.1.tar.gz (md5, pgp)
下載完成解壓,這里我解壓到D:\python\pip-9.0.1,命令行進(jìn)入D:\python\pip-9.0.1
cd D:\python\pip-9.0.1
安裝pip
python setup.py install
安裝完成,輸入pip list
查看是否成功
pip list
顯示下面信息代表安裝成功:
pip (9.0.1)
setuptools (28.8.0)
pip安裝模塊命令:
pip install xxx
感謝各位的閱讀!關(guān)于“Python怎么實(shí)現(xiàn)識(shí)別圖片內(nèi)容”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。