溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

使用Python3怎么獲取圖片文字中的中文

發(fā)布時(shí)間:2021-02-18 16:27:57 來源:億速云 閱讀:144 作者:Leah 欄目:開發(fā)技術(shù)

使用Python3怎么獲取圖片文字中的中文?相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。

一、運(yùn)行環(huán)境

(1) win10

(2) pycharm

(3) python 3.5

(4) pillow與pytesseract庫安裝:

pip3 install pillow
pip3 install pytesseract

(5)  識(shí)別引擎tesseract-ocr ,下載之后解壓安裝,下載地址:https://www.jb51.net/softs/538925.html

二、 運(yùn)行代碼

# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
#上面都是導(dǎo)包,只需要下面這一行就能實(shí)現(xiàn)圖片文字識(shí)別
text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #設(shè)置為中文文字的識(shí)別
#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng')  #設(shè)置為英文或阿拉伯字母的識(shí)別
print(text)

三、報(bào)錯(cuò)解決

1.FileNotFoundError:[WinError 2]系統(tǒng)找不到指定文件。

解決辦法:

打開文件pytesseract.py,找到如下代碼,將tesseract_cmd的值修改為全路徑,再次使用就不會(huì)報(bào)這個(gè)錯(cuò)了。

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr

解決辦法:

打開文件pytesseract.py,找到image_to_string,指定config的參數(shù),如下:

tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):

看完上述內(nèi)容,你們掌握使用Python3怎么獲取圖片文字中的中文的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI