Python中可以使用OCR(Optical Character Recognition,光學(xué)字符識別)庫來實(shí)現(xiàn)識別圖片中的文字。下面是一個(gè)使用Tesseract庫進(jìn)行OCR識別的示例代碼:
import pytesseract
from PIL import Image
# 讀取圖片
image = Image.open('image.png')
# 使用Tesseract進(jìn)行OCR識別
text = pytesseract.image_to_string(image, lang='eng')
# 輸出識別的文字
print(text)
在上面的代碼中,首先需要安裝Tesseract庫和Pillow庫:
pip install pytesseract
pip install Pillow
然后,通過Image.open
函數(shù)打開圖片,并使用pytesseract.image_to_string
函數(shù)將圖片中的文字識別出來。lang
參數(shù)可以指定識別的語言,默認(rèn)為英語。
需要注意的是,使用Tesseract進(jìn)行OCR識別需要提前安裝Tesseract OCR引擎。具體安裝方法可以參考Tesseract的官方文檔。