溫馨提示×

Python怎么實(shí)現(xiàn)識別圖片中的文字

小億
168
2024-01-29 15:01:56
欄目: 編程語言

Python中可以使用OCR(Optical Character Recognition,光學(xué)字符識別)庫來實(shí)現(xiàn)識別圖片中的文字。下面是一個(gè)使用Tesseract庫進(jìn)行OCR識別的示例代碼:

import pytesseract
from PIL import Image

# 讀取圖片
image = Image.open('image.png')

# 使用Tesseract進(jìn)行OCR識別
text = pytesseract.image_to_string(image, lang='eng')

# 輸出識別的文字
print(text)

在上面的代碼中,首先需要安裝Tesseract庫和Pillow庫:

pip install pytesseract
pip install Pillow

然后,通過Image.open函數(shù)打開圖片,并使用pytesseract.image_to_string函數(shù)將圖片中的文字識別出來。lang參數(shù)可以指定識別的語言,默認(rèn)為英語。

需要注意的是,使用Tesseract進(jìn)行OCR識別需要提前安裝Tesseract OCR引擎。具體安裝方法可以參考Tesseract的官方文檔。

0