溫馨提示×

怎么用python提取圖片中的文字

小億
145
2024-04-08 14:38:39
欄目: 編程語言

要在Python中提取圖像中的文字,您可以使用一個(gè)名為Tesseract的OCR(光學(xué)字符識別)引擎。以下是使用Tesseract和Python提取圖像中的文字的示例代碼:

首先,您需要安裝Tesseract OCR引擎和Python的Pytesseract庫。您可以使用以下命令來安裝這些依賴項(xiàng):

pip install pytesseract

接下來,您需要安裝Tesseract OCR引擎。您可以從以下鏈接下載并安裝Tesseract OCR:https://github.com/tesseract-ocr/tesseract

安裝完這些依賴項(xiàng)后,可以使用以下Python代碼來提取圖像中的文字:

import pytesseract
from PIL import Image

# 打開圖像文件
img = Image.open('image.jpg')

# 使用Tesseract提取文字
text = pytesseract.image_to_string(img)

# 打印提取的文字
print(text)

以上代碼將打開名為image.jpg的圖像文件,然后使用Tesseract OCR引擎提取圖像中的文字,并將提取的文字打印到控制臺上。

請注意,Tesseract的準(zhǔn)確性可能會受到圖像質(zhì)量、文字字體和大小等因素的影響。在使用Tesseract提取文字之前,建議您先對圖像進(jìn)行預(yù)處理(如調(diào)整亮度、對比度、裁剪等),以提高提取準(zhǔn)確性。

0