溫馨提示×

python如何捕捉屏幕上的文字

小億
300
2023-10-17 02:32:41
欄目: 編程語言

要捕捉屏幕上的文字,你可以使用Python中的pytesseract庫。pytesseract是一個OCR(光學(xué)字符識別)庫,可以用于提取圖像中的文字。
首先,確保你已經(jīng)安裝了pytesseract庫。你可以使用以下命令在命令提示符或終端中安裝它:

pip install pytesseract

然后,你需要安裝并配置tesseract OCR引擎。你可以在https://github.com/tesseract-ocr/tesseract下載并安裝它。
以下是一個示例代碼,演示如何使用pytesseract捕捉屏幕上的文字:

import pyautogui
import pytesseract
# 設(shè)置tesseract OCR引擎的路徑,如果你的安裝路徑不同,請相應(yīng)修改
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files/Tesseract-OCR/tesseract.exe'
# 使用pyautogui模塊截取屏幕上的一部分圖像
image = pyautogui.screenshot(region=(100, 100, 300, 300))
# 將截取的圖像保存為臨時文件
image_path = 'temp.png'
image.save(image_path)
# 使用pytesseract識別圖像中的文字
text = pytesseract.image_to_string(image_path)
# 輸出識別到的文字
print(text)
# 刪除臨時文件
os.remove(image_path)

此代碼將在屏幕上的(100, 100)位置開始,截取300x300像素大小的圖像。然后,它將圖像保存為臨時文件,并使用pytesseract進(jìn)行OCR處理,提取其中的文字。最后,它會輸出識別到的文字。
請注意,這個示例代碼假設(shè)你已經(jīng)安裝了pytesseract和tesseract OCR,并且指定了正確的tesseract_cmd路徑。如果你的安裝路徑不同,請相應(yīng)修改該路徑。

0