PaddleOCR如何對(duì)大量圖片進(jìn)行批量文本識(shí)別

小億
284
2024-04-07 17:27:37

PaddleOCR可以通過(guò)編寫簡(jiǎn)單的Python腳本來(lái)實(shí)現(xiàn)對(duì)大量圖片進(jìn)行批量文本識(shí)別。以下是一個(gè)示例代碼,演示如何使用PaddleOCR對(duì)指定目錄下的所有圖片進(jìn)行批量文本識(shí)別:

import os
from paddleocr import PaddleOCR, draw_ocr

ocr = PaddleOCR()

# 指定需要識(shí)別文本的圖片目錄
img_dir = 'path/to/your/image/directory'

# 獲取目錄下所有圖片文件名
img_files = [f for f in os.listdir(img_dir) if f.endswith('.jpg') or f.endswith('.png')]

for img_file in img_files:
    img_path = os.path.join(img_dir, img_file)
    result = ocr.ocr(img_path, cls=True)

    for line in result:
        print('Detected text:', ''.join([word[0] for word in line[1]]))
        print('Confidence:', line[1][0][-1])
        
    # 可以根據(jù)需要將識(shí)別結(jié)果保存到文件中
    output_file = 'path/to/save/{}.txt'.format(os.path.splitext(img_file)[0])
    with open(output_file, 'w', encoding='utf-8') as f:
        for line in result:
            f.write(''.join([word[0] for word in line[1]]) + '\n')

在上面的示例代碼中,首先導(dǎo)入PaddleOCR模塊,然后實(shí)例化一個(gè)PaddleOCR對(duì)象。接著指定需要識(shí)別文本的圖片目錄,獲取該目錄下所有圖片文件名,并遍歷每個(gè)圖片文件進(jìn)行文本識(shí)別。最后,將識(shí)別結(jié)果打印出來(lái),并可選擇保存到文件中。

通過(guò)這種方式,您可以輕松地對(duì)大量圖片進(jìn)行批量文本識(shí)別,并將結(jié)果保存到文件中,以供后續(xù)分析和處理。

0