<table id="zlale"><wbr id="zlale"><ins id="zlale"></ins></wbr></table>

<center id="zlale"><listing id="zlale"></listing></center>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

python怎么實現(xiàn)圖片轉文字

發(fā)布時間：2023-03-25 10:30:52 來源：億速云閱讀：99 作者：iii 欄目：開發(fā)技術

本文小編為大家詳細介紹“python怎么實現(xiàn)圖片轉文字”，內(nèi)容詳細，步驟清晰，細節(jié)處理妥當，希望這篇“python怎么實現(xiàn)圖片轉文字”文章能幫助大家解決疑惑，下面跟著小編的思路慢慢深入，一起來學習新知識吧。

python圖片轉文字

用python+Tesseract-OCR做了一個圖片轉文字的小工具，GUI設計使用tkinter庫的控件

界面及效果見下圖：

python怎么實現(xiàn)圖片轉文字

python怎么實現(xiàn)圖片轉文字

#進一步優(yōu)化  1. 底部添加label   2.對識別后的文本處理，去空格


from PIL import Image as PImage
from PIL import ImageTk
import pytesseract
from tkinter import *
from tkinter import filedialog
from tkinter.scrolledtext import ScrolledText
import re

# 將圖片內(nèi)容翻譯為文字，顯示在文本框內(nèi)
def trans():
    contents.delete('1.0', END)
    transTxt = pytesseract.image_to_string(PImage.open(filePath.get()),lang='chi_sim')
    #對transTxt進行處理  去空格，換行符去重
    transTxt = transTxt.strip('\n\r')   #無參數(shù)可以刪除開頭結尾的空格\n\t\r
    print(transTxt)
    contents.insert( INSERT, transTxt.replace(' ','').replace('\n\n','\n').replace('\r',''))

#打開圖片文件，顯示路徑，并將圖片展現(xiàn)
def openfile():
    filename.delete('1.0', END)
    filePath.set(filedialog.askopenfilename())
    filename.insert(1.0,filePath.get())
    org_img = PImage.open(filePath.get())
    #調(diào)整圖片顯示大小 600*800
    w,h = org_img.size
    if w>600:
        h=int(h*600/w)
        w=600
    if h>800:
        w=int(w*800/h)
        h=800
    img = ImageTk.PhotoImage(org_img.resize((w,h)))
    showPic.config(image=img)
    showPic.image = img       #保持一個引用才能顯示圖片，tkinter的BUG
    

#設置主窗口
top = Tk()
top.title("OCR圖片轉文字  引擎：Tesseract-OCR  Made by: kaivis")
#top.iconbitmap("./pic/y1.ico")
top.geometry("1200x800")

filePath=StringVar()

bt_img1 = ImageTk.PhotoImage( file= "./pic/Outbox1.png")
bt_img2 = ImageTk.PhotoImage( file= "./pic/bt_img2.png")

#第一個窗體
frame1 = Frame (top, relief=RAISED, borderwidth=2)
frame1.pack(side=TOP, fill=BOTH,  ipady=5, expand=0)
Label(frame1,height=1,text="圖片路徑：").pack(side=LEFT)
filename = Text(frame1,height=2)
filename.pack(side=LEFT,padx=1, pady=0,expand=True, fill=X)
Button(frame1,text="打開文件", image=bt_img1, command=openfile).pack(side=LEFT,padx=5, pady=0)
Button(frame1,text="中文識別", image=bt_img2, command=trans).pack(side=LEFT,padx=5, pady=0)

#第二個窗體
frame2 = Frame (top, relief=RAISED, borderwidth=2)
frame2.pack (side=LEFT, fill=BOTH,  expand=1)
Label(frame2,text='圖片顯示：',borderwidth=5).pack(side=TOP,padx=20,pady=5)
showPic = Label(frame2,text='圖片顯示區(qū)')
showPic.pack(side=BOTTOM,expand=1,fill=BOTH)

#第三個窗體
frame3 = Frame (top)
frame3.pack (side=RIGHT, fill=BOTH,  expand=1)
#contents = ScrolledText(frame3)
Label(frame3,text='識別結果：',borderwidth=5).pack(side=TOP,padx=20,pady=10)
contents = Text(frame3,font=('Arial',15))
contents.pack(side=TOP,expand=1,fill=BOTH)
Label(frame3,text='Copyright 2021 baidu.com ALL Rights Reserved',borderwidth=5).pack(side=BOTTOM,padx=20,pady=10)

top.mainloop()

存在的問題：

識別率不高，對緊密型的漢字更是難以做到較高的準確率，有沒有更好的OCR引擎呢
識別后的文字已經(jīng)做了去空格處理，文本可以進一步優(yōu)化，特別是多余的換行符需要處理

python截圖轉文字功能

由于在網(wǎng)上找資料時，經(jīng)常遇到文章無法復制的情況，為了能夠快速copy想要的文字，于是就想寫一個python程序去實現(xiàn)截圖轉文字的功能。

python怎么實現(xiàn)圖片轉文字

1. 思路

首先要有記錄鍵盤的功能(讓程序知道你在截圖) - keyboard庫截圖后需要接收圖像 - ImageGrab庫獲取圖像后要進行文字識別 - 百度AI文字識別API

2. 實現(xiàn)

2.1 導入相關庫

python怎么實現(xiàn)圖片轉文字

2.2 創(chuàng)建類，并編寫實現(xiàn)截圖保存的函數(shù)

由于我使用的是win10自帶的截圖軟件，所以截圖熱鍵為‘win+shift+s’，大家可以根據(jù)截圖軟件的不同自由更改。

python怎么實現(xiàn)圖片轉文字

2.3 編寫圖片轉文字的函數(shù)

先去百度智能云官網(wǎng)申請一個圖像識別的API。

python怎么實現(xiàn)圖片轉文字

將參數(shù)寫入程序：

python怎么實現(xiàn)圖片轉文字

編寫轉文字函數(shù)：

python怎么實現(xiàn)圖片轉文字

2.5 運行

使用時創(chuàng)建類，調(diào)用兩個函數(shù)即可：

python怎么實現(xiàn)圖片轉文字

2.6 效果

運行程序，隨意在百度文庫的一篇文章里截一張圖：

python怎么實現(xiàn)圖片轉文字

結果如下：

python怎么實現(xiàn)圖片轉文字

注意：

由2.6運行結果可知，效果還是不錯的。完美解決了我當前的需求。

讀到這里，這篇“python怎么實現(xiàn)圖片轉文字”文章已經(jīng)介紹完畢，想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領會，如果想了解更多相關內(nèi)容的文章，歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權內(nèi)容。

上一篇新聞：
jquery追加元素的方法有哪些
下一篇新聞：
MySQL同步數(shù)據(jù)Replication如何實現(xiàn)

猜你喜歡

AI
助
手

產(chǎn)品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網(wǎng)站二維碼