溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python3.7?+?Yolo3怎么實(shí)現(xiàn)識別語音播報功能

發(fā)布時間:2021-12-27 09:20:03 來源:億速云 閱讀:324 作者:柒染 欄目:開發(fā)技術(shù)

這篇文章將為大家詳細(xì)講解有關(guān)Python3.7 + Yolo3怎么實(shí)現(xiàn)識別語音播報功能,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。

一、利用Python調(diào)用系統(tǒng)win10的文字轉(zhuǎn)語音

首先下載需要用到的庫:pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/

接下來直接上代碼:

import win32com.client as win

# SpVoice類是支持語音合成(TTS)的核心類。通過SpVoice對象調(diào)用TTS引擎,從而實(shí)現(xiàn)朗讀功能
speak = win.Dispatch("SAPI.SpVoice")
# 完成將文本信息轉(zhuǎn)換為語音并按照指定的參數(shù)進(jìn)行朗讀。
# 該方法有Text和Flags兩個參數(shù),分別指定要朗讀的文本和朗讀方式(同步或異步等)。
speak.Speak("come on")
speak.Speak("你好")

最后運(yùn)行代碼,就會聽到系統(tǒng)傳出來的聲音,讀出了 come on 和 你好。

二、開始使用Yolo識別,利用語音播報返回出來

開始之前我們先得解析出來Yolo3的代碼,從而獲取到被識別出來的物體標(biāo)簽。

首先我們找到一個coco_classes.txt,發(fā)現(xiàn)里面有很多的英文單詞,這些就是準(zhǔn)備識別匹配的標(biāo)簽了。

Python3.7?+?Yolo3怎么實(shí)現(xiàn)識別語音播報功能

然后我們在找到y(tǒng)olo.py,發(fā)現(xiàn)的我們的coco_classes.txt被傳入進(jìn)來了

Python3.7?+?Yolo3怎么實(shí)現(xiàn)識別語音播報功能

關(guān)鍵的來了,我們通過Ctrl + F 搜索一下classes_path這個Key,發(fā)現(xiàn)這幾行代碼

Python3.7?+?Yolo3怎么實(shí)現(xiàn)識別語音播報功能

這里就是讀取了存放標(biāo)簽的那個文本,進(jìn)行了處理,并且返回了名字。

最后找到這一行代碼,此處代碼就是一開始進(jìn)行識別的時候,我們的控制臺打印出來的代碼。

Python3.7?+?Yolo3怎么實(shí)現(xiàn)識別語音播報功能

運(yùn)行代碼的時候發(fā)現(xiàn),打印的這個label,就是識別出的物體的標(biāo)簽了。

這個時候我們就可以將我們的語音播報的代碼添加進(jìn)行,把label傳入進(jìn)去,就會發(fā)現(xiàn)識別出來的物體就會通過語音返回。

Python3.7?+?Yolo3怎么實(shí)現(xiàn)識別語音播報功能

關(guān)于Python3.7 + Yolo3怎么實(shí)現(xiàn)識別語音播報功能就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI