您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關Python如何將文字轉(zhuǎn)成語音并讀出來,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
環(huán)境
Python版本:Anaconda 4.4.10
操作系統(tǒng):win10
注意:在使用第三方庫的時候,不同的操作系統(tǒng)和Python版本代碼可能有所差別。
調(diào)用api
可以調(diào)用第三方的語音合成api生成音頻文件,然后再播放音頻文件即可,這里我使用的是百度語音合成api。
1、注冊賬號創(chuàng)建應用
在使用之前,需要先注冊一個百度賬號,然后再創(chuàng)建一個語音合成的api,需要拷貝AppID、API Key、Secret Key后面調(diào)用接口的時候需要使用。
2、調(diào)用語音合成接口
python調(diào)用百度語音合成api接口詳細文檔:http://yuyin.baidu.com/docs/tts/196
3、安裝百度提供的Python庫:
如果已安裝pip,執(zhí)行pip install baidu-aip即可。
如果已安裝setuptools,執(zhí)行python setup.py install即可。
from aip import AipSpeech """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) result = client.synthesis('你好嗎?', 'zh', 1, { 'vol': 5, }) # 識別正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼 if not isinstance(result, dict): with open('auido.mp3', 'wb') as f: f.write(result)
播放音頻文件
安裝playsound:pip install playsound
from playsound import playsound playsound("auido.mp3")
利用系統(tǒng)內(nèi)置語音引擎實現(xiàn)發(fā)音
1. Pyttsx
Pyttsx是一個跨平臺將文字轉(zhuǎn)成語音的第三方庫,它對操作系統(tǒng)內(nèi)置的語音引擎實現(xiàn)了包裝。
Pyttsx安裝
Python2:pip install pyttsx
Python3:pip install pyttsx3
代碼
import pyttsx3 engine = pyttsx3.init() engine.say("Good") engine.runAndWait()
pyttsx默認使用的是讀取英文引擎,如果需要讀取中文時需要修改語言設置,不然可能會報錯或者無法發(fā)音,首先我們需要參考系統(tǒng)支持的語言類型和參數(shù),通過以下代碼可以查看
engine = pyttsx3.init() voices = engine.getProperty("voices") for item in voices: print(item.id,item.languages)
可以看到ZH-CN的參數(shù),表示的是中文,然后將代碼修改成如下即可
engine = pyttsx3.init() engine.setProperty("voice","HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Sp eech\Voices\Tokens\TTS_MS_ZH-CN_HUIHUI_11.0") engine.say("你好嗎?") engine.runAndWait()
2. gTTS
gTTS可以將文字轉(zhuǎn)成語音進行保存為MP3格式,然后再讀取語音實現(xiàn)發(fā)音,它是通過調(diào)用Google提供的TTS服務來實現(xiàn)將文字轉(zhuǎn)語音的,因為需要調(diào)用Google的服務,所以需要翻墻,因為缺少環(huán)境所以下面的代碼是沒有測試過的。調(diào)用下面代碼的時候,需要設置在代碼中設置代碼或者全局代理。
from gtts import gTTS import os tts = gTTS(text="come on",lang="en") tts.save("test.mp3") os.system("mpg321 test.mp3")
如果需要生成wav格式的音頻文件,可以利用FFmpeg將MP3的音頻文件轉(zhuǎn)成wav格式。
操作系統(tǒng)內(nèi)置引擎
利用win32com來調(diào)用Windows操作系統(tǒng)內(nèi)置的語音引擎實現(xiàn)文字的發(fā)音
關于“Python如何將文字轉(zhuǎn)成語音并讀出來”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。