溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python如何將文字轉(zhuǎn)成語音并讀出來

發(fā)布時間:2021-07-16 13:55:04 來源:億速云 閱讀:173 作者:小新 欄目:開發(fā)技術

這篇文章將為大家詳細講解有關Python如何將文字轉(zhuǎn)成語音并讀出來,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

環(huán)境

Python版本:Anaconda 4.4.10

操作系統(tǒng):win10

注意:在使用第三方庫的時候,不同的操作系統(tǒng)和Python版本代碼可能有所差別。

調(diào)用api

可以調(diào)用第三方的語音合成api生成音頻文件,然后再播放音頻文件即可,這里我使用的是百度語音合成api。

1、注冊賬號創(chuàng)建應用

在使用之前,需要先注冊一個百度賬號,然后再創(chuàng)建一個語音合成的api,需要拷貝AppID、API Key、Secret Key后面調(diào)用接口的時候需要使用。

Python如何將文字轉(zhuǎn)成語音并讀出來

2、調(diào)用語音合成接口

python調(diào)用百度語音合成api接口詳細文檔:http://yuyin.baidu.com/docs/tts/196

3、安裝百度提供的Python庫:

如果已安裝pip,執(zhí)行pip install baidu-aip即可。

如果已安裝setuptools,執(zhí)行python setup.py install即可。

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

result = client.synthesis('你好嗎?', 'zh', 1, {
 'vol': 5,
})
# 識別正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼
if not isinstance(result, dict):
 with open('auido.mp3', 'wb') as f:
  f.write(result)

播放音頻文件

安裝playsound:pip install playsound

from playsound import playsound

playsound("auido.mp3")

利用系統(tǒng)內(nèi)置語音引擎實現(xiàn)發(fā)音

1. Pyttsx

Pyttsx是一個跨平臺將文字轉(zhuǎn)成語音的第三方庫,它對操作系統(tǒng)內(nèi)置的語音引擎實現(xiàn)了包裝。

Pyttsx安裝

Python2:pip install pyttsx

Python3:pip install pyttsx3

代碼

import pyttsx3

engine = pyttsx3.init()
engine.say("Good")
engine.runAndWait()

pyttsx默認使用的是讀取英文引擎,如果需要讀取中文時需要修改語言設置,不然可能會報錯或者無法發(fā)音,首先我們需要參考系統(tǒng)支持的語言類型和參數(shù),通過以下代碼可以查看

engine = pyttsx3.init()
voices = engine.getProperty("voices")
for item in voices:
 print(item.id,item.languages)

Python如何將文字轉(zhuǎn)成語音并讀出來

可以看到ZH-CN的參數(shù),表示的是中文,然后將代碼修改成如下即可

engine = pyttsx3.init()
engine.setProperty("voice","HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Sp
 eech\Voices\Tokens\TTS_MS_ZH-CN_HUIHUI_11.0")
engine.say("你好嗎?")
engine.runAndWait()

2. gTTS

gTTS可以將文字轉(zhuǎn)成語音進行保存為MP3格式,然后再讀取語音實現(xiàn)發(fā)音,它是通過調(diào)用Google提供的TTS服務來實現(xiàn)將文字轉(zhuǎn)語音的,因為需要調(diào)用Google的服務,所以需要翻墻,因為缺少環(huán)境所以下面的代碼是沒有測試過的。調(diào)用下面代碼的時候,需要設置在代碼中設置代碼或者全局代理。

from gtts import gTTS
import os

tts = gTTS(text="come on",lang="en")
tts.save("test.mp3")
os.system("mpg321 test.mp3")

如果需要生成wav格式的音頻文件,可以利用FFmpeg將MP3的音頻文件轉(zhuǎn)成wav格式。

操作系統(tǒng)內(nèi)置引擎

利用win32com來調(diào)用Windows操作系統(tǒng)內(nèi)置的語音引擎實現(xiàn)文字的發(fā)音

關于“Python如何將文字轉(zhuǎn)成語音并讀出來”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI