溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Python如何將文字轉(zhuǎn)成語音并讀出來

發(fā)布時間：2021-07-16 13:55:04 來源：億速云閱讀：173 作者：小新欄目：開發(fā)技術

這篇文章將為大家詳細講解有關Python如何將文字轉(zhuǎn)成語音并讀出來，小編覺得挺實用的，因此分享給大家做個參考，希望大家閱讀完這篇文章后可以有所收獲。

環(huán)境

Python版本：Anaconda 4.4.10

操作系統(tǒng)：win10

注意：在使用第三方庫的時候，不同的操作系統(tǒng)和Python版本代碼可能有所差別。

調(diào)用api

可以調(diào)用第三方的語音合成api生成音頻文件，然后再播放音頻文件即可，這里我使用的是百度語音合成api。

1、注冊賬號創(chuàng)建應用

在使用之前，需要先注冊一個百度賬號，然后再創(chuàng)建一個語音合成的api，需要拷貝AppID、API Key、Secret Key后面調(diào)用接口的時候需要使用。

Python如何將文字轉(zhuǎn)成語音并讀出來

2、調(diào)用語音合成接口

python調(diào)用百度語音合成api接口詳細文檔:http://yuyin.baidu.com/docs/tts/196

3、安裝百度提供的Python庫：

如果已安裝pip，執(zhí)行pip install baidu-aip即可。

如果已安裝setuptools，執(zhí)行python setup.py install即可。

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

result = client.synthesis('你好嗎？', 'zh', 1, {
 'vol': 5,
})
# 識別正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼
if not isinstance(result, dict):
 with open('auido.mp3', 'wb') as f:
  f.write(result)

播放音頻文件

安裝playsound：pip install playsound

from playsound import playsound

playsound("auido.mp3")

利用系統(tǒng)內(nèi)置語音引擎實現(xiàn)發(fā)音

1. Pyttsx

Pyttsx是一個跨平臺將文字轉(zhuǎn)成語音的第三方庫，它對操作系統(tǒng)內(nèi)置的語音引擎實現(xiàn)了包裝。

Pyttsx安裝

Python2：pip install pyttsx

Python3：pip install pyttsx3

代碼

import pyttsx3

engine = pyttsx3.init()
engine.say("Good")
engine.runAndWait()

pyttsx默認使用的是讀取英文引擎，如果需要讀取中文時需要修改語言設置，不然可能會報錯或者無法發(fā)音，首先我們需要參考系統(tǒng)支持的語言類型和參數(shù)，通過以下代碼可以查看

engine = pyttsx3.init()
voices = engine.getProperty("voices")
for item in voices:
 print(item.id,item.languages)

Python如何將文字轉(zhuǎn)成語音并讀出來

可以看到ZH-CN的參數(shù)，表示的是中文，然后將代碼修改成如下即可

engine = pyttsx3.init()
engine.setProperty("voice","HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Sp
 eech\Voices\Tokens\TTS_MS_ZH-CN_HUIHUI_11.0")
engine.say("你好嗎？")
engine.runAndWait()

2. gTTS

gTTS可以將文字轉(zhuǎn)成語音進行保存為MP3格式，然后再讀取語音實現(xiàn)發(fā)音，它是通過調(diào)用Google提供的TTS服務來實現(xiàn)將文字轉(zhuǎn)語音的，因為需要調(diào)用Google的服務，所以需要翻墻，因為缺少環(huán)境所以下面的代碼是沒有測試過的。調(diào)用下面代碼的時候，需要設置在代碼中設置代碼或者全局代理。

from gtts import gTTS
import os

tts = gTTS(text="come on",lang="en")
tts.save("test.mp3")
os.system("mpg321 test.mp3")

如果需要生成wav格式的音頻文件，可以利用FFmpeg將MP3的音頻文件轉(zhuǎn)成wav格式。

操作系統(tǒng)內(nèi)置引擎

利用win32com來調(diào)用Windows操作系統(tǒng)內(nèi)置的語音引擎實現(xiàn)文字的發(fā)音

關于“Python如何將文字轉(zhuǎn)成語音并讀出來”這篇文章就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，使各位可以學到更多知識，如果覺得文章不錯，請把它分享出去讓更多的人看到。

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
ASP.NET中 Request 、Response 與Server如何使用
下一篇新聞：
Web開發(fā)中客戶端跳轉(zhuǎn)與服務器端跳轉(zhuǎn)有什么區(qū)別

猜你喜歡

AI
助
手

產(chǎn)品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網(wǎng)站二維碼

<strong id="0xfmi"></strong>

<nobr id="0xfmi"><td id="0xfmi"><tr id="0xfmi"></tr></td></nobr>