溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

使用python腳本進(jìn)行文本轉(zhuǎn)換的方法

發(fā)布時(shí)間:2020-11-13 10:05:40 來(lái)源:億速云 閱讀:309 作者:小新 欄目:編程語(yǔ)言

小編給大家分享一下使用python腳本進(jìn)行文本轉(zhuǎn)換的方法,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

語(yǔ)音識(shí)別通常有以下流程:

接收語(yǔ)音,比如通過(guò)電話等方式

對(duì)接收到的語(yǔ)音做處理,將聲音轉(zhuǎn)化為電子信號(hào)

通過(guò)模擬數(shù)字轉(zhuǎn)換器將模擬形式的連續(xù)電子信號(hào)轉(zhuǎn)換為數(shù)字形式的離散信號(hào)

轉(zhuǎn)換成數(shù)字信號(hào)后,模型便可以將音頻轉(zhuǎn)換為文本了

Python 庫(kù)

pip install SpeechRecognition

將音頻文件轉(zhuǎn)換為文本

導(dǎo)入語(yǔ)音識(shí)別庫(kù)

初始化識(shí)別類(lèi),以便識(shí)別語(yǔ)音。

支持語(yǔ)音識(shí)的音頻文件格式:wav, AIFF, AIFF-C, FLAC Wav,AIFF,AIFF-c,F(xiàn)LAc.在這個(gè)例子中我們使用wav文件.

我用的是一段電影音頻剪輯,里邊說(shuō)的話是:"I don’t know who you are,I don’t know what you want, if you’re looking for ransom,I can tell you I don’t have money"

默認(rèn)情況下,谷歌識(shí)別器讀取的是英語(yǔ)。

具體代碼如下所示:

#import library
import speech_recognition as sr
 
# Initialize recognizer class (for recognizing the speech)
r = sr.Recognizer()
 
# Reading Audio file as source
# listening the audio file and store in audio_text variable
 
with sr.AudioFile('I-dont-know.wav') as source:
    
    audio_text = r.listen(source)
    
# recoginize_() method will throw a request error if the API is unreachable, hence using exception handling
    try:
        
        # using google speech recognition
        text = r.recognize_google(audio_text)
        print('Converting audio transcripts into text ...')
        print(text)
     
    except:
         print('Sorry.. run again...')

以上是使用python腳本進(jìn)行文本轉(zhuǎn)換的方法的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI