您好,登錄后才能下訂單哦!
小編給大家分享一下python如何實(shí)現(xiàn)播放音頻和錄音功能,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
音頻預(yù)處理
這一講主要介紹些音頻基本處理方式,為接下來的語音識(shí)別打基礎(chǔ)。
三種播放音頻的方式
使用 python 播放音頻有以下幾種方式:
os.system()
os.system(file) 調(diào)用系統(tǒng)應(yīng)用來打開文件,file 可為圖片或者音頻文件。
缺點(diǎn):要打開具體的應(yīng)用,不能在后臺(tái)播放音頻。
pyaudio
安裝:pip install pyaudio
官方提供了播放音頻與錄音的 api ,使用十分方便,只要把Filename更改為你的音頻文件的文字,就可以播放音頻了。
"""PyAudio Example: Play a WAVE file.""" import pyaudio import wave CHUNK = 1024 FILENAME = '你的音頻文件' def play(filename = FILENAME): wf = wave.open(filename, 'rb') p = pyaudio.PyAudio() stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), channels=wf.getnchannels(), rate=wf.getframerate(), output=True) data = wf.readframes(CHUNK) while data != b'': stream.write(data) data = wf.readframes(CHUNK) stream.stop_stream() stream.close() p.terminate()
jupyter notebook
在 jupyer notebook 中播放音頻可以使用以下函數(shù):
import IPython.display as ipd ipd.Audio(文件名)
幾種讀取音頻的方式
python 有很多讀取音頻文件的方法,內(nèi)置的庫 wave ,科學(xué)計(jì)算庫 scipy, 和方便易用的語音處理庫 librosa。
下面將介紹分別使用這幾種庫讀取音頻文件:
安裝:
wave 是內(nèi)置庫直接導(dǎo)入即可。
scipy: pip install scipy
librosa: pip install librosa
使用:
wave.open:
參數(shù) path 為文件名,mode 為打開方式
以'rb'方式打開文件返回一個(gè) Wave_read 對象,而以'wb'方式打開文件返回一個(gè) Wave_write 對象。
scipy.io.wavfile:
參數(shù) path 為文件名
返回 rate : 采樣率(每秒采樣點(diǎn)的個(gè)數(shù)),data : 音頻數(shù)據(jù)
librosa.load:
參數(shù) path 為文件名
返回 y 為音頻數(shù)據(jù),sr 為采樣率
# read wav file from path from scipy.io import wavfile import librosa import pyaudio # wave file = wave.open(path,'rb') # wavfile rate, data = wavfile.read(path) # librosa y, sr = librosa.load(path)
下面演示一個(gè)使用 wavfile 讀取音頻文件并且畫出波形的例子:
首先要計(jì)算音頻到底持續(xù)了多長時(shí)間,wave 的 shape 就是總的采樣點(diǎn)個(gè)數(shù),除以采樣頻率可以得到持續(xù)的總時(shí)間(秒),乘1000得到總持續(xù)時(shí)間(毫秒)。接著通過 np.linsapce 產(chǎn)生時(shí)間的序列,最后使用 matplotlib 畫出圖像。
from scipy.io import wavfile import matplotlib.pyplot as plt import numpy as np %matplotlib inline # 一秒采樣數(shù) sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav') sample_number = wave.shape[0] total_time = int(sample_number / sr * 1000) time_series = np.linspace(0,total_time,sample_number) fig, ax = plt.subplots(1, 1) ax.plot(time_series, wave) ax.set_title('Time*Amplitude') ax.set_xlabel('Time/ms') ax.set_ylabel('Amplitude/dB')
最后再借用 pyaudio 的 api 我們可以實(shí)現(xiàn)連續(xù)錄音功能:
python 實(shí)現(xiàn)錄音功能
其中,函數(shù) multi_record每結(jié)束一次錄音會(huì)詢問 “是否進(jìn)行下一次錄音?”,按回車就可以進(jìn)行下一次錄音了。
import wave import pyaudio import matplotlib.pyplot as plt import time CHUNK = 1024 FORMAT = pyaudio.paInt16 CHANNELS = 2 RATE = 44100 RECORD_SECONDS = 5 def record(filename='output.wav'): """官方錄音教程 """ p = pyaudio.PyAudio() stream = p.open(format=FORMAT, channels=CHANNELS, rate=RATE, input=True, frames_per_buffer=CHUNK) print("* recording") frames = [] for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)): data = stream.read(CHUNK) frames.append(data) print("* done recording") stream.stop_stream() stream.close() p.terminate() wf = wave.open(filename, 'wb') wf.setnchannels(CHANNELS) wf.setsampwidth(p.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b''.join(frames)) wf.close() def multi_record(num=3): """implement 多次錄音""" for i in range(1,num+1): print('第{}次錄音準(zhǔn)備'.format(i)) filename = 'record_{}.wav'.format(i) record(filename) time.sleep(second) _ = input('進(jìn)行下一次錄音?') def main(): multi_record() if __name__ == '__main__': main()
以上是“python如何實(shí)現(xiàn)播放音頻和錄音功能”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。