溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python如何實(shí)現(xiàn)播放音頻和錄音功能

發(fā)布時(shí)間:2021-04-09 11:28:04 來源:億速云 閱讀:1261 作者:小新 欄目:開發(fā)技術(shù)

小編給大家分享一下python如何實(shí)現(xiàn)播放音頻和錄音功能,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

音頻預(yù)處理

這一講主要介紹些音頻基本處理方式,為接下來的語音識(shí)別打基礎(chǔ)。

三種播放音頻的方式

使用 python 播放音頻有以下幾種方式:

os.system()

os.system(file) 調(diào)用系統(tǒng)應(yīng)用來打開文件,file 可為圖片或者音頻文件。

缺點(diǎn):要打開具體的應(yīng)用,不能在后臺(tái)播放音頻。

pyaudio

安裝:pip install pyaudio

官方提供了播放音頻與錄音的 api ,使用十分方便,只要把Filename更改為你的音頻文件的文字,就可以播放音頻了。

"""PyAudio Example: Play a WAVE file."""

import pyaudio
import wave


CHUNK = 1024
FILENAME = '你的音頻文件'

def play(filename = FILENAME):
 wf = wave.open(filename, 'rb')

 p = pyaudio.PyAudio()

 stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
   channels=wf.getnchannels(),
   rate=wf.getframerate(),
   output=True)

 data = wf.readframes(CHUNK)

 while data != b'':
 stream.write(data)
 data = wf.readframes(CHUNK)

 stream.stop_stream()
 stream.close()

 p.terminate()

jupyter notebook

在 jupyer notebook 中播放音頻可以使用以下函數(shù):

import IPython.display as ipd
ipd.Audio(文件名)

幾種讀取音頻的方式

python 有很多讀取音頻文件的方法,內(nèi)置的庫 wave ,科學(xué)計(jì)算庫 scipy, 和方便易用的語音處理庫 librosa。
下面將介紹分別使用這幾種庫讀取音頻文件:

安裝:

  • wave 是內(nèi)置庫直接導(dǎo)入即可。

  • scipy: pip install scipy

  • librosa: pip install librosa

使用:

wave.open:

參數(shù) path 為文件名,mode 為打開方式

以'rb'方式打開文件返回一個(gè) Wave_read 對象,而以'wb'方式打開文件返回一個(gè) Wave_write 對象。

scipy.io.wavfile:

參數(shù) path 為文件名

返回 rate : 采樣率(每秒采樣點(diǎn)的個(gè)數(shù)),data : 音頻數(shù)據(jù)

librosa.load:

參數(shù) path 為文件名

返回 y 為音頻數(shù)據(jù),sr 為采樣率

# read wav file from path
from scipy.io import wavfile
import librosa
import pyaudio

# wave
file = wave.open(path,'rb')
# wavfile
rate, data = wavfile.read(path)
# librosa
y, sr = librosa.load(path)

下面演示一個(gè)使用 wavfile 讀取音頻文件并且畫出波形的例子:

首先要計(jì)算音頻到底持續(xù)了多長時(shí)間,wave 的 shape 就是總的采樣點(diǎn)個(gè)數(shù),除以采樣頻率可以得到持續(xù)的總時(shí)間(秒),乘1000得到總持續(xù)時(shí)間(毫秒)。接著通過 np.linsapce 產(chǎn)生時(shí)間的序列,最后使用 matplotlib 畫出圖像。

from scipy.io import wavfile
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

# 一秒采樣數(shù)
sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')
sample_number = wave.shape[0]
total_time = int(sample_number / sr * 1000)
time_series = np.linspace(0,total_time,sample_number)
fig, ax = plt.subplots(1, 1)
ax.plot(time_series, wave)
ax.set_title('Time*Amplitude')
ax.set_xlabel('Time/ms')
ax.set_ylabel('Amplitude/dB')

python如何實(shí)現(xiàn)播放音頻和錄音功能

最后再借用 pyaudio 的 api 我們可以實(shí)現(xiàn)連續(xù)錄音功能:

python 實(shí)現(xiàn)錄音功能

其中,函數(shù) multi_record每結(jié)束一次錄音會(huì)詢問 “是否進(jìn)行下一次錄音?”,按回車就可以進(jìn)行下一次錄音了。

import wave
import pyaudio
import matplotlib.pyplot as plt
import time

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5


def record(filename='output.wav'):
 """官方錄音教程
 """
 
 p = pyaudio.PyAudio()
 
 stream = p.open(format=FORMAT,
   channels=CHANNELS,
   rate=RATE,
   input=True,
   frames_per_buffer=CHUNK)
 
 print("* recording")
 
 frames = []

 for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
 data = stream.read(CHUNK)
 frames.append(data)
 
 print("* done recording")
 
 stream.stop_stream()
 stream.close()
 p.terminate()
 
 wf = wave.open(filename, 'wb')
 wf.setnchannels(CHANNELS)
 wf.setsampwidth(p.get_sample_size(FORMAT))
 wf.setframerate(RATE)
 wf.writeframes(b''.join(frames))
 wf.close()


def multi_record(num=3):
 """implement 多次錄音"""
 for i in range(1,num+1):
 print('第{}次錄音準(zhǔn)備'.format(i))
 filename = 'record_{}.wav'.format(i)
 record(filename)
 time.sleep(second)
 _ = input('進(jìn)行下一次錄音?')


def main():
 multi_record()

if __name__ == '__main__':
 main()

以上是“python如何實(shí)現(xiàn)播放音頻和錄音功能”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI