溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

python如何實(shí)現(xiàn)播放音頻和錄音功能

發(fā)布時(shí)間：2021-04-09 11:28:04 來源：億速云閱讀：1261 作者：小新欄目：開發(fā)技術(shù)

小編給大家分享一下python如何實(shí)現(xiàn)播放音頻和錄音功能，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

音頻預(yù)處理

這一講主要介紹些音頻基本處理方式，為接下來的語音識(shí)別打基礎(chǔ)。

三種播放音頻的方式

使用 python 播放音頻有以下幾種方式：

os.system()

os.system(file) 調(diào)用系統(tǒng)應(yīng)用來打開文件，file 可為圖片或者音頻文件。

缺點(diǎn)：要打開具體的應(yīng)用，不能在后臺(tái)播放音頻。

pyaudio

安裝：pip install pyaudio

官方提供了播放音頻與錄音的 api ，使用十分方便，只要把Filename更改為你的音頻文件的文字，就可以播放音頻了。

"""PyAudio Example: Play a WAVE file."""

import pyaudio
import wave


CHUNK = 1024
FILENAME = '你的音頻文件'

def play(filename = FILENAME):
 wf = wave.open(filename, 'rb')

 p = pyaudio.PyAudio()

 stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
   channels=wf.getnchannels(),
   rate=wf.getframerate(),
   output=True)

 data = wf.readframes(CHUNK)

 while data != b'':
 stream.write(data)
 data = wf.readframes(CHUNK)

 stream.stop_stream()
 stream.close()

 p.terminate()

jupyter notebook

在 jupyer notebook 中播放音頻可以使用以下函數(shù)：

import IPython.display as ipd
ipd.Audio(文件名)

幾種讀取音頻的方式

python 有很多讀取音頻文件的方法，內(nèi)置的庫 wave ，科學(xué)計(jì)算庫 scipy, 和方便易用的語音處理庫 librosa。
下面將介紹分別使用這幾種庫讀取音頻文件：

安裝：

wave 是內(nèi)置庫直接導(dǎo)入即可。
scipy: pip install scipy
librosa: pip install librosa

使用：

wave.open:

參數(shù) path 為文件名，mode 為打開方式

以'rb'方式打開文件返回一個(gè) Wave_read 對象，而以'wb'方式打開文件返回一個(gè) Wave_write 對象。

scipy.io.wavfile:

參數(shù) path 為文件名

返回 rate : 采樣率（每秒采樣點(diǎn)的個(gè)數(shù)），data : 音頻數(shù)據(jù)

librosa.load:

參數(shù) path 為文件名

返回 y 為音頻數(shù)據(jù)，sr 為采樣率

# read wav file from path
from scipy.io import wavfile
import librosa
import pyaudio

# wave
file = wave.open(path,'rb')
# wavfile
rate, data = wavfile.read(path)
# librosa
y, sr = librosa.load(path)

下面演示一個(gè)使用 wavfile 讀取音頻文件并且畫出波形的例子：

首先要計(jì)算音頻到底持續(xù)了多長時(shí)間，wave 的 shape 就是總的采樣點(diǎn)個(gè)數(shù)，除以采樣頻率可以得到持續(xù)的總時(shí)間（秒），乘1000得到總持續(xù)時(shí)間（毫秒）。接著通過 np.linsapce 產(chǎn)生時(shí)間的序列，最后使用 matplotlib 畫出圖像。

from scipy.io import wavfile
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

# 一秒采樣數(shù)
sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')
sample_number = wave.shape[0]
total_time = int(sample_number / sr * 1000)
time_series = np.linspace(0,total_time,sample_number)
fig, ax = plt.subplots(1, 1)
ax.plot(time_series, wave)
ax.set_title('Time*Amplitude')
ax.set_xlabel('Time/ms')
ax.set_ylabel('Amplitude/dB')

python如何實(shí)現(xiàn)播放音頻和錄音功能

最后再借用 pyaudio 的 api 我們可以實(shí)現(xiàn)連續(xù)錄音功能：

python 實(shí)現(xiàn)錄音功能

其中，函數(shù) multi_record每結(jié)束一次錄音會(huì)詢問 “是否進(jìn)行下一次錄音？”，按回車就可以進(jìn)行下一次錄音了。

import wave
import pyaudio
import matplotlib.pyplot as plt
import time

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5


def record(filename='output.wav'):
 """官方錄音教程
 """
 
 p = pyaudio.PyAudio()
 
 stream = p.open(format=FORMAT,
   channels=CHANNELS,
   rate=RATE,
   input=True,
   frames_per_buffer=CHUNK)
 
 print("* recording")
 
 frames = []

 for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
 data = stream.read(CHUNK)
 frames.append(data)
 
 print("* done recording")
 
 stream.stop_stream()
 stream.close()
 p.terminate()
 
 wf = wave.open(filename, 'wb')
 wf.setnchannels(CHANNELS)
 wf.setsampwidth(p.get_sample_size(FORMAT))
 wf.setframerate(RATE)
 wf.writeframes(b''.join(frames))
 wf.close()


def multi_record(num=3):
 """implement 多次錄音"""
 for i in range(1,num+1):
 print('第{}次錄音準(zhǔn)備'.format(i))
 filename = 'record_{}.wav'.format(i)
 record(filename)
 time.sleep(second)
 _ = input('進(jìn)行下一次錄音？')


def main():
 multi_record()

if __name__ == '__main__':
 main()

以上是“python如何實(shí)現(xiàn)播放音頻和錄音功能”這篇文章的所有內(nèi)容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內(nèi)容對大家有所幫助，如果還想學(xué)習(xí)更多知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
python怎么實(shí)現(xiàn)生成字符串大小寫字母和數(shù)字的各種組合
下一篇新聞：
使用Python實(shí)現(xiàn)KMeans聚類算法的案例

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼