您好,登錄后才能下訂單哦!
Python 讀取WAV文件
import wave import struct from scipy import * from pylab import * #讀取wav文件,我這兒讀了個(gè)自己用python寫(xiě)的音階的wav filename = '1.wav' wavefile = wave.open(filename, 'r') # open for writing #讀取wav文件的四種信息的函數(shù)。期中numframes表示一共讀取了幾個(gè)frames,在后面要用到滴。 nchannels = wavefile.getnchannels() sample_width = wavefile.getsampwidth() framerate = wavefile.getframerate() numframes = wavefile.getnframes() print("channel",nchannels) print("sample_width",sample_width) print("framerate",framerate) print("numframes",numframes) #建一個(gè)y的數(shù)列,用來(lái)保存后面讀的每個(gè)frame的amplitude。 y = zeros(numframes) #for循環(huán),readframe(1)每次讀一個(gè)frame,取其前兩位,是左聲道的信息。右聲道就是后兩位啦。 #unpack是struct里的一個(gè)函數(shù),用法詳見(jiàn)http://docs.python.org/library/struct.html。簡(jiǎn)單說(shuō)來(lái)就是把#packed的string轉(zhuǎn)換成原來(lái)的數(shù)據(jù),無(wú)論是什么樣的數(shù)據(jù)都返回一個(gè)tuple。這里返回的是長(zhǎng)度為一的一個(gè) #tuple,所以我們?nèi)∷牡诹阄弧?for i in range(numframes): val = wavefile.readframes(1) left = val[0:2] #right = val[2:4] v = struct.unpack('h', left )[0] y[i] = v #framerate就是44100,文件初讀取的值。然后本程序最關(guān)鍵的一步!specgram!實(shí)在太簡(jiǎn)單了。。。 Fs = framerate specgram(y, NFFT=1024, Fs=Fs, noverlap=900) show()
補(bǔ)充知識(shí):matlab生成wav文件并用python驗(yàn)證
在進(jìn)行頻譜分析時(shí),發(fā)現(xiàn)MATLAB和python讀取wav文件的波形不一致,導(dǎo)致不能得出正確結(jié)果,為了驗(yàn)證MATLAB和python哪部分有問(wèn)題,于是有了這篇博客。
1、需求分析
用MATLAB生成一個(gè)正弦波并保存為wav文件,然后用python讀取這個(gè)wav文件畫(huà)出波形,查看python讀取出來(lái)的波形和matlab生成的波形是否一致。
2、代碼實(shí)現(xiàn)
2.1 MATLAB生成wav文件
Df=5; %頻率間隔 fs = 8000; %采樣頻率 T = 1/fs; %采樣周期 N=fs/Df; %序列點(diǎn)數(shù) time = (N-1)./fs; %第一個(gè)聲音片段的總時(shí)長(zhǎng) t=0:T:(N-1)./fs; y = sin(2*pi*200*t); %生成第一個(gè)聲音片段,注意需要用db2mag()函數(shù)把dB轉(zhuǎn)換成magnitude。 sound(y,fs) %可以播放聲音的函數(shù) sound() filename = ('sinwave.wav'); %給文件取名 plot(t,y) audiowrite(filename,y,fs) %存儲(chǔ).wav音頻文件,在這里文件名為sinwave.wav
其中生成的正弦波波形如下圖所示:
2.2 python讀取wav文件
import wave import numpy as np import pylab as plt #打開(kāi)wav文件 ,open返回一個(gè)的是一個(gè)Wave_read類(lèi)的實(shí)例,通過(guò)調(diào)用它的方法讀取WAV文件的格式和數(shù)據(jù)。 f = wave.open(r"E:\練習(xí)\音頻信號(hào)處理\spectrum.m\sinwave.wav","rb") #讀取格式信息 #一次性返回所有的WAV文件的格式信息,它返回的是一個(gè)組元(tuple):聲道數(shù), 量化位數(shù)(byte單位), 采 #樣頻率, 采樣點(diǎn)數(shù), 壓縮類(lèi)型, 壓縮類(lèi)型的描述。wave模塊只支持非壓縮的數(shù)據(jù),因此可以忽略最后兩個(gè)信息 params = f.getparams() nchannels, sampwidth, framerate, nframes = params[:4] #讀取波形數(shù)據(jù) #讀取聲音數(shù)據(jù),傳遞一個(gè)參數(shù)指定需要讀取的長(zhǎng)度(以取樣點(diǎn)為單位) str_data = f.readframes(nframes) f.close() #將波形數(shù)據(jù)轉(zhuǎn)換成數(shù)組 #需要根據(jù)聲道數(shù)和量化單位,將讀取的二進(jìn)制數(shù)據(jù)轉(zhuǎn)換為一個(gè)可以計(jì)算的數(shù)組 wave_data = np.fromstring(str_data,dtype=np.short) #通過(guò)取樣點(diǎn)數(shù)和取樣頻率計(jì)算出每個(gè)取樣的時(shí)間。 time=np.arange(0,nframes)/framerate print(params) print(wave_data.max())#找出正弦波的峰值 #time 也是一個(gè)數(shù)組,與wave_data[0]或wave_data[1]配對(duì)形成系列點(diǎn)坐標(biāo) plt.plot(time,wave_data/32768) plt.show()
python讀取wav文件顯示出來(lái)的正弦波如下圖所示:
python讀取wav文件的信息及求出波形峰值的結(jié)果如下圖所示:
我們可以看出峰值為32767(該wav文件有16bit,且?guī)б粋€(gè)符號(hào)位。215=32768215=32768 ),我們進(jìn)行歸一化處理后的到波形如下圖所示:
由上圖可以看出MATLAB生成的正弦波保存為wav文件后,python讀取該wav文件。兩種語(yǔ)言下正弦波相同。
以上這篇Python 讀取WAV音頻文件 畫(huà)頻譜的實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。