溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

利用python怎么對系統(tǒng)聲音進(jìn)行錄制

發(fā)布時間:2020-12-21 15:23:34 來源:億速云 閱讀:395 作者:Leah 欄目:開發(fā)技術(shù)

本篇文章給大家分享的是有關(guān)利用python怎么對系統(tǒng)聲音進(jìn)行錄制,小編覺得挺實用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

環(huán)境準(zhǔn)備

python

  • wave

  • pyaudio

wave 可以通過pip直接install,在安裝pyaudio時,通過正常的pip install 直接安裝一直處于報錯階段,后來想到可以通過輪子直接安裝。

在pypi提供的安裝包中有對應(yīng)的安裝包,注意,不僅僅是python2和python3的區(qū)別,python3的小版本也有點差別。可杯具的是,小主電腦里裝的是python3.8,后來想到還有一個網(wǎng)站可以安裝pythonlibs,找到對應(yīng)的版本后,下載下來。直接在文件所在目錄,或者在安裝中指定文件目錄中執(zhí)行安裝

pip install /c/Users/root/Downloads/PyAudio-0.2.11-cp38-cp38-win_amd64.whl

代碼和運行

def audio_record(out_file, rec_time):
  CHUNK = 1024
  FORMAT = pyaudio.paInt16 # 16bit編碼格式
  CHANNELS = 1 # 單聲道
  RATE = 16000 # 16000采樣頻率
  p = pyaudio.PyAudio()
  # 創(chuàng)建音頻流
  dev_idx = findInternalRecordingDevice(p)
  stream = p.open(format=FORMAT, # 音頻流wav格式
          channels=CHANNELS, # 單聲道
          rate=RATE, # 采樣率16000
          input=True,
          input_device_index=dev_idx, # 指定內(nèi)錄設(shè)備的id,可以不寫,使用win的默認(rèn)錄音設(shè)備
          frames_per_buffer=CHUNK)
  print("Start Recording...")
  frames = [] # 錄制的音頻流
  # 錄制音頻數(shù)據(jù)
  for i in range(0, int(RATE / CHUNK * rec_time)): # 控制錄音時間
    data = stream.read(CHUNK)
    frames.append(data)
  # 錄制完成
  stream.stop_stream()
  stream.close()
  p.terminate()
  print("Recording Done...")
  # 保存音頻文件
  wf = wave.open(out_file, 'wb')
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  wf.writeframes(b''.join(frames))
  wf.close()

在使用默認(rèn)錄音設(shè)備時,發(fā)現(xiàn)是話筒錄音,效果并不是太理想,所以就去查查能不能直接錄系統(tǒng)的聲音。

def findInternalRecordingDevice(p):
  # 要找查的設(shè)備名稱中的關(guān)鍵字
  target = '立體聲混音'
  # 逐一查找聲音設(shè)備
  for i in range(p.get_device_count()):
    devInfo = p.get_device_info_by_index(i)
    print(devInfo)
    if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
      # print('已找到內(nèi)錄設(shè)備,序號是 ',i)
      return i
  print('無法找到內(nèi)錄設(shè)備!')
  return -1

可以使用p.get_device_info_by_index()去查看系統(tǒng)有關(guān)聲音的設(shè)備,通過設(shè)置為立體聲混音就可以錄制系統(tǒng)聲音。

保存聲音

def save(fileName):
  # 創(chuàng)建pyAudio對象
  p = pyaudio.PyAudio()
  # 打開用于保存數(shù)據(jù)的文件
  wf = wave.open(fileName, 'wb')
  # 設(shè)置音頻參數(shù)
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  # 寫入數(shù)據(jù)
  wf.writeframes(b''.join(_frames))
  # 關(guān)閉文件
  wf.close()
  # 結(jié)束pyaudio
  p.terminate()

保存聲音是通過上述代碼進(jìn)行保存,此處的_frames是個list,是通過每錄一個chunk(數(shù)據(jù)流塊),就把這一塊的數(shù)據(jù)添加進(jìn)去

然后只需要重新創(chuàng)建PyAudio對象,把這個list轉(zhuǎn)為字節(jié)串保存到文件中就可以了

問題

上述一般可以錄到系統(tǒng)聲音,但在執(zhí)行的時候發(fā)現(xiàn),并不能。

原因是:win的輸入設(shè)備中沒有配置立體聲混音

設(shè)置步驟:

  • 在win的聲音調(diào)節(jié)出,右擊打開聲音設(shè)置

  • 找到管理聲音設(shè)備

  • 在輸入設(shè)備處啟用立體聲混音

就此,就完成了錄制系統(tǒng)聲音的需求

注意

上述操作,可以外放,可以插入3.5mm耳機,但系統(tǒng)靜音和tpye-c耳機插入的時候不能錄到聲音

完整代碼

import os
import pyaudio
import threading
import wave
import time
from datetime import datetime

# 需要系統(tǒng)打開立體聲混音

# 錄音類
class Recorder():
  def __init__(self, chunk=1024, channels=2, rate=44100):
    self.CHUNK = chunk
    self.FORMAT = pyaudio.paInt16
    self.CHANNELS = channels
    self.RATE = rate
    self._running = True
    self._frames = []

  # 獲取內(nèi)錄設(shè)備序號,在windows操作系統(tǒng)上測試通過,hostAPI = 0 表明是MME設(shè)備
  def findInternalRecordingDevice(self, p):
    # 要找查的設(shè)備名稱中的關(guān)鍵字
    target = '立體聲混音'
    # 逐一查找聲音設(shè)備
    for i in range(p.get_device_count()):
      devInfo = p.get_device_info_by_index(i)
      # print(devInfo)
      if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
        # print('已找到內(nèi)錄設(shè)備,序號是 ',i)
        return i
    print('無法找到內(nèi)錄設(shè)備!')
    return -1

  # 開始錄音,開啟一個新線程進(jìn)行錄音操作
  def start(self):
    threading._start_new_thread(self.__record, ())

  # 執(zhí)行錄音的線程函數(shù)
  def __record(self):
    self._running = True
    self._frames = []

    p = pyaudio.PyAudio()
    # 查找內(nèi)錄設(shè)備
    dev_idx = self.findInternalRecordingDevice(p)
    if dev_idx < 0:
      return
    # 在打開輸入流時指定輸入設(shè)備
    stream = p.open(input_device_index=dev_idx,
            format=self.FORMAT,
            channels=self.CHANNELS,
            rate=self.RATE,
            input=True,
            frames_per_buffer=self.CHUNK)
    # 循環(huán)讀取輸入流
    while (self._running):
      data = stream.read(self.CHUNK)
      self._frames.append(data)

    # 停止讀取輸入流
    stream.stop_stream()
    # 關(guān)閉輸入流
    stream.close()
    # 結(jié)束pyaudio
    p.terminate()
    return

  # 停止錄音
  def stop(self):
    self._running = False

  # 保存到文件
  def save(self, fileName):
    # 創(chuàng)建pyAudio對象
    p = pyaudio.PyAudio()
    # 打開用于保存數(shù)據(jù)的文件
    wf = wave.open(fileName, 'wb')
    # 設(shè)置音頻參數(shù)
    wf.setnchannels(self.CHANNELS)
    wf.setsampwidth(p.get_sample_size(self.FORMAT))
    wf.setframerate(self.RATE)
    # 寫入數(shù)據(jù)
    wf.writeframes(b''.join(self._frames))
    # 關(guān)閉文件
    wf.close()
    # 結(jié)束pyaudio
    p.terminate()


if __name__ == "__main__":

  # 檢測當(dāng)前目錄下是否有record子目錄
  if not os.path.exists('record'):
    os.makedirs('record')

  print("\npython 錄音機 ....\n")
  print("提示:按 r 鍵并回車 開始錄音\n")

  i = input('請輸入操作碼:')
  if i == 'r':
    rec = Recorder()
    begin = time.time()

    print("\n開始錄音,按 s 鍵并回車 停止錄音,自動保存到 record 子目錄\n")
    rec.start()

    running = True
    while running:
      i = input("請輸入操作碼:")
      if i == 's':
        running = False
        print("錄音已停止")
        rec.stop()
        t = time.time() - begin
        print('錄音時間為%ds' % t)
        # 以當(dāng)前時間為關(guān)鍵字保存wav文件
        rec.save("record/rec_" + datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".wav")

以上就是利用python怎么對系統(tǒng)聲音進(jìn)行錄制,小編相信有部分知識點可能是我們?nèi)粘9ぷ鲿姷交蛴玫降摹OM隳芡ㄟ^這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI