溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在python中調(diào)用百度REST API實現(xiàn)語音識別

發(fā)布時間:2021-06-01 17:36:08 來源:億速云 閱讀:167 作者:Leah 欄目:開發(fā)技術(shù)

怎么在python中調(diào)用百度REST API實現(xiàn)語音識別?相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。

創(chuàng)建應用

打開 http://yuyin.baidu.com/app ,點擊創(chuàng)建應用,應用名稱自己取,選擇合適的應用類型。下一步,服務類型選擇語音識別,繼續(xù)點擊下一步,然后就可以關(guān)閉了。

刷新當前頁面,你就可以看到自己創(chuàng)建的應用,點擊查看key,這些是進行身份識別的關(guān)鍵信息。

代碼編寫

在 http://yuyin.baidu.com/docs/asr/54 可以查看官方文檔,百度提供了兩種方法:隱式發(fā)送是將音頻數(shù)據(jù)打包轉(zhuǎn)換成一個字符串,放到json數(shù)據(jù)包中來發(fā)送;顯示發(fā)送則是直接發(fā)送語音數(shù)據(jù)。本代碼使用隱式發(fā)送。

注意:使用前要將你的應用信息填入適當位置

#!/usr/bin/env python
# coding: utf-8
import urllib2
import json
import base64
import os

#設置應用信息
baidu_server = "https://openapi.baidu.com/oauth/2.0/token?"
grant_type = "client_credentials"
client_id = "" #填寫API Key
client_secret = "" #填寫Secret Key

#合成請求token的URL
url = baidu_server+"grant_type="+grant_type+"&client_id="+client_id+"&client_secret="+client_secret

#獲取token
res = urllib2.urlopen(url).read()
data = json.loads(res)
token = data["access_token"]
print token

#設置音頻屬性,根據(jù)百度的要求,采樣率必須為8000,壓縮格式支持pcm(不壓縮)、wav、opus、speex、amr
VOICE_RATE = 8000
WAVE_FILE = "test.wav" #音頻文件的路徑
USER_ID = "hail_hydra" #用于標識的ID,可以隨意設置
WAVE_TYPE = "wav"

#打開音頻文件,并進行編碼
f = open(WAVE_FILE, "r")
speech = base64.b64encode(f.read())
size = os.path.getsize(WAVE_FILE)
update = json.dumps({"format":WAVE_TYPE, "rate":VOICE_RATE, 'channel':1,'cuid':USER_ID,'token':token,'speech':speech,'len':size})
headers = { 'Content-Type' : 'application/json' } 
url = "http://vop.baidu.com/server_api"
req = urllib2.Request(url, update, headers)

r = urllib2.urlopen(req)


t = r.read()
result = json.loads(t)
print result
if result['err_msg']=='success.':
  word = result['result'][0].encode('utf-8')
  if word!='':
    if word[len(word)-3:len(word)]==',':
      print word[0:len(word)-3]
    else:
      print word
  else:
    print "音頻文件不存在或格式錯誤"
else:
  print "錯誤"

看完上述內(nèi)容,你們掌握怎么在python中調(diào)用百度REST API實現(xiàn)語音識別的方法了嗎?如果還想學到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI