溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么使用Java實現(xiàn)在線語音識別

發(fā)布時間:2021-04-15 12:19:36 來源:億速云 閱讀:222 作者:小新 欄目:編程語言

這篇文章主要介紹了怎么使用Java實現(xiàn)在線語音識別,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

具體內(nèi)容如下

利用訊飛開發(fā)平臺作為第三方庫

首先需要在訊飛開發(fā)平臺下載SDK,網(wǎng)址為,訊飛開發(fā)平臺,這些SDK 下載都是免費的,當(dāng)然你需要先注冊。在SDK 中不僅包含相應(yīng)的jar包,還有一些相應(yīng)的demo,可以供你參考學(xué)習(xí)

怎么使用Java實現(xiàn)在線語音識別

在我們下載下來第一個SDK 之后就可以進行開發(fā)了,訊飛的SDK 給我們提供了詳盡而強大的函數(shù)支持,下面我就從代碼的角度來進行一些解釋。

代碼

package myVoice;
import java.awt.Button;
import java.awt.Font;
import java.awt.Frame;
import java.awt.GridLayout;
import java.awt.Panel;
import java.awt.TextArea;
import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
import java.lang.reflect.Parameter;
import java.util.ArrayList;
import javax.swing.ImageIcon;
import javax.swing.JFrame;
import javax.swing.JLabel;
import com.iflytek.cloud.speech.RecognizerListener;
import com.iflytek.cloud.speech.RecognizerResult;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechRecognizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.util.DebugLog;
import com.iflytek.util.JsonParser;
import com.iflytek.util.Version;

public class VoiceSpeech extends Frame implements ActionListener {
Button startBtn;
Button stopBtn;
TextArea textArea;

// 語音聽寫對象

SpeechRecognizer speechRecognize;
private static final String DEF_FONT_NAME = "宋體";
private static final int DEF_FONT_STYLE = Font.BOLD;
private static final int DEF_FONT_SIZE = 30;
private static final int TEXT_COUNT = 100;

public VoiceSpeech() {
// 初始化聽寫對象
speechRecognize = SpeechRecognizer.createRecognizer();
// 設(shè)置組件
startBtn = new Button("start");
stopBtn = new Button("stop");
textArea = new TextArea();
Panel btnPanel = new Panel();
Panel textPanel = new Panel();
// Button startBtn = new Button("開始");

//添加監(jiān)聽器
startBtn.addActionListener(this);
stopBtn.addActionListener(this);
btnPanel.add(startBtn);
btnPanel.add(stopBtn);
textPanel.add(textArea);
add(btnPanel);
add(textPanel);

// 設(shè)置窗體
setLayout(new GridLayout(2, 1));
setSize(400, 300);
setTitle("語音識別");
setLocation(200, 200);
setVisible(true);

}

public void actionPerformed(ActionEvent e) {
if (e.getSource() == startBtn) {
textArea.setText("*************你說的是:");
if (!speechRecognize.isListening())
speechRecognize.startListening(recognizerListener);

else

speechRecognize.stopListening();
} else if (e.getSource() == stopBtn) {
speechRecognize.stopListening();

}

}

/**
* 聽寫監(jiān)聽器
*/

private RecognizerListener recognizerListener = new RecognizerListener() {
public void onBeginOfSpeech() {

// DebugLog.Log( "onBeginOfSpeech enter" );
// ((JLabel) jbtnRecognizer.getComponent(0)).setText("聽寫中...");
// jbtnRecognizer.setEnabled(false);

}

public void onEndOfSpeech() {
DebugLog.Log("onEndOfSpeech enter");

}

/**
* 獲取聽寫結(jié)果. 獲取RecognizerResult類型的識別結(jié)果,并對結(jié)果進行累加,顯示到Area里
*/

public void onResult(RecognizerResult results, boolean islast) {
DebugLog.Log("onResult enter");

// 如果要解析json結(jié)果,請考本項目示例的 com.iflytek.util.JsonParser類
String text =

JsonParser.parseIatResult(results.getResultString());

// String text = results.getResultString();
// JsonParser json = new JsonParser();
//  String newTest = json.parseIatResult(text);
//  textArea.setText(newTest);

textArea.append(text);
text = textArea.getText();
if (null != text) {
int n = text.length() / TEXT_COUNT + 1;
int fontSize = Math.max(10, DEF_FONT_SIZE - 2 * n);
DebugLog.Log("onResult new font size=" + fontSize);
int style = n > 1 ? Font.PLAIN : DEF_FONT_SIZE;
Font newFont = new Font(DEF_FONT_NAME, style, fontSize);
textArea.setFont(newFont);

}

if (islast) {

iatSpeechInitUI();

}

}

public void onVolumeChanged(int volume) {
DebugLog.Log("onVolumeChanged enter");

if (volume == 0)
volume = 1;
else if (volume >= 6)
volume = 6;

// labelWav.setIcon(new ImageIcon("res/mic_0" + volume + ".png"));

}

public void onError(SpeechError error) {
DebugLog.Log("onError enter");
if (null != error) {
DebugLog.Log("onError Code:" + error.getErrorCode());
textArea.setText(error.getErrorDescription(true));
iatSpeechInitUI();

}

}

public void onEvent(int eventType, int arg1, int agr2, String msg) {
DebugLog.Log("onEvent enter");

}

};

/**
* 聽寫結(jié)束,恢復(fù)初始狀態(tài)
*/

public void iatSpeechInitUI() {

// labelWav.setIcon(new ImageIcon("res/mic_01.png"));
// jbtnRecognizer.setEnabled(true);
// ((JLabel) jbtnRecognizer.getComponent(0)).setText("開始聽寫");

}

public static void main(String[] args) {

// 初始化
StringBuffer param = new StringBuffer();
param.append( "appid=" + Version.getAppid() );
// param.append( ","+SpeechConstant.LIB_NAME_32+"=myMscName" );
SpeechUtility.createUtility( param.toString() );
VoiceSpeech t = new VoiceSpeech();

}

}

代碼解析

1.SpeechRecognizer類,語音識別類,語音識別,包括聽寫、語法識別功能。本類使用單例,調(diào)用者使用本類的對象,只需要通過createRecognizer()創(chuàng)建 一次對象后,便可一直使用該對象,直到通過調(diào)用destroy()進行單例對象銷毀。調(diào) 用者可通過getRecognizer()獲取當(dāng)前已經(jīng)創(chuàng)建的單例。我們在一開始導(dǎo)包,把相應(yīng)的類導(dǎo)入,然后聲明語音識別類,然后在VoiceSpeech類的構(gòu)造器中初始化。

2.在SpeechRecognizer類中有很多有關(guān)語音識別的方法,

(1)startListening方法,開始進行語音識別,其方法的參數(shù)是一個回調(diào)函數(shù),這個方法是另一個類RecognizerListener聲明的實例,在其匿名內(nèi)部類中重寫關(guān)鍵的方法,借此到底我們想要的結(jié)果,我們在onResult方法中重寫,把識別的結(jié)果通過json解析之后(識別的結(jié)果默認是json格式),把它依次添加到文本欄上面,之后我們對文本欄的內(nèi)容進行文字字體大小等的設(shè)定

(2)stopListening方法,等錄音結(jié)束之后,調(diào)用該方法,把錄音結(jié)果通過網(wǎng)絡(luò)傳輸給訊飛遠程識別平臺進行解析,解析完成之后,把解析結(jié)果傳送過來

3.在main方法中先要進行SpeechUtility.createUtility,這是訊飛SDK的初始化,相當(dāng)于遠程連接訊飛識別平臺,因為Java現(xiàn)在還不支持離線識別,所以在進行識別方法調(diào)用之前,必須連接訊飛開發(fā)平臺,這個方法的作用正是如此,其參數(shù)就是不同的識別版本

4.因為很多方法都是訊飛提供的,所以我們需要導(dǎo)入相應(yīng)的包

具體如下

import com.iflytek.cloud.speech.RecognizerListener;
import com.iflytek.cloud.speech.RecognizerResult;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechRecognizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.util.DebugLog;
import com.iflytek.util.JsonParser;//json解析類
import com.iflytek.util.Version;//版本類

這些在SDK 中都有

最終的結(jié)果

ps:因為只是注重識別功能,所以界面很丑。

怎么使用Java實現(xiàn)在線語音識別

感謝你能夠認真閱讀完這篇文章,希望小編分享的“怎么使用Java實現(xiàn)在線語音識別”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI