溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

發(fā)布時(shí)間:2020-07-01 14:47:40 來(lái)源:網(wǎng)絡(luò) 閱讀:598 作者:myja 欄目:開(kāi)發(fā)技術(shù)

一、文檔概述


本文檔是開(kāi)發(fā)科大訊飛Windows語(yǔ)音程序的用戶指南,提供工程創(chuàng)建、配置、編譯、運(yùn)行等相關(guān)信息的說(shuō)明。其適用的讀者為使用語(yǔ)音SDK進(jìn)行開(kāi)發(fā)的產(chǎn)品設(shè)計(jì)師、軟件工程師,通過(guò)閱讀本文檔,讀者可以掌握如何集成和使用語(yǔ)音庫(kù)文件。


二、新建項(xiàng)目


1)打開(kāi)Microsoft Visual Studio 2010,選擇文件->新建->新建項(xiàng)目。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

2)選擇Visual C++ ->Win32->Win32控制臺(tái)應(yīng)用程序,輸入項(xiàng)目名稱,然后點(diǎn)擊確定鍵。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?


3)點(diǎn)擊下一步。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

4)附加選項(xiàng)選擇“空項(xiàng)目”,應(yīng)用程序類型選擇“控制臺(tái)應(yīng)用程序”,然后點(diǎn)擊完成。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

5)鼠標(biāo)右鍵點(diǎn)擊“源文件”,點(diǎn)擊添加->新建項(xiàng)。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

6)選擇“代碼”,輸入后綴名為.c的名稱,例如“main.c”,點(diǎn)擊添加。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

7)代碼請(qǐng)參考SDK/Windows_SDK/samples下的語(yǔ)音示例。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

8)將科大訊飛語(yǔ)音SDK中bin,include,libs文件復(fù)制到Demo文件夾下。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?


三、導(dǎo)入頭文件


1)鼠標(biāo)右鍵點(diǎn)擊Demo項(xiàng)目,選擇屬性。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

2)點(diǎn)擊C/C++->常規(guī)->附加包含目錄,輸入相對(duì)于工程文件Demo.vcxproj的相對(duì)路徑,即相對(duì)于$(ProjectDir)的路徑。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?


四、加載msc.dll


1)加載msc.lib文件:在main.c文件中輸入如下圖所示代碼。(注意:加載路徑輸入相對(duì)于工程文件的相對(duì)路徑)

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

2)將msc.dll所在目錄設(shè)置為工作目錄,即“$(ProjectDir)..\bin\”。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?


五、打印日志


運(yùn)行程序后,bin/msc文件夾下會(huì)生成日志。(注意:msc文件夾下需有msc.cfg文件)

 

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?


六、運(yùn)行可執(zhí)行文件


1)通過(guò)屬性設(shè)置,將可執(zhí)行文件copy到bin目錄下運(yùn)行,否則會(huì)報(bào)如圖16錯(cuò)誤。 

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

2)點(diǎn)擊“命令行”后邊的下拉框,選擇“編輯”。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?

3)輸入“copy $(TargetPath) $(ProjectDir)..\bin\”。

使用語(yǔ)音SDK開(kāi)發(fā):如何集成和使用語(yǔ)音庫(kù)文件?


七、常見(jiàn)問(wèn)題

1)如何聯(lián)系我們獲得技術(shù)支持?

答:科大訊飛提供以下方式的技術(shù)支持:

a.自助查詢——請(qǐng)登陸官網(wǎng):http://www.xfyun.cn/

語(yǔ)音合成:http://www.xfyun.cn/doccenter/tts

語(yǔ)音識(shí)別:http://www.xfyun.cn/doccenter/asr

新手指南:http://www.xfyun.cn/doccenter/newer

常見(jiàn)解答:http://www.xfyun.cn/default/doccenter/doccenterInner?itemTitle=ZmFx


b.電話支持——請(qǐng)于周一~周五,北京時(shí)間9:00~17:00間,撥打電話: 0551-65309063獲得技術(shù)支持信息。

c.電子郵件支持——請(qǐng)將問(wèn)題的詳細(xì)描述發(fā)至:msp_support@iflytek.com。

d.在線支持——請(qǐng)登錄我們的論壇:http://bbs.xfyun.cn/forum.php


聯(lián)系時(shí)對(duì)問(wèn)題的描述請(qǐng)盡量包含以下內(nèi)容:

1.系統(tǒng)配置(包括CPU、內(nèi)存、硬盤、操作系統(tǒng)及產(chǎn)品版本等信息)

2.問(wèn)題細(xì)節(jié)(包括問(wèn)題的重現(xiàn)過(guò)程及合成的文本內(nèi)容、識(shí)別音頻等)

3.問(wèn)題重現(xiàn)(包括詳細(xì)的操作過(guò)程和運(yùn)行日志等)


2)拿到了合成音頻但不知道如何來(lái)播放?

答:合成拿到的音頻是沒(méi)有音頻頭的,音頻頭中含有音頻格式、采樣率、音頻長(zhǎng)度等播放音頻所需信息。拿到合成音頻后,用戶可以添加音頻頭,可參考例子tts_sample中的代碼,然后使用常規(guī)播放器來(lái)播放;也可以使用Cool Edit等軟件手動(dòng)選擇音頻參數(shù)來(lái)播放。


3) 如何進(jìn)行大文本的合成?

答:語(yǔ)音云一次語(yǔ)音合成允許的合成文本大小不超過(guò)8192個(gè)字節(jié),所以對(duì)于長(zhǎng)度超過(guò)此值的大合成文本,用戶可以采用“分段合成”的方式,即先將大文本按照標(biāo)點(diǎn)符號(hào)如句號(hào)進(jìn)行切分,然后對(duì)每一段文本分別進(jìn)行合成。進(jìn)行分段合成時(shí),用戶既可以在一路會(huì)話中循環(huán)使用QTTSTextPut+QTTSAudioGet組合完成合成,也可以為每一段文本使用一路獨(dú)立的會(huì)話完成合成。


4) 獲取不到識(shí)別/聽(tīng)寫結(jié)果。

答:原因可能是:

a.QISRSessionBegin的參數(shù)設(shè)置不正確,如沒(méi)有設(shè)置好正確的引擎類型等。      

b.音頻格式不對(duì),客戶端支持的音頻編解碼算法只支持16位Intel PCM格式的音頻。


5)能獲取到語(yǔ)音聽(tīng)寫結(jié)果但是不全。

答:此問(wèn)題主要是在調(diào)用QISRAudioWrite時(shí)沒(méi)有正確設(shè)置參數(shù)audioStatus所致,此參數(shù)在寫入非最后一個(gè)音頻數(shù)據(jù)塊時(shí)需要設(shè)置為2,寫入最后一個(gè)數(shù)據(jù)塊時(shí)需要設(shè)置為4,以告訴MSC音頻寫入完畢。如果只有一個(gè)音頻數(shù)據(jù)塊,audioStatus也需要設(shè)置為4。


6) 可以拿到識(shí)別或轉(zhuǎn)寫結(jié)果但是響應(yīng)很慢。

答:此問(wèn)題可以嘗試如下方法來(lái)解決:

a.調(diào)用QISRAudioWrite接口寫音頻數(shù)據(jù)時(shí),盡量做到“勻速發(fā)送”——周期性的發(fā)送定長(zhǎng)數(shù)據(jù),做到邊錄邊發(fā),避免一次發(fā)送數(shù)據(jù)量過(guò)大的音頻。

b.采用QISRAudioWrite接口和QISRGetResult接口混調(diào)的方式。在調(diào)用QISRAudioWrite接口時(shí),可以檢查out型參數(shù)recogStatus,如果其值為0,表明已經(jīng)有(部分)識(shí)別結(jié)果緩存在MSC中了,此時(shí)可以調(diào)用QISRGetResult來(lái)獲取結(jié)果。


向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI