溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么 在HTML5中實(shí)現(xiàn)一個(gè)語音合成功能

發(fā)布時(shí)間:2021-05-08 17:13:42 來源:億速云 閱讀:273 作者:Leah 欄目:web開發(fā)

怎么 在HTML5中實(shí)現(xiàn)一個(gè)語音合成功能?相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。

 Speech Synthesis API

通過上面的例子我們可以猜測(cè)到上面調(diào)用的兩個(gè)方法的功能

SpeechSyntehesisUtteranc
window.speechSynthesis.speak

當(dāng)然了,語音合成不僅僅包含這兩個(gè)API,but我們先從這兩點(diǎn)入手

SpeechSyntehesisUtteranc

參考:developer.mozilla.org/en-US/docs/… SpeechSyntehesisUtteranc 對(duì)象包含了語音服務(wù)要讀取的內(nèi)容和一些參數(shù),比如語言,音高和音量

SpeechSyntehesisUtteranc()
SpeechSynthesisUtterance.lang
SpeechSynthesisUtterance.pitch
SpeechSynthesisUtterance.rate
SpeechSynthesisUtterance.voice
SpeechSynthesisUtterance.volume

注意:以上屬性都是 可讀寫 的! 可以把下面這段代碼copy下來嘗試一下,注釋中會(huì)有說明

let msg = new SpeechSynthesisUtterance();
msg.text = "how are you" // 要合成的文本
msg.lang = "en-US" // 美式英語發(fā)音(默認(rèn)自動(dòng)選擇)
msg.rate = 2  // 二倍速(默認(rèn)為 1,范圍 0.1~10)
msg.pitch = 2 // 高音調(diào)(數(shù)字越大越尖銳,默認(rèn)為 1,范圍 0~2 )
msg.volume = 0.5 // 音量 0.5 倍(默認(rèn)為1,范圍 0~1)
window.speechSynthesis.speak(msg);

同時(shí)這個(gè)對(duì)象還可以響應(yīng)一系列事件,可能會(huì)用到的:

  • start

  • end

  • boundary

  • pause

  • resume

借助這些事件我們可以完成一些簡單的功能,比如英文句子的單詞數(shù)量統(tǒng)計(jì):

怎么 在HTML5中實(shí)現(xiàn)一個(gè)語音合成功能

let count = 0; // 詞語數(shù)量
let msg = new SpeechSynthesisUtterance();
let synth = window.speechSynthesis;
msg.addEventListener('start',()=>{
    // 開始閱讀
    console.log(`文本內(nèi)容: ${msg.text}`);
    console.log("start");
});
msg.addEventListener('end',()=>{
    // 閱讀結(jié)束
    console.log("end");
    console.log(`文本單詞(詞語)數(shù)量:${count}`);
    count = 0;
});
msg.addEventListener('boundary',()=>{
    // 統(tǒng)計(jì)單詞
    count++;
});

經(jīng)過嘗試,由于中文沒有用空格將每個(gè)詞語分開,所以會(huì)進(jìn)行自動(dòng)的識(shí)別,比如 歡迎讀者 會(huì)被識(shí)別為 歡迎 和 讀者 兩個(gè)詞語

SpeechSynthesis

參考: developer.mozilla.org/en-US/docs/…

說完了 SpeechSyntehesisUtteranc 我們?cè)賮砜纯?SpeechSynthesis

SpeechSynthesis 的主要作用是對(duì)語音進(jìn)行一系列的控制,比如開始或者暫停

它有三個(gè)只讀屬性,表明了語音的狀態(tài):

SpeechSynthesis.paused
SpeechSynthesis.pending

同時(shí)還有一系列方法用來操作語音:

•SpeechSynthesis.speak() 開始讀語音,同時(shí)觸發(fā) start 事件
•SpeechSynthesis.pause() 暫停,同時(shí)觸發(fā) pause 事件
•SpeechSynthesis.resume() 繼續(xù),同時(shí)觸發(fā) resume 事件
•SpeechSynthesis.cancel() 取消閱讀,同時(shí)觸發(fā) end 事件

基于這些操作方法,我們可以進(jìn)一步增強(qiáng)我們的文字閱讀器:

怎么 在HTML5中實(shí)現(xiàn)一個(gè)語音合成功能

回到最初的起點(diǎn)

讓我們回到最初的起點(diǎn),我們可以基于上面的內(nèi)容猜測(cè)一下有些網(wǎng)站中,文章的自動(dòng)閱讀是怎么實(shí)現(xiàn)的

如果這個(gè)網(wǎng)站前端采用了 MVVM 框架(以 Vue 為例),那么文章內(nèi)容是也許存儲(chǔ)在 data 中,可以用來構(gòu)造我們需要的語音合成

當(dāng)然,也有可能文章是通過 ajax 請(qǐng)求得到的,解析請(qǐng)求的數(shù)據(jù),構(gòu)造語音合成對(duì)象

如果文章是直接在 html 中寫死的,這個(gè)時(shí)候就需要對(duì) DOM 進(jìn)行解析,經(jīng)過測(cè)試,即便是下面這樣的混亂的結(jié)構(gòu)

<div id="test">
    <p>1</p>
    <p>2</p>
    <ul>
        <li>3</li>
        <li>4</li>
    </ul>
    <table>
        <tr>
            <td>5</td>
            <td>6</td>
        </tr>
        <tr>
            <td>7</td>
            <td>8</td>
        </tr>
    </table>
    <img src="https://www.baidu.com/img/bd_logo1.png" alt="">
    9
</div>

看完上述內(nèi)容,你們掌握怎么 在HTML5中實(shí)現(xiàn)一個(gè)語音合成功能的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI