溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Java 中怎么實(shí)現(xiàn)DFA算法

發(fā)布時(shí)間:2021-08-13 17:26:42 來源:億速云 閱讀:339 作者:Leah 欄目:開發(fā)技術(shù)

Java 中怎么實(shí)現(xiàn)DFA算法,很多新手對此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。

DFA全稱為:Deterministic Finite Automaton,即確定有窮自動機(jī)。其特征為:有一個(gè)有限狀態(tài)集合和一些從一個(gè)狀態(tài)通向另一個(gè)狀態(tài)的邊,每條邊上標(biāo)記有一個(gè)符號,其中一個(gè)狀態(tài)是初態(tài),某些狀態(tài)是終態(tài)。但不同于不確定的有限自動機(jī),DFA中不會有從同一狀態(tài)出發(fā)的兩條邊標(biāo)志有相同的符號。

Java 中怎么實(shí)現(xiàn)DFA算法

簡單點(diǎn)說就是,它是是通過event和當(dāng)前的state得到下一個(gè)state,即event+state=nextstate。理解為系統(tǒng)中有多個(gè)節(jié)點(diǎn),通過傳遞進(jìn)入的event,來確定走哪個(gè)路由至另一個(gè)節(jié)點(diǎn),而節(jié)點(diǎn)是有限的。

3.敏感詞搜尋中的DFA算法

3.1敏感詞庫構(gòu)造描述

以王八蛋和王八羔子兩個(gè)敏感詞來進(jìn)行描述,首先構(gòu)建敏感詞庫,該詞庫名稱為SensitiveMap,這兩個(gè)詞的二叉樹構(gòu)造為:

 Java 中怎么實(shí)現(xiàn)DFA算法

用hash表構(gòu)造為:

 Java 中怎么實(shí)現(xiàn)DFA算法

3.2基于敏感詞庫收索算法的描述

以上面例子構(gòu)造出來的SensitiveMap為敏感詞庫進(jìn)行示意,假設(shè)這里輸入的關(guān)鍵字為:王八不好,流程圖如下:

  Java 中怎么實(shí)現(xiàn)DFA算法

4.代碼編寫

4.1構(gòu)造敏感詞實(shí)現(xiàn)代碼

Java 中怎么實(shí)現(xiàn)DFA算法

4.2實(shí)現(xiàn)敏感詞查詢代碼

Java 中怎么實(shí)現(xiàn)DFA算法

5.優(yōu)化思路

5.1敏感詞中間填充無意義字符問題

對于“王*八&&蛋”這樣的詞,中間填充了無意義的字符來混淆,在我們做敏感詞搜索時(shí),同樣應(yīng)該做一個(gè)無意義詞的過濾,當(dāng)循環(huán)到這類無意義的字符時(shí)進(jìn)行跳過,避免干擾。

5.2敏感詞用拼音或部分用拼音代替

兩種解決思路:一種是最簡單是遇到這類問題,先豐富敏感詞庫進(jìn)行快速解決。第二種是判斷時(shí)將敏感詞轉(zhuǎn)換為拼音進(jìn)行對比判斷。

不過目前這兩種方案均不能徹底很好的解決該問題,此類問題還需進(jìn)一步研究。

看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進(jìn)一步的了解或閱讀更多相關(guān)文章,請關(guān)注億速云行業(yè)資訊頻道,感謝您對億速云的支持。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI