您好,登錄后才能下訂單哦!
Java 中怎么實(shí)現(xiàn)DFA算法,很多新手對此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。
DFA全稱為:Deterministic Finite Automaton,即確定有窮自動機(jī)。其特征為:有一個(gè)有限狀態(tài)集合和一些從一個(gè)狀態(tài)通向另一個(gè)狀態(tài)的邊,每條邊上標(biāo)記有一個(gè)符號,其中一個(gè)狀態(tài)是初態(tài),某些狀態(tài)是終態(tài)。但不同于不確定的有限自動機(jī),DFA中不會有從同一狀態(tài)出發(fā)的兩條邊標(biāo)志有相同的符號。
簡單點(diǎn)說就是,它是是通過event和當(dāng)前的state得到下一個(gè)state,即event+state=nextstate。理解為系統(tǒng)中有多個(gè)節(jié)點(diǎn),通過傳遞進(jìn)入的event,來確定走哪個(gè)路由至另一個(gè)節(jié)點(diǎn),而節(jié)點(diǎn)是有限的。
以王八蛋和王八羔子兩個(gè)敏感詞來進(jìn)行描述,首先構(gòu)建敏感詞庫,該詞庫名稱為SensitiveMap,這兩個(gè)詞的二叉樹構(gòu)造為:
用hash表構(gòu)造為:
以上面例子構(gòu)造出來的SensitiveMap為敏感詞庫進(jìn)行示意,假設(shè)這里輸入的關(guān)鍵字為:王八不好,流程圖如下:
對于“王*八&&蛋”這樣的詞,中間填充了無意義的字符來混淆,在我們做敏感詞搜索時(shí),同樣應(yīng)該做一個(gè)無意義詞的過濾,當(dāng)循環(huán)到這類無意義的字符時(shí)進(jìn)行跳過,避免干擾。
兩種解決思路:一種是最簡單是遇到這類問題,先豐富敏感詞庫進(jìn)行快速解決。第二種是判斷時(shí)將敏感詞轉(zhuǎn)換為拼音進(jìn)行對比判斷。
不過目前這兩種方案均不能徹底很好的解決該問題,此類問題還需進(jìn)一步研究。
看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進(jìn)一步的了解或閱讀更多相關(guān)文章,請關(guān)注億速云行業(yè)資訊頻道,感謝您對億速云的支持。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。