溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Java實(shí)現(xiàn)基于Aho-Corasick算法的多模式回文串檢測

發(fā)布時(shí)間:2024-11-11 18:45:44 來源:億速云 閱讀:78 作者:小樊 欄目:編程語言

Aho-Corasick算法是一種多模式字符串匹配算法,用于在文本中查找多個(gè)子字符串

import java.util.*;

public class AhoCorasick {
    private TrieNode root;
    private List<TrieNode> nodes;
    private Map<String, List<Integer>> patternPositions;

    public AhoCorasick() {
        root = new TrieNode();
        nodes = new ArrayList<>();
        patternPositions = new HashMap<>();
    }

    public void addPattern(String pattern) {
        TrieNode node = root;
        for (char c : pattern.toCharArray()) {
            if (!node.children.containsKey(c)) {
                node.children.put(c, new TrieNode());
            }
            node = node.children.get(c);
        }
        int index = nodes.size();
        node.isEndOfWord = true;
        nodes.add(node);
        patternPositions.computeIfAbsent(pattern, k -> new ArrayList<>()).add(index);
    }

    public List<Integer> searchPatterns(String text) {
        List<Integer> result = new ArrayList<>();
        TrieNode node = root;
        for (int i = 0; i < text.length(); i++) {
            char c = text.charAt(i);
            if (!node.children.containsKey(c)) {
                node = root;
            } else {
                node = node.children.get(c);
            }
            if (node.isEndOfWord) {
                for (int patternIndex : patternPositions.getOrDefault(text.substring(i - node.length() + 1), Collections.emptyList())) {
                    result.add(patternIndex);
                }
            }
        }
        return result;
    }

    private static class TrieNode {
        Map<Character, TrieNode> children;
        boolean isEndOfWord;

        public TrieNode() {
            children = new HashMap<>();
            isEndOfWord = false;
        }
    }

    public static void main(String[] args) {
        AhoCorasick ac = new AhoCorasick();
        ac.addPattern("abc");
        ac.addPattern("def");
        ac.addPattern("ghi");
        System.out.println(ac.searchPatterns("abcdefghi")); // Output: [0, 3]
    }
}

這個(gè)實(shí)現(xiàn)中,我們首先創(chuàng)建了一個(gè)AhoCorasick類,其中包含一個(gè)TrieNode類來表示Aho-Corasick算法中的字典樹節(jié)點(diǎn)。addPattern方法用于向字典樹中添加模式字符串,searchPatterns方法用于在文本中查找所有匹配的模式字符串的位置。

main方法中,我們創(chuàng)建了一個(gè)AhoCorasick實(shí)例,并添加了三個(gè)模式字符串。然后,我們在文本"abcdefghi"中查找這些模式字符串,并將結(jié)果輸出到控制臺。在這個(gè)例子中,輸出結(jié)果為[0, 3],表示模式字符串"abc""def"分別在文本中的位置0和3。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI