溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python如何實(shí)現(xiàn)glob style pattern

發(fā)布時(shí)間:2021-10-13 09:44:49 來源:億速云 閱讀:199 作者:柒染 欄目:編程語言

python如何實(shí)現(xiàn)glob style pattern,相信很多沒有經(jīng)驗(yàn)的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。

一說起通配符,大家很快就會(huì)想起*和?號,有了通配符,使得表達(dá)能力大大增強(qiáng),很多l(xiāng)inux命令都支持這個(gè)東西,其實(shí)就是glob style pattern.
就連redis的keys命令都支持glob.

我要實(shí)現(xiàn)的glob,支持以下特性:

  • 星號*匹配0個(gè)或多個(gè)任意字符

  • ?匹配確切的一個(gè)任意字符

  • [characters]匹配任意一個(gè)方括號內(nèi)的字符,比如[abc],要么匹配a,要么匹配b,要么匹配c.

  • [!character]排除方括號內(nèi)的字符

  • [character-character],表示2個(gè)字符范圍內(nèi)的都可以匹配,如[a-z],[0-9]

實(shí)現(xiàn)這個(gè)東西其實(shí)挺簡單的,從左往右掃描s串和p串,如果最后都走到了結(jié)尾,那么就是可以匹配的.
主要難點(diǎn)在于*號的匹配.因?yàn)?號可以匹配0個(gè)或者多個(gè),所以需要試探回溯.這里通過保存*號位置,如果后面的走不通了,就拉回*號位置,貪婪匹配.

至于方括號的展開,弄個(gè)include和exclude變量就很清晰了.

下面上代碼.

#coding=utf-8
def build_expand(p):#方括號展開
    ptr2include = {}
    ptr2exclude = {}
    ptr2next = {}
    len_p = len(p)
    pPtr = 0
    while pPtr<len_p:
        if p[pPtr] == '[':
            start = pPtr
            pPtr += 1
            include = set([])
            exclude = set([])
            while p[pPtr]!=']':
                if p[pPtr]=='!':
                    exclude.add(p[pPtr+1])
                    pPtr += 2
                elif p[pPtr+1] == '-':
                    include.update({chr(x) for x in range(ord(p[pPtr]),ord(p[pPtr+2])+1)})
                    pPtr += 3
                else:
                    include.add(p[pPtr])
                    pPtr += 1
            if include:
                ptr2include[start] = include
            if exclude:
                ptr2exclude[start] = exclude
            ptr2next[start] = pPtr + 1
        else:
            pPtr += 1
    return ptr2include, ptr2exclude, ptr2next

def isMatch(s, p):
    len_s = len(s); len_p = len(p)
    sPtr = pPtr = ss = 0
    star = None
    ptr2include, ptr2exclude, ptr2next = build_expand(p)
    while sPtr<len_s:
        if pPtr<len_p and (p[pPtr] in ['?',s[sPtr]]):
            sPtr += 1; pPtr += 1
            continue
        if pPtr<len_p and p[pPtr] == '[':
            if pPtr in ptr2include and s[sPtr] in ptr2include[pPtr]:
                sPtr += 1
                pPtr = ptr2next[pPtr]
                continue
            if pPtr in ptr2exclude and s[sPtr] not in ptr2exclude[pPtr]:
                sPtr += 1
                pPtr = ptr2next[pPtr]
                continue
        if pPtr<len_p and p[pPtr]=='*':
            star = pPtr; pPtr += 1; ss = sPtr
            continue
        if star is not None:
            pPtr = star + 1; ss += 1; sPtr = ss
            continue
        return False
    while pPtr<len(p) and p[pPtr]=='*':
        pPtr += 1
    return pPtr == len_p

if __name__ == '__main__':
    params = [
            ("aa","a"),
            ("aa","aa"),
            ("aaa","aa"),
            ("aa", "*"),
            ("aa", "a*"),
            ("ab", "?*"),
            ("aab", "c*a*b"),
            ("cab", "c*a*b"),
            ("cxyzbazba", "c*ba"),
            ('abc','ab[a-c]'),
            ('abd','ab[a-c]'),
            ('abe','ab[cde]'),
            ('abe','ab[!e]'),
            ('abe','ab[!c]'),
        ]

    for p in params:
        print p,isMatch(*p)

運(yùn)行結(jié)果是

('aa', 'a') False
('aa', 'aa') True
('aaa', 'aa') False
('aa', '*') True
('aa', 'a*') True
('ab', '?*') True
('aab', 'c*a*b') False
('cab', 'c*a*b') True
('cxyzbazba', 'c*ba') True
('abc', 'ab[a-c]') True
('abd', 'ab[a-c]') False
('abe', 'ab[cde]') True
('abe', 'ab[!e]') False
('abe', 'ab[!c]') True

看完上述內(nèi)容,你們掌握python如何實(shí)現(xiàn)glob style pattern的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI