您好,登錄后才能下訂單哦!
python如何實(shí)現(xiàn)glob style pattern,相信很多沒有經(jīng)驗(yàn)的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。
一說起通配符,大家很快就會(huì)想起*和?號,有了通配符,使得表達(dá)能力大大增強(qiáng),很多l(xiāng)inux命令都支持這個(gè)東西,其實(shí)就是glob style pattern.
就連redis的keys命令都支持glob.
我要實(shí)現(xiàn)的glob,支持以下特性:
星號*匹配0個(gè)或多個(gè)任意字符
?匹配確切的一個(gè)任意字符
[characters]匹配任意一個(gè)方括號內(nèi)的字符,比如[abc],要么匹配a,要么匹配b,要么匹配c.
[!character]排除方括號內(nèi)的字符
[character-character],表示2個(gè)字符范圍內(nèi)的都可以匹配,如[a-z],[0-9]
實(shí)現(xiàn)這個(gè)東西其實(shí)挺簡單的,從左往右掃描s串和p串,如果最后都走到了結(jié)尾,那么就是可以匹配的.
主要難點(diǎn)在于*號的匹配.因?yàn)?號可以匹配0個(gè)或者多個(gè),所以需要試探回溯.這里通過保存*號位置,如果后面的走不通了,就拉回*號位置,貪婪匹配.
至于方括號的展開,弄個(gè)include和exclude變量就很清晰了.
下面上代碼.
#coding=utf-8 def build_expand(p):#方括號展開 ptr2include = {} ptr2exclude = {} ptr2next = {} len_p = len(p) pPtr = 0 while pPtr<len_p: if p[pPtr] == '[': start = pPtr pPtr += 1 include = set([]) exclude = set([]) while p[pPtr]!=']': if p[pPtr]=='!': exclude.add(p[pPtr+1]) pPtr += 2 elif p[pPtr+1] == '-': include.update({chr(x) for x in range(ord(p[pPtr]),ord(p[pPtr+2])+1)}) pPtr += 3 else: include.add(p[pPtr]) pPtr += 1 if include: ptr2include[start] = include if exclude: ptr2exclude[start] = exclude ptr2next[start] = pPtr + 1 else: pPtr += 1 return ptr2include, ptr2exclude, ptr2next def isMatch(s, p): len_s = len(s); len_p = len(p) sPtr = pPtr = ss = 0 star = None ptr2include, ptr2exclude, ptr2next = build_expand(p) while sPtr<len_s: if pPtr<len_p and (p[pPtr] in ['?',s[sPtr]]): sPtr += 1; pPtr += 1 continue if pPtr<len_p and p[pPtr] == '[': if pPtr in ptr2include and s[sPtr] in ptr2include[pPtr]: sPtr += 1 pPtr = ptr2next[pPtr] continue if pPtr in ptr2exclude and s[sPtr] not in ptr2exclude[pPtr]: sPtr += 1 pPtr = ptr2next[pPtr] continue if pPtr<len_p and p[pPtr]=='*': star = pPtr; pPtr += 1; ss = sPtr continue if star is not None: pPtr = star + 1; ss += 1; sPtr = ss continue return False while pPtr<len(p) and p[pPtr]=='*': pPtr += 1 return pPtr == len_p if __name__ == '__main__': params = [ ("aa","a"), ("aa","aa"), ("aaa","aa"), ("aa", "*"), ("aa", "a*"), ("ab", "?*"), ("aab", "c*a*b"), ("cab", "c*a*b"), ("cxyzbazba", "c*ba"), ('abc','ab[a-c]'), ('abd','ab[a-c]'), ('abe','ab[cde]'), ('abe','ab[!e]'), ('abe','ab[!c]'), ] for p in params: print p,isMatch(*p)
運(yùn)行結(jié)果是
('aa', 'a') False
('aa', 'aa') True
('aaa', 'aa') False
('aa', '*') True
('aa', 'a*') True
('ab', '?*') True
('aab', 'c*a*b') False
('cab', 'c*a*b') True
('cxyzbazba', 'c*ba') True
('abc', 'ab[a-c]') True
('abd', 'ab[a-c]') False
('abe', 'ab[cde]') True
('abe', 'ab[!e]') False
('abe', 'ab[!c]') True
看完上述內(nèi)容,你們掌握python如何實(shí)現(xiàn)glob style pattern的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。