您好,登錄后才能下訂單哦!
這篇文章主要介紹“Python正則表達(dá)re模塊之findall()函數(shù)怎么使用”的相關(guān)知識,小編通過實(shí)際案例向大家展示操作過程,操作方法簡單快捷,實(shí)用性強(qiáng),希望這篇“Python正則表達(dá)re模塊之findall()函數(shù)怎么使用”文章能幫助大家解決問題。
它在re.py中有定義:
def findall(pattern, string, flags=0): """Return a list of all non-overlapping matches in the string. If one or more capturing groups are present in the pattern, return a list of groups; this will be a list of tuples if the pattern has more than one group. Empty matches are included in the result.""" return _compile(pattern, flags).findall(string)
返回string中所有與pattern匹配的全部字符串,返回形式為數(shù)組。
findall()函數(shù)的兩種表示形式
import re kk = re.compile(r'\d+') kk.findall('one1two2three3four4') #[1,2,3,4] #注意此處findall()的用法,可傳兩個(gè)參數(shù); kk = re.compile(r'\d+') re.findall(kk,"one123") #[1,2,3]
后面會講解代碼里的各個(gè)部分,先列出來~
import re str = 'aabbabaabbaa' # 一個(gè)"."就是匹配除 \n (換行符)以外的任意一個(gè)字符 print(re.findall(r'a.b',str))#['aab', 'aab'] # *前面的字符出現(xiàn)0次或以上 print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b'] # 貪婪,匹配從.*前面為開始到后面為結(jié)束的所有內(nèi)容 print(re.findall(r'a.*b',str))#['aabbabaabb'] # 非貪婪,遇到開始和結(jié)束就進(jìn)行截取,因此截取多次符合的結(jié)果,中間沒有字符也會被截取 print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab'] # 非貪婪,與上面一樣,只是與上面的相比多了一個(gè)括號,只保留括號的內(nèi)容 print(re.findall(r'a(.*?)b',str))#['a', '', 'a'] str = '''aabbab aabbaa bb''' #后面多加了2個(gè)b # 沒有把最后一個(gè)換行的aab算進(jìn)來 print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab'] # re.S不會對\n進(jìn)行中斷 print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n b']
字符串是
str = 'aabbabaabbaa'
1. 符號 . 就 是匹配除 \n (換行符)以外的任意一個(gè)字符
print(re.findall(r'a.b',str)) #['aab', 'aab']
2.符號 * 前面的字符出現(xiàn)0次或以上
print(re.findall(r'a*b',str)) #['aab', 'b', 'ab', 'aab', 'b']
3.符號.* 貪婪,匹配從.*前面為開始到后面為結(jié)束的所有內(nèi)容
print(re.findall(r'a.*b',str)) #['aabbabaabb']
4.符號.*? 非貪婪,遇到開始和結(jié)束就進(jìn)行截取,因此截取多次符合的結(jié)果,中間沒有字符也會被截取
print(re.findall(r'a.*?b',str)) #['aab', 'ab', 'aab']
5.符號(.*?) 非貪婪,與上面一樣,只是與上面的相比多了一個(gè)括號,只保留括號的內(nèi)容
print(re.findall(r'a(.*?)b',str)) #['a', '', 'a']
關(guān)于帶括號與不帶括號的區(qū)別
import re string="abcdefg acbdgef abcdgfe cadbgfe" #不帶括號 regex=re.compile("((\w+)\s+\w+)") print(regex.findall(string)) #輸出:[('abcdefg acbdgef', 'abcdefg'), ('abcdgfe cadbgfe', 'abcdgfe')] regex1=re.compile("(\w+)\s+\w+") print(regex1.findall(string)) #輸出:['abcdefg', 'abcdgfe'] regex2=re.compile("\w+\s+\w+") print(regex2.findall(string)) #輸出:['abcdefg acbdgef', 'abcdgfe cadbgfe']
第一個(gè) regex 中帶有2個(gè)括號,其輸出list 中包含2個(gè) tuple
第二個(gè) regex 中帶有1個(gè)括號,其輸出內(nèi)容是括號匹配到的內(nèi)容,而不是整個(gè)表達(dá)式所匹配到的結(jié)果。
第三個(gè) regex 中不帶括號,其輸出的內(nèi)容就是整個(gè)表達(dá)式所匹配到的內(nèi)容。
實(shí)際上這并不是python特有的,這是正則所特有的 , 任何一門高級語言使用正則都滿足這個(gè)特點(diǎn):有括號時(shí)只能匹配到括號中的內(nèi)容,沒有括號【相當(dāng)于在最外層增加了一個(gè)括號】。在正則里面 "()" 代表的是分組的意思,一個(gè)括號代表一個(gè)分組,你只能匹配到 "()" 中的內(nèi)容。
1.字符串變?yōu)椋ê竺娑嗉恿?個(gè)b)
str = '''aabbab aabbaa bb'''
2.參數(shù)無re.S,沒有把最后一個(gè)換行的aab算進(jìn)來
print(re.findall(r'a.*?b',str)) #['aab', 'ab', 'aab']
3.參數(shù)有re.S,不會對\n進(jìn)行中斷
print(re.findall(r'a.*?b',str,re.S)) #['aab', 'ab', 'aab', 'aa\n b']
關(guān)于“Python正則表達(dá)re模塊之findall()函數(shù)怎么使用”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識,可以關(guān)注億速云行業(yè)資訊頻道,小編每天都會為大家更新不同的知識點(diǎn)。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。