Python正則表達(dá)re模塊之findall()函數(shù)怎么使用

發(fā)布時(shí)間：2022-07-07 14:08:03 來源：億速云閱讀：196 作者：iii 欄目：開發(fā)技術(shù)

這篇文章主要介紹“Python正則表達(dá)re模塊之findall()函數(shù)怎么使用”的相關(guān)知識，小編通過實(shí)際案例向大家展示操作過程，操作方法簡單快捷，實(shí)用性強(qiáng)，希望這篇“Python正則表達(dá)re模塊之findall()函數(shù)怎么使用”文章能幫助大家解決問題。

一、re.findall函數(shù)介紹

它在re.py中有定義：

def findall(pattern, string, flags=0):
    """Return a list of all non-overlapping matches in the string.

    If one or more capturing groups are present in the pattern, return
    a list of groups; this will be a list of tuples if the pattern
    has more than one group.

    Empty matches are included in the result."""

    return _compile(pattern, flags).findall(string)

返回string中所有與pattern匹配的全部字符串,返回形式為數(shù)組。

findall()函數(shù)的兩種表示形式

import re
kk = re.compile(r'\d+')
kk.findall('one1two2three3four4')
#[1,2,3,4]
 
#注意此處findall()的用法，可傳兩個(gè)參數(shù);
kk = re.compile(r'\d+')
re.findall(kk,"one123")
#[1,2,3]

二、實(shí)例代碼

后面會講解代碼里的各個(gè)部分，先列出來~

import re
 
str = 'aabbabaabbaa'

# 一個(gè)"."就是匹配除 \n (換行符)以外的任意一個(gè)字符
print(re.findall(r'a.b',str))#['aab', 'aab']

# *前面的字符出現(xiàn)0次或以上
print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']

# 貪婪，匹配從.*前面為開始到后面為結(jié)束的所有內(nèi)容
print(re.findall(r'a.*b',str))#['aabbabaabb']

# 非貪婪，遇到開始和結(jié)束就進(jìn)行截取，因此截取多次符合的結(jié)果，中間沒有字符也會被截取
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']

# 非貪婪，與上面一樣，只是與上面的相比多了一個(gè)括號，只保留括號的內(nèi)容
print(re.findall(r'a(.*?)b',str))#['a', '', 'a']
 
str = '''aabbab
         aabbaa
         bb'''     #后面多加了2個(gè)b

# 沒有把最后一個(gè)換行的aab算進(jìn)來
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']

# re.S不會對\n進(jìn)行中斷
print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n         b']

三、re.findall中正則表達(dá)式(.*?)

字符串是

str = 'aabbabaabbaa'

1. 符號 . 就是匹配除 \n (換行符)以外的任意一個(gè)字符

print(re.findall(r'a.b',str))
#['aab', 'aab']

2.符號 * 前面的字符出現(xiàn)0次或以上

print(re.findall(r'a*b',str))
#['aab', 'b', 'ab', 'aab', 'b']

3.符號.* 貪婪，匹配從.*前面為開始到后面為結(jié)束的所有內(nèi)容

print(re.findall(r'a.*b',str))
#['aabbabaabb']

4.符號.*? 非貪婪，遇到開始和結(jié)束就進(jìn)行截取，因此截取多次符合的結(jié)果，中間沒有字符也會被截取

print(re.findall(r'a.*?b',str))
#['aab', 'ab', 'aab']

5.符號(.*?) 非貪婪，與上面一樣，只是與上面的相比多了一個(gè)括號，只保留括號的內(nèi)容

print(re.findall(r'a(.*?)b',str))
#['a', '', 'a']

關(guān)于帶括號與不帶括號的區(qū)別

import re

string="abcdefg  acbdgef  abcdgfe  cadbgfe"

#不帶括號
regex=re.compile("((\w+)\s+\w+)")
print(regex.findall(string))
#輸出：[('abcdefg  acbdgef', 'abcdefg'), ('abcdgfe  cadbgfe', 'abcdgfe')]

regex1=re.compile("(\w+)\s+\w+")
print(regex1.findall(string))
#輸出：['abcdefg', 'abcdgfe']

regex2=re.compile("\w+\s+\w+")
print(regex2.findall(string))
#輸出：['abcdefg  acbdgef', 'abcdgfe  cadbgfe']

第一個(gè) regex 中帶有2個(gè)括號，其輸出list 中包含2個(gè) tuple
第二個(gè) regex 中帶有1個(gè)括號，其輸出內(nèi)容是括號匹配到的內(nèi)容，而不是整個(gè)表達(dá)式所匹配到的結(jié)果。
第三個(gè) regex 中不帶括號,其輸出的內(nèi)容就是整個(gè)表達(dá)式所匹配到的內(nèi)容。

實(shí)際上這并不是python特有的，這是正則所特有的，任何一門高級語言使用正則都滿足這個(gè)特點(diǎn)：有括號時(shí)只能匹配到括號中的內(nèi)容，沒有括號【相當(dāng)于在最外層增加了一個(gè)括號】。在正則里面 "()" 代表的是分組的意思，一個(gè)括號代表一個(gè)分組，你只能匹配到 "()" 中的內(nèi)容。

四、re.findall中參數(shù)re.S的意義

1.字符串變?yōu)椋ê竺娑嗉恿?個(gè)b）

str = '''aabbab
         aabbaa
         bb'''

2.參數(shù)無re.S，沒有把最后一個(gè)換行的aab算進(jìn)來

print(re.findall(r'a.*?b',str))
#['aab', 'ab', 'aab']

3.參數(shù)有re.S，不會對\n進(jìn)行中斷

print(re.findall(r'a.*?b',str,re.S))
#['aab', 'ab', 'aab', 'aa\n         b']

關(guān)于“Python正則表達(dá)re模塊之findall()函數(shù)怎么使用”的內(nèi)容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識，可以關(guān)注億速云行業(yè)資訊頻道，小編每天都會為大家更新不同的知識點(diǎn)。

向AI問一下細(xì)節(jié)

Python正則表達(dá)re模塊之findall()函數(shù)怎么使用

一、re.findall函數(shù)介紹

二、實(shí)例代碼

三、re.findall中正則表達(dá)式(.*?)

四、re.findall中參數(shù)re.S的意義

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽

二、實(shí)例代碼

三、re.findall中正則表達(dá)式(.*?)

四、re.findall中參數(shù)re.S的意義