溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

什么是Python 多行匹配模式

發(fā)布時間:2020-07-28 09:52:27 來源:億速云 閱讀:187 作者:Leah 欄目:編程語言

什么是Python 多行匹配模式?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。

問題

你正在試著使用正則表達(dá)式去匹配一大塊的文本,而你需要跨越多行去匹配。

解決方案

這個問題很典型的出現(xiàn)在當(dāng)你用點(.)去匹配任意字符的時候,忘記了點(.)不能匹配換行符的事實。比如,假設(shè)你想試著去匹配C語言分割的注釋:

>>> comment = re.compile(r'/\*(.*?)\*/')
>>> text1 = '/* this is a comment */'
>>> text2 = '''/* this is a
... multiline comment */
... '''
>>>
>>> comment.findall(text1)
[' this is a comment ']
>>> comment.findall(text2)
[]
>>>

為了修正這個問題,你可以修改模式字符串,增加對換行的支持。比如:

>>> comment = re.compile(r'/\*((?:.|\n)*?)\*/')
>>> comment.findall(text2)
[' this is a\n multiline comment ']
>>>

在這個模式中,(?:.|\n) 指定了一個非捕獲組(也就是它定義了一個僅僅用來做匹配,而不能通過單獨捕獲或者編號的組)。

討論

re.compile() 函數(shù)接受一個標(biāo)志參數(shù)叫 re.DOTALL ,在這里非常有用。它可以讓正則表達(dá)式中的.匹配包括換行符在內(nèi)的任意字符。比如:

>>> comment = re.compile(r'/\*(.*?)\*/', re.DOTALL)
>>> comment.findall(text2)
[' this is a\n multiline comment ']

對于簡單的情況使用 re.DOTALL 標(biāo)記參數(shù)工作的很好,但是如果模式非常復(fù)雜或者是為了構(gòu)造字符串令牌而將多個模式合并起來(2.18節(jié)有詳細(xì)描述),這時候使用這個標(biāo)記參數(shù)就可能出現(xiàn)一些問題。如果讓你選擇的話,最好還是定義自己的正則表達(dá)式模式,這樣它可以在不需要額外的標(biāo)記參數(shù)下也能工作的很好。

看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進(jìn)一步的了解或閱讀更多相關(guān)文章,請關(guān)注億速云行業(yè)資訊頻道,感謝您對億速云的支持。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI