溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

Python常用的正則表達(dá)式處理函數(shù)是什么

發(fā)布時(shí)間：2021-06-08 11:44:10 來源：億速云閱讀：200 作者：小新欄目：互聯(lián)網(wǎng)科技

這篇文章將為大家詳細(xì)講解有關(guān)Python常用的正則表達(dá)式處理函數(shù)是什么，小編覺得挺實(shí)用的，因此分享給大家做個(gè)參考，希望大家閱讀完這篇文章后可以有所收獲。

正則表達(dá)式是一個(gè)特殊的字符序列，用于簡(jiǎn)潔表達(dá)一組字符串特征，檢查一個(gè)字符串是否與某種模式匹配，使用起來十分方便。

在Python中，我們通過調(diào)用re庫(kù)來使用re模塊：

import re

正則表達(dá)式語(yǔ)法模式和操作符詳見：https://www.runoob.com/python/python-reg-expressions.html#flags

下面介紹Python常用的正則表達(dá)式處理函數(shù)。

re.match函數(shù)

re.match 函數(shù)從字符串的起始位置匹配正則表達(dá)式，返回match對(duì)象，如果不是起始位置匹配成功的話，match()就返回None。

re.match(pattern, string, flags=0)

pattern：匹配的正則表達(dá)式。

string：待匹配的字符串。

flags：標(biāo)志位，用于控制正則表達(dá)式的匹配方式，如：是否區(qū)分大小寫，多行匹配等等。具體參數(shù)為：

re.I：忽略大小寫。

re.L：表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當(dāng)前環(huán)境。

re.M：多行模式。

re.S：即 . ，并且包括換行符在內(nèi)的任意字符（. 不包括換行符）。

re.U：表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數(shù)據(jù)庫(kù)。

re.X：為了增加可讀性，忽略空格和 # 后面的注釋。

import re
#從起始位置匹配
r1=re.match('abc','abcdefghi')
print(r1)
#不從起始位置匹配
r2=re.match('def','abcdefghi')
print(r2)

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

其中，span表示匹配成功的整個(gè)子串的索引。

使用group(num) 或 groups() 匹配對(duì)象函數(shù)來獲取匹配表達(dá)式。

group(num)：匹配的整個(gè)表達(dá)式的字符串，group() 可以一次輸入多個(gè)組號(hào)，這時(shí)它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。

groups()：返回一個(gè)包含所有小組字符串的元組，從 1 到所含的小組號(hào)。

import re

s='This is a demo'
r1=re.match(r'(.*) is (.*)',s)
r2=re.match(r'(.*) is (.*?)',s)

print(r1.group())
print(r1.group(1))
print(r1.group(2))
print(r1.groups())
print()
print(r2.group())
print(r2.group(1))
print(r2.group(2))
print(r2.groups())

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

上述代碼中的(.*)和(.*?)表示正則表達(dá)式的貪婪匹配與非貪婪匹配，詳情見此：https://www.jb51.net/article/31491.htm

re.search函數(shù)

re.search函數(shù)掃描整個(gè)字符串并返回第一個(gè)成功的匹配，如果匹配成功則返回match對(duì)象，否則返回None。

re.search(pattern, string, flags=0)

pattern：匹配的正則表達(dá)式。

string：待匹配的字符串。

flags：標(biāo)志位，用于控制正則表達(dá)式的匹配方式，如：是否區(qū)分大小寫，多行匹配等等。

import re
#從起始位置匹配
r1=re.search('abc','abcdefghi')
print(r1)
#不從起始位置匹配
r2=re.search('def','abcdefghi')
print(r2)

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

使用group(num) 或 groups() 匹配對(duì)象函數(shù)來獲取匹配表達(dá)式。

group(num=0)：匹配的整個(gè)表達(dá)式的字符串，group() 可以一次輸入多個(gè)組號(hào)，這時(shí)它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。

groups()：返回一個(gè)包含所有小組字符串的元組，從 1 到所含的小組號(hào)。

import re

s='This is a demo'
r1=re.search(r'(.*) is (.*)',s)
r2=re.search(r'(.*) is (.*?)',s)

print(r1.group())
print(r1.group(1))
print(r1.group(2))
print(r1.groups())
print()
print(r2.group())
print(r2.group(1))
print(r2.group(2))
print(r2.groups())

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

從上面不難發(fā)現(xiàn)re.match與re.search的區(qū)別：re.match只匹配字符串的起始位置，只要起始位置不符合正則表達(dá)式就匹配失敗，而re.search是匹配整個(gè)字符串，直到找到一個(gè)匹配為止。

re.compile 函數(shù)

compile 函數(shù)用于編譯正則表達(dá)式，生成一個(gè)正則表達(dá)式對(duì)象，供 match() 和 search() 這兩個(gè)函數(shù)使用。

re.compile(pattern[, flags])

pattern：一個(gè)字符串形式的正則表達(dá)式。

flags：可選，表示匹配模式，比如忽略大小寫，多行模式等。

import re
#匹配數(shù)字
r=re.compile(r'\d+') 
r1=r.match('This is a demo')
r2=r.match('This is 111 and That is 222',0,27)
r3=r.match('This is 111 and That is 222',8,27)
 
print(r1)
print(r2)
print(r3)

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

findall函數(shù)

搜索字符串，以列表形式返回正則表達(dá)式匹配的所有子串，如果沒有找到匹配的，則返回空列表。

需要注意的是，match 和 search 是匹配一次，而findall 匹配所有。

findall(string[, pos[, endpos]])

string：待匹配的字符串。

pos：可選參數(shù)，指定字符串的起始位置，默認(rèn)為0。

endpos：可選參數(shù)，指定字符串的結(jié)束位置，默認(rèn)為字符串的長(zhǎng)度。

import re
#匹配數(shù)字
r=re.compile(r'\d+') 
r1=r.findall('This is a demo')
r2=r.findall('This is 111 and That is 222',0,11)
r3=r.findall('This is 111 and That is 222',0,27)
 
print(r1)
print(r2)
print(r3)

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

re.finditer函數(shù)

和 findall 類似，在字符串中找到正則表達(dá)式所匹配的所有子串，并把它們作為一個(gè)迭代器返回。

re.finditer(pattern, string, flags=0)

pattern：匹配的正則表達(dá)式。

string：待匹配的字符串。

flags：標(biāo)志位，用于控制正則表達(dá)式的匹配方式，如是否區(qū)分大小寫，多行匹配等。

import re 

r=re.finditer(r'\d+','This is 111 and That is 222')
for i in r: 
 print (i.group())

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

re.split函數(shù)

將一個(gè)字符串按照正則表達(dá)式匹配的子串進(jìn)行分割后，以列表形式返回。

re.split(pattern, string[, maxsplit=0, flags=0])

pattern：匹配的正則表達(dá)式。

string：待匹配的字符串。

maxsplit：分割次數(shù)，maxsplit=1分割一次，默認(rèn)為0，不限次數(shù)。

flags：標(biāo)志位，用于控制正則表達(dá)式的匹配方式，如：是否區(qū)分大小寫，多行匹配等。

import re 

r1=re.split('\W+','This is 111 and That is 222') 
r2=re.split('\W+','This is 111 and That is 222',maxsplit=1) 
r3=re.split('\d+','This is 111 and That is 222') 
r4=re.split('\d+','This is 111 and That is 222',maxsplit=1) 
print(r1)
print(r2)
print(r3)
print(r4)

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

re.sub函數(shù)

re.sub函數(shù)用于替換字符串中的匹配項(xiàng)。

re.sub(pattern, repl, string, count=0, flags=0)

pattern：正則中的模式字符串。

repl：替換的字符串，也可為一個(gè)函數(shù)。

string：要被查找替換的原始字符串。

count：模式匹配后替換的最大次數(shù)，默認(rèn)0表示替換所有的匹配。

import re 

r='This is 111 and That is 222'
# 刪除字符串中的數(shù)字
r1=re.sub(r'\d+','',r)
print(r1)
# 刪除非數(shù)字的字符串 
r2=re.sub(r'\D','',r)
print(r2)

運(yùn)行結(jié)果：

Python常用的正則表達(dá)式處理函數(shù)是什么

關(guān)于“Python常用的正則表達(dá)式處理函數(shù)是什么”這篇文章就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，使各位可以學(xué)到更多知識(shí)，如果覺得文章不錯(cuò)，請(qǐng)把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Django自定義權(quán)限管理系統(tǒng)的示例分析
下一篇新聞：
Python中從attribute到property的示例分析

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼