您好,登錄后才能下訂單哦!
這篇文章主要介紹“python正則表達(dá)式的常見(jiàn)用途”,在日常操作中,相信很多人在python正則表達(dá)式的常見(jiàn)用途問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”python正則表達(dá)式的常見(jiàn)用途”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!
正則表達(dá)式的常見(jiàn)用途:
在模式字符串中根據(jù)需求提取子字符串;
字符串內(nèi)某些字符或者指定字符串進(jìn)行替換或者刪除或者分離;
在用戶輸入用戶名時(shí)判斷輸入字符串格式是否正確;
一,基礎(chǔ)
re模塊匹配經(jīng)常用到的元字符和語(yǔ)法
字符型:
預(yù)義字符型:
數(shù)量字符型:
邊界、邏輯或組匹配:
貪婪模式與非貪戀模式:
貪婪模式的量詞也叫做匹配優(yōu)先量詞,主要包括: “{m,n}”、“{m,}”、“?”、“*”和“+”;
在匹配優(yōu)先量詞后面加上“?”叫做忽略優(yōu)先量詞,主要包括:“{n}?”、“{m,n}?”、“*?”和
“+?”;
貪婪模式:在匹配字符對(duì)象滿足的情況下盡可能匹配多個(gè)字符,指被匹配優(yōu)先量詞修飾的字符串;
非貪婪模式:在匹配規(guī)則滿足的情況下盡可能匹配少的字符,指被忽略優(yōu)先量詞匹配的字符串;
列個(gè)表幫助你深刻理解貪婪模式與非貪婪模式的區(qū)別:
說(shuō)明:當(dāng)字符串遍歷到第二個(gè)<abc>時(shí)就已經(jīng)滿足匹配規(guī)則了,但是模式一是貪婪模式需要盡可能匹配多的字符,第三個(gè)<abc>后面已經(jīng)沒(méi)有能夠滿足匹配規(guī)則的字符了,所以在遍歷到第3個(gè)<abc>就停下了結(jié)果即為:<abc>.*<abc>56.<abc>;而模式二為非貪婪模式即結(jié)果為:<abc>56.<abc>
匹配時(shí)出現(xiàn)的反斜杠的問(wèn)題
在用正則匹配時(shí),需要對(duì)于某些特殊字符進(jìn)行轉(zhuǎn)義,就比如‘baidu.com’,匹配時(shí)需要寫(xiě)成“baidu\.com”;但是python字符中本身也用‘\’轉(zhuǎn)義,所以需要寫(xiě)成‘baidu\\.com';為了在寫(xiě)匹配字符對(duì)象時(shí)避免‘\’出現(xiàn)程序問(wèn)題,我們可以匹配時(shí)在字符串前面加一個(gè)字母r,轉(zhuǎn)化為原字符串進(jìn)行匹配,例如 r "baidu\.com";
二、re模板中常用到的函數(shù)
re.compile();
re.compile()將一個(gè)字符串編譯成一個(gè)模式對(duì)象,便于直接利用search,findall,split等函數(shù)直接匹配與搜索或者分割;
re.compile()的原型:re.compile( pattern [, flags] )
pattern表示字符串匹配模式對(duì)象,flags表示修飾量詞:例如:“*”、“+”;
compile函數(shù)的例子:re.compile(r"\d+") : 表示匹配連續(xù)多個(gè)數(shù)字;
compile還有一個(gè)參數(shù)flag可以設(shè)正則表達(dá)式修飾符,常用的修飾符如下:
對(duì)于re.X的解釋,例如,圖中兩個(gè)正則表達(dá)式是等價(jià)的:
re.match()
match函數(shù)從字符串的頭部開(kāi)始匹配,當(dāng)字符滿足匹配模式對(duì)象時(shí)會(huì)返回一個(gè)正確對(duì)象(object),當(dāng)不滿足時(shí)則就會(huì)返回None;例子如下:
字符頭部匹配成功:
字符串頭部匹配失敗
match還有幾個(gè)命令,可以連續(xù)匹配多個(gè)組(用group(n)或者groups()表示),并且組之間的匹配內(nèi)容用元組來(lái)表示:
match還有一些用來(lái)查找滿足匹配某一組字符串起始、結(jié)尾的位置以及范圍,使用方法如下:
re.search()
search在字符串的任一部位都可以進(jìn)行匹配,與match相似如果在模式字符串第一次滿足指定的匹配對(duì)象則返回一個(gè)object,若都不滿足則返回None;當(dāng)然可指定模式字符串的匹配起始位置;match、research、findall(后面需要介紹的函數(shù))都可以不經(jīng)過(guò)compile方法直接進(jìn)行匹配;例子如下圖:
re.findall()
findall也是對(duì)于字符串全部任意部位進(jìn)行匹配,但是與search的主要區(qū)別:匹配組時(shí)search只返回滿足匹配對(duì)象的第一個(gè)組,findall則返回所有滿足匹配對(duì)象的組,而且findall沒(méi)有g(shù)roup或者groups方法的應(yīng)用,匹配的值可以直接返回;寫(xiě)個(gè)例子大家感受一下:
re.sub()
sub的原型:sub(pat,repl,string[,count=0]);用string中的pat用字符repl替換;
sub方法的目的:是用一個(gè)字符或字符串來(lái)替換模式字符串中某一字符或字符串,sub同樣可以借用compile中的匹配對(duì)象,也可以直接進(jìn)行匹配,使用方法如下:
re.split()
split方法的原型:split(pattern,string[,maxsplit = 0])
split作用:根據(jù)匹配分割字符對(duì)象把字符串分割成一個(gè)列表,例子如下:
到此,關(guān)于“python正則表達(dá)式的常見(jiàn)用途”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。