溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

python如何實(shí)現(xiàn)正則表達(dá)式

發(fā)布時(shí)間:2021-09-23 10:25:52 來源:億速云 閱讀:154 作者:小新 欄目:互聯(lián)網(wǎng)科技

這篇文章給大家分享的是有關(guān)python如何實(shí)現(xiàn)正則表達(dá)式的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

  1、re.sub和replace:

    sub的全拼是substitute,也就是替換的意思;既然知道是替換了,那就很容易用到實(shí)例中了,其實(shí)replace也是替換的意思,只不過它們的用法不太相同,下面用一個(gè)例子來詳細(xì)說明下它們的異同之處:

>>> import re
>>> str1 = 'Hello 111 is 222'
>>> str2 = str1.replace('111','222')
>>> print(str2)
Hello 222 is 222
>>>

   這是一個(gè)簡(jiǎn)單的例子,如果是下面這種情形,把所有的數(shù)字都換成222,那么用replace實(shí)現(xiàn)起來就比較麻煩,而用re模塊的sub方法實(shí)現(xiàn)起來就比較的簡(jiǎn)單:(如果是更復(fù)雜的操作,使用replace可能就無法實(shí)現(xiàn)了。)

>>> import re
>>> str1 = 'Hello 123 is 456'
>>> str2 = re.sub('\d+','222',str1)
>>> print(str2)
Hello 222 is 222
>>>

  2、re.search()和re.match():

    match: 只從字符串的開始與正則表達(dá)式匹配,匹配成功返回matchobject,否則返回none.

    search:將字符串的所有字串嘗試與正則表達(dá)式匹配,如果所有的字串都沒有匹配成功則返回none,否則返回matchobject.

    下面這個(gè)例子說明了match和search的異同點(diǎn),也說明了,在實(shí)際的應(yīng)用中,search用的還是比較多的:

import re
str = 'helloword,i am alex'
if not re.match('word',str):
print('cannot match')
print(re.match('hello',str1).group())
print(re.search('word',str1).group())
#顯示結(jié)果
cannot match
hello
word

  3、re.split:

    在Python中,如果想對(duì)一個(gè)字符串進(jìn)行分割的話,只需要調(diào)用str的split方法就可以實(shí)現(xiàn),但是這個(gè)split只能根據(jù)某個(gè)字符來進(jìn)行分割的操作,如果要同時(shí)指定多個(gè)字符來進(jìn)行分割的話,它就無法實(shí)現(xiàn)了。

    好在re模塊也提供了split這個(gè)方法來對(duì)字符串進(jìn)行分割,而且這個(gè)方法更加強(qiáng)大,可以同時(shí)根據(jù)多個(gè)字符進(jìn)行分割的操作,下面來看分別看一下str的split和re的split有什么不同的地方:

str1 = 'helloword,i;am\nalex'
str2 = str1.split(',')
print(str2)
import re
str3 = re.split('[,|;|\n]',str1)
print(str3)
#下面是不同的輸出結(jié)果
['helloword', 'i;am\nalex']
['helloword', 'i', 'am', 'alex']

    從中我們可以看出,上面說的真實(shí)性。

  4、findall:

    findall方法基本上都是和compile方法同時(shí)出現(xiàn)的,它們的用法是:

      先由compile將一個(gè)正則表達(dá)式的字符串形式轉(zhuǎn)換成pattern實(shí)例,然后再使用patte實(shí)例調(diào)用findall方法生成match對(duì)象來獲取結(jié)果,在將它們結(jié)合的實(shí)例之前,我們先來看下正則表達(dá)式中預(yù)設(shè)的特殊字符含義:

    \d 匹配任何十進(jìn)制數(shù);它相當(dāng)于類 [0-9]。

    \D 匹配任何非數(shù)字字符;它相當(dāng)于類 [^0-9]。

    \s 匹配任何空白字符;它相當(dāng)于類 [ "t"n"r"f"v]。

    \S 匹配任何非空白字符;它相當(dāng)于類 [^ "t"n"r"f"v]。

    \w 匹配任何字母數(shù)字字符;它相當(dāng)于類 [a-zA-Z0-9_]。

    \W 匹配任何非字母數(shù)字字符;它相當(dāng)于類 [^a-zA-Z0-9_]。

   看完這幾個(gè)特殊字符的含義,我們?cè)倥e一個(gè)例子來說明一下上面的論點(diǎn):

import re
str1 = 'asdf12dvdve4gb4'
pattern1 = re.compile('\d')
pattern2 = re.compile('[0-9]')
mch2 = pattern1.findall(str1)
mch3 = pattern2.findall(str1)
print('mch2:\t%s'% mch2)
print('mch3:\t%s'% mch3)
#輸出結(jié)果
mch2: ['1', '2', '4', '4']13 mch3: ['1', '2', '4', '4']

   上面的兩個(gè)實(shí)例都可以很好的闡述上面的論點(diǎn),而且也表明了,特殊字符\d確實(shí)跟[0-9]是一樣的,通過輸出結(jié)果就可以看出,那么如果你不想把每個(gè)數(shù)字都拆分為一個(gè)元素放在列表中,而是想把12整體的輸出出來,那么你可以這樣做:(就是在\d的后面加上個(gè)+號(hào)來實(shí)現(xiàn)的,這里的+號(hào)表示的是把一個(gè)或者多個(gè)相連的十進(jìn)制數(shù)字整體輸出)

import re
str1 = 'asdf12dvdve4gb4'
pattern1 = re.compile('\d+')
pattern2 = re.compile('[0-9]')
mch2 = pattern1.findall(str1)
mch3 = pattern2.findall(str1)
print('mch2:\t%s'% mch2)
print('mch3:\t%s'% mch3)
#輸出結(jié)果
mch2: ['12', '4', '4']
mch3: ['1', '2', '4', '4']

   我們?cè)倥e一個(gè)小例子,這個(gè)例子是結(jié)合特殊字符和re的sub功能實(shí)現(xiàn)一下把字符串中所有的空格都給去掉:

import re
str1 = 'asd \tf12d vdve4gb4'
new_str = re.sub('\s*','',str)
print(new_str)
#輸出結(jié)果
asdf12dvdve4gb4

  5、元字符:

    我們通常所說的二元字符有;2元字符:. ^ $ * + ? { } [ ] | ( ) \

    我們首先考察的元字符是"[" 和 "]"。它們常用來指定一個(gè)字符類別,所謂字符類別就是你想匹配的一個(gè)字符集。字符可以單個(gè)列出,也可以用“-”號(hào)分隔的兩個(gè)給定
字符來表示一個(gè)字符區(qū)間。例如,[abc] 將匹配"a", "b", 或 "c"中的任意一個(gè)字符;也可以用區(qū)間[a-c]來表示同一字符集,和前者效果一致。如果你只想匹配小寫字母,那么 RE 應(yīng)寫成 [a-z].元字符在類別里并不起作用。例如,[akm$]將匹配字符"a", "k", "m", 或 "$" 中的任意一個(gè);"$"通常用作元字符,但在字符類別里,其特性被除去,恢復(fù)成普通字
符。

    []:元字符[]表示字符類,在一個(gè)字符類中,只有字符^、-、]和\有特殊含義。字符\仍然表示轉(zhuǎn)義,字符-可以定義字符范圍,字符^放在前面,表示非.(這個(gè)在上面的特殊字符示例中也有提現(xiàn)),

    + 匹配+號(hào)前內(nèi)容1次至無限次
    ? 匹配?號(hào)前內(nèi)容0次到1次
    {m} 匹配前面的內(nèi)容m次
    {m,n} 匹配前面的內(nèi)容m到n次

    下面通過一個(gè)小例子,來闡述一下上面的字符在元字符[]中的使用:(在下面的這個(gè)例子中,要注意的有兩點(diǎn):一是在\d+后面的?號(hào)的含義,二是在匹配的前面加上了一個(gè)字符r,其實(shí)在這個(gè)示例中,加與不加都可以顯示一樣的結(jié)果)

>>> import re
>>> print(re.findall(r"a(\d+?)","a123b"))
['1']
>>> print(re.findall(r"a(\d+)","a123b"))
['123']
>>>

感謝各位的閱讀!關(guān)于“python如何實(shí)現(xiàn)正則表達(dá)式”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI