溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

如何使用Python正則表達(dá)式

發(fā)布時(shí)間:2021-10-19 13:34:00 來(lái)源:億速云 閱讀:164 作者:小新 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要介紹了如何使用Python正則表達(dá)式,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

    Python3 正則表達(dá)式

    正則表達(dá)式是一個(gè)特殊的字符序列,它能幫助你方便的檢查一個(gè)字符串是否與某種模式匹配。本文主要闡述re包中的主要函數(shù)。

    在闡述re包中的函數(shù)之前,我們首先看議案正則表達(dá)式的模式,即使用特殊的語(yǔ)法來(lái)表示一個(gè)正則表達(dá)式。

    如何使用Python正則表達(dá)式

    如何使用Python正則表達(dá)式

    1.match函數(shù)

    • re.match 嘗試從字符串的起始位置匹配一個(gè)模式,如果不是起始位置匹配成功的話,match()就返回none。

    • 函數(shù)用法:re.match(pattern, string, flags=0)

    • pattern: 所要匹配的正則表達(dá)式string: 要匹配的字符串flags: 標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫(xiě),多行匹配等等。

      •  re.I 忽略大小寫(xiě)

      • re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴(lài)于當(dāng)前環(huán)境

      • re.M 多行模式re.S 即為' . ‘并且包括換行符在內(nèi)的任意字符(' . '不包括換行符)

      • re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴(lài)于 Unicode 字符屬性數(shù)據(jù)庫(kù)

      • re.X 為了增加可讀性,忽略空格和' # '后面的注釋

    匹配對(duì)象方法:

    • group(num=0): 匹配的整個(gè)表達(dá)式的字符串,group() 可以一次輸入多個(gè)組號(hào),在這種情況下它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。

    • groups(): 返回一個(gè)包含所有小組字符串的元組,從 1 到 所含的小組號(hào)。

    import re
    print(re.match("xixi", "xixi_haha_heihei").group())
    xixi
    line = 'Cats are smarter than dogs'
    b = re.match(r'(.*) are (.*?) .*', line, re.M|re.I)
    
    print(b.group()) # 返回所有
    print(b.group(1)) # 返回第一組,即(.*)對(duì)應(yīng)的
    print(b.group(2)) # 返回第二組,即(.*?)對(duì)應(yīng)的
    Cats are smarter than dogs
    Cats
    smarter

    2.search函數(shù)

    re.search 掃描整個(gè)字符串并返回第一個(gè)成功的匹配。

    函數(shù)用法:re.search(pattern, string, flags=0)

    print(re.match('heihei', 'xixi_haha_heihei'))
    print(re.search('heihei', 'xixi_haha_heihei').group())
    None
    heihei
    line = 'Cats are smarter than dogs'
    b = re.search(r'(.*) are (.*?) .*', line, re.M|re.I)
    
    print(b.group()) # 返回所有
    print(b.group(1)) # 返回第一組,即(.*)對(duì)應(yīng)的
    print(b.group(2)) # 返回第二組,即(.*?)對(duì)應(yīng)的
    Cats are smarter than dogs
    Cats
    smarter

    search和match的區(qū)別

    match只匹配字符串的開(kāi)始,如果字符串開(kāi)始不符合正則表達(dá)式,則匹配失敗,函數(shù)返回None;而search匹配整個(gè)字符串,直到找到一個(gè)匹配。

    3. sub函數(shù)

    re提供了re.sub來(lái)替換字符串中的匹配項(xiàng)。
    函數(shù)用法:re.sub(pattern, repl, string, count=0, flags=0)

    • pattern : 正則中的模式字符串。

    • repl : 替換的字符串,也可為一個(gè)函數(shù)。

    • string : 要被查找替換的原始字符串。

    • count : 模式匹配后替換的最大次數(shù),默認(rèn) 0 表示替換所有的匹配。

    • flags : 編譯時(shí)用的匹配模式,數(shù)字形式。

    phone = '133-3333-3333  # this is a phone number'
    
    num = re.sub(r'#.*$', '', phone)
    print('phone num', num)
    # 移除注釋?zhuān)业揭?開(kāi)頭的。
    
    num = re.sub(r'\D', '', phone)
    print('phone num', num)
    # 移除非數(shù)字內(nèi)容
    phone num 133-3333-3333  
    phone num 13333333333

    repl是函數(shù)的情況

    def double(matched):
        value = int(matched.group('value'))
        return str(value * 2)
    
    s = 'A233Sfd34'
    print(re.sub('(?P<value>\d+)', double, s))
    A466Sfd68

    4.compile函數(shù)

    compile 函數(shù)用于編譯正則表達(dá)式,生成一個(gè)正則表達(dá)式( Pattern )對(duì)象,供 match() 和 search() 這兩個(gè)函數(shù)使用。
    函數(shù)使用:re.compile(pattern, flags)

    pattern = re.compile(r'/d+')
    m = pattern.match('ones123412')
    print(m)
    None

    5.findall

    在字符串中找到正則表達(dá)式所匹配的所有子串,并返回一個(gè)列表,如果沒(méi)有找到匹配的,則返回空列表。
    注意:match和search是匹配一次,但是findall是匹配所有。

    函數(shù)使用:findall(string, pos, endpos)

    • string 待匹配的字符串。

    • pos 可選參數(shù),指定字符串的起始位置,默認(rèn)為 0。

    • endpos 可選參數(shù),指定字符串的結(jié)束位置,默認(rèn)為字符串的長(zhǎng)度。

    pattern = re.compile(r'\d+')
    result1 = pattern.findall('xixixix 123 heihiehei 456')
    result2 = pattern.findall('xixixix 123 heihiehei 456', 0, 15)
    
    print(result1)
    print(result2)
    ['123', '456']
    ['123']

    6.finditer

    和 findall 類(lèi)似,在字符串中找到正則表達(dá)式所匹配的所有子串,并把它們作為一個(gè)迭代器返回。

    ittt = re.finditer(r'\d+', '12dsfasdf123asdf534')
    for ttt in ittt:
        print(ttt.group())
    12
    123
    534

    7.split

    split 方法按照能夠匹配的子串將字符串分割后返回列表。

    函數(shù)使用:

    re.split(pattern, string, maxsplit=0, flags=0)

    • pattern: 匹配的正則表達(dá)式

    • string: 要匹配的字符串。

    • maxsplit: 分隔次數(shù),maxsplit=1 分隔一次,默認(rèn)為 0,不限制次數(shù)。

    • flags: 標(biāo)志位,用于控制正則表達(dá)式的匹配方式,

    print(re.split('\W+', 'xxixix, xixixi, hehiehei'))
    print(re.split('(\W+)', ' xxixix, xixixi, hehiehei'))
    ['xxixix', 'xixixi', 'hehiehei']
    ['', ' ', 'xxixix', ', ', 'xixixi', ', ', 'hehiehei']

    感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“如何使用Python正則表達(dá)式”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來(lái)學(xué)習(xí)!

    向AI問(wèn)一下細(xì)節(jié)

    免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

    AI