溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

42 python中正則中的分組 正則中匹配字符串的起始和結(jié)

發(fā)布時間:2020-07-27 02:03:50 來源:網(wǎng)絡(luò) 閱讀:199 作者:馬吉輝 欄目:大數(shù)據(jù)
第七課 正則中的分組
# 分組
# 正則表達(dá)式中用一對圓括號括起來的部分被稱為一個分組
# '(\d\d\d)-(\d\d)'

import re

'''
1. 只有圓括號括起來的部分才算一組,如果正則表達(dá)式中既有被圓括號括起來的部分,
也有未被圓括號括起來的部分,那么只將圓括號括起來的部分算一組
2. group方法,如果不指定參數(shù),會返回匹配的整個字符串,如果加參數(shù),會返回指定
分組的字符串,組索引從1開始
3. groups方法,以元組形式返回匹配的所有分組
4. 分組的索引是從1開始的 
'''
# 分3組   3個數(shù)字-4個數(shù)字-2個小寫字母
m = re.match('(\d{3})-\d{4}-[a-z]{2}','123-4567-xy')
print(m)            # <re.Match object; span=(0, 11), match='123-4567-xy'>
print(m.groups())  # ('123',)
print(m.group())   # 123-4567-xy
print(m.group(1))  # 123
print('-------------')
m = re.match('(\d{3})-(\d{4})-[a-z]{2}','123-4567-xy')
print(m)                # <re.Match object; span=(0, 11), match='123-4567-xy'>
print(m.groups())   # ('123', '4567') 這個是返回一個元組 只要是分組里面的就放在元組里
print(m.group())   # 123-4567-xy
print(m.group(1)) # 123
print(m.group(2)) # 456
print('----------')
m = re.match('(\d{3})-(\d{4})-([a-z]{2})','123-4567-xy')
print(m)           # <re.Match object; span=(0, 11), match='123-4567-xy'>
print(m.groups())  # ('123', '4567', 'xy')
print(m.group())   # 123-4567-xy
print(m.group(1))  # 123
print(m.group(2))  # 456
print(m.group(3))  # xy
print('-----------')
m = re.match('(\d{3}-\d{4})-([a-z]{2})','123-4567-xy')
print(m)            # <re.Match object; span=(0, 11), match='123-4567-xy'>
print(m.groups())   # ('123-4567', 'xy')
print(m.group())    # 123-4567-xy
print(m.group(1))   # 123-4567
print(m.group(2))   # xy
第八課 正則中匹配字符串的起始和結(jié)尾以及單詞邊界

# 匹配字符串的起始和結(jié)尾以及單詞邊界
'''
"^":匹配字符串的開始
"$":匹配字符串的結(jié)束
"\b":匹配單詞邊界

單詞邊界:是指空格或標(biāo)點(diǎn)符號
" hello?"  這個左右2側(cè)都有邊界
" world0"  這個表示左側(cè)有邊界,右側(cè)沒有邊界
'''
import re
# "The"必須在字符串的開始才會搜索到
m = re.search('The', 'abc The.')
print(m)     # <re.Match object; span=(4, 7), match='The'>
m = re.search('^The', 'The bus.')
print(m)     # <re.Match object; span=(0, 3), match='The'>

# The必須在字符串的結(jié)尾才會搜索到
m = re.search('The$','The end.')
print(m)     # None
m = re.search('The$','end.The')
print(m)     # <re.Match object; span=(4, 7), match='The'>

print("---------------")
# 要求'this'左側(cè)必須有邊界才能搜索到
m = re.search(r'\bthis',"What's this?")    # 不使用r里面的\b就會給你轉(zhuǎn)義了
print(m)     # <re.Match object; span=(7, 11), match='this'>

m = re.search(r'\bthis',"this is a bus.")
print(m)      # <re.Match object; span=(0, 4), match='this'>

m = re.search(r'\bthis',"<this> is a bus.")
print(m)      # <re.Match object; span=(1, 5), match='this'>

m = re.search(r'\bthis',"1234this is a bus.")
print(m)     # None

m = re.search(r'\bthis\b',"What's this123")
print(m)    # None
第九課 正則中使用findall和finditer函數(shù)查找所有匹配的結(jié)果
# 使用findall和finditer函數(shù)查找所有匹配正則表達(dá)式的字符串

'''
findall:通過列表返回所有滿足條件的字符串,DOM    這是所有結(jié)果一起返回
finditer:將搜索結(jié)果通過一個迭代器返回,SAX      這個不是所有的返回
'''

import re
s = '12-a-abc54-a-xyz---78-A-ytr'
result = re.findall(r'\d\d-[a]-[a-z]{3}',s)
print(result)                                   # ['12-a-abc', '54-a-xyz']
result = re.findall(r'\d\d-[aA]-[a-z]{3}',s)   # 這一步里面的 [aA] 也是忽略大小寫
print(result)                               # ['12-a-abc', '54-a-xyz', '78-A-ytr'] 

result = re.findall(r'(\d\d-[aA])-([a-z]{3})',s)   # 分組返回 拆成一個組
print(result)                               # [('12-a', 'abc'), ('54-a', 'xyz'), ('78-A', 'ytr')]
s1 = '12-a-abc54-a-xYz---78-A-ytr'
result = re.findall(r'\d\d-a-[a-z]{3}',s1,re.I)   # 可以加第三個參數(shù) 第三個參數(shù)的位置 可以忽略大小寫 re.I 這個就是忽略大小寫
print(result)                               # ['12-a-abc', '54-a-xYz', '78-A-ytr']

it = re.finditer(r'(\d\d)-a-([a-z]{3})',s,re.I)
for result in it:
    print(result.group(),end=' <')
    groups = result.groups()
    for i in groups:
        print(i, end = ' ')
    print('>')

'''
12-a-abc <12 abc >
54-a-xyz <54 xyz >
78-A-ytr <78 ytr >

'''
向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI