python正則表達中的re庫常用方法有哪些

發(fā)布時間：2022-08-29 16:44:31 來源：億速云閱讀：117 作者：iii 欄目：開發(fā)技術(shù)

這篇文章主要講解了“python正則表達中的re庫常用方法有哪些”，文中的講解內(nèi)容簡單清晰，易于學(xué)習(xí)與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“python正則表達中的re庫常用方法有哪些”吧！

元字符 ：

預(yù)定義字符集：

python正則表達中的re庫常用方法有哪些

我進行組合一些復(fù)雜的正則表達式的時候是為了快捷去晚上找一些現(xiàn)成的模式，然后再自己進行修改，變成符合自己需要的一些正則表達式。

import re
 
# 正則表達式中的一些使用的符號
 
# 匹配出現(xiàn)符合條件的 0 次的或者是 多次
 
str1 = 'qwertyuio1ui3oo467j398k'
 
#  關(guān)鍵詞: *    下面的句子就是進行匹配 零次 或者是 多次（多個字符） 符合是數(shù)字的意思
pattern = re.compile(r'\d*')
res = re.findall(pattern, str1)
print(res)
""""
顯示的結(jié)果:
['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']
"""
# 關(guān)鍵詞: +  匹配一次或者是多次的結(jié)果
 
pattern = re.compile(r'\d+')
res = re.findall(pattern, str1)
print(res)
"""
顯示結(jié)果:
['1', '3', '467', '398']
"""
 
# 關(guān)鍵詞: ?  匹配0次或者是1次的結(jié)果
 
pattern = re.compile(r'\d?')
res = re.findall(pattern, str1)
print(res)
"""
['', '', '', '', '', '', '', '', '', '1', 
'', '', '3', '', '', '4', '6', '7', '', 
'3', '9', '8', '', '']
"""

# {m}精確匹配m次  (比如寫進去的3，那么他就是匹配到是3個數(shù)字字符串的所有小字符串)
pattern = re.compile(r'\d{3}')
res = re.findall(pattern, str1)
print(res)
# 結(jié)果:['467', '398']
 
# {m, n} 最少匹配m次，最多匹配n次
# 記住在{}里面是不能隨便加上空格的?
pattern = re.compile(r'\d{1,3}')
res = re.findall(pattern, str1)
print(res)
# 結(jié)果:['1', '3', '467', '398']

match()函數(shù)只檢測 目標字符(串) 是不是在string的開始位置匹配，search()會掃描整個string查找匹配, match()只有在0位置匹配成功才會有返回，如果不是開始位置匹配成功,match()就會返回None

代碼解釋：

import re
m = re.match('lsp','hhttlsp')
if m is not None:
        print(m.group())
else:
        print('noneFine')
顯示結(jié)果：
noneFine
n = re.search('lsp','hhttlsp')
if n is not None:
        print(n.group())
else:
        print(noneFine')
顯示結(jié)果：
lsp

import re
n = re.search('lsp','hhttlsp')
if n:
    print(n.group())
else:
    print('noneFine')
# 顯示結(jié)果：
# lsp
m = re.match('lsp','hhttlsp')
if m:
    print(m.group())
else:
    print('noneFine')
# 顯示結(jié)果：
# noneFine

python的re庫有兩個函數(shù)/方法用于實現(xiàn)搜索和替換功能: sub()和subn().兩者幾乎一樣，都是將某字符串中所有匹配正則表達式的部分進行某種形式的替換.用來替換的部分通常是一個字符串，但它也可能是一個函數(shù)，該函數(shù)返回一個用來替換的字符串.subn()和 sub()一樣，但subn()還返回一個表示替換的總數(shù)，替換后的字符串和表示替換總數(shù)的數(shù)字一起作為一個擁有兩個元素的元組返回.

# 可以使用sub()方法來進行查詢和替換，sub方法的格式為：
# sub(replacement, string[, count=0])
# replacement是被替換成的文本
# string是需要被替換的文本
# count是一個可選參數(shù)，指最大被替換的數(shù)量
 
# 下面進行將所有的數(shù)字給進行替換掉
pattern = re.compile(r'\d')
res = re.sub(pattern, '替換掉的數(shù)字  ',str1)
print(res)
# 下文結(jié)果，為了方便大家看到換了多少個數(shù)字，我使用了換行將字符串給換行看出有幾次換了數(shù)字
"""
qwertyuio替換掉的數(shù)字  
ui替換掉的數(shù)字  
oo替換掉的數(shù)字  
替換掉的數(shù)字  
替換掉的數(shù)字  
j替換掉的數(shù)字  
替換掉的數(shù)字  
替換掉的數(shù)字  k
"""

# 加上顯示修改了多少次
res = re.subn(pattern, '替換掉的數(shù)字  ',str1)
print(res)
"""
結(jié)果：
('qwertyuio替換掉的數(shù)字 
 ui替換掉的數(shù)字  
 oo替換掉的數(shù)字 
  替換掉的數(shù)字 
   替換掉的數(shù)字  
   j替換掉的數(shù)字  
   替換掉的數(shù)字 
    替換掉的數(shù)字  
    k', 8)
"""

re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功，則返回一個列表，否則返回原string列表；

第1個參數(shù)：正則表達式
第2個參數(shù)：要匹配查找的原始字符串；
第3個參數(shù)：可選參數(shù)，表示最大的拆分次數(shù)，默認為0，表示全部分割；
第4個參數(shù)：可選參數(shù)，標志位，用于控制正則表達式的匹配方式，如：是否區(qū)分大小寫，多行匹配等等；

特別注意: 此方法并不是完全匹配。它僅僅決定在字符串開始的位置是否匹配。所以當pattern結(jié)束時若還有剩余字符，仍然成功。若想進行完全匹配，可以在表達式末尾加上邊界匹配符'$'

str2 = '自然語言處理123機器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'\d+')
res = re.split(pattern, str2)
print(res)
# 結(jié)果:
# ['自然語言處理', '機器學(xué)習(xí)', '深度學(xué)習(xí)']

Python的re模塊是第一個提出解決方案的模塊：命名捕獲組和命名后向引用。（？P <name> group）將組的匹配捕獲到后向引用“名稱”中。

str2 = '自然語言處理123機器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')
m = re.search(pattern, str2)
print(m.group('lsp'))
# 結(jié)果為:
# 機器學(xué)習(xí)

str2 = '自然語言處理123機器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')
m = re.search(pattern, str2)
print(m.group('dota'))
# 結(jié)果為:
# 123

進行號碼的篩選，小嘗試：

# 篩選號碼
str3 = 'number  132-3209-*******'
pattern = re.compile(r'(\d\d\d-\d\d)')
res = re.search(pattern, str3)
print(res.group())
# 顯示結(jié)果：
# 132-32

全部代碼：

# -*- coding:utf-8 -*-
# @Author : DaFuChen
# @File : demo1.py
# @software: PyCharm

import re
 
# 正則表達式中的一些使用的符號
 
# 匹配出現(xiàn)符合條件的 0 次的或者是 多次
 
str1 = 'qwertyuio1ui3oo467j398k'
 
#  關(guān)鍵詞: *    下面的句子就是進行匹配 零次 或者是 多次（多個字符） 符合是數(shù)字的意思
pattern = re.compile(r'\d*')
res = re.findall(pattern, str1)
print(res)
""""
顯示的結(jié)果:
['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']
"""
 
# 關(guān)鍵詞: +  匹配一次或者是多次的結(jié)果
 
pattern = re.compile(r'\d+')
res = re.findall(pattern, str1)
print(res)
"""
顯示結(jié)果:
['1', '3', '467', '398']
"""
 
# 關(guān)鍵詞: ?  匹配0次或者是1次的結(jié)果
 
pattern = re.compile(r'\d?')
res = re.findall(pattern, str1)
print(res)
"""
['', '', '', '', '', '', '', '', '', '1', 
'', '', '3', '', '', '4', '6', '7', '', 
'3', '9', '8', '', '']
"""
# {m}精確匹配m次  (比如寫進去的3，那么他就是匹配到是3個數(shù)字字符串的所有小字符串)
pattern = re.compile(r'\d{3}')
res = re.findall(pattern, str1)
print(res)
# 結(jié)果:['467', '398']
 
# {m, n} 最少匹配m次，最多匹配n次
# 記住在{}里面是不能隨便加上空格的?
pattern = re.compile(r'\d{1,3}')
res = re.findall(pattern, str1)
print(res)
# 結(jié)果:['1', '3', '467', '398']
 
import re
 
n = re.search('lsp','hhttlsp')
if n:
    print(n.group())
else:
    print('noneFine')
# 顯示結(jié)果：
# lsp
 
m = re.match('lsp','hhttlsp')
if m:
    print(m.group())
else:
    print('noneFine')
# 顯示結(jié)果：
# noneFine
 
# 可以使用sub()方法來進行查詢和替換，sub方法的格式為：
# sub(replacement, string[, count=0])
# replacement是被替換成的文本
# string是需要被替換的文本
# count是一個可選參數(shù)，指最大被替換的數(shù)量
 
# 下面進行將所有的數(shù)字給進行替換掉
pattern = re.compile(r'\d')
res = re.sub(pattern, '替換掉的數(shù)字  ',str1)
print(res)
# 下文結(jié)果，為了方便大家看到換了多少個數(shù)字，我使用了換行將字符串給換行看出有幾次換了數(shù)字
"""
qwertyuio替換掉的數(shù)字  
ui替換掉的數(shù)字  
oo替換掉的數(shù)字  
替換掉的數(shù)字  
替換掉的數(shù)字  
j替換掉的數(shù)字  
替換掉的數(shù)字  
替換掉的數(shù)字  k
"""
 
# 加上顯示修改了多少次
res = re.subn(pattern, '替換掉的數(shù)字  ',str1)
print(res)
"""
結(jié)果：
('qwertyuio替換掉的數(shù)字 
 ui替換掉的數(shù)字  
 oo替換掉的數(shù)字 
  替換掉的數(shù)字 
   替換掉的數(shù)字  
   j替換掉的數(shù)字  
   替換掉的數(shù)字 
    替換掉的數(shù)字  
    k', 8)
"""
str2 = '自然語言處理123機器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'\d+')
res = re.split(pattern, str2)
print(res)
# 結(jié)果:
# ['自然語言處理', '機器學(xué)習(xí)', '深度學(xué)習(xí)']
str2 = '自然語言處理123機器學(xué)習(xí)456深度學(xué)習(xí)'
pattern = re.compile(r'(?P<dota>\d+)(?P<lsp>\D+)')
m = re.search(pattern, str2)
print(m.group('dota'))
# 結(jié)果為:
# 123
 
# 篩選號碼
str3 = 'number  132-3209-*******'
pattern = re.compile(r'(\d\d\d-\d\d)')
res = re.search(pattern, str3)
print(res.group())
# 顯示結(jié)果：
# 132-32

感謝各位的閱讀，以上就是“python正則表達中的re庫常用方法有哪些”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對python正則表達中的re庫常用方法有哪些這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是億速云，小編將為大家推送更多相關(guān)知識點的文章，歡迎關(guān)注！

向AI問一下細節(jié)

python正則表達中的re庫常用方法有哪些

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標簽