溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

【學(xué)習(xí)筆記】Python正則表達(dá)式

發(fā)布時(shí)間:2020-07-22 06:49:36 來(lái)源:網(wǎng)絡(luò) 閱讀:531 作者:wx57a1620925627 欄目:移動(dòng)開(kāi)發(fā)

一、準(zhǔn)備知識(shí)
\d:匹配一個(gè)數(shù)字
\w:匹配一個(gè)字母
. :匹配任意字符
\s :匹配一個(gè)空格

?表示0個(gè)或1個(gè)字符
+表示至少一個(gè)字符
*表示任意個(gè)字符(包括0個(gè))
{n}表示n個(gè)字符,{n,m}表示n-m個(gè)字符

[0-9a-zA-Z_]可以匹配一個(gè)數(shù)字、字母或者下劃線
(P|p)ython可以匹配'Python'或者'python'
^py$只能匹配'py'了

二、在Python中使用
(1)匹配

import re
re.match(r'^\d{3}-\d{3,8}$', '010-12345')
<_sre.SRE_Match object at 0x1026e18b8>
re.match(r'^\d{3}-\d{3,8}$', '010 12345')

match()方法判斷是否匹配,如果匹配成功,返回一個(gè)Match對(duì)象,否則返回None

(2)切分字符串

import re
re.split(r'[\s\,\;]+', 'a,b;; c d')
['a', 'b', 'c', 'd']

(3)提取子串

import re
m = re.match(r'^(\d{3})-(\d{3,8})$', '010-12345')
m.group(0)
'010-12345'
m.groups()
('010', '12345')
m.group(1)
'010'
m.group(2)
'12345'
用()表示的就是要提取的分組(Group),group(0)永遠(yuǎn)是原始字符串,group(1)、group(2)……表示第1、2、……個(gè)子串

(4)貪婪匹配
正則匹配默認(rèn)是貪婪匹配,也就是匹配盡可能多的字符。舉例如下,匹配出數(shù)字后面的0:

re.match(r'^(\d+)(0)$', '102300').groups()
('102300', '')
由于\d+采用貪婪匹配,直接把后面的0全部匹配了,結(jié)果0
只能匹配空字符串了。

必須讓\d+采用非貪婪匹配(也就是盡可能少匹配),才能把后面的0匹配出來(lái),加個(gè)?就可以讓\d+采用非貪婪匹配:

re.match(r'^(\d+?)(0*)$', '102300').groups()
('1023', '00')

(5)編譯
先編譯-后匹配,提高效率

import re

編譯:

re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$')

使用:

re_telephone.match('010-12345').groups()
('010', '12345')
re_telephone.match('010-8086').groups()
('010', '8086')

三、實(shí)例
#郵箱匹配
import re

reemail = re.compile(r'^[0-9a-zA-Z][0-9a-zA-Z\.]+\@[0-9a-z]+.(com|cn|org|net)$')

m = re_email.match(email)

if m:
print "OK."
else:
print "You have input a wrong e-mail."

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI