溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python中的正則表達(dá)式與JSON數(shù)據(jù)交換格式

發(fā)布時(shí)間:2020-10-11 13:49:04 來(lái)源:腳本之家 閱讀:133 作者:張 濤 欄目:開發(fā)技術(shù)

一、初識(shí)正則表達(dá)式

正則表達(dá)式 是一個(gè)特殊的字符序列,一個(gè)字符串是否與我們所設(shè)定的這樣的字符序列,相匹配快速檢索文本、實(shí)現(xiàn)替換文本的操作

json(xml) 輕量級(jí) web 數(shù)據(jù)交換格式

import re
a='C|C++|Java|C#||Python|Javascript'
r= re.findall('Python',a)
print(r)
if len(r) > 0:
 print('字符串中包含Python')
else:
 print('No')
['Python']
字符串中包含Python 

二、元字符與普通字符

import re
a='C0C++7Java8C#9Python6Javascript'
r= re.findall('\d',a)
print(r)
b=''
for x in a:
 try:
 int(x)
 b +=x+','
 except :
 pass
print(b)

結(jié)果:

['0', '7', '8', '9', '6']
0,7,8,9,6,

'Python' 普通字符 '\d' 元字符

三、字符集

import re
#找出中間一個(gè)字符不是C 和F的 單詞
s = 'abc, acc, adc, aec, afc, ahc'
r = re.findall('a[^cf]c', s) #[a-z] [cf]
print(r)

結(jié)果:

['abc', 'adc', 'aec', 'ahc']

四、概括字符集

#\d 數(shù)字 \D 字母
#\w 數(shù)字和字母 =[a-zA-Z0-9_] \W 
#\s 空白字符 \S
a='python 11\t11java&678p\nh\rp'
r = re.findall('\s', a)
print(r)

結(jié)果:

[' ', '\t', '\n', '\r']

五、數(shù)量詞

a='python 1111java&678php'
r = re.findall('[a-z]{3,6}', a)
print(r)

結(jié)果:

['python', 'java', 'php']

六、貪婪與非貪婪

a='python 1111java&678php'
r = re.findall('[a-z]{3,6}?', a)
#貪婪 與 非貪婪 ?
print(r)

結(jié)果:

['pyt', 'hon', 'jav', 'php']

七、匹配0次1次或者無(wú)限多次

# * 匹配0次或者無(wú)限多次
# + 匹配1次或者無(wú)限多次
# ? 匹配0次或者1次
a='pytho0python1pythonn2pythonw'
r = re.findall('python*', a)
print(r)

結(jié)果:

['pytho', 'python', 'pythonn', 'python']

八、邊界匹配符

qq = '12345678'
# 4~8 
r = re.findall('^\d{4,8}$', qq)
print(r)
a = '123456789'
# 4~8 ^規(guī)則$ ^開頭 $結(jié)尾
e = re.findall('^\d{4,8}$', a)
print(e)

結(jié)果:

['12345678']
[]

九、組

# () 組
a = 'pythonpythonpythonpythonpython'
# 
r = re.findall('(python){3}', a)
print(r)

結(jié)果:

['python'] 代表存在一組(pythonpythonpython) 這樣的數(shù)據(jù)

十、匹配模式參數(shù)

# I | S 忽略大小寫 | 匹配所有字符
lanuage = 'PythonC#\nJavaPHP'
r = re.findall('c#.{1}', lanuage,re.I | re.S)
print(r)

結(jié)果:

['C#\n']

十一、re.sub正則替換

搜索替換

def convert(value):
 matched = value.group()
 # print(value) <_sre.SRE_Match object; span=(6, 8), match='C#'>
 return '!!'+matched+'!!'
lanuage = 'PythonC#JavaC#PHPC#'
# r = re.sub('C#', 'GO', lanuage, 1) 返回結(jié)果: PythonGOJavaC#PHPC#
# s=lanuage.replace('C#', 'GO')
r = re.sub('C#', convert, lanuage) #傳入?yún)?shù)
print(r)

結(jié)果:

Python!!C#!!Java!!C#!!PHP!!C#!!

十二、把函數(shù)作為參數(shù)傳遞

def convert(value):
 matched = value.group() #拿到對(duì)象的值
 # print(value) <_sre.SRE_Match object; span=(6, 8), match='C#'>
 if int(matched) >=6 :
 return '9'
 else:
 return '0'
lanuage = 'A8C3721D86'
r = re.sub('\d', convert, lanuage)
print(r)
#
A9C0900D99

十三、search與match函數(shù)

s = 'A8C3721D86'
# None 從開頭開始匹配 假如沒有找到相應(yīng)的匹配結(jié)果 返回None 只匹配一次
r = re.match('\d', s) 
print(r) #None
#搜索這個(gè)字符串 一旦找到第一個(gè)滿足匹配的結(jié)果就返回 只匹配一次
r1 = re.search('\d', s)
print(r1) #<_sre.SRE_Match object; span=(1, 2), match='8'>
print(r1.group()) #8
print(r1.span()) # (1, 2)
r2 = re.findall('\d', s)
print(r2) #['8', '3', '7', '2', '1', '8', '6']

十四、group分組

#提取life 和python 之間的值
s = 'life is short,i use python'
#None
r = re.search('life.*python', s)
print(r.group()) #life is short,i use python group(組號(hào))
r = re.search('life(.*)python', s)
print(r.group(0)) #life is short,i use python group(組號(hào))
print(r.group(1)) # is short,i use
#group(0) 一種特殊情況 匹配正則表達(dá)式完整的結(jié)果
r = re.findall('life(.*)python', s)
print(r) #[' is short,i use ']
s = 'life is short,i use python, i love python'
r = re.search('life(.*)python(.*)python', s)
print(r.group(0)) # life is short,i use python, i love python 
print(r.group(1)) # is short,i use
print(r.group(2)) # , i love
print(r.group(0,1,2)) #('life is short,i use python, i love python', ' is short,i use ', ', i love ')
print(r.groups()) # (' is short,i use ', ', i love ')

十五、一些關(guān)于學(xué)習(xí)正則的建議

#\d 數(shù)字 \D 字母
#\w 數(shù)字和字母 =[a-zA-Z0-9_] \W 
#\s 空白字符 \S
# . 匹配除了換行符\n之外其他所有字符
# * 匹配0次或者無(wú)限多次
# + 匹配1次或者無(wú)限多次
# ? 匹配0次或者1次
# () 組 
# I | S 忽略大小寫 | 匹配所有字符

python :爬蟲,數(shù)據(jù)處理

十六、理解JSON

JSON 是一種輕量級(jí)的數(shù)據(jù)交換格式

字符串是JSON的表現(xiàn)形式

符合 JSON 格式的字符串叫做 JSON 字符串

{"name":"qiyue"}

JSON VS XML

優(yōu)勢(shì):

跨語(yǔ)言交換數(shù)據(jù)

易于閱讀

易于解析

網(wǎng)絡(luò)傳輸效率高

十七、反序列化

import json
# JSON object array
json_str = '{"name":"qiyue","age":18}'
s = json.loads(json_str)
# dict
#反序列化
s = json.loads(json_str) #load() 把json 的數(shù)據(jù)類型 轉(zhuǎn)換為我們自己語(yǔ)言的數(shù)據(jù)類型
print(type(s)) #<class 'dict'>
print(s) #{'name': 'qiyue', 'age': 18}
print(s['name']) # qiyue
json_str = '[{"name":"qiyue","age":18},{"name":"qiyue","age":18}]'
s = json.loads(json_str)
print(type(s)) # <class 'list'>
print(s) # [{'name': 'qiyue', 'age': 18}, {'name': 'qiyue', 'age': 18}]

JSON Python
object dict
array list
string str
number int
number float
true True
false False
null None

十八、序列化

#序列化 為json
student = [
 {"name":"qiyue","age":18, 'flag':False},
 {"name":"python","age":18}
]
json_str = json.dumps(student)
print(type(json_str)) # <class 'str'>
print(json_str) #[{"name": "qiyue", "age": 18, "flag": false}, {"name": "python", "age": 18}]

十九、小談JSON、JSON對(duì)象與JSON字符串

JSON 是一種輕量級(jí)的數(shù)據(jù)交換格式

JSON對(duì)象 局限于語(yǔ)言

JSON字符串

JSON 有自己的數(shù)據(jù)類型

雖然它和JavaScript 的數(shù)據(jù)類型有些相似 但是他們不是一種語(yǔ)言

ECMASCRIPT一個(gè)標(biāo)準(zhǔn) JavaScript ActionScription JSON 實(shí)現(xiàn)標(biāo)準(zhǔn)的一種方案

REST 服務(wù)

Python中的正則表達(dá)式與JSON數(shù)據(jù)交換格式

總結(jié)

以上所述是小編給大家介紹的Python中的正則表達(dá)式與JSON數(shù)據(jù)交換格式 ,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)億速云網(wǎng)站的支持!
如果你覺得本文對(duì)你有幫助,歡迎轉(zhuǎn)載,煩請(qǐng)注明出處,謝謝!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI