溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

PHP中如何使用preg_match_all正則表達(dá)式

發(fā)布時(shí)間:2021-07-14 14:29:23 來源:億速云 閱讀:208 作者:Leah 欄目:編程語言

今天就跟大家聊聊有關(guān)PHP中如何使用preg_match_all正則表達(dá)式,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

實(shí)例代碼

$html = '<div id="biuuu">51CTO</div><div id="biuuu_2">51CTO2</div><div id="biuuu_3">51CTO3</div>';

實(shí)例要求:分別將每一個(gè)DIV元素的ID和內(nèi)容取出,如biuuu,biuuu_2,biuuu_3,51CTO,51CTO2和51CTO3(一些常用的抓站方法就是這樣匹配的)

分析:字符串是一個(gè)簡(jiǎn)單的HTML元素,每一個(gè)DIV元素對(duì)應(yīng)該一個(gè)ID和內(nèi)容,并且是獨(dú)立的,首先考慮如何取出一個(gè)DIV內(nèi)的ID值和內(nèi)容,如:51CTO,然后匹配其它類似的元素。一個(gè)DIV中需要取出兩個(gè)值,也就是兩個(gè)匹配的表達(dá)式,***個(gè)表達(dá)式用于匹配ID值(biuuu),第二個(gè)表達(dá)式用于匹配ID的內(nèi)容(51CTO),正則表達(dá)式常用的表達(dá)式使用小括號(hào),那么前面的元素將會(huì)變成如下形式:

<div id="(biuuu)">(51CTO)</div> <div id="(表達(dá)式1)">(表達(dá)式2)</div>

好,使用如上小括號(hào)把需要匹配的區(qū)域進(jìn)行了劃分,接下來就是如何匹配各個(gè)表達(dá)式內(nèi)的內(nèi)容,我們猜想一個(gè)ID可能是字母,數(shù)字或下劃線,那這就變得簡(jiǎn)單了,使用中括號(hào)就可以實(shí)現(xiàn),如下:

表達(dá)式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數(shù)字和下劃線)

那如何匹配表達(dá)式2,因?yàn)镮D的內(nèi)容可以是任意的字符,但是要注意,不能匹配<或>字符,因?yàn)槿绻ヅ溥@兩個(gè)字符將會(huì)把后面使用的DIV都匹配出來,因此需要排除這兩個(gè)字符開始的元素,也就是不匹配以<或>字符,如下:

表達(dá)式2:[^<>]+ (表示不匹配<和>字符)

這樣,需要匹配的子表達(dá)式就實(shí)現(xiàn)了,但是還要需要匹配一個(gè)的表達(dá)式,方法如下:

表達(dá)式:/ '\"(表達(dá)式1)\"'>(表達(dá)式2)<\/div>/

注意其中的雙引號(hào)"和/需要使用\轉(zhuǎn)義字符轉(zhuǎn)義,然后把前面兩個(gè)表達(dá)式放進(jìn)去,如下:

'\"([a-z0-9_]+)\"'>/<div id=\"([a-z0-9_]+)\">([^<>]+)<\/div>/ 

 

這樣就實(shí)現(xiàn)一個(gè)匹配每一個(gè)DIV元素ID值和內(nèi)容的正則表達(dá)式,然后使用preg_match_all函數(shù)測(cè)試如下:

$html = '<div id="biuuu">51CTO</div><div id="biuuu_2">51CTO2</div><div id="biuuu_3">51CTO3</div>'; preg_match_all('/<div\sid=\"([a-z0-9_]+)\">([^<>]+)<\/div>/',$html,$result); var_dump($result);

結(jié)果:

array(3) { [0]=> array(3)

{ [0]=> string(30) "<div id="biuuu">51CTO</div>" [1]=> string(33) "<div id="biuuu_2">51CTO2</div>" [2]=> string(33) "<div id="biuuu_3">51CTO3</div>" } [1]=> array(3) { [0]=> string(5) "biuuu" [1]=> string(7) "biuuu_2" [2]=> string(7) "biuuu_3" } [2]=> array(3) { [0]=> string(8) "51CTO" [1]=> string(9) "51CTO2" [2]=> string(9) "51CTO3" } }

看完上述內(nèi)容,你們對(duì)PHP中如何使用preg_match_all正則表達(dá)式有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI