您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“如何理解php使用自帶dom擴展進行元素匹配”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
DOMDocument
php提供了非常好用的解析html和xml文檔的擴展庫DOM,使用這個庫可以非常高效的進行html和xml文檔的解析,它的原理就是通過尋找首尾匹配對來進行文檔的解析。
從上面的分析可以看出,如果首位不匹配,可能就會導(dǎo)致一些錯誤的出現(xiàn),因此,這個時候我們需要設(shè)置
libxml_use_internal_errors(true);
來進行錯誤的屏蔽,讓它可以解析整個文檔。
解析html基本用法
$dom = new \DOMDocument; $content = htmlspecialchars_decode($content); libxml_use_internal_errors(true); $content = mb_convert_encoding($content, 'HTML-ENTITIES', 'UTF-8'); $dom->loadHTML($content);
$content是要解析的html字符串,其中我們對它進行了轉(zhuǎn)義,因為可能含有實體集,然后我們有進行了編碼的轉(zhuǎn)換,因為可能文檔不是utf-8格式的,會導(dǎo)致日文,法文等文字亂碼。
獲取元素
$a = $dom->getElementsByTagName('a'); $p = $dom->getElementsByTagName('p');
遍歷元素
$elements = $dom->getElementsByTagName('a'); foreach ($elements as $element) { $element->textContent = '替換成其它的文字'; }
通過上面的循環(huán),可以將全部a標(biāo)簽的文字替換掉。
元素嵌套
有些時候,html會嵌套很多層,比如
<div> <p> <a href="xxx" rel="external nofollow" >我是文字</a> </p> <p> 內(nèi)容替換 </p> </div>
如果我們想要對p標(biāo)簽文字進行替換的化,并且不想要替換含有子元素的內(nèi)容,就是這里的a標(biāo)簽不想替換,下面的語句不能夠解決我們的問題:
$elements = $dom->getElementsByTagName('p'); foreach ($elements as $element) { if($element->hasChildNodes()){ $element->textContent = 'p標(biāo)簽內(nèi)容替換'; } }
上面的代會將a標(biāo)簽的內(nèi)容也替換掉,這不是我們想要的結(jié)果,因為hasChildNodes()這個函數(shù)表示的含有內(nèi)容,無論它是標(biāo)簽還是文字,它都是返回true的,除非它是空標(biāo)簽,例如
它才會返回false.
所以我們需要自己封裝一個函數(shù)進行檢查是否含有嵌套標(biāo)簽。
function hasChild($element, $tags) { foreach($tags as $v){ $elements = $element->getElementsByTagName($v); if($elements->length){ return true; } } return false; } $tags = array('title','h2','h3','h4','h5','h6','a','p','dd','img'); $elements = $dom->getElementsByTagName('p'); foreach ($elements as $element) { if(hasChild($element, $tags)){ $element->textContent = 'p標(biāo)簽內(nèi)容替換'; } }
通過我們自己封裝的函數(shù),就可以判斷出$dom的node節(jié)點是否含有子標(biāo)簽。
總結(jié)
“如何理解php使用自帶dom擴展進行元素匹配”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。