您好,登錄后才能下訂單哦!
經(jīng)常扒別人網(wǎng)站文章的坑們;我是指那種批量式采集的壓根不看內(nèi)容的,少不了都會(huì)用到刪除html標(biāo)簽的函數(shù);這里介紹3種不同用途上的方法;
$str='<div><p>這里是p標(biāo)簽</p><img src="" alt="這里是img標(biāo)簽"><a href="">這里是a標(biāo)簽</a><br></div>';
1:刪除全部或者保留指定html標(biāo)簽
php自帶的函數(shù)strip_tags即可滿足要求,
使用方法:strip_tags(string,allow);
string:需要處理的字符串;
allow:需要保留的指定標(biāo)簽,可以寫多個(gè);
<?php echo strip_tags($str,'<p><a>'); ?> //輸出:<p>這里是p標(biāo)簽</p><a href="">這里是a標(biāo)簽</a>
次函數(shù)的優(yōu)點(diǎn)是簡單粗暴,但是缺點(diǎn)也很明顯;如果有一大堆標(biāo)簽;而我只是想刪除指定的某一個(gè);那要寫很多需要保留的標(biāo)簽; 所以有了第二個(gè)方法;
2:刪除指定的html標(biāo)簽
使用方法:strip_html_tags($tags,$str);
$tags:需要?jiǎng)h除的標(biāo)簽(數(shù)組格式)
$str:需要處理的字符串;
<?php function strip_html_tags($tags,$str){ $html=array(); foreach ($tags as $tag) { $html[]="/(<(?:\/".$tag."|".$tag.")[^>]*>)/i"; } $data=preg_replace($html, '', $str); } echo strip_html_tags(array('p','img'),$str); ?> //輸出<div>這里是p標(biāo)簽<a href="">這里是a標(biāo)簽</a><br></div>;
3:刪除標(biāo)簽和標(biāo)簽的內(nèi)容
使用方法:strip_html_tags($tags,$str);
$tags:需要?jiǎng)h除的標(biāo)簽(數(shù)組格式)
$str:需要處理的字符串;
<?php function strip_html_tags($tags,$str){ $html=array(); foreach ($tags as $tag) { $html[]='/(<'.$tag.'.*?>[\s|\S]*?<\/'.$tag.'>)/'; } $data=preg_replace($html,'',$str); } echo strip_html_tags(array('a','img'),$str); ?> //輸出<div><p>這里是p標(biāo)簽</p><img src="" alt="這里是img標(biāo)簽"><br></div>;
很多網(wǎng)站文章里面會(huì)帶上網(wǎng)站名和鏈接,比如<a >白俊遙博客</a>;這個(gè)函數(shù)就是專治這種; 別拿這個(gè)函數(shù)采集本站啊;不然保證不打死你;
4:終極函數(shù),刪除指定標(biāo)簽;刪除或者保留標(biāo)簽內(nèi)的內(nèi)容;
使用方法:strip_html_tags($tags,$str,$content);
$tags:需要?jiǎng)h除的標(biāo)簽(數(shù)組格式)
$str:需要處理的字符串;
$ontent:是否刪除標(biāo)簽內(nèi)的內(nèi)容 0保留內(nèi)容 1不保留內(nèi)容
<?php /** * 刪除指定的標(biāo)簽和內(nèi)容 * @param array $tags 需要?jiǎng)h除的標(biāo)簽數(shù)組 * @param string $str 數(shù)據(jù)源 * @param string $content 是否刪除標(biāo)簽內(nèi)的內(nèi)容 默認(rèn)為0保留內(nèi)容 1不保留內(nèi)容 * @return string */ function strip_html_tags($tags,$str,$content=0){ if($content){ $html=array(); foreach ($tags as $tag) { $html[]='/(<'.$tag.'.*?>[\s|\S]*?<\/'.$tag.'>)/'; } $data=preg_replace($html,'',$str); }else{ $html=array(); foreach ($tags as $tag) { $html[]="/(<(?:\/".$tag."|".$tag.")[^>]*>)/i"; } $data=preg_replace($html, '', $str); } return $data; } echo strip_html_tags(array('a'),$str,1); ?> //輸出<div><p>這里是p標(biāo)簽</p><img src="" alt="這里是img標(biāo)簽"><br></div>;
前面扯了那么多;其實(shí)最后這個(gè)函數(shù)才是干貨;一口氣搞定各種標(biāo)簽刪除的疑難雜癥不費(fèi)勁;
別看下面這張截圖了;無非帶點(diǎn)顏色好看,我主要是拿來湊圖當(dāng)文章封面的;
本文為白俊遙原創(chuàng)文章,轉(zhuǎn)載無需和我聯(lián)系,但請注明來自白俊遙博客baijunyao.com
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。