溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

總結(jié)php刪除html標(biāo)簽和標(biāo)簽內(nèi)的內(nèi)容的方法

發(fā)布時(shí)間:2020-05-21 20:40:45 來源:網(wǎng)絡(luò) 閱讀:1393 作者:帥白123 欄目:web開發(fā)

經(jīng)常扒別人網(wǎng)站文章的坑們;我是指那種批量式采集的壓根不看內(nèi)容的,少不了都會(huì)用到刪除html標(biāo)簽的函數(shù);這里介紹3種不同用途上的方法;

$str='<div><p>這里是p標(biāo)簽</p><img src="" alt="這里是img標(biāo)簽"><a href="">這里是a標(biāo)簽</a><br></div>';

1:刪除全部或者保留指定html標(biāo)簽

    php自帶的函數(shù)strip_tags即可滿足要求,

    使用方法:strip_tags(string,allow);

              string:需要處理的字符串;

              allow:需要保留的指定標(biāo)簽,可以寫多個(gè);

   <?php
       echo strip_tags($str,'<p><a>');
       
   ?>
   //輸出:<p>這里是p標(biāo)簽</p><a href="">這里是a標(biāo)簽</a>

    次函數(shù)的優(yōu)點(diǎn)是簡單粗暴,但是缺點(diǎn)也很明顯;如果有一大堆標(biāo)簽;而我只是想刪除指定的某一個(gè);那要寫很多需要保留的標(biāo)簽;        所以有了第二個(gè)方法;

2:刪除指定的html標(biāo)簽

    使用方法:strip_html_tags($tags,$str);

              $tags:需要?jiǎng)h除的標(biāo)簽(數(shù)組格式)

              $str:需要處理的字符串;

  <?php
    function strip_html_tags($tags,$str){ 
        $html=array();
        foreach ($tags as $tag) {
            $html[]="/(<(?:\/".$tag."|".$tag.")[^>]*>)/i";
        }
        $data=preg_replace($html, '', $str); 
    } 
    echo strip_html_tags(array('p','img'),$str);
    
   ?>
   //輸出<div>這里是p標(biāo)簽<a href="">這里是a標(biāo)簽</a><br></div>;

3:刪除標(biāo)簽和標(biāo)簽的內(nèi)容

    使用方法:strip_html_tags($tags,$str);

              $tags:需要?jiǎng)h除的標(biāo)簽(數(shù)組格式)

              $str:需要處理的字符串;

  <?php
    function strip_html_tags($tags,$str){ 
        $html=array();
        foreach ($tags as $tag) {
            $html[]='/(<'.$tag.'.*?>[\s|\S]*?<\/'.$tag.'>)/';
        }
        $data=preg_replace($html,'',$str);
    } 
    echo strip_html_tags(array('a','img'),$str);
    
   ?>
   //輸出<div><p>這里是p標(biāo)簽</p><img src="" alt="這里是img標(biāo)簽"><br></div>;

    很多網(wǎng)站文章里面會(huì)帶上網(wǎng)站名和鏈接,比如<a >白俊遙博客</a>;這個(gè)函數(shù)就是專治這種; 別拿這個(gè)函數(shù)采集本站啊;不然保證不打死你;

4:終極函數(shù),刪除指定標(biāo)簽;刪除或者保留標(biāo)簽內(nèi)的內(nèi)容;

    使用方法:strip_html_tags($tags,$str,$content);

              $tags:需要?jiǎng)h除的標(biāo)簽(數(shù)組格式)

              $str:需要處理的字符串;

              $ontent:是否刪除標(biāo)簽內(nèi)的內(nèi)容 0保留內(nèi)容 1不保留內(nèi)容

  <?php
    /**
     * 刪除指定的標(biāo)簽和內(nèi)容
     * @param array $tags 需要?jiǎng)h除的標(biāo)簽數(shù)組
     * @param string $str 數(shù)據(jù)源
     * @param string $content 是否刪除標(biāo)簽內(nèi)的內(nèi)容 默認(rèn)為0保留內(nèi)容    1不保留內(nèi)容
     * @return string
     */
    function strip_html_tags($tags,$str,$content=0){
        if($content){
            $html=array();
            foreach ($tags as $tag) {
                $html[]='/(<'.$tag.'.*?>[\s|\S]*?<\/'.$tag.'>)/';
            }
            $data=preg_replace($html,'',$str);
        }else{
            $html=array();
            foreach ($tags as $tag) {
                $html[]="/(<(?:\/".$tag."|".$tag.")[^>]*>)/i";
            }
            $data=preg_replace($html, '', $str);
        }
        return $data;
    }
    echo strip_html_tags(array('a'),$str,1);
   ?>
   //輸出<div><p>這里是p標(biāo)簽</p><img src="" alt="這里是img標(biāo)簽"><br></div>;


前面扯了那么多;其實(shí)最后這個(gè)函數(shù)才是干貨;一口氣搞定各種標(biāo)簽刪除的疑難雜癥不費(fèi)勁;

別看下面這張截圖了;無非帶點(diǎn)顏色好看,我主要是拿來湊圖當(dāng)文章封面的;

總結(jié)php刪除html標(biāo)簽和標(biāo)簽內(nèi)的內(nèi)容的方法



向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI