溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地

發(fā)布時(shí)間:2021-07-01 11:38:20 來(lái)源:億速云 閱讀:235 作者:chen 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要介紹“thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地”,在日常操作中,相信很多人在thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!

我需要寫(xiě)這么一個(gè)例子,到電子課本網(wǎng)下載一本電子書(shū)。

電子課本網(wǎng)的電子書(shū),是把書(shū)的每一頁(yè)當(dāng)成一個(gè)圖片,然后一本書(shū)就是有很多張圖片,我需要批量的進(jìn)行下載圖片操作。

下面是代碼部分:

 public function download() {
    $http = new \Org\Net\Http();
    $url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/";
    $localUrl = "Public/bookcover/";
    $reg="|showImg\('(.+)'\);|";
    $i=1;
    
    do {
      $filename = substr("000".$i,-3).".htm";
      $ch = curl_init();
      curl_setopt($ch, CURLOPT_URL, $url_pref.$filename);
      curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
      curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
      curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
      $html = curl_exec($ch);
      curl_close($ch);
      
      $result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER);
      if($result==1) {
        $picUrl = $out[1][0];
        $picFilename = substr("000".$i,-3).".jpg";
        $http->curlDownload($picUrl, $localUrl.$picFilename);
      }
      $i = $i+1;
    } while ($result==1);

    echo "下載完成";
  }

我這里是以人教版地理七年級(jí)地理上冊(cè)為例子 http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm

網(wǎng)頁(yè)是從001.htm開(kāi)始,然后數(shù)字一直加

每個(gè)網(wǎng)頁(yè)里面都有一張圖,就是對(duì)應(yīng)課本的內(nèi)容,以圖片的形式展示課本內(nèi)容

我的代碼是做了一個(gè)循環(huán),從第一頁(yè)開(kāi)始抓,一直抓到找不到網(wǎng)頁(yè)里的圖片為止

抓到網(wǎng)頁(yè)的內(nèi)容后,把網(wǎng)頁(yè)里面的圖片抓取到本地服務(wù)器

抓取后的實(shí)際效果:

thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地

到此,關(guān)于“thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI