您好,登錄后才能下訂單哦!
這篇文章主要介紹“thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地”,在日常操作中,相信很多人在thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!
我需要寫(xiě)這么一個(gè)例子,到電子課本網(wǎng)下載一本電子書(shū)。
電子課本網(wǎng)的電子書(shū),是把書(shū)的每一頁(yè)當(dāng)成一個(gè)圖片,然后一本書(shū)就是有很多張圖片,我需要批量的進(jìn)行下載圖片操作。
下面是代碼部分:
public function download() { $http = new \Org\Net\Http(); $url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/"; $localUrl = "Public/bookcover/"; $reg="|showImg\('(.+)'\);|"; $i=1; do { $filename = substr("000".$i,-3).".htm"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url_pref.$filename); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); $html = curl_exec($ch); curl_close($ch); $result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER); if($result==1) { $picUrl = $out[1][0]; $picFilename = substr("000".$i,-3).".jpg"; $http->curlDownload($picUrl, $localUrl.$picFilename); } $i = $i+1; } while ($result==1); echo "下載完成"; }
我這里是以人教版地理七年級(jí)地理上冊(cè)為例子 http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm
網(wǎng)頁(yè)是從001.htm開(kāi)始,然后數(shù)字一直加
每個(gè)網(wǎng)頁(yè)里面都有一張圖,就是對(duì)應(yīng)課本的內(nèi)容,以圖片的形式展示課本內(nèi)容
我的代碼是做了一個(gè)循環(huán),從第一頁(yè)開(kāi)始抓,一直抓到找不到網(wǎng)頁(yè)里的圖片為止
抓到網(wǎng)頁(yè)的內(nèi)容后,把網(wǎng)頁(yè)里面的圖片抓取到本地服務(wù)器
抓取后的實(shí)際效果:
到此,關(guān)于“thinkphp怎么抓取網(wǎng)站的內(nèi)容并且保存到本地”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。