溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

QueryList怎么在TP5框架中使用

發(fā)布時間:2021-04-13 15:42:13 來源:億速云 閱讀:265 作者:Leah 欄目:開發(fā)技術

QueryList怎么在TP5框架中使用?針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

#首先應該下載TP5框架,然后在extend里面建立一個文件夾命名為QL,再去官網(wǎng)下載QueryList,然后把phpQuery.php 和 QueryList.php 兩個文件放在QL文件夾下,如圖:

QueryList怎么在TP5框架中使用
##在QueryList.php里面加上命名空間:

namespace QL;
require ‘phpQuery.php';

use phpQuery,Exception,ReflectionClass;
use Monolog\Logger;
use Monolog\Handler\StreamHandler;
use Iterator,Countable,ArrayAccess;//使用phpQuuery接口

#準備工作做好了下來開始采集小說(我們這里以https://www.17k.com/這個網(wǎng)站的免費小說為例)

##先找到你要采集的小說的目錄頁面的url作為采集url

##再在url前面加上 view-source: 查看他的源碼,找到包含所有章節(jié)url的class屬性,寫好采集規(guī)則,執(zhí)行語句進行采集

##采集他的章節(jié)名和每一章節(jié)的url,因為url采集下來沒有域名,需要用正則表達式加上https://www.17k.com 然后采用for循環(huán)去一個一個采集每一章節(jié)的內(nèi)容

##最后再將采集到的章節(jié)名與章節(jié)內(nèi)容存入數(shù)據(jù)庫

直接上代碼:

<?php
namespace app\index\Controller;
use think\Controller;
use QL\QueryList;
 
class Xiaoshuo extends Controller
{
  public function index()
  {
    //采集目標
    //$url = 'https://www.17k.com/list/3032846.html?offset=';
     $url = 'https://www.17k.com/list/3041226.html?offset=';
    //采集規(guī)則
    $rules = array(
          'title'=>array('.ellipsis','text'),//獲取書每個章節(jié)名
          'link'=>array('.Volume a','href','-.folding -copy -a'),//獲取每個章節(jié)鏈接
        );
    //開始采集
    $data = QueryList::Query($url,$rules)->data;
    //var_dump($data);
    //求數(shù)組長度
     $j = count($data);
    if($data)
    {
      for($i=0;$i<=$j-1;$i++)
      {
       $values = ['title'=>$data[$i]['title'],'link'=>$data[$i+1]['link']];
       $_POST['url']=$data[$i+1]['link'];
       if (!preg_match("/^(http|ftp):/", $_POST['url']))//給鏈接加上域名頭
        {
         $url1 = 'https://www.17k.com'.$_POST['url'];
        }
       $rules1 = array(
          'novel'=>array('.p','text','-li -a'),
          );
       $data1 = QueryList::Query($url1,$rules1)->data;
       //var_dump($data1);
       $values1 = ['title'=>$data[$i]['title'],'novel'=>$data1[0]['novel']];//將章節(jié)名、內(nèi)容插入數(shù)據(jù)庫
       $data2 = \think\Db::name('novel6')->insert($values1); 
      }
    }
    
  }
}

我們來打印一下他的章節(jié)名和章節(jié)內(nèi)容:
QueryList怎么在TP5框架中使用QueryList怎么在TP5框架中使用注:1.class屬性一定要找對
2.采集下來 $data 的第一個數(shù)組的link不是第一章的url,下一個才是第一章的,所以data[data[" role="presentation" >

關于QueryList怎么在TP5框架中使用問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業(yè)資訊頻道了解更多相關知識。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI