溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

jquery怎么爬取頁面數(shù)據(jù)

發(fā)布時(shí)間:2022-03-05 10:22:48 來源:億速云 閱讀:389 作者:iii 欄目:web開發(fā)

本篇內(nèi)容主要講解“jquery怎么爬取頁面數(shù)據(jù)”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“jquery怎么爬取頁面數(shù)據(jù)”吧!

  搭建環(huán)境:

  (1)、創(chuàng)建一個(gè)文件夾,進(jìn)入并初始化一個(gè)package.json文件。

  npm init -y

 ?。?)、安裝相關(guān)依賴:

  npm install --save koa? ? npm install --save cheerio //后面會(huì)用到,用于抓取頁面模塊,為服務(wù)器特別定制的,快速、靈活、實(shí)施的jQuery核心實(shí)現(xiàn)

  現(xiàn)在來一個(gè)簡(jiǎn)單的demo熱熱身。直接上代碼(文件名:demo2.js):

  var http=require('http') // Node.js提供了http模塊,用于搭建HTTP服務(wù)端和客戶端

  var url='' //輸入任何網(wǎng)址都可以

  http.get(url,function(res){  //發(fā)送get請(qǐng)求

  var html=''

  res.on('data',function(data){

  html +=data  //字符串的拼接

  })

  res.on('end',function(){

  console.log(html)

  })

  })。on('error',function(){

  console.log('獲取資源出錯(cuò)!')

  })

  執(zhí)行node demo2.js? ?得到結(jié)果如下:

  很神奇有木有。然而這不是我們想要的,我們想要的是獲取頁面里面某一部份的數(shù)據(jù)。

  這里以 沒事影院 的電視劇頁面為例。這時(shí)候cheerio就派上用場(chǎng)了,前面已經(jīng)安裝過,這里就不再贅述,它的用法其實(shí)跟jquery是很相似的。參考?cheerio(百度百科的解釋)

  在剛剛的js文件中引入cheerio模塊,然后加載所需要的html內(nèi)容。

  var $=cheerio.load(html)? // 加載需要的html

  為了方便使用,這里封裝一個(gè)函數(shù):

  functionfilterChapters(html) {var $=cheerio.load(html)  //加載需要的html,然后就可以愉快地使用類似jQuery的語法了

  var chapters=$('.movie-item')  //在html里尋找需要的資源的class

  var courseData=[] //創(chuàng)建一個(gè)數(shù)組,用來保存資源

  chapters.each(function(item, index) {  //遍歷我們的html文檔

到此,相信大家對(duì)“jquery怎么爬取頁面數(shù)據(jù)”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI