您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“jquery怎么爬取頁面數(shù)據(jù)”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“jquery怎么爬取頁面數(shù)據(jù)”吧!
搭建環(huán)境:
(1)、創(chuàng)建一個(gè)文件夾,進(jìn)入并初始化一個(gè)package.json文件。
npm init -y
?。?)、安裝相關(guān)依賴:
npm install --save koa? ? npm install --save cheerio //后面會(huì)用到,用于抓取頁面模塊,為服務(wù)器特別定制的,快速、靈活、實(shí)施的jQuery核心實(shí)現(xiàn)
現(xiàn)在來一個(gè)簡(jiǎn)單的demo熱熱身。直接上代碼(文件名:demo2.js):
var http=require('http') // Node.js提供了http模塊,用于搭建HTTP服務(wù)端和客戶端
var url='' //輸入任何網(wǎng)址都可以
http.get(url,function(res){ //發(fā)送get請(qǐng)求
var html=''
res.on('data',function(data){
html +=data //字符串的拼接
})
res.on('end',function(){
console.log(html)
})
})。on('error',function(){
console.log('獲取資源出錯(cuò)!')
})
執(zhí)行node demo2.js? ?得到結(jié)果如下:
很神奇有木有。然而這不是我們想要的,我們想要的是獲取頁面里面某一部份的數(shù)據(jù)。
這里以 沒事影院 的電視劇頁面為例。這時(shí)候cheerio就派上用場(chǎng)了,前面已經(jīng)安裝過,這里就不再贅述,它的用法其實(shí)跟jquery是很相似的。參考?cheerio(百度百科的解釋)
在剛剛的js文件中引入cheerio模塊,然后加載所需要的html內(nèi)容。
var $=cheerio.load(html)? // 加載需要的html
為了方便使用,這里封裝一個(gè)函數(shù):
functionfilterChapters(html) {var $=cheerio.load(html) //加載需要的html,然后就可以愉快地使用類似jQuery的語法了
var chapters=$('.movie-item') //在html里尋找需要的資源的class
var courseData=[] //創(chuàng)建一個(gè)數(shù)組,用來保存資源
chapters.each(function(item, index) { //遍歷我們的html文檔
到此,相信大家對(duì)“jquery怎么爬取頁面數(shù)據(jù)”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。