溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

使用aardio抓取網(wǎng)頁數(shù)據(jù)

發(fā)布時間:2020-07-15 07:47:29 來源:網(wǎng)絡(luò) 閱讀:980 作者:wen66to88 欄目:開發(fā)技術(shù)

項目說明:【抓取網(wǎng)頁數(shù)據(jù)】

項目介紹:
采集指定網(wǎng)頁內(nèi)容,通過模式匹配匹配到要采集的數(shù)據(jù)格式返回到數(shù)組中

項目步驟:
1.創(chuàng)建匹配模式表
2.請求網(wǎng)頁連接
3.過濾文本,并對數(shù)據(jù)去重處理
4.顯示結(jié)果

效果展示:   

使用aardio抓取網(wǎng)頁數(shù)據(jù)

完整代碼:

    import console; 
/*
項目說明:【抓取網(wǎng)頁數(shù)據(jù)】
項目介紹:
    采集指定網(wǎng)頁內(nèi)容,通過模式匹配匹配到要采集的數(shù)據(jù)格式返回到數(shù)組中
項目步驟:
    1.創(chuàng)建匹配模式表
    2.請求網(wǎng)頁連接
    3.過濾文本,并對數(shù)據(jù)去重處理
    4.顯示結(jié)果
*/
//參考來源:http://bbs.aardio.com/forum.php?mod=viewthread&tid=11218&extra=page%3D1

import web.rest.jsonClient;

var httpUrl="http://www.meijumi.vip/usa/katong/5754.html";

//1.獲取用于查找的模式匹配數(shù)組
var parttern = {};
table.push(parttern, `ed2k\://[^\s"']+`);

//2.請求網(wǎng)頁鏈接
var http = web.rest.jsonClient();
var magnet = http.api(httpUrl,,parttern);
var urls = magnet.get();

//console.log("采集到的數(shù)據(jù)列表:");
//for(k,v in urls){ 
//  console.log(k, v);
//}

//3.過濾文本,并對數(shù)據(jù)去重處理
var resultStr="";
if(urls){
    var f = `S01E`;//過濾文本
    if(#f){
        //篩選結(jié)果
        urls = table.filter(urls, function(v){
            return string.find(v,f); 
        })  

        urls = table.unique(urls);//數(shù)組去重
    } 
    //提取結(jié)果
    resultStr = string.join(urls,'\r\n');//將字符串數(shù)組使用指定的分隔符合并為一個字符串   
}

//4.顯示結(jié)果
console.log("采集結(jié)果:", resultStr)

console.pause(true);
向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI