您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關node.js實現(xiàn)微信小程序抓取網(wǎng)頁內(nèi)容的方法,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
最近在研究微信小程序的云開發(fā)功能。云開發(fā)最大的好處就是不需要前端搭建服務器,可以使用云端能力,從零開始寫出來一個能上線的微信小程序,避免了買服務器的開銷,對于個人來嘗試練手微信小程序從前端到后臺的開發(fā),還是一個不錯的選擇??梢宰龅揭惶炀湍苌暇€一個微信小程序。
云開發(fā)的優(yōu)點
云開發(fā)為開發(fā)者提供完整的云端支持,弱化后端和運維概念,無需搭建服務器,使用平臺提供的 API 進行核心業(yè)務開發(fā),即可實現(xiàn)快速上線和迭代,同時這一能力,同開發(fā)者已經(jīng)使用的云服務相互兼容,并不互斥。
云開發(fā)目前提供三大基礎能力支持:
云函數(shù):在云端運行的代碼,微信私有協(xié)議天然鑒權,開發(fā)者只需編寫自身業(yè)務邏輯代碼
數(shù)據(jù)庫:一個既可在小程序前端操作,也能在云函數(shù)中讀寫的 JSON 數(shù)據(jù)庫
存儲:在小程序前端直接上傳/下載云端文件,在云開發(fā)控制臺可視化管理
好了,介紹了這么多關于云開發(fā)的知識,感性的同學可以去研究研究。官方文檔地址:https://developers.weixin.qq....
網(wǎng)頁內(nèi)容抓取
小程序是關于答題的,所以題目的來源是一個問題。上網(wǎng)搜,一個題目一個題目粘貼是一種方法,但是這樣的重復工作,估計粘個10左右就想放棄了。所以想到了網(wǎng)頁抓取。正好把之前學的node撿起來。
必備工具:
Cheerio。一個類似于服務器端JQuery的包。主要用它來分析和過濾抓取來的內(nèi)容。
node的fs模塊。這個是node自帶的模塊,用來讀寫文件的。此處用來將解析好的數(shù)據(jù)寫入json文件。
Axios(非必須)。用來抓取網(wǎng)站的HTML網(wǎng)頁。因為我要的數(shù)據(jù)是從網(wǎng)頁上點擊一個button后獲取渲染的,所以直接訪問這個網(wǎng)址是抓取不到的。無奈只能將想要的內(nèi)容復制出來,存成字符串,去解析這個字符串。
接下來就可以用npm init來初始化一個node項目,一路回車后,即可生成一個package.json文件。
然后npm install --save axios cheerio安裝cheerio和axios包。
關鍵的是用cheerio來實現(xiàn)一個類似jquery的功能。只需將抓取到的內(nèi)容cheerio.load(quesitons)一下即可,之后就可以按照jquery的操作取dom,組裝你想要的數(shù)據(jù)了。
最后用fs.writeFile將數(shù)據(jù)保存到json文件中,大功告成。
具體代碼如下
let axios = require("axios"); let cheerio = require("cheerio"); let fs = require("fs"); // 我的html結構大致如下,有很多條數(shù)據(jù) const questions = `<li id="q1" style="display: list-item;"> <div class="questionWrapper"> <div class="question">舉頭望明月,__________。</div> <div class="answer" value="0"> 回首白云低 </div> <div class="answer" value="1"> 低頭思故鄉(xiāng) </div> <div class="answer" value="0"> 當春乃發(fā)生 </div> <div class="answer" value="0"> 紅掌撥清波 </div> </div> </li> <li id="q2"> <div class="questionWrapper"> <div class="question">__________,卻話巴山夜雨時。</div> <div class="answer" value="1"> 何當共剪西窗燭 </div> <div class="answer" value="0"> 在天愿做比翼鳥 </div> <div class="answer" value="0"> 世味年來薄似紗 </div> <div class="answer" value="0"> 兩岸青山相對出 </div> </div> </li> .......... `; const $ = cheerio.load(quesitons); var arr = []; for (var i = 0; i < 300; i++) { var obj = {}; obj.quesitons = $("#q" + i).find(".question").text(); obj.A = $($("#q" + i).find(".answer")[0]).text(); obj.B = $($("#q" + i).find(".answer")[1]).text(); obj.C = $($("#q" + i).find(".answer")[2]).text(); obj.D = $($("#q" + i).find(".answer")[3]).text(); obj.index = i + 1; obj.answer = $($("#q" + i).find(".answer")[0]).attr("value") == 1 ? "A" : $($("#q" + i).find(".answer")[1]).attr("value") == 1 ? "B" : $($("#q" + i).find(".answer")[2]).attr("value") == 1 ? "C" : "D"; arr.push(obj); } fs.writeFile("poem.json", JSON.stringify(arr), err => { if (err) throw err; console.log("json文件已成功保存!"); });
保存到json后的文件格式如下,這樣就可以通過json文件上傳到云端服務器了。
注意事項
微信小程序云開發(fā)的數(shù)據(jù)庫,上傳json文件的數(shù)據(jù)格式需要注意一下,之前一直提示格式錯誤,后來才發(fā)現(xiàn),JSON 數(shù)據(jù)不是數(shù)組,而是類似 JSON Lines,即各個記錄對象之間使用 n 分隔,而非逗號。所以還需要對node寫出來的json文件做一個小處理之后才能上傳成功。
關于node.js實現(xiàn)微信小程序抓取網(wǎng)頁內(nèi)容的方法就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。