溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

微信小程序之如何解析網(wǎng)頁內(nèi)容

發(fā)布時間:2021-01-29 14:56:49 來源:億速云 閱讀:190 作者:小新 欄目:移動開發(fā)

這篇文章將為大家詳細講解有關(guān)微信小程序之如何解析網(wǎng)頁內(nèi)容,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

微信小程序 解析網(wǎng)頁內(nèi)容詳解

最近在寫一個爬蟲,需要將網(wǎng)頁進行解析供微信小程序使用。文字和圖片解析都好說,小程序也有對應(yīng)的text和image標(biāo)簽可以呈現(xiàn)。而更復(fù)雜的,比如表格,則比較棘手,不管是服務(wù)端解析還是小程序呈現(xiàn)都很費勁,也很難覆蓋所有情況。于是我想,將表格對應(yīng)的HTML代碼轉(zhuǎn)成圖片,不失為一種變通的方法。

這里我們采用node-webshot模塊,它對PhantomJS進行了輕量封裝,可以輕松地將網(wǎng)頁以截圖形式保存下來。

首先安裝Node.js和PhantomJS,然后新建一個js文件,加載node-webshot模塊:

const webshot = require('webshot');

定義選項:

const options = {
  // 瀏覽器窗口
  screenSize: {
    width: 755,
    height: 25
  },
  // 要截圖的頁面文檔區(qū)域
  shotSize: {
    height: 'all'
  },
  // 網(wǎng)頁類型
  siteType: 'html'
};

這里,瀏覽器窗口的寬度要根據(jù)網(wǎng)頁情況合理設(shè)置,高度可以設(shè)置為一個很小的數(shù)值,然后頁面文檔區(qū)域的高度一定要設(shè)置為all,寬度默認(rèn)為窗口寬度,這樣就可以把表格以最小的尺寸完整截圖。

接下來,定義html字符串:

let html = "target rich text html code, eg: <table>...</table>";

注意,里面的HTML代碼一定要去掉換行符,并將雙引號替換為單引號。

最后,截圖:

webshot(html, 'demo.png', options, (err) => {
  if (err)
    console.log(`Webshot error: ${err.message}`);
});

關(guān)于“微信小程序之如何解析網(wǎng)頁內(nèi)容”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI