溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

HTML如何解析模塊

發(fā)布時(shí)間:2021-10-12 16:06:37 來(lái)源:億速云 閱讀:144 作者:柒染 欄目:大數(shù)據(jù)

這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)?lái)有關(guān)HTML如何解析模塊,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

這個(gè)就比較簡(jiǎn)單了沒有什么好強(qiáng)調(diào)的,如果返回的json 就是直接按照鍵值取,如果是網(wǎng)頁(yè)就是用lxml模塊的html進(jìn)行xpath解析。

from lxml import html
import json
class GetNodeList():
   def __init__(self):
       self.getdivxpath="//div[@class='demo']"
   def use_xpath(self,source):
       if len(source):
           root=html.fromstring(source) #html轉(zhuǎn)換成dom對(duì)象
           nodelist=root.xpath(self.getdivxpath)#對(duì)dom對(duì)象進(jìn)行xpath解析
           if len(nodelist):
               return nodelist
           return None
   def use_json(self, source,keyname):
       if len(source):
           jsonstr=json.loads(source)
           value=jsonstr.get(keyname) #根據(jù)具體的鍵值修改
           if len(value):
               return value
           return None


上述就是小編為大家分享的HTML如何解析模塊了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI