溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python中如何處理“&#”開頭加數(shù)字的html字符

發(fā)布時間:2021-08-18 14:16:33 來源:億速云 閱讀:154 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要為大家展示了“python中如何處理“&#”開頭加數(shù)字的html字符”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“python中如何處理“&#”開頭加數(shù)字的html字符”這篇文章吧。

python如何處理“&#”開頭加數(shù)字的html字符,比如:风水這類數(shù)據(jù)。

用python抓取數(shù)據(jù)時,有時會遇到想要數(shù)據(jù)是以“&#”開頭加數(shù)字的字符,比如圖中所示的這些:

风水大术士

python中如何處理“&#”開頭加數(shù)字的html字符

python中如何處理“&#”開頭加數(shù)字的html字符

這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

python中如何處理“&#”開頭加數(shù)字的html字符

定義變量,再定義轉(zhuǎn)換代碼。

python中如何處理“&#”開頭加數(shù)字的html字符

代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過此才能用“.unescape()”方法。 

python中如何處理“&#”開頭加數(shù)字的html字符

測試運行,這串字符串正常輸出了中文。

python中如何處理“&#”開頭加數(shù)字的html字符

Python3.7+版本

在最新python版本中,不能用上面的導(dǎo)入方法??梢杂?quot;import html"或者“from html import unescape”。這里使用"import html"做測試。

python中如何處理“&#”開頭加數(shù)字的html字符

導(dǎo)入html后,直接用".unescape()"來處理字符串。

python中如何處理“&#”開頭加數(shù)字的html字符

運行后,正常轉(zhuǎn)換成了中文字符。

python中如何處理“&#”開頭加數(shù)字的html字符

以上是“python中如何處理“&#”開頭加數(shù)字的html字符”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI