python如何去除html標簽

發(fā)布時間：2021-04-28 13:42:13 來源：億速云閱讀：585 作者：小新欄目：編程語言

這篇文章主要介紹了python如何去除html標簽，具有一定借鑒價值，感興趣的朋友可以參考下，希望大家閱讀完這篇文章之后大有收獲，下面讓小編帶著大家一起了解一下。

python的五大特點是什么

python的五大特點：1.簡單易學，開發(fā)程序時，專注的是解決問題,而不是搞明白語言本身。2.面向對象，與其他主要的語言如C++和Java相比, Python以一種非常強大又簡單的方式實現(xiàn)面向對象編程。3.可移植性，Python程序無需修改就可以在各種平臺上運行。4.解釋性，Python語言寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序。5.開源，Python是 FLOSS(自由/開放源碼軟件)之一。

python去除html標簽的方法：1、“pattern.sub('',html)”方法；2、“BeautifulSoup(html,'html.parser')”方法；3、“response.xpath('string(.)')”方法。

本文操作環(huán)境：windows7系統(tǒng)、python3.6.4版，DELL G3電腦。

python去除html標簽的幾種方法

import re
from bs4 import BeautifulSoup
from lxml import etree
 
html = '<p>你好</p><br/><font>哈哈</font><b>大家好</b>'
 
# 方法一
pattern = re.compile(r'<[^>]+>',re.S)
result = pattern.sub('', html)
print(result)
 <br># 方法二
soup = BeautifulSoup(html,'html.parser')
print(soup.get_text())
 
# 方法三
response = etree.HTML(text=html)
# print(dir(response))
print(response.xpath('string(.)'))
 
 
# 你好哈哈大家好
# 你好哈哈大家好
# 你好哈哈大家好

感謝你能夠認真閱讀完這篇文章，希望小編分享的“python如何去除html標簽”這篇文章對大家有幫助，同時也希望大家多多支持億速云，關注億速云行業(yè)資訊頻道，更多相關知識等著你來學習!

向AI問一下細節(jié)

python如何去除html標簽

python的五大特點是什么

猜你喜歡

最新資訊

相關推薦

相關標簽