BeautifulSoup如何解析XML文檔中的XML NMTOKEN屬性

小樊
82
2024-05-15 14:36:19

要解析XML文檔中的XML NMTOKEN屬性,可以使用BeautifulSoup庫(kù)中的find()或find_all()方法來(lái)查找具有特定屬性的標(biāo)簽,并使用get()方法來(lái)獲取該屬性的值。

例如,假設(shè)XML文檔如下所示:

<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>

要找到所有具有id屬性的book標(biāo)簽,可以使用以下代碼來(lái)解析XML文檔并獲取id屬性的值:

from bs4 import BeautifulSoup

xml_doc = """
<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>
"""

soup = BeautifulSoup(xml_doc, 'xml')
books = soup.find_all('book')

for book in books:
    book_id = book.get('id')
    print(f"Book ID: {book_id}")

運(yùn)行上述代碼將輸出:

Book ID: 1
Book ID: 2

這樣就可以成功解析XML文檔中的XML NMTOKEN屬性。

0