您好,登錄后才能下訂單哦!
在python的Beautiful Soup 4 擴(kuò)展庫的使用過程中出現(xiàn)了
TypeError: list indices must be integers or slices, not str
這個錯誤,這里就分析一下為什么會報錯以及如何解決。
這個錯誤的意思是'類型錯誤:list的索引必須是'integers'或者'slices'不能是'str'
我出現(xiàn)錯誤的代碼:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標(biāo)簽 img_tag = div.select("img") #獲取標(biāo)簽屬性(這里報錯) src = img_tag['src'] #輸出 print(src)
經(jīng)過檢查對比后我發(fā)現(xiàn)錯誤原因
就是獲取標(biāo)簽時獲取的是list數(shù)據(jù)而不是tag
主要原因如下:
主要就是獲取的內(nèi)容和自己認(rèn)為的有偏差。
也就是find()和find_all(),select()和select_one()的區(qū)別。
當(dāng)使用
find() select_one()
時,獲得的是一個標(biāo)簽
類型為
<class 'bs4.element.Tag'>
所以可以使用tag['class']取值
當(dāng)使用
find_all() select()
時,獲得的是組標(biāo)簽(就算只有一個標(biāo)簽也是一組)
類型為
#find_all()的返回值類型 <class 'bs4.element.ResultSet'> #select()的返回值類型 <class 'list'>
這時,我們要取值就需要先定位是list(ResultSet)中的那個標(biāo)簽在取值
例如tag[0]['class']
解決方法
方法一:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標(biāo)簽 img_tag = div.select("img") #獲取標(biāo)簽屬性(這里有改動) src = img_tag[0]['src'] #輸出 print(src)
因?yàn)槲抑理撁嬷械慕Y(jié)構(gòu)可以確保獲得的第一個bag為我需要的標(biāo)簽。
所以使用src = img_tag[0]['src']來獲取屬性信息。
方法二:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標(biāo)簽 img_tag = div.select_one("img") #獲取標(biāo)簽屬性(這里有改動) src = img_tag['src'] #輸出 print(src)
同上理,這樣修改也是可以成功的。
出現(xiàn)這種問題還是因?yàn)樽约翰挥眯模€是要時刻提醒自己。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。