python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名

發(fā)布時(shí)間：2021-07-26 11:38:55 來(lái)源：億速云閱讀：147 作者：小新欄目：開發(fā)技術(shù)

這篇文章主要介紹python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名，文中介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們一定要看完！

目標(biāo)網(wǎng)站：

首先獲取第一頁(yè)的數(shù)據(jù)，這里關(guān)鍵要切換到iframe里

python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名

打印一下

python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名

獲取剩下的頁(yè)數(shù)，這里在點(diǎn)擊下一頁(yè)之前需要設(shè)置一個(gè)延遲，不然會(huì)報(bào)錯(cuò)。

python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名

結(jié)果：

python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名

一共37頁(yè)，爬取完畢后關(guān)閉瀏覽器

完整代碼：

url = 'https://music.163.com/#/discover/playlist/'

from selenium import webdriver
import time
# 創(chuàng)建瀏覽器對(duì)象
window = webdriver.Chrome('./chromedriver')
window.get(url)
time.sleep(1)
# 切換到iframe窗口
iframe = window.find_element_by_id('g_iframe')
window.switch_to.frame(iframe)
music_list = window.find_elements_by_xpath('//ul[@class="m-cvrlst f-cb"]/li')
for music_element in music_list:
 print(music_element.text)
 print()
print('*'*20)

page = 1
# 開始提取
while True:
 time.sleep(2)
 # 獲取下一頁(yè)
 next = window.find_element_by_link_text('下一頁(yè)')
 if not next.get_attribute('class') == 'zbtn znxt js-disabled':
  next.click()
 else:
  break
 time.sleep(1)
 # 提取數(shù)據(jù)
 music_list = window.find_elements_by_xpath('//ul[@class="m-cvrlst f-cb"]/li')
 for music_element in music_list:
  print(music_element.text)
  print()
 print(page,'*'*20)
 page+=1
# 退出瀏覽器
window.quit()

以上是“python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名”這篇文章的所有內(nèi)容，感謝各位的閱讀！希望分享的內(nèi)容對(duì)大家有幫助，更多相關(guān)知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問(wèn)一下細(xì)節(jié)

python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽