您好,登錄后才能下訂單哦!
這篇文章主要介紹python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!
目標(biāo)網(wǎng)站:
首先獲取第一頁(yè)的數(shù)據(jù),這里關(guān)鍵要切換到iframe里
打印一下
獲取剩下的頁(yè)數(shù),這里在點(diǎn)擊下一頁(yè)之前需要設(shè)置一個(gè)延遲,不然會(huì)報(bào)錯(cuò)。
結(jié)果:
一共37頁(yè),爬取完畢后關(guān)閉瀏覽器
完整代碼:
url = 'https://music.163.com/#/discover/playlist/' from selenium import webdriver import time # 創(chuàng)建瀏覽器對(duì)象 window = webdriver.Chrome('./chromedriver') window.get(url) time.sleep(1) # 切換到iframe窗口 iframe = window.find_element_by_id('g_iframe') window.switch_to.frame(iframe) music_list = window.find_elements_by_xpath('//ul[@class="m-cvrlst f-cb"]/li') for music_element in music_list: print(music_element.text) print() print('*'*20) page = 1 # 開始提取 while True: time.sleep(2) # 獲取下一頁(yè) next = window.find_element_by_link_text('下一頁(yè)') if not next.get_attribute('class') == 'zbtn znxt js-disabled': next.click() else: break time.sleep(1) # 提取數(shù)據(jù) music_list = window.find_elements_by_xpath('//ul[@class="m-cvrlst f-cb"]/li') for music_element in music_list: print(music_element.text) print() print(page,'*'*20) page+=1 # 退出瀏覽器 window.quit()
以上是“python中selenium如何爬取網(wǎng)易云音樂(lè)歌單名”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。