您好,登錄后才能下訂單哦!
小編給大家分享一下selenium怎么應對網(wǎng)頁內(nèi)容需要鼠標滾動加載的問題,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
相信大家在selenium爬取網(wǎng)頁的時候都遇到過這樣的問題:就是網(wǎng)頁內(nèi)容需要用鼠標滾動加載剩余內(nèi)容,而不是一次全部加載出網(wǎng)頁的全部內(nèi)容,這個時候如果要模擬翻頁的時候就必須加載出全部的內(nèi)容,不然定位元素會找不到,出現(xiàn)報錯。
這里提供兩種方法供大家參考
一,通過selenium模擬瀏覽器,然后設置瀏覽器高度足夠長,最后延時使之能夠?qū)㈨撁娴膬?nèi)容都能夠加載出來
import time from selenium import webdriver driver = webdriver.Firefox() driver.set_window_size(1000,30000) driver.get(url) time.sleep(5)
二,通過selenium模擬瀏覽器下拉操作
from selenium import webdriver import time browser.execute_script("window.scrollBy(0,3000)") time.sleep(1) browser.execute_script("window.scrollBy(0,5000)") time.sleep(1) browser.execute_script("window.scrollBy(0,8000)") time.sleep(1)
補充知識:針對懶加載如何實現(xiàn)selenium 滑動至頁面底部page_source一次性包含全部網(wǎng)頁內(nèi)容
有時網(wǎng)站使用了懶加載技術:只有在瀏覽器中縱向滾動條滾動到指定的位置時,頁面的元素才會被動態(tài)加載。
注意,在加載之前,selenium的page_source是不會包含該頁面的內(nèi)容,page_source只包含加載出來的頁面內(nèi)容。
那么如何實現(xiàn)加載全部內(nèi)容了,就需要模擬人滾動滾動條的行為,實現(xiàn)頁面的加載
from selenium.webdriver.chrome.options import Options from selenium import webdriver from selenium.common.exceptions import TimeoutException from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC def scroll_until_loaded(self): check_height = self.browser.execute_script("return document.body.scrollHeight;") while True: self.browser.execute_script("window.scrollTo(0, document.body.scrollHeight);") try: self.wait.until(lambda driver: self.browser.execute_script("return document.body.scrollHeight;") > check_height) check_height = self.browser.execute_script("return document.body.scrollHeight;") except TimeoutException: break
這里懶加載并不是一直有效, 當網(wǎng)速不好時,加載超過self.wait()時間, 頁面還沒加載出來時, 會認為全部加載完成, page_source里面的代碼就會是以前加載出來的, 所以執(zhí)行翻頁操作后, 要執(zhí)行time.sleep(3), 等待網(wǎng)頁加載, 更新html再獲取網(wǎng)頁源代碼
以上是“selenium怎么應對網(wǎng)頁內(nèi)容需要鼠標滾動加載的問題”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業(yè)資訊頻道!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。