溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中Selenium如何使用

發(fā)布時間:2021-08-05 17:36:17 來源:億速云 閱讀:178 作者:Leah 欄目:大數(shù)據(jù)

本篇文章給大家分享的是有關Python中Selenium如何使用,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

Selenium介紹

Selenium是一個Web的自動化測試工具,最初是為網(wǎng)站自動化測試而開發(fā)的,Selenium 可以直接運行在瀏覽器上,它支持所有主流的瀏覽器(包括PhantomJS這些無界面的瀏覽器(2018年開發(fā)者說暫停開發(fā),chromedriver也可以實現(xiàn)同樣的功能)),可以接收指令,讓瀏覽器自動加載頁面,獲取需要的數(shù)據(jù),甚至頁面截屏。

安裝

pip install selenium

二、Chromedriver的介紹

Chromedriver 也是一個能夠被selenium驅動的瀏覽器,但是和PhantomJS(網(wǎng)上有很多這個的介紹)的區(qū)別在于它是有界面的。Chromedriver下載你需要先查看自己的Chrome瀏覽器的版本,然后選擇對應的Chromedriver。

Python中Selenium如何使用

  • 下載地址:https://npm.taobao.org/mirrors/chromedriver

----- Windows 下安裝方式
chromedriver_win32.zip : 版本 ChromeDriver v2.32 (2017-08-30)
(支持 Chrome v59-61)

1. 解壓 chromedriver_win32.zip
2. 將 chromedriver.exe 移動到 Python安裝目錄下
(其實放哪都可以,但是需要配環(huán)境變量,放Python安裝目錄下省事)


注意:Chromedriver和電腦上的chrome版本有對應關系,建議使用最新的Chromedriver版本并且更新chrome瀏覽器到最新版

三、Selenium的基本使用

是否開啟無頭模式(即是否需要界面)

from selenium.webdriver import Chrome
from selenium.webdriver.chrome.options import Options

option = Options()  # 實例化option對象
option.add_argument("--headless")  # 給option對象添加無頭參數(shù)

driver = Chrome(executable_path=r"E:\python學習\python爬蟲\chromedriver.exe",  # 實例化瀏覽器對象,可以指定chromedriver的路徑,不指定的話 默認會去找python解釋器的同級目錄
                options=option)  # 實例化瀏覽器對象的時候 把option對象帶進來

保存當前網(wǎng)頁的截圖

from selenium.webdriver import Chrome

driver = Chrome(executable_path=r"E:\python學習\python爬蟲\chromedriver.exe",  # 實例化瀏覽器對象,可以指定chromedriver的路徑,不指定的話 默認會去找python解釋器的同級目錄
                # options=option)  # 實例化瀏覽器對象的時候 把option對象帶進來
                )
driver.get("https://www.baidu.com/")
driver.save_screenshot('baidu.png')  # 保存當前網(wǎng)頁的截圖
driver.close()  # 關閉當前網(wǎng)頁

瀏覽器窗口最大化

from selenium.webdriver import Chrome

driver = Chrome(executable_path=r"E:\python學習\python爬蟲\chromedriver.exe")
driver.maximize_window()  # 瀏覽器窗口最大化

在input輸入框中輸入數(shù)據(jù)

from selenium.webdriver import Chrome

driver = Chrome(executable_path=r"E:\python學習\python爬蟲\chromedriver.exe")
driver.maximize_window()  # 瀏覽器窗口最大化
ele = driver.find_element_by_id("kw")  # 找到id為kw的節(jié)點
ele.send_keys("數(shù)學")  # 向input輸入框輸入數(shù)據(jù)

模擬點擊

from selenium.webdriver import Chrome

driver = Chrome(executable_path=r"E:\python學習\python爬蟲\chromedriver.exe")
driver.maximize_window()  # 瀏覽器窗口最大化
ele = driver.find_element_by_id("kw")  # 找到id為kw的節(jié)點
ele.send_keys("數(shù)學")  # 向input輸入框輸入數(shù)據(jù)
ele = driver.find_element_by_id('su')  # 找到id為su的節(jié)點(百度一下)
ele.click()  # 模擬點擊

根據(jù)文本值查找節(jié)點

# 找到文本值為百度一下的節(jié)點
driver.find_element_by_link_text("百度一下") 
# 根據(jù)鏈接包含的文本獲取元素列表,模糊匹配
driver.find_elements_by_partial_link_text("度一下")

獲取當前節(jié)點的文本

ele.text # 獲取當前節(jié)點的文本
ele.get_attribute("data-click")  # 獲取到屬性對應的value

打印當前網(wǎng)頁的一些信息

print(driver.page_source)  # 打印網(wǎng)頁的源碼
print(driver.get_cookies())  # 打印出網(wǎng)頁的cookie
print(driver.current_url)  # 打印出當前網(wǎng)頁的url

關閉瀏覽器

driver.close()  # 關閉當前網(wǎng)頁
driver.quit()  # 直接關閉瀏覽器

頁面等待

from selenium.webdriver import Chrome
import time

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = Chrome(executable_path=r"E:\python學習\python爬蟲\chromedriver.exe")

driver.get("https://www.baidu.com/")
# time.sleep(1)
driver.implicitly_wait(5)  # 跟time.sleep類似,比time.sleep更加智能,不會被動的等待時間結束

wait = WebDriverWait(driver, 10)  # 等待時間
ele = wait.until(EC.presence_of_element_located((By.ID, "kw")))
ele.send_keys("數(shù)學")
wait = WebDriverWait(driver, 10)
ele = wait.until(EC.element_to_be_clickable((By.ID, 'su')))
ele.click()
time.sleep(3)
driver.close()

四、Selenium切換窗口

1. 獲取當前所有的窗口

current_windows = driver.window_handles
#返回一個list.

2. 根據(jù)窗口索引進行切換

driver.switch_to.window(current_windows[0])

3. selenium切換iframe

driver.switch_to.frame("iframe的id")

4.切換進入alert

alert = driver.switch_to.alert()

五、Selenium滑動界面

from selenium.webdriver import Chrome
import time

driver = Chrome(executable_path=r"E:\python學習\python爬蟲\chromedriver.exe")

driver.get(
    "https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=78000241_12_hao_pg&wd=selenium%20js%E6%BB%91%E5%8A%A8&fenlei=256&rsv_pq=8215ec3a00127601&rsv_t=a763fm%2F7SHtPeSVYKeWnxKwKBisdp%2FBe8pVsIapxTsrlUnas7%2F7Hoo6FnDp6WsslfyiRc3iKxP2s&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=31&rsv_sug1=17&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&inputT=9266&rsv_sug4=9770")
#  1.滾動到網(wǎng)頁底部
js = "document.documentElement.scrollTop=800" 
# 執(zhí)行js
driver.execute_script(js) 
time.sleep(1)
# 滾動到頂部
js = "document.documentElement.scrollTop=0" 
driver.execute_script(js)  # 執(zhí)行js

time.sleep(1)
driver.close()

selenium的優(yōu)缺點

selenium能夠執(zhí)行頁面上的js,對于js渲染的數(shù)據(jù)和模擬登陸處理起來非常容易。
selenium由于在獲取頁面的過程中會發(fā)送很多請求,所以效率非常低,所以在很多時候需要酌情使用。

以上就是Python中Selenium如何使用,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI