溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Selenium基于PIL實(shí)現(xiàn)拼接滾動截圖的方法

發(fā)布時間:2020-08-04 13:42:16 來源:億速云 閱讀:281 作者:小豬 欄目:開發(fā)技術(shù)

這篇文章主要講解了Selenium基于PIL實(shí)現(xiàn)拼接滾動截圖的方法,內(nèi)容清晰明了,對此有興趣的小伙伴可以學(xué)習(xí)一下,相信大家閱讀完之后會有幫助。

Selenium默認(rèn)的截圖save_screenshot只支持對當(dāng)前窗口內(nèi)容進(jìn)行截圖,當(dāng)如果你想要截取整個網(wǎng)頁,那么,可以明確的告訴你。
Selenium做不到。

你可以手工使用開發(fā)者工具Ctrl+Shift+P調(diào)出命令行菜單,執(zhí)行Capture full screenshot命令進(jìn)行截圖,如下圖圖:

Selenium基于PIL實(shí)現(xiàn)拼接滾動截圖的方法

也可以通過

Selenium Webdriver的 execute_cdp_cmd()來調(diào)用一下Chrome DevTools Protocal提供的方法。但是,很遺憾,沒有全屏截圖的方法。

Selenium2時,還可以使用Firefox全屏截圖。Selenium3之后,所有瀏覽器不再支持。

一種方式是使用aShot,一個jar包,這顯然是Java派的解決方案。

另外如果對樣式?jīng)]有強(qiáng)迫癥的話,可以通過滾動頁面截取多張+PIL圖片拼接的方式實(shí)現(xiàn)全屏的截圖。

示例代碼:

from time import sleep
from PIL import Image
import numpy as np
from selenium import webdriver

driver = webdriver.Chrome()
driver.fullscreen_window() # 全屏窗口
driver.get('https://www.qq.com/')
window_height = driver.get_window_size()['height'] # 窗口高度

page_height = driver.execute_script('return document.documentElement.scrollHeight') # 頁面高度
driver.save_screenshot('qq.png')

if page_height > window_height:
  n = page_height // window_height # 需要滾動的次數(shù)
  base_mat = np.atleast_2d(Image.open('qq.png')) # 打開截圖并轉(zhuǎn)為二維矩陣

  for i in range(n):
    driver.execute_script(f'document.documentElement.scrollTop={window_height*(i+1)};')
    sleep(.5)
    driver.save_screenshot(f'qq_{i}.png') # 保存截圖
    mat = np.atleast_2d(Image.open(f'qq_{i}.png')) # 打開截圖并轉(zhuǎn)為二維矩陣
    base_mat = np.append(base_mat, mat, axis=0) # 拼接圖片的二維矩陣
  Image.fromarray(base_mat).save('hao123.png')

driver.quit()

需要安裝PIL和numpy: pip install PIL numpy

上例中,全屏窗口以獲得最大展示范圍,通過get_window_size()獲取屏幕高度,通過執(zhí)行js,獲取頁面高度。
相除后獲得滾動次數(shù)。

每次滾動后,截圖保存,然后使用Image打開轉(zhuǎn)換為二維矩陣拼接到上一個圖片的二維矩陣中。

循環(huán)完,最后再將拼接的二維矩陣輸出成圖片。

效果展示,如下圖:

Selenium基于PIL實(shí)現(xiàn)拼接滾動截圖的方法

注意:如果是流式加載的頁面,頁面高度是不斷變長的,非固定為第一次獲取到的page_height的值,需要另外處理

看完上述內(nèi)容,是不是對Selenium基于PIL實(shí)現(xiàn)拼接滾動截圖的方法有進(jìn)一步的了解,如果還想學(xué)習(xí)更多內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI