怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

發(fā)布時間：2023-04-18 11:24:48 來源：億速云閱讀：134 作者：iii 欄目：開發(fā)技術(shù)

本文小編為大家詳細(xì)介紹“怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸”，內(nèi)容詳細(xì)，步驟清晰，細(xì)節(jié)處理妥當(dāng)，希望這篇“怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸”文章能幫助大家解決疑惑，下面跟著小編的思路慢慢深入，一起來學(xué)習(xí)新知識吧。

環(huán)境

python 3.9, selenium和Opencv相關(guān)依賴，用于抓取圖片的requests包，具體安裝這里不多講了，其中selenium用的火狐版本。

selenium登錄網(wǎng)站

整體流程就是這個樣子：訪問網(wǎng)站->點擊登錄->輸入賬號密碼->搞定滑塊驗證->登錄網(wǎng)站，其中最大的難點是滑塊驗證碼，但在此之前我們當(dāng)然要先讓selenium自動打開網(wǎng)站把賬號密碼輸好，我們通過find_element()方法定位輸入框之后執(zhí)行操作，元素的各個屬性F12就可以找到：

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

代碼如下：

options = webdriver.FirefoxOptions()
driver = webdriver.Firefox(options=options)
driver.get('網(wǎng)址')
driver.find_element("link text", "登錄").click()
name = driver.find_element("id", "name-input")
name.send_keys("賬號######") # 輸入賬號
pw = driver.find_element("id", "password-input")
pw.send_keys("密碼#########") # 輸入密碼
driver.find_element("id", "submit").click() # 提交

requests抓取驗證碼圖片

為了做后續(xù)處理我們需要把滑塊驗證碼相關(guān)圖片抓到本地，網(wǎng)上關(guān)于滑塊驗證碼這塊很多都是用原圖和有缺口的圖對比來確定缺口位置的，但是我并沒有找到原圖，這里用到的是有缺口的背景圖和滑塊圖，如下：

滑塊圖：

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

有缺口的背景圖：

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

這里爬圖是selenium定位之后用requests包爬的，注意驗證碼和登陸界面不在一個iframe里，selenium記得切到對應(yīng)iframe才能定位到圖片，代碼如下：

driver.switch_to.frame('tcaptcha_iframe')
 # 切換iframe
img = driver.find_element("id", "slideBg").get_attribute('src')
headers = {
    'Accept': "application/json, text/plain, */*",
    'User-Agent': "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"
} # 請求頭
r = requests.get(img, headers=headers)
with open('img.png', 'wb') as f:
    f.write(r.content)
block = driver.find_element("id", "slideBlock").get_attribute('src')
r = requests.get(block, headers=headers)
with open('block.png', 'wb') as f:
    f.write(r.content)

OpenCV識別缺口位置

接下來就是重點，如何確定缺口位置來定位滑動驗證碼該往哪滑。這里主要用到OpenCV的模板匹配。首先對滑塊也就是稍后匹配時用到的模板進(jìn)行處理，這里主要就是把形狀輪廓提取出來然后去掉多余的東西，先把原圖變成灰度圖：

tpl_gray = cv2.cvtColor(tpl, cv2.COLOR_BGR2GRAY)

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

可以看到邊緣有一圈陰影部分，我們需要把周圍這圈去掉，遍歷找到黑色像素點把它變成和周圍一樣。

width, height = tpl_gray.shape
    for h in range(height):
        for w in range(width):
            if tpl_gray[w, h] == 0:
                tpl_gray[w, h] = 96

處理后變成了這樣，然后把中間主體部分涂黑，也就是將圖片二值化。

binary = cv2.inRange(tpl_gray, 96, 96)  # 二值化
kernel = np.ones((8, 8), np.uint8)
template = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel) # 去白色噪點

處理完畢得到理想的模板圖：

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

接下來對帶有缺口的背景圖進(jìn)行處理，這個過程稍微麻煩一點，不過思路還是比較清晰的，還是先轉(zhuǎn)化成灰度圖再二值化，這里有一個問題，不同驗證碼圖片之間差距很大，有的顏色很顯眼，有的卻很清淡，比如下面這兩差別太大了，這就導(dǎo)致在二值化的過程中很難有一個固定的參數(shù)。

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

這里我根據(jù)圖片的平均灰度值設(shè)定了幾個區(qū)間，對不同區(qū)間的驗證碼圖片傳入不同參數(shù)進(jìn)行二值化：

def avg_mean(img):
    mean_val, _, _, _ = cv2.mean(img)
    print("平均灰度：", mean_val)
    return mean_val
 
def match(img):
    gauss = cv2.GaussianBlur(img, [5, 5], 0)
    img_gray = cv2.cvtColor(gauss, cv2.COLOR_BGR2GRAY)
    cv2.imshow("111", img_gray)
    if avg_mean(img) > 140: # 二值化
        ret, target = cv2.threshold(img_gray, 105, 255, cv2.THRESH_BINARY)
    elif avg_mean(img) > 102:
        ret, target = cv2.threshold(img_gray, 95, 255, cv2.THRESH_BINARY) 
    else:
        ret, target = cv2.threshold(img_gray, 85, 255, cv2.THRESH_BINARY)

處理過的結(jié)果大概像這樣：

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

效果還是不錯的，清晰的凸顯了缺口位置，最后把背景圖和模板傳入opencv的模板匹配方法，記錄下匹配到的坐標(biāo)即可。

result = cv2.matchTemplate(target, template, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)
left_up = max_loc
print(left_up)
right_down = (left_up[0] + height, left_up[1] + width)
cv2.rectangle(img, left_up, right_down, (0, 0, 255), 2)
cv2.imshow('res', img)

這里框出來看看效果：

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

模擬拖動滑塊

識別出位置之后就要算出滑塊移動了多少距離，我們可以看到滑塊初始狀態(tài)距離邊緣有26個像素：

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

同時抓下來的圖片相比在網(wǎng)頁中放大了一倍，所以真實滑動距離是：

(left_up - 26*2)/2

于是用selenium的actionchains模擬拖動滑塊：

def drag_block(l):
    drag = driver.find_element("id", "tcaptcha_drag_button")
    ActionChains(driver).click_and_hold(on_element=drag).perform()
    ActionChains(driver).move_to_element_with_offset(to_element=drag, xoffset=l, yoffset=0).perform()
    ActionChains(driver).release().perform()

這樣整個流程就搞定了，理論上這樣簡單粗暴的自動拖過去在很多時候會不奏效，還需要模擬人手動拖動，不過因為我做測試的時候直接就成功了，所以沒寫下去，整體思路大概是加速減速停幾秒或者中間觸發(fā)幾個mouse_up()，mouse_down()事件。

腳本示例：

下面是測試時用到的腳本，selenium部分和主函數(shù)，拿某個CTF靶場做的測試，僅供參考，根據(jù)實際網(wǎng)站不同肯定得改改：

import time
import requests
 
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
 
import block_loc
 
 
def drag_block(l):
    drag = driver.find_element("id", "tcaptcha_drag_button")
    ActionChains(driver).click_and_hold(on_element=drag).perform()
    ActionChains(driver).move_to_element_with_offset(to_element=drag, xoffset=l, yoffset=0).perform()
    ActionChains(driver).release().perform()
 
 
def login_in(username, password):
    headers = {
        'Accept': "application/json, text/plain, */*",
        'User-Agent': "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"
    }
    driver.get('網(wǎng)址')
    driver.find_element("link text", "登錄").click()
    name = driver.find_element("id", "name-input")
    name.send_keys(username)
    pw = driver.find_element("id", "password-input")
    pw.send_keys(password)
    driver.find_element("id", "submit").click()
    time.sleep(2)
    driver.switch_to.frame('tcaptcha_iframe')
    img = driver.find_element("id", "slideBg").get_attribute('src')
    r = requests.get(img, headers=headers)
    with open('img.png', 'wb') as f:
        f.write(r.content)
    block = driver.find_element("id", "slideBlock").get_attribute('src')
    r = requests.get(block, headers=headers)
    with open('block.png', 'wb') as f:
        f.write(r.content)
 
 
if __name__ == '__main__':
    options = webdriver.FirefoxOptions()
    driver = webdriver.Firefox(options=options)
    user = "##########"
    pw = "############"
    login_in(user, pw)
    image = "img.png"
    tpl = "block.png"
    length = block_loc.match(image, tpl)
    print(length)
    drag_block(length)

Opencv部分：

import cv2
import numpy as np
 
 
def avg_mean(img):
    mean_val, _, _, _ = cv2.mean(img)
    print("平均灰度：", mean_val)
    return mean_val
 
 
def match(image, temp):
    img = cv2.imread(image)
    tpl = cv2.imread(temp)
    tpl_gray = cv2.cvtColor(tpl, cv2.COLOR_BGR2GRAY)
    # cv2.imshow("111", tpl_gray)
    width, height = tpl_gray.shape
    for h in range(height):
        for w in range(width):
            if tpl_gray[w, h] == 0:
                tpl_gray[w, h] = 96
    binary = cv2.inRange(tpl_gray, 96, 96)
    kernel = np.ones((8, 8), np.uint8)
    template = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel)
    # cv2.imshow('tpl', template)
    print(img.shape)
    gauss = cv2.GaussianBlur(img, [5, 5], 0)
    img_gray = cv2.cvtColor(gauss, cv2.COLOR_BGR2GRAY)
    # cv2.imshow("111", img_gray)
    if avg_mean(img) > 140:
        ret, target = cv2.threshold(img_gray, 105, 255, cv2.THRESH_BINARY) # 二值化
    elif avg_mean(img) > 102:
        ret, target = cv2.threshold(img_gray, 95, 255, cv2.THRESH_BINARY)  # 二值化
    else:
        ret, target = cv2.threshold(img_gray, 80, 255, cv2.THRESH_BINARY)
    # cv2.imshow('target', target)
    result = cv2.matchTemplate(target, template, cv2.TM_CCOEFF_NORMED)
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)
    left_up = max_loc
    print(left_up)
    right_down = (left_up[0] + height, left_up[1] + width)
    cv2.rectangle(img, left_up, right_down, (0, 0, 255), 2)
    # cv2.imshow('res', img)
    length = (left_up[0] - 26*2)/2
    return length

讀到這里，這篇“怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸”文章已經(jīng)介紹完畢，想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會，如果想了解更多相關(guān)內(nèi)容的文章，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

怎么使用selenium+opencv實現(xiàn)滑塊驗證碼的登陸

環(huán)境

selenium登錄網(wǎng)站

requests抓取驗證碼圖片

OpenCV識別缺口位置

模擬拖動滑塊

腳本示例：

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽