溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

發(fā)布時(shí)間:2021-09-01 14:15:33 來源:億速云 閱讀:111 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要介紹了python爬蟲之如何快速對js內(nèi)容進(jìn)行破解,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

前言

一般js破解有兩種方法,一種是用Python重寫js邏輯,一種是利用第三方庫來調(diào)用js內(nèi)容獲取結(jié)果。這兩種方法各有利弊,第一種方法性能好,但對js和Python要求掌握比較高;第二種方法快捷便利,對一些復(fù)雜js加密很有效。這次我們就用第三方庫來進(jìn)行js破解。

目標(biāo)網(wǎng)站

本次網(wǎng)站是[企名片],網(wǎng)站對展示的數(shù)據(jù)進(jìn)行了加密,所以直接找根本找不到。

目標(biāo)url:https://www.qimingpian.com/finosda/project/pinvestment

js分析調(diào)試工具

對js進(jìn)行分析調(diào)試的瀏覽器一定要用谷歌瀏覽器,用這個(gè)來調(diào)試測試真的很方便。首先我們按F12打開開發(fā)者工具,選到network選項(xiàng)并勾選preserve log 選項(xiàng),然后輸入網(wǎng)址url來抓包。此時(shí)你會(huì)發(fā)現(xiàn)網(wǎng)頁源碼里沒有展示內(nèi)容,在搜索也找不到我們看到的內(nèi)容,那說明網(wǎng)頁內(nèi)容是被加密處理了。

此時(shí)你可以一個(gè)個(gè)看每個(gè)包找找有什么可疑的內(nèi)容,當(dāng)然我們一般會(huì)先看xhr里的內(nèi)容,一眼我們就發(fā)現(xiàn)里面都有encrypt_data這個(gè)數(shù)據(jù),看著很像。

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

我們ctrl加shift加f鍵搜索encrypt_data,找到第一個(gè)js里的encrypt_data內(nèi)容,然后翻到下面return e.encrypt_data這一行來,打上斷點(diǎn)看看這會(huì)是什么內(nèi)容。(一般我們搜索到return我們搜索的內(nèi)容都要打上斷點(diǎn)來看看,八九不離十的)

打好斷點(diǎn)后我們刷新頁面來觀察,選中e.encrypt_data右鍵有個(gè)什么什么in console的,點(diǎn)這個(gè)會(huì)在下面出現(xiàn)我們選中的內(nèi)容是什么。然后把后面的Object(d.a)(e.encrypt_data)用同樣的方法來試下,發(fā)現(xiàn)沒有網(wǎng)頁的內(nèi)容啊。

這里一定要注意我們打的斷點(diǎn),在按一次,重復(fù)上面的步驟會(huì)發(fā)現(xiàn),Object(d.a)(e.encrypt_data)這不就是我們要的內(nèi)容嗎!e.encrypt_data這個(gè)就是我們xhr里面的那個(gè)encrypt_data,Object(d.a)是一個(gè)函數(shù),就是這個(gè)函數(shù)對內(nèi)容進(jìn)行了加密,我們只要破解這個(gè)函數(shù)就OK了。

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

選中Object(d.a)上面會(huì)出現(xiàn)它在哪里,點(diǎn)擊下跳轉(zhuǎn)過去??梢园l(fā)現(xiàn)函數(shù)返回了一個(gè)json對象。這個(gè)返回結(jié)果包括1個(gè)s函數(shù),參數(shù)里只有a.a.decode(t)這一個(gè)變量,其余都是常量。

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

所有我們用同樣的方法找到s函數(shù)的具體內(nèi)容和a.a.decode()這個(gè)函數(shù)的具體內(nèi)容。方法就是我們在return JSON.parse這里重新打斷點(diǎn),點(diǎn)擊斷點(diǎn)的那個(gè)下一步,然后找上述函數(shù)的內(nèi)容。

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

s函數(shù)

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

a.a.decode()

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

利用webstorm編輯器來運(yùn)行上述函數(shù)進(jìn)行調(diào)試

1 首先我們安裝Nodejs,去官網(wǎng)下載安裝,這是js環(huán)境。這個(gè)自己搜索個(gè)安裝教程吧,這里不過多介紹了。

2 WebStorm 安裝后激活,教程網(wǎng)上很多,大家自行搜索。它使用方式與 PyCharm 很類似。

我們把上述所需要的函數(shù)全部扣下來放到webstorm中,然后運(yùn)行。注意有的函數(shù)里面會(huì)有沒有定義的參數(shù),遇到這些我們幾句在谷歌瀏覽器里一個(gè)個(gè)找就可以了,一般會(huì)有很多常量,直接替換掉。

然后我們調(diào)用上述方法可以看到能夠正常獲取數(shù)據(jù)了,這里js里的部分方法我重新命名了,注意下,下面是部分代碼片段。

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

最后用 Python 去調(diào)用解密函數(shù)就行了,這里出于對網(wǎng)站保護(hù)就不直接貼完整代碼了。

python爬蟲之如何快速對js內(nèi)容進(jìn)行破解

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“python爬蟲之如何快速對js內(nèi)容進(jìn)行破解”這篇文章對大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI