您好,登錄后才能下訂單哦!
這篇文章主要講解了“Python和JS解密怎么爬取某音漫客網(wǎng)站數(shù)據(jù)”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“Python和JS解密怎么爬取某音漫客網(wǎng)站數(shù)據(jù)”吧!
首先打開網(wǎng)站
https://www.zymk.cn/1/37988.html
打開開發(fā)者工具
選擇XHR標(biāo)簽頁,沒有找到什么
再查看一下這些圖片的URL值
http://mhpic.xiaomingtaiji.net/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%E6%8B%86%E5%88%86%E7%89%88%2F20%E8%AF%9D%2F1.jpg-zymk.middle.webp 可以發(fā)現(xiàn)URL前面的“http://mhpic.xiaomingtaiji.net/comic/”和后面的“.jpg-zymk.middle.webp“是不變的,那么就是要找到中間的值了
嘗試搜索圖片元素
發(fā)現(xiàn)有一個js文件,打開搜索
發(fā)現(xiàn)這里有一個疑點(diǎn),這不是html里面的字段嗎,那么 “i.getPicUrl(e)” 不就是那個圖片的URL的值了嗎
在這里下一個斷點(diǎn),走你
果然,這個就那個圖片URL生成的切入點(diǎn),現(xiàn)在就是看調(diào)用棧,找到這個函數(shù)的起點(diǎn),點(diǎn)擊右側(cè)的 ”e.init“,這里有一個setInitData函數(shù),從名字來看,應(yīng)該就是設(shè)置初始數(shù)據(jù)的地方,在這里下一個斷點(diǎn),進(jìn)去看看
這里有一個this.imgpath,這個應(yīng)該就是圖片的URL值了,點(diǎn)擊F10,再單步調(diào)式,來到了charcode函數(shù)
進(jìn)去看看,這里應(yīng)該就是加密函數(shù)了
這里一步步調(diào)式,不要著急,來到了這里
繼續(xù)單步調(diào)式,在第二次打開這么VM文件的時候,”__cr.imgpath“這個看起來很熟悉呀
Plain Text "L-:N-M>-A>-A?-M?-I8-J<-M@-@J-@L-M?-IA-JA-M>-@J-@>-M=-@@-@>-M?-@A-@@-:N:8-M@-IN-AL-:N"
打開頁面源代碼,就在這里啦,不僅僅有圖片的URL加密值,還有其他數(shù)據(jù),這些都是在后面圖片URL拼接需要使用到的
現(xiàn)在我們再重新看看那個加密函數(shù),它無非就是遍歷那個加密值的每個字符,獲取其Unicode值,再與__cr.chapter_id進(jìn)行相關(guān)運(yùn)算,然后再得到的Unicode數(shù)值返回字符
現(xiàn)在我們可以用python仿寫這個算法
感謝各位的閱讀,以上就是“Python和JS解密怎么爬取某音漫客網(wǎng)站數(shù)據(jù)”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對Python和JS解密怎么爬取某音漫客網(wǎng)站數(shù)據(jù)這一問題有了更深刻的體會,具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云,小編將為大家推送更多相關(guān)知識點(diǎn)的文章,歡迎關(guān)注!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。