您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“如何實(shí)現(xiàn)Python爬蟲之掌握酷狗音樂(lè)的加密過(guò)程”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“如何實(shí)現(xiàn)Python爬蟲之掌握酷狗音樂(lè)的加密過(guò)程”吧!
我們?cè)谒阉鳈谏陷斎胛覀兿肼牭囊魳?lè),小編輸入:刺客
是不是看到了一系列音樂(lè),怎樣得到這些音樂(lè)的一些信息呢?(這里指的音樂(lè)信息是指音樂(lè)的hash值和音樂(lè)的album_id值【這兩個(gè)參數(shù)在獲取音樂(lè)的下載鏈接那里會(huì)用到】,當(dāng)然還包括音樂(lè)的名稱【不然怎么區(qū)別呢?】)。
由于這一系列音樂(lè)是動(dòng)態(tài)加載出來(lái)的,也就是如果直接解析這個(gè)界面的數(shù)據(jù),根本得不到,這個(gè)時(shí)候我們就應(yīng)該來(lái)到如下這個(gè)界面了。
是不是可以看到我們剛才看到的那些音樂(lè)了,而且展開其中一首音樂(lè),可以發(fā)現(xiàn)上述小編講的哪些信息好像都有了呀!
我們看一下這個(gè)請(qǐng)求的網(wǎng)址吧!發(fā)現(xiàn)這是一個(gè)get請(qǐng)求,請(qǐng)求數(shù)據(jù)如下:
小編搜索了多首歌曲,發(fā)現(xiàn)它們的請(qǐng)求參數(shù)有一個(gè)共同點(diǎn),那就是除了keyword、clienttime、mid、uuid和signature這幾個(gè)參數(shù)值不同之外,其他的都差不多,而clienttime本意就是客戶端時(shí)間,它的值是一個(gè)時(shí)間戳,mid和uuid的值和clienttime一樣的,keyword它的值就是我們搜索的關(guān)鍵詞,現(xiàn)在我們需要的就是搞懂signature這個(gè)參數(shù)值到底是什么呀!
小編得到這個(gè)signature參數(shù)值的長(zhǎng)度為32,覺(jué)得應(yīng)該是使用了加密,將一些初始數(shù)據(jù),把它加密得到的,那么怎樣得到這個(gè)初始數(shù)據(jù)呢?
小編點(diǎn)擊了這個(gè)網(wǎng)站所有的js文件,發(fā)現(xiàn)這個(gè)參數(shù)值在這個(gè)js文件下
是不是看到了md5這個(gè)函數(shù)呀!這應(yīng)該就是那個(gè)加密函數(shù)了吧!而o.join("")就應(yīng)該是那個(gè)初始數(shù)據(jù)了,o是一個(gè)js數(shù)組。
現(xiàn)在知道要獲取o的值,怎樣獲取呢?肯定是使用斷點(diǎn)呀!我們?cè)趕ignature周圍打上相應(yīng)的斷點(diǎn),然后執(zhí)行斷點(diǎn)操作(這個(gè)小編就不一一贅述了,小編使用js斷點(diǎn)還是有一點(diǎn)懵逼的,就不在這里誤導(dǎo)大家了)。
上述圖片就是那個(gè)js數(shù)組o中的值了,經(jīng)過(guò)對(duì)這些數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其實(shí)這其中絕大部分值就是我們請(qǐng)求網(wǎng)址的哪些參數(shù)值,讀者覺(jué)得呢?
整個(gè)加密算法如下:
這也太長(zhǎng)了吧!原本小編打斷使用python來(lái)模擬這個(gè)加密過(guò)程,但是現(xiàn)在小編看到這么長(zhǎng),放棄了,但是并不代表加密過(guò)程就無(wú)法實(shí)現(xiàn),小編查閱資料,發(fā)現(xiàn)原來(lái)python可以執(zhí)行js語(yǔ)句,我們是不是只需結(jié)合python和js,就能實(shí)現(xiàn)這個(gè)加密了呢?開干!
代碼如下:
看看運(yùn)行結(jié)果吧!
是不是這樣就獲取我們想要的數(shù)據(jù)了呀!我們只需使用json解析這些數(shù)據(jù),就可以獲取小編在上面提到的那兩個(gè)參數(shù)了?!疽魳?lè)的hash值和音樂(lè)的album_id值】
在上述第二點(diǎn)那里講到音樂(lè)的hash值和音樂(lè)album_id值,為什么要提到它們倆呢?當(dāng)然是為了給第第三點(diǎn)這里做鋪墊的哈!
這個(gè)過(guò)程小編不會(huì)講的很詳細(xì),因?yàn)樾【幗裉熘v的重點(diǎn)是這個(gè)加密哈!
我們點(diǎn)擊一首歌播放,來(lái)到上述界面,可以看到歌曲的下載鏈接,這個(gè)請(qǐng)求的參數(shù)如下:
這些請(qǐng)求參數(shù)中是不是看到我提到的那兩個(gè)參數(shù)呀!
通過(guò)分析發(fā)現(xiàn),其實(shí)只需以下三個(gè)參數(shù)即可請(qǐng)求成功!如下
到此,相信大家對(duì)“如何實(shí)現(xiàn)Python爬蟲之掌握酷狗音樂(lè)的加密過(guò)程”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。