溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

實例講解Style–CSS 在反爬蟲中的應用

發(fā)布時間：2020-08-11 00:10:37 來源：ITPUB博客閱讀：141 作者：mmz_77 欄目：編程語言

由于這個例子比較簡單，所以這里我就省略掉分析請求的步驟了，直接來分析一下瀏覽器看到的效果與源碼分別長什么樣，找找有沒有什么突破口吧。

這是瀏覽器看到的效果：

可以在源碼中看到部分內容被 <span class="context_kwx"></span> 替換。

頁面分析

打開瀏覽器的 開發(fā)者模式，看看隱藏的文字是什么樣子的：

實例講解Style–CSS 在反爬蟲中的應用 cdn.nlark.com/yuque/0/2020/webp/1313084/1589287177467-0a19a791-7fd1-4fc8-9664-92c0faf93a5b.webp">

第二個是下圖中在返回時的判斷語句，同樣是對 Node 中不存在的屬性進行判斷，所以也需要在這里進行相應的修改。

實例講解Style–CSS 在反爬蟲中的應用

第二個修改點可以像這樣改：

_0x1532b6[_0xea12('0x26')](_0x490c80, 0x3 * +!('object' === _0xea12('0x27')))復制代碼

以上兩點修改完后就可以獲取到所有被替換過的字符了，接下來只需要把它們替換進 HTML 里就可以還原出正常的頁面。替換的步驟這里就不再演示了，因為非常簡單，一看就會。當然反爬蟲有很多的方法，這個只是其中一個，所以只是大概的講述了下。但是不管使用什么方式采集數據都是一個長期的過程，所以需要配合代理才能更好的獲取數據，而億牛云提供的爬蟲代理就能更好的助力我們進行數據采集，尤其是加強版，效果會更好。

產品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

實例講解Style–CSS 在反爬蟲中的應用

頁面分析

猜你喜歡

最新資訊

相關推薦

相關標簽