python要反爬蟲的原因

發(fā)布時間：2020-11-25 13:38:20 來源：億速云閱讀：179 作者：小新欄目：編程語言

這篇文章給大家分享的是有關python要反爬蟲的原因的內容。小編覺得挺實用的，因此分享給大家做個參考。一起跟隨小編過來看看吧。

爬蟲也分善惡。

像谷歌這樣的搜索引擎爬蟲，每隔幾天對全網的網頁掃一遍，供大家查閱，各個被掃的網站大都很開心。這種就被定義為「善意爬蟲」。

但是，像搶票軟件這樣的爬蟲，對著 12306 每秒鐘恨不得擼幾萬次。鐵總并不覺得很開心。這種就被定義為「惡意爬蟲」。（注意，搶票的你覺得開心沒用，被掃描的網站覺得不開心，它就是惡意的。）

給大家看一張圖：

python要反爬蟲的原因

這張圖里顯示的，就是各行各業(yè)被爬「叨擾」的比例。（注意，這張圖顯示是全世界）

你可能會問：為什么 12306不能大方地讓爬蟲隨意爬呢？

那大家知道每年過年之前，12306 被點成什么樣了嗎？公開數據是這么說的：「最高峰時 1 天內頁面瀏覽量達 813.4 億次，1 小時最高點擊量 59.3 億次，平均每秒 164.8 萬次。」這還是加上驗證碼防護之后的數據?？上攵粩r截在外面的爬蟲還有多少。

況且這里還沒有討論，被搶票軟件把票搶走，對我們父母那樣的不會搶票的人來說，是不是公平呢？

所以我們在買票時多了驗證碼的步驟，這就是鐵路對于爬蟲的應對措施：

python要反爬蟲的原因

感謝各位的閱讀！關于python要反爬蟲的原因就分享到這里了，希望以上內容可以對大家有一定的幫助，讓大家可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到吧！

向AI問一下細節(jié)

猜你喜歡