溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

文章正在審核中 為什么使用了爬蟲代理ip,真實(shí)IP還是被封禁了?

發(fā)布時(shí)間:2020-06-25 22:18:59 來(lái)源:網(wǎng)絡(luò) 閱讀:1387 作者:HC48星云 欄目:網(wǎng)絡(luò)管理

很多朋友在剛做爬蟲的時(shí)候會(huì)遇到一個(gè)問(wèn)題,明明我已經(jīng)使用爬蟲代理ip了,開(kāi)開(kāi)心心地去抓取某一個(gè)網(wǎng)站,正想去泡一杯咖啡,發(fā)現(xiàn)爬蟲程序終止了, 一查,真實(shí)ip被封了,這時(shí)候會(huì)非常納悶,我明明用了代理ip了啊,為什么我的真實(shí)IP還是會(huì)被封呢?是不是IP質(zhì)量與問(wèn)題?我被代理IP提供商給欺騙了?

當(dāng)然不排除這個(gè)可能,比如使用透明代理,目標(biāo)服務(wù)器明確知道你使用了代理,也能知道你的真實(shí)IP,當(dāng)然會(huì)被封禁;又如普匿代理,目標(biāo)服務(wù)器知道你是一只披著羊皮的狼,當(dāng)然也會(huì)封禁你的真實(shí)IP;而如果使用高匿代理ip,高匿ip代理則是和正常家庭上網(wǎng)一樣,沒(méi)有什么區(qū)別。如果使用透明代理、普匿代理被目標(biāo)服務(wù)器識(shí)別后被封IP,那應(yīng)該就是代理IP的質(zhì)量不行。但是,使用高匿代理IP后,還是被封IP,這到底是怎么回事呢?

首先我們要清楚地知道,爬蟲程序?yàn)槭裁葱枰鞩P?代理IP有什么作用?代理IP的原理是什么?之所以需要代理IP,是因?yàn)閱蜪P頻繁的爬取某個(gè)目標(biāo)服務(wù)器,會(huì)對(duì)服務(wù)器造成巨大負(fù)載,服務(wù)器自然要作出一定的限制(限制訪問(wèn)頻率或者限制訪問(wèn)次數(shù),其根本是減少服務(wù)器壓力),那如果超出限制的頻率或者次數(shù)呢,反爬程序就會(huì)工作,比如把這個(gè)IP封禁,或者把整段IP進(jìn)行封禁。而代理IP的作用就是代替被封的IP繼續(xù)爬取,當(dāng)?shù)竭_(dá)了那個(gè)閾值時(shí),這個(gè)代理IP一樣會(huì)被封的,然后封了一個(gè)代理IP,還有千千萬(wàn)萬(wàn)個(gè)代理IP,前仆后繼,只為完成爬取任務(wù)。由此可見(jiàn),代理IP被封是很正常的,很多朋友認(rèn)為,我用了代理IP,為什么要封我,我是不是買了個(gè)垃圾IP代理?然后就來(lái)找客服投訴,說(shuō)自己被騙了,要求退款。

其實(shí)封IP有很多種原因,上面那種被封情況是不可避免的,并不是使用了代理IP就不會(huì)被封了。但也有不正常被封的,比如使用了“垃圾代理”(透明代理)。還有使用了高匿代理ip,也沒(méi)有爬取幾次就被封了的情況,這是為什么呢?那是因?yàn)闆](méi)有很好的模擬人工訪問(wèn)服務(wù)器的行為,也就是說(shuō)爬取策略不當(dāng),比如沒(méi)有清除cookie等原因,也有可能是目標(biāo)服務(wù)器的反爬策略升級(jí)了,代理IP被封的原因有很多種,而找出原因,讓每個(gè)代理IP能發(fā)揮出最大的作用則是爬蟲工作者的工作職責(zé),也就是升級(jí)爬蟲策略。

上文中我們提到,當(dāng)超出限制的頻率或者次數(shù)呢,反爬程序就會(huì)工作,比如把這個(gè)IP封禁,或者把整段IP進(jìn)行封禁。這也就是為什么有些代理IP可用率低的原因,因?yàn)楫?dāng)某個(gè)IP段被封禁后,你撥出的下一個(gè)IP也是被封禁的,所以不可用,造成整體IP可用率很低,浪費(fèi)很多時(shí)間,這是為什么呢?

因?yàn)楹芏郃DSL撥號(hào)的代理IP,撥出來(lái)的IP是連號(hào)的, 這樣的IP顯得很假,跟正常用戶訪問(wèn)的區(qū)別也很大,所以會(huì)有很多反爬程序會(huì)設(shè)置封禁整段IP地址,造成批量IP不可用,所以最好的IP資源是IP分散分布的不連號(hào)的,能夠有效地提高各項(xiàng)業(yè)務(wù)的效率。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI