溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python爬蟲簡單的添加代理以及編寫進(jìn)行訪問的實(shí)現(xiàn)代碼

發(fā)布時(shí)間:2021-10-26 10:56:07 來源:億速云 閱讀:178 作者:柒染 欄目:編程語言

python爬蟲簡單的添加代理以及編寫進(jìn)行訪問的實(shí)現(xiàn)代碼,針對這個(gè)問題,這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問題的小伙伴找到更簡單易行的方法。

在使用python對網(wǎng)頁進(jìn)行多次快速爬取的時(shí)候,訪問次數(shù)過于頻繁,服務(wù)器不會(huì)考慮User-Agent的信息,會(huì)直接把你視為爬蟲,從而過濾掉,拒絕你的訪問,在這種時(shí)候就需要設(shè)置代理,我們可以給proxies屬性設(shè)置一個(gè)代理的IP地址,代碼如下:

<?php
 // 要訪問的目標(biāo)頁面
 $url = "http://httpbin.org/ip";
 $urls = "https://httpbin.org/ip";
 
 // 代理服務(wù)器
 define("PROXY_SERVER", "tcp://t.16yun.cn:31111");
 
 // 隧道身份信息
 define("PROXY_USER", "16YUN123");
 define("PROXY_PASS", "123456");
 
 $proxyAuth = base64_encode(PROXY_USER . ":" . PROXY_PASS);
 
 // 設(shè)置 Proxy tunnel
 $tunnel = rand(1,10000);
 
 $headers = implode("\r\n", [
 "Proxy-Authorization: Basic {$proxyAuth}",
 "Proxy-Tunnel: ${tunnel}",
 ]);
 $sniServer = parse_url($urls, PHP_URL_HOST);
 $options = [
 "http" => [
 "proxy" => PROXY_SERVER,
 "header" => $headers,
 "method" => "GET",
 'request_fulluri' => true,
 ],
 'ssl' => array(
 'SNI_enabled' => true, // Disable SNI for https over http proxies
 'SNI_server_name' => $sniServer
 )
 ];
 print($url);
 $context = stream_context_create($options);
 $result = file_get_contents($url, false, $context);
 var_dump($result);
 
 // 訪問 HTTPS 頁面
 print($urls);
 $context = stream_context_create($options);
 $result = file_get_contents($urls, false, $context);
 var_dump($result);?>

在代碼中的目標(biāo)網(wǎng)站是檢測代理是否訪問成功,如果訪問成功就會(huì)返回代理ip,如果代理返回

異常有可能是代理的配置沒有正確,那就需要對配置的代理信息進(jìn)行檢查。

關(guān)于python爬蟲簡單的添加代理以及編寫進(jìn)行訪問的實(shí)現(xiàn)代碼問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI