您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“php爬蟲怎么添加代理進行訪問”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“php爬蟲怎么添加代理進行訪問”吧!
在使用python對網(wǎng)頁進行多次快速爬取的時候,訪問次數(shù)過于頻繁,服務器不會考慮User-Agent的信息,會直接把你視為爬蟲,從而過濾掉,拒絕你的訪問,在這種時候就需要設(shè)置代理,我們可以給proxies屬性設(shè)置一個代理的IP地址,代碼如下:
<?php
// 要訪問的目標頁面
$url = "http://httpbin.org/ip";
$urls = "https://httpbin.org/ip";
// 代理服務器
define("PROXY_SERVER", "tcp://t.16yun.cn:31111");
// 隧道身份信息
define("PROXY_USER", "16YUN123");
define("PROXY_PASS", "123456");
$proxyAuth = base64_encode(PROXY_USER . ":" . PROXY_PASS);
// 設(shè)置 Proxy tunnel
$tunnel = rand(1,10000);
$headers = implode("\r\n", [
"Proxy-Authorization: Basic {$proxyAuth}",
"Proxy-Tunnel: ${tunnel}",
]);
$sniServer = parse_url($urls, PHP_URL_HOST);
$options = [
"http" => [
"proxy" => PROXY_SERVER,
"header" => $headers,
"method" => "GET",
'request_fulluri' => true,
],
'ssl' => array(
'SNI_enabled' => true, // Disable SNI for https over http proxies
'SNI_server_name' => $sniServer
)
];
print($url);
$context = stream_context_create($options);
$result = file_get_contents($url, false, $context);
var_dump($result);
// 訪問 HTTPS 頁面
print($urls);
$context = stream_context_create($options);
$result = file_get_contents($urls, false, $context);
var_dump($result);?>
在代碼中的目標網(wǎng)站是檢測代理是否訪問成功,如果訪問成功就會返回代理ip,如果代理返回
異常有可能是代理的配置沒有正確,那就需要對配置的代理信息進行檢查。
到此,相信大家對“php爬蟲怎么添加代理進行訪問”有了更深的了解,不妨來實際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學習!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。