溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何利用php curl多線程模擬并發(fā)

發(fā)布時(shí)間:2021-07-24 12:01:20 來(lái)源:億速云 閱讀:193 作者:chen 欄目:開(kāi)發(fā)技術(shù)

本篇內(nèi)容主要講解“如何利用php curl多線程模擬并發(fā)”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“如何利用php curl多線程模擬并發(fā)”吧!

首先,先了解下 php中的curl多線程函數(shù):

復(fù)制代碼 代碼如下:


# curl_multi_add_handle
# curl_multi_close
# curl_multi_exec
# curl_multi_getcontent
# curl_multi_info_read
# curl_multi_init
# curl_multi_remove_handle
# curl_multi_select


一般來(lái)說(shuō),想到要用這些函數(shù)時(shí),目的顯然應(yīng)該是要同時(shí)請(qǐng)求多個(gè)url,而不是一個(gè)一個(gè)依次請(qǐng)求,否則不如自己循環(huán)去調(diào)curl_exec好了。
步驟總結(jié)如下:
第一步:調(diào)用curl_multi_init
第二步:循環(huán)調(diào)用curl_multi_add_handle
這一步需要注意的是,curl_multi_add_handle的第二個(gè)參數(shù)是由curl_init而來(lái)的子handle。
第三步:持續(xù)調(diào)用curl_multi_exec
第四步:根據(jù)需要循環(huán)調(diào)用curl_multi_getcontent獲取結(jié)果
第五步:調(diào)用curl_multi_remove_handle,并為每個(gè)字handle調(diào)用curl_close
第六步:調(diào)用curl_multi_close
這里有一個(gè)網(wǎng)上找的簡(jiǎn)單例子,其作者稱為dirty的例子,(稍后我會(huì)說(shuō)明為何dirty):

復(fù)制代碼 代碼如下:


/*
Here's a quick and dirty example for curl-multi from PHP, tested on PHP 5.0.0RC1 CLI / FreeBSD 5.2.1
*/
$connomains = array(
"http://www.cnn.com/",
"http://www.canada.com/",
"http://www.yahoo.com/"
);
$mh = curl_multi_init();
foreach ($connomains as $i => $url) {
     $conn[$i]=curl_init($url);
      curl_setopt($conn[$i],CURLOPT_RETURNTRANSFER,1);
      curl_multi_add_handle ($mh,$conn[$i]);
}
do { $n=curl_multi_exec($mh,$active); } while ($active);
foreach ($connomains as $i => $url) {
      $res[$i]=curl_multi_getcontent($conn[$i]);
      curl_close($conn[$i]);
}
print_r($res);


整個(gè)使用過(guò)程差不多就是這樣,但是,這個(gè)簡(jiǎn)單代碼有個(gè)致命弱點(diǎn),就是在do循環(huán)的那段,在整個(gè)url請(qǐng)求期間是個(gè)死循環(huán),它會(huì)輕易導(dǎo)致CPU占用100%。

現(xiàn)在我們來(lái)改進(jìn)它,這里要用到一個(gè)幾乎沒(méi)有任何文檔的函數(shù)curl_multi_select了,雖然C的curl庫(kù)對(duì)select有說(shuō)明,但是,php里的接口和用法確與C中有不同。
把上面do的那段改成下面這樣:

復(fù)制代碼 代碼如下:


do {
                        $mrc = curl_multi_exec($mh,$active);
                } while ($mrc == CURLM_CALL_MULTI_PERFORM);
                while ($active and $mrc == CURLM_OK) {
                        if (curl_multi_select($mh) != -1) {
                                do {
                                        $mrc = curl_multi_exec($mh, $active);
                                } while ($mrc == CURLM_CALL_MULTI_PERFORM);
                        }
                }


因?yàn)?active要等全部url數(shù)據(jù)接受完畢才變成false,所以這里用到了curl_multi_exec的返回值判斷是否還有數(shù)據(jù),當(dāng)有數(shù)據(jù)的時(shí)候就不停調(diào)用curl_multi_exec,暫時(shí)沒(méi)有數(shù)據(jù)就進(jìn)入select階段,新數(shù)據(jù)一來(lái)就可以被喚醒繼續(xù)執(zhí)行。這里的好處就是CPU的無(wú)謂消耗沒(méi)有了。

另外:還有一些細(xì)節(jié)的地方可能有時(shí)候要遇到:
控制每一個(gè)請(qǐng)求的超時(shí)時(shí)間,在curl_multi_add_handle之前通過(guò)curl_setopt去做:
curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
判斷是否超時(shí)了或者其他錯(cuò)誤,在curl_multi_getcontent之前用:curl_error($conn[$i]);

這里我只是簡(jiǎn)單使用上述的dirty的例子(足夠用了,并未發(fā)現(xiàn)cpu使用100%的情況)。
對(duì)“看點(diǎn)”(kandian.com)某一接口模擬并發(fā),功能是向 memcache中讀數(shù)據(jù)并寫(xiě)入數(shù)據(jù)。因?yàn)楸C荜P(guān)系,相關(guān)數(shù)據(jù)及結(jié)果就不貼出了。

模擬了3次,第一次10線程同時(shí)請(qǐng)求1000次,第二次,100線程同時(shí)請(qǐng)求1000次,第三次,1000線程同時(shí)請(qǐng)求100次(已經(jīng)相當(dāng)費(fèi)勁了,不敢在設(shè)置超過(guò)1000的多線程)。
看來(lái)curl多線程模擬并發(fā)還是有一定局限的。

另外還懷疑,可能會(huì)因?yàn)槎嗑€程延遲帶來(lái)結(jié)果的大誤差,對(duì)比數(shù)據(jù)發(fā)現(xiàn)。在初始化和set所用時(shí)間出入不大,差別處在get方法,因此可簡(jiǎn)單排除這點(diǎn)~~~

到此,相信大家對(duì)“如何利用php curl多線程模擬并發(fā)”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI