溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

爬蟲ip池能改變ip的原理及實(shí)例說明

發(fā)布時間:2021-09-07 11:55:39 來源:億速云 閱讀:151 作者:chen 欄目:編程語言

本篇內(nèi)容主要講解“爬蟲ip池能改變ip的原理及實(shí)例說明”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“爬蟲ip池能改變ip的原理及實(shí)例說明”吧!

原理

1、存儲模塊使用Redis的有序集合來表示dialing的去重和狀態(tài)。

同時也是中心模塊和基礎(chǔ)模塊,連接其他模塊。

2、獲取模塊定期從代理網(wǎng)站獲取代理。

將獲取的代理傳輸?shù)酱鎯δK并保存到數(shù)據(jù)庫中。

3、檢測模塊定期從存儲模塊獲取所有代理。

并檢測代理,根據(jù)不同的檢測結(jié)果為代理設(shè)置不同的標(biāo)識。

4、接口模塊通過WebAPI連接服務(wù)接口。

接口連接數(shù)據(jù)庫,以Web的形式返回可用代理。

實(shí)例

from multiprocessing import Process
import time
from api import app
from getter import Getter
from tester import Tester
TESTER_CYCLE = 20
GETTER_CYCLE = 20
TESTER_ENABLED = True
GETTER_ENABLED = True
API_ENABLED = True
class Scheduler():
    """調(diào)度模塊"""
    def schedule_tester(self, cycle=TESTER_CYCLE):
        """
        定時測試代理
        :param cycle:
        :return:
        """
        tester = Tester()
        while True:
            print("測試器開始運(yùn)行")
            tester.run()
            time.sleep(cycle)
    def schedule_getter(self, cycle=GETTER_CYCLE):
        """
        定時獲取代理
        :param cycle:
        :return:
        """
        getter = Getter()
        while True:
            print("開始抓取代理")
            getter.run()
            time.sleep(cycle)
    def schedule_api(self):
        """
        開啟api
        :return:
        """
        app.run()
    def run(self):
        print("代理池開始運(yùn)行")
        if TESTER_ENABLED:
            test_process = Process(target=self.schedule_tester)
            test_process.start()
        if GETTER_ENABLED:
            getter_process = Process(target=self.schedule_getter)
            getter_process.start()
        if API_ENABLED:
            api_process = Process(target=self.schedule_api)
            api_process.start()
if __name__ == '__main__':
    a = Scheduler()
    a.run()

到此,相信大家對“爬蟲ip池能改變ip的原理及實(shí)例說明”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

ip
AI