溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么用Golang處理每分鐘100萬個請求

發(fā)布時間:2023-04-11 14:59:16 來源:億速云 閱讀:116 作者:iii 欄目:開發(fā)技術(shù)

本文小編為大家詳細(xì)介紹“怎么用Golang處理每分鐘100萬個請求”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“怎么用Golang處理每分鐘100萬個請求”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學(xué)習(xí)新知識吧。

面臨的問題

在我設(shè)計一個分析系統(tǒng)中,我們公司的目標(biāo)是能夠處理來自數(shù)百萬個端點的大量POST請求。web 網(wǎng)絡(luò)處理程序?qū)⑹盏揭粋€JSON文檔,其中可能包含許多有效載荷的集合,需要寫入Amazon S3,以便我們的地圖還原系統(tǒng)隨后對這些數(shù)據(jù)進行操作。

傳統(tǒng)上,我們會研究創(chuàng)建一個工人層架構(gòu),利用諸如以下東西:

  • Sidekiq

  • Resque

  • DelayedJob

  • Elasticbeanstalk Worker Tier

  • RabbitMQ

  • 還有等等其他的技術(shù)手段...

并設(shè)置 2 個不同的集群,一個用于 Web 前端,另一個用于 worker 處理進程,這樣我們就可以擴大我們可以處理的后臺工作量。

但從一開始,我們的團隊就知道我們應(yīng)該在 Go 中這樣做,因為在討論階段我們看到這可能是一個非常大的流量系統(tǒng)。 我使用 Go 已有大約 2 年左右的時間,我們公司在處理業(yè)務(wù)時開發(fā)了一些系統(tǒng),但沒有一個能承受如此大的負(fù)載。以下是優(yōu)化的過程。

我們首先創(chuàng)建一些結(jié)構(gòu)體來定義我們將通過 POST 調(diào)用接收的 Web 請求負(fù)載,以及一種將其上傳到我們的 S3 存儲桶的方法。代碼如下:

type PayloadCollection struct {
    WindowsVersion  string    `json:"version"`
    Token           string    `json:"token"`
    Payloads        []Payload `json:"data"`
}

type Payload struct {
    // ...負(fù)載字段
}

func (p *Payload) UploadToS3() error {
    // storageFolder 方法確保在我們在鍵名中獲得相同時間戳?xí)r不會發(fā)生名稱沖突
    storage_path := fmt.Sprintf("%v/%v", p.storageFolder, time.Now().UnixNano())

    bucket := S3Bucket

    b := new(bytes.Buffer)
    encodeErr := json.NewEncoder(b).Encode(payload)
    if encodeErr != nil {
        return encodeErr
    }

    // 我們發(fā)布到 S3 存儲桶的所有內(nèi)容都應(yīng)標(biāo)記為“私有”
    var acl = s3.Private
    var contentType = "application/octet-stream"

    return bucket.PutReader(storage_path, b, int64(b.Len()), contentType, acl, s3.Options{})
}

使用 Go 協(xié)程

最初我們采用了一個非常簡單的 POST 處理程序?qū)崿F(xiàn),只是試圖將job 處理程序并行化到一個簡單的 goroutine 中:

func payloadHandler(w http.ResponseWriter, r *http.Request) {

    if r.Method != "POST" {
        w.WriteHeader(http.StatusMethodNotAllowed)
        return
    }

    // 將body讀入字符串進行json解碼
    var content = &PayloadCollection{}
    err := json.NewDecoder(io.LimitReader(r.Body, MaxLength)).Decode(&content)
    if err != nil {
        w.Header().Set("Content-Type", "application/json; charset=UTF-8")
        w.WriteHeader(http.StatusBadRequest)
        return
    }
    
    // 分別檢查每個有效負(fù)載和隊列項目以發(fā)布到 S3
    for _, payload := range content.Payloads {
        go payload.UploadToS3()   // <----- 這是不建議的做法。這里是最開始的做法。
    }

    w.WriteHeader(http.StatusOK)
}

對于中等負(fù)載,這可能適用于大多數(shù)公司的流量,但很快證明這在大規(guī)模情況下效果不佳。 我們期望有很多請求,但沒有達(dá)到我們將第一個版本部署到生產(chǎn)環(huán)境時開始看到的數(shù)量級。 我們完全低估了流量。

上面的方法在幾個不同的方面是不好的。 無法控制我們生成了多少個 go routines。 由于我們每分鐘收到 100 萬個 POST 請求,因此這段代碼很快崩潰了。

進一步優(yōu)化

我們需要找到一種不同的方式。 從一開始我們就開始討論我們需要如何保持請求處理程序的生命周期非常短,并在后臺進行生成處理。 當(dāng)然,這是你在使用 Ruby on Rails 時必須做的,否則你將阻止所有可用的 worker web 處理器,無論你使用的是 puma、unicorn 還是 passenger(請不要進入 JRuby 討論)。 然后我們需要利用常見的解決方案來做到這一點,例如 Resque、Sidekiq、SQS 等等,有很多方法可以實現(xiàn)這一點。

所以第二次迭代是創(chuàng)建一個緩沖通道,我們可以創(chuàng)建一些隊列,然后把 job push到隊列并將它們上傳到 S3,并且由于我們可以控制job 隊列中的最大數(shù)數(shù)量并且我們有足夠的內(nèi)存來處理隊列中的 job。在這個方案中,我們認(rèn)為只需要在通道隊列中緩沖需要處理的 job 就可以了。

代碼如下:

var Queue chan Payload

func init() {
    Queue = make(chan Payload, MAX_QUEUE)
}

func payloadHandler(w http.ResponseWriter, r *http.Request) {
    ...
    // 分別檢查每個有效負(fù)載和隊列項目以發(fā)布到 S3
    for _, payload := range content.Payloads {
        Queue <- payload // <----- 這是建議的做法。
    }
    ...
}

然后為了實際出列作業(yè)并處理它們,我們使用了類似的東西:

func StartProcessor() {
    for {
        select {
        case job := <-Queue:
            job.payload.UploadToS3()  // <-- 這里雖然優(yōu)化了,但還不是最好的。
        }
    }
}

在上面的代碼中,我們用一個緩沖隊列來交換有缺陷的并發(fā)性,而緩沖隊列只是推遲了問題。 我們的同步處理器一次只將一個有效負(fù)載上傳到 S3,并且由于傳入請求的速率遠(yuǎn)遠(yuǎn)大于單個處理器上傳到 S3 的能力,我們的 job 緩沖通道很快達(dá)到了極限并阻止了請求處理程序的能力,隊列很快就阻塞滿了。

我們只是在避免這個問題,并開始倒計時,直到我們的系統(tǒng)最終死亡。 在我們部署這個有缺陷的版本后,我們的延遲率在幾分鐘內(nèi)以恒定的速度持續(xù)增加。以下是延遲率增長圖:

怎么用Golang處理每分鐘100萬個請求

更好的解決方案

我們決定在使用 Go 通道時使用一種通用模式,以創(chuàng)建一個 2 層通道系統(tǒng),一個用于 Job 隊列,另一個用于控制同時在 Job 隊列上操作的 Worker 的數(shù)量。

這個想法是將上傳到 S3 的數(shù)據(jù)并行化到某種程度上可持續(xù)的速度,這種速度既不會削弱機器也不會開始從 S3 生成連接錯誤。 所以我們選擇創(chuàng)建 Job/Worker 模式。 對于那些熟悉 Java、C# 等的人來說,可以將其視為 Golang 使用通道實現(xiàn) Worker 線程池的方式。

代碼如下:

var (
    MaxWorker = os.Getenv("MAX_WORKERS")
    MaxQueue  = os.Getenv("MAX_QUEUE")
)

// Job 表示要運行的作業(yè)
type Job struct {
    Payload Payload
}

// 我們可以在 Job 隊列上發(fā)送工作請求的緩沖通道。
var JobQueue chan Job

// Worker 代表執(zhí)行作業(yè)的 Worker。
type Worker struct {
    WorkerPool  chan chan Job
    JobChannel  chan Job
    quit        chan bool
}

func NewWorker(workerPool chan chan Job) Worker {
    return Worker{
        WorkerPool: workerPool,
        JobChannel: make(chan Job),
        quit:       make(chan bool)}
}

// Start 方法為 Worker 啟動循環(huán)監(jiān)聽。監(jiān)聽退出信號以防我們需要停止它。
func (w Worker) Start() {
    go func() {
        for {
            // 將當(dāng)前 woker 注冊到工作隊列中。
            w.WorkerPool <- w.JobChannel

            select {
            case job := <-w.JobChannel:
                // 接收 work 請求。
                if err := job.Payload.UploadToS3(); err != nil {
                    log.Errorf("Error uploading to S3: %s", err.Error())
                }

            case <-w.quit:
                // 接收一個退出的信號。
                return
            }
        }
    }()
}

// 將退出信號傳遞給 Worker 進程以停止處理清理。
func (w Worker) Stop() {
    go func() {
        w.quit <- true
    }()
}

我們已經(jīng)修改了我們的 Web 請求處理程序,以創(chuàng)建一個帶有有效負(fù)載的 Job 結(jié)構(gòu)實例,并將其發(fā)送到 JobQueue 通道以供 Worker 提取。

func payloadHandler(w http.ResponseWriter, r *http.Request) {

    if r.Method != "POST" {
        w.WriteHeader(http.StatusMethodNotAllowed)
        return
    }

    // 將body讀入字符串進行json解碼
    var content = &PayloadCollection{}
    err := json.NewDecoder(io.LimitReader(r.Body, MaxLength)).Decode(&content)
    if err != nil {
        w.Header().Set("Content-Type", "application/json; charset=UTF-8")
        w.WriteHeader(http.StatusBadRequest)
        return
    }

    // 分別檢查每個有效負(fù)載和隊列項目以發(fā)布到 S3
    for _, payload := range content.Payloads {

        // 創(chuàng)建一個有效負(fù)載的job
        work := Job{Payload: payload}

        // 將 work push 到隊列。
        JobQueue <- work
    }

    w.WriteHeader(http.StatusOK)
}

在我們的 Web 服務(wù)器初始化期間,我們創(chuàng)建一個 Dispatcher 調(diào)度器并調(diào)用 Run() 來創(chuàng)建 Woker 工作池并開始偵聽將出現(xiàn)在 Job 隊列中的 Job。

dispatcher := NewDispatcher(MaxWorker) 
dispatcher.Run()

下面是我們的調(diào)度程序?qū)崿F(xiàn)的代碼:

type Dispatcher struct {
    // 通過調(diào)度器注冊一個 Worker 通道池
    WorkerPool chan chan Job
}

func NewDispatcher(maxWorkers int) *Dispatcher {
    pool := make(chan chan Job, maxWorkers)
    return &Dispatcher{WorkerPool: pool}
}

func (d *Dispatcher) Run() {
    // 啟動指定數(shù)量的 Worker
    for i := 0; i < d.maxWorkers; i++ {
        worker := NewWorker(d.pool)
        worker.Start()
    }

    go d.dispatch()
}

func (d *Dispatcher) dispatch() {
    for {
        select {
        case job := <-JobQueue:
            // 接收一個 job 請求
            go func(job Job) {
                // 嘗試獲取可用的 worker job 通道
                // 這將阻塞 worker 直到空閑
                jobChannel := <-d.WorkerPool

                // 調(diào)度一個 job 到 worker job 通道
                jobChannel <- job
            }(job)
        }
    }
}

請注意,我們提供了要實例化并添加到我們的 Worker 池中的最大worker 數(shù)量。 由于我們在這個項目中使用了 Amazon Elasticbeanstalk 和 dockerized Go 環(huán)境,因此我們從環(huán)境變量中讀取這些值。 這樣我們就可以控制 Job 隊列的數(shù)量和最大大小,因此我們可以快速調(diào)整這些值而無需重新部署集群。

var ( 
  MaxWorker = os.Getenv("MAX_WORKERS")
  MaxQueue  = os.Getenv("MAX_QUEUE")
)

在我們部署它之后,我們立即看到我們所有的延遲率都下降到極低的延遲,并且我們處理請求的能力急劇上升。以下是流量截圖:

怎么用Golang處理每分鐘100萬個請求

在我們的彈性負(fù)載均衡器完全預(yù)熱幾分鐘后,我們看到我們的 ElasticBeanstalk 應(yīng)用程序每分鐘處理近 100 萬個請求。 我們通常在早上有幾個小時的流量會飆升至每分鐘超過一百萬。

一旦我們部署了新代碼,服務(wù)器數(shù)量就從 100 臺服務(wù)器大幅下降到大約 20 臺服務(wù)器。以下是服務(wù)器數(shù)量變化截圖:

怎么用Golang處理每分鐘100萬個請求

在正確配置集群和自動縮放設(shè)置后,我們能夠?qū)⑵溥M一步降低到僅 4x EC2 c4.Large 實例,并且如果 CPU 使用率超過 90% 持續(xù) 5 天,Elastic Auto-Scaling 將生成一個新實例 分鐘值。以下是截圖:

怎么用Golang處理每分鐘100萬個請求

讀到這里,這篇“怎么用Golang處理每分鐘100萬個請求”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會,如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI