溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

iptables與IPVS選哪個好

發(fā)布時間：2021-11-17 09:30:34 來源：億速云閱讀：1556 作者：iii 欄目：大數(shù)據(jù)

本篇內(nèi)容主要講解“iptables與IPVS選哪個好”，感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷，實用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“iptables與IPVS選哪個好”吧!

kube-proxy 是 Kubernetes 中的關(guān)鍵組件。他的角色就是在服務(wù)（ClusterIP 和 NodePort）和其后端 Pod 之間進(jìn)行負(fù)載均衡。kube-proxy 有三種運(yùn)行模式，每種都有不同的實現(xiàn)技術(shù)： userspace 、 iptables 或者 IPVS 。

背景：iptables 模式

iptables 是一個 Linux 內(nèi)核功能，是一個高效的防火墻，并提供了大量的數(shù)據(jù)包處理和過濾方面的能力。它可以在核心數(shù)據(jù)包處理管線上用 Hook 掛接一系列的規(guī)則。iptables 模式中 kube-proxy 在 NAT pre-routing Hook 中實現(xiàn)它的 NAT 和負(fù)載均衡功能。這種方法簡單有效，依賴于成熟的內(nèi)核功能，并且能夠和其它跟 iptables 協(xié)作的應(yīng)用（例如 Calico）融洽相處。

然而 kube-proxy 的用法是一種 O(n) 算法，其中的 n 隨集群規(guī)模同步增長，這里的集群規(guī)模，更明確的說就是服務(wù)和后端 Pod 的數(shù)量。

背景：IPVS 模式

IPVS 是一個用于負(fù)載均衡的 Linux 內(nèi)核功能。IPVS 模式下，kube-proxy 使用 IPVS 負(fù)載均衡代替了 iptable。這種模式同樣有效，IPVS 的設(shè)計就是用來為大量服務(wù)進(jìn)行負(fù)載均衡的，它有一套優(yōu)化過的 API，使用優(yōu)化的查找算法，而不是簡單的從列表中查找規(guī)則。

這樣一來，kube-proxy 在 IPVS 模式下，其連接過程的復(fù)雜度為 O(1)。換句話說，多數(shù)情況下，他的連接處理效率是和集群規(guī)模無關(guān)的。

另外作為一個獨立的負(fù)載均衡器，IPVS 包含了多種不同的負(fù)載均衡算法，例如輪詢、最短期望延遲、最少連接以及各種哈希方法等。而 iptables 就只有一種隨機(jī)平等的選擇算法。

IPVS 的一個潛在缺點就是，IPVS 處理數(shù)據(jù)包的路徑和通常情況下 iptables 過濾器的路徑是不同的。如果計劃在有其他程序使用 iptables 的環(huán)境中使用 IPVS，需要進(jìn)行一些研究，看看他們是否能夠協(xié)調(diào)工作。（Calico 已經(jīng)和 IPVS kube-proxy 兼容）

性能對比

iptables 的連接處理算法復(fù)雜度是 O(n)，而 IPVS 模式是 O(1)，但是在微服務(wù)環(huán)境中，其具體表現(xiàn)如何呢？

在多數(shù)場景中，有兩個關(guān)鍵屬性需要關(guān)注：

響應(yīng)時間：一個微服務(wù)向另一個微服務(wù)發(fā)起調(diào)用時，第一個微服務(wù)發(fā)送請求，并從第二個微服務(wù)中得到響應(yīng)，中間消耗了多少時間？
CPU 消耗：運(yùn)行微服務(wù)的過程中，總體 CPU 使用情況如何？包括用戶和核心空間的 CPU 使用，包含所有用于支持微服務(wù)的進(jìn)程（也包括 kube-proxy）。

為了說明問題，我們運(yùn)行一個微服務(wù)作為客戶端，這個微服務(wù)以 Pod 的形式運(yùn)行在一個獨立的節(jié)點上，每秒鐘發(fā)出 1000 個請求，請求的目標(biāo)是一個 Kubernetes 服務(wù)，這個服務(wù)由 10 個 Pod 作為后端，運(yùn)行在其它的節(jié)點上。接下來我們在客戶端節(jié)點上進(jìn)行了測量，包括 iptables 以及 IPVS 模式，運(yùn)行了數(shù)量不等的 Kubernetes 服務(wù)，每個服務(wù)都有 10 個 Pod，最大有 10,000 個服務(wù)（也就是 100,000 個 Pod）。我們用 golang 編寫了一個簡單的測試工具作為客戶端，用標(biāo)準(zhǔn)的 NGINX 作為后端服務(wù)。

響應(yīng)時間

響應(yīng)時間很重要，有助于我們理解連接和請求的差異。典型情況下，多數(shù)微服務(wù)都會使用持久或者 keepalive 連接，這意味著每個連接都會被多個請求復(fù)用，而不是每個請求一次連接。這很重要，因為多數(shù)連接的新建過程都需要完成三次 TCP 握手的過程，這需要消耗時間，也需要在 Linux 網(wǎng)絡(luò)棧中進(jìn)行更多操作，也就會消耗更多 CPU 和時間。

iptables與IPVS選哪個好

這張圖展示了兩個關(guān)鍵點：

iptables 和 IPVS 的平均響應(yīng)時間在 1000 個服務(wù)（10000 個 Pod）以上時，會開始觀察到差異。
只有在每次請求都發(fā)起新連接的情況下，兩種模式的差異才比較明顯。

不管是 iptables 還是 IPVS，kube-proxy 的響應(yīng)時間開銷都是和建立連接的數(shù)量相關(guān)的，而不是數(shù)據(jù)包或者請求數(shù)量，這是因為 Linux 使用了 Conntrack，能夠高效地將數(shù)據(jù)包和現(xiàn)存連接關(guān)聯(lián)起來。如果數(shù)據(jù)包能夠被 Conntrack 成功匹配，那就不需要通過 kube-proxy 的 iptables 或 IPVS 規(guī)則來推算去向。Linux conntrack 非常棒?。ń^大多數(shù)時候）

值得注意的是，例子中的服務(wù)端微服務(wù)使用 NGINX 提供一個靜態(tài)小頁面。多數(shù)微服務(wù)要做更多操作，因此會產(chǎn)生更高的響應(yīng)時間，也就是 kube-proxy 處理過程在總體時間中的占比會減少。

還有個需要解釋的古怪問題：既然 IPVS 的連接過程復(fù)雜度是 O(1)，為什么在 10,000 服務(wù)的情況下，非 Keepalive 的響應(yīng)時間還是提高了？我們需要深入挖掘更多內(nèi)容才能解釋這一問題，但是其中一個因素就是因為上升的 CPU 用量拖慢了整個系統(tǒng)。這就是下一個主題需要探究的內(nèi)容。

CPU 用量

為了描述 CPU 用量，下圖關(guān)注的是最差情況：不使用持久/keepalive 連接的情況下，kube-proxy 會有最大的處理開銷。

iptables與IPVS選哪個好

上圖說明了兩件事：

在超過 1000 個服務(wù)（也就是 10,000 個 Pod）的情況下，CPU 用量差異才開始明顯。
在一萬個服務(wù)的情況下（十萬個后端 Pod），iptables 模式增長了 0.35 個核心的占用，而 IPVS 模式僅增長了 8%。

有兩個主要因素造成 CPU 用量增長：

第一個因素是，缺省情況下 kube-proxy 每 30 秒會用所有服務(wù)對內(nèi)核重新編程。這也解釋了為什么 IPVS 模式下，新建連接的 O(1) 復(fù)雜度也仍然會產(chǎn)生更多的 CPU 占用。另外，如果是舊版本內(nèi)核，重新編程 iptables 的 API 會更慢。所以如果你用的內(nèi)核較舊，iptables 模式可能會占用更多的 CPU。

另一個因素是，kube-proxy 使用 IPVS 或者 iptables 處理新連接的消耗。對 iptables 來說，通常是 O(n) 的復(fù)雜度。在存在大量服務(wù)的情況下，會出現(xiàn)顯著的 CPU 占用升高。例如在 10,000 服務(wù)（100,000 個后端 Pod）的情況下，iptables 會為每個請求的每個連接處理大約 20000 條規(guī)則。如果使用 NINGX 缺省每連接 100 請求的 keepalive 設(shè)置，kube-proxy 的 iptables 規(guī)則執(zhí)行次數(shù)會減少為 1%，會把 iptables 的 CPU 消耗降低到和 IPVS 類似的水平。

客戶端微服務(wù)會簡單的丟棄響應(yīng)內(nèi)容。真實世界中自然會進(jìn)行更多處理，也會造成更多的 CPU 消耗，但是不會影響 CPU 消耗隨服務(wù)數(shù)量增長的事實。

結(jié)論

在超過 1000 服務(wù)的規(guī)模下，kube-proxy 的 IPVS 模式會有更好的性能表現(xiàn)。雖然可能有多種不同情況，但是通常來說，讓微服務(wù)使用持久連接、運(yùn)行現(xiàn)代內(nèi)核，也能取得較好的效果。如果運(yùn)行的內(nèi)核較舊，或者無法使用持久連接，那么 IPVS 模式可能是個更好的選擇。

拋開性能問題不談，IPVS 模式還有個好處就是具有更多的負(fù)載均衡算法可供選擇。

如果你還不確定 IPVS 是否合適，那就繼續(xù)使用 iptables 模式好了。這種傳統(tǒng)模式有大量的生產(chǎn)案例支撐，他是一個不完美的缺省選項。

補(bǔ)充：Calico 和 kube-proxy 的 iptables 比較

本文中我們看到，kube-proxy 中的 iptables 用法在大規(guī)模集群中可能會產(chǎn)生性能問題。有人問我 Calico 為什么沒有類似的問題。答案是 Calico 中 kube-proxy 的用法是不同的。kube-proxy 使用了一個很長的規(guī)則鏈條，鏈條長度會隨著集群規(guī)模而增長，Calico 使用的是一個很短的優(yōu)化過的規(guī)則鏈，經(jīng)由 ipsets 的加持，也具備了 O(1) 復(fù)雜度的查詢能力。

下圖證明了這一觀點，其中展示了每次連接過程中，kube-proxy 和 Calico 中 iptables 規(guī)則數(shù)量的平均值。這里假設(shè)集群中的節(jié)點平均有 30 個 Pod，每個 Pod 具有 3 個網(wǎng)絡(luò)規(guī)則。

iptables與IPVS選哪個好

即使是使用 10,000 個服務(wù)和 100,000 個 Pod 的情況下，Calico 每連接執(zhí)行的 iptables 規(guī)則也只是和 kube-proxy 在 20 服務(wù) 200 個 Pod 的情況基本一致。

到此，相信大家對“iptables與IPVS選哪個好”有了更深的了解，不妨來實際操作一番吧！這里是億速云網(wǎng)站，更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢，關(guān)注我們，繼續(xù)學(xué)習(xí)！

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
java中JUC多線程的方式有哪些
下一篇新聞：
jquery如何獲取tr里面有幾個td

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼