怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

發(fā)布時間：2021-11-01 16:30:03 來源：億速云閱讀：225 作者：柒染欄目：系統(tǒng)運維

本篇文章為大家展示了怎么深入理解Linux高性能網(wǎng)絡架構(gòu)，內(nèi)容簡明扼要并且容易理解，絕對能使你眼前一亮，通過這篇文章的詳細介紹希望你能有所收獲。

1. 落寞的小黑

上周北京很冷，周五晚上大白下班奔地鐵站，收到了好基友小黑的微信:

于是大白掉頭掃了個單車奔五道口了，小黑靠譜地選了個不錯的位置。

小黑: 你今天下班挺早呀!

大白: 就咱這覺悟，心里有工作，哪里都是辦公桌，不要拘泥于形式嘛。

明顯能感覺得到小黑哥最近好像比較累，之前眼里bulingbuling閃的光是看不到了。

大白: 下午去面的哪家?啥崗位?咋樣?

小黑: 是一家做自動駕駛的創(chuàng)業(yè)公司，網(wǎng)站是看團隊介紹還不錯，就去看看了，這次沒咋準備，很多問題其實都熟悉，但是回答的不到位。

大白: 哦，明白了，那就是當時理解的不到位，稀里糊涂過去了，現(xiàn)在忽然問起來，想不起重點。

小黑: 差不多吧，問我都做過哪些高性能的網(wǎng)絡框架模型，也就是IO和事件驅(qū)動那一套。

話說完，小黑喝了一大口啤酒，大白看出了小黑心里有一些落寞。畢竟在帝都這個地方競爭和工作壓力，以及生活瑣事都一直圍繞著我們，但是金錢和好運都巧妙地避開了自己...

想到這里，大白也深深喝了一大口，我命由我不由天，開整!

大白：黑哥，你說這個問題確實不好回答，全是術(shù)語和略帶歧義的東西，我覺得我們抓住本質(zhì)去闡述就好。

小黑：來，請開始你的表演，我學習學習。

大白決定和小黑好好聊聊，Linux開發(fā)中常用的高性能網(wǎng)絡框架中的一些事兒，火鍋的映襯下讓夜色和天氣都不那么寒冷了。

通過本文你將會了解到以下內(nèi)容：

IO事件和IO復用
線程模型和事件驅(qū)動模型的架構(gòu)
基于事件驅(qū)動的Reactor模式詳解
同步IO和異步IO簡介

2. IO事件和IO復用

2.1 什么是IO事件

IO指的是輸入Input/輸出Output，但是從漢語角度來說，出和入是相對的，所以我們需要個參照物。這里我們的參照物選擇為程序運行時的主存儲空間，外部通常包括網(wǎng)卡、磁盤等。有了上述的設定理解起來就方便多了，我們來一起看下：

IO的本質(zhì)是數(shù)據(jù)的流動，數(shù)據(jù)可以從網(wǎng)卡到程序內(nèi)存，也可以從程序內(nèi)存寫到網(wǎng)卡，磁盤操作也是如此。

所以可以把常見的IO分為:

網(wǎng)絡IO：內(nèi)存和網(wǎng)卡的數(shù)據(jù)交互
文件IO：內(nèi)存和磁盤的數(shù)據(jù)交互

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

那什么又是IO事件呢?事件可以理解為一種狀態(tài)或者動作，也就是狀態(tài)的遷移會觸發(fā)一種相應的動作。網(wǎng)絡IO的事件通常包括：

可讀事件
可寫事件
異常事件

理解可讀可寫事件是非常有必要的，一般來說一個socket大部分時候是可寫的，但是并不是都可讀?？勺x一般代表是一個新連接或者原有連接有新數(shù)據(jù)交互，對于服務端程序來說也是重點關注的事件。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

2.2 什么是IO復用

設想假如有幾萬個IO事件，那么應用程序該如何管理呢?這就要提到IO復用了。IO復用從本質(zhì)上來說就是應用程序借助于IO復用函數(shù)向內(nèi)核注冊很多類型的IO事件，當這些注冊的IO事件發(fā)生變化時內(nèi)核就通過IO復用函數(shù)來通知應用程序。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

從圖中可以看到，IO復用中復用的就是一個負責監(jiān)聽管理這些IO事件的線程。之所以可以實現(xiàn)一個線程管理成百上千個IO事件，是因為大部分時間里某個時刻只有少量IO事件被觸發(fā)。

大概就像這樣：草原上的一只大狗可以看管幾十只綿羊，因為大部分時候只有個別綿羊不守規(guī)矩亂跑，其他的都是乖乖吃草。

3. 網(wǎng)絡框架設計要素

要理解網(wǎng)絡框架有哪些，必須要清楚網(wǎng)絡框架完成了哪些事情。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

大致描述下這個請求處理的流程：

遠端的機器A發(fā)送了一個HTTP請求到服務器B，此時服務器B網(wǎng)卡接收到數(shù)據(jù)并產(chǎn)生一個IO可讀事件;
我們以同步IO為例，此時內(nèi)核將該可讀事件通知到應用程序的Listen線程;
Listen線程將任務甩給Handler線程，由Handler將數(shù)據(jù)從內(nèi)核讀緩沖區(qū)拷貝到用戶空間讀緩沖區(qū);
請求數(shù)據(jù)包在應用程序內(nèi)部進行計算和處理并封裝響應包;
Handler線程等待可寫事件的到來;
當這個連接可寫時將數(shù)據(jù)從用戶態(tài)寫緩沖區(qū)拷貝到內(nèi)核緩沖區(qū)，并通過網(wǎng)卡發(fā)送出去;

備注：上述例子是以同步IO為例，并且將線程中的角色分為Listen線程、Handler線程、Worker線程，分別完成不同的工作，后續(xù)會詳細展開。

所以我們可以知道，要完成一個數(shù)據(jù)交互，涉及了幾大塊內(nèi)容：

IO事件監(jiān)聽
數(shù)據(jù)拷貝
數(shù)據(jù)處理和計算

大白認為，這三大塊內(nèi)容，不論什么形式的框架都繞不開，也是理解網(wǎng)絡架構(gòu)的關鍵所在。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

4. 高性能網(wǎng)絡框架實踐

4.1 基于線程模型

在早期并發(fā)數(shù)不多的場景中，有一種One Request One Thread的架構(gòu)模式。該模式下每次接收一個新請求就創(chuàng)建一個處理線程，線程雖然消耗資源并不多，但是成千上萬請求打過來，性能也是扛不住的。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

這是一種比較原始的架構(gòu)，思路也非常清晰，創(chuàng)建多個線程來提供處理能力，但在高并發(fā)生產(chǎn)環(huán)境中幾乎沒有應用，本文不再展開。

4.2 基于事件驅(qū)動模型

當前流行的是基于事件驅(qū)動的IO復用模型，相比多線程模型優(yōu)勢很明顯。

在此我們先理解一下什么是事件驅(qū)動Event-Drive-Model。

事件驅(qū)動編程是一種編程范式，程序的執(zhí)行流由外部事件來決定，它的特點是包含一個事件循環(huán)，當外部事件發(fā)生時使用回調(diào)機制來觸發(fā)相應的處理。

通俗來說就是：有一個循環(huán)裝置在一直等待各種事件的到來，并將到達的事件放到隊列中，再由一個分揀裝置來調(diào)用對應的處理裝置來響應。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

4.3 Reactor反應堆模式

第一次聽到這個模式的時候很困惑，究竟反應堆是個啥?研究了一下發(fā)現(xiàn)，反應堆是個核物理的概念，大致是這個樣子的：

核反應堆是核電站的心臟，它的工作原理是這樣的：原子由原子核與核外電子組成，原子核由質(zhì)子與中子組成。

當鈾235的原子核受到外來中子轟擊時，一個原子核會吸收一個中子分裂成兩個質(zhì)量較小的原子核，同時放出2-3個中子。

這裂變產(chǎn)生的中子又去轟擊另外的鈾235原子核，引起新的裂變，如此持續(xù)進行就是裂變的鏈式反應。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

結(jié)合這種核裂變的圖，好像是一個請求打過來，服務器內(nèi)部瞬間延伸出很多分支來完成響應，一變二，二變四，甚至更多，確實有種反應堆的感覺。接下來我們看看究竟反應堆模式是如何構(gòu)建高性能網(wǎng)絡框架的。

5.反應堆模式詳解

反應堆模式是一種思想，形式卻有很多種。

5.1 反應堆模式的本質(zhì)是什么

從本質(zhì)上理解，無論什么網(wǎng)絡框架都要完成兩部分操作：

IO操作：數(shù)據(jù)包的讀取和寫入

CPU操作：數(shù)據(jù)請求的處理和封裝

所以上述這些問題由誰來做以及多少線程來做，就衍生出了很多形式，所以不要被表面現(xiàn)象迷惑，出現(xiàn)必有原因，追溯之后我們才能真正掌握它。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

反應堆模式根據(jù)處理IO環(huán)節(jié)和處理數(shù)據(jù)環(huán)節(jié)的數(shù)量差異分為如下幾種：

單Reactor線程
單Reactor線程和線程池
多Reactor線程和線程池

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

我們來看看這三種常見模式的特點、原理、優(yōu)缺點、應用場景等。

5.2 單Reactor線程模式

這種模式最為簡潔，一個線程完成了連接的監(jiān)聽、接收新連接、處理連接、讀取數(shù)據(jù)、寫入數(shù)據(jù)全套工作。由于只使用了一個線程，對于多核利用率偏低，但是編程簡單。是不是覺得這個種單線程的模式?jīng)]有市場?那可未必，不信你看Redis。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

在這種模式種IO操作和CPU操作是沒有分開的，都是由1個線程來完成的，顯然如果在Handler處理某個請求超時了將會阻塞客戶端的正常連接。在Redis中由于都是內(nèi)存操作，速度很快，這種瓶頸雖然存在但是不夠明顯。

5.3 單Reactor線程和線程池模式

為了解決IO操作和CPU操作的不匹配，也就是IO操作和CPU操作是在一個線程內(nèi)部串行執(zhí)行的，這樣就拉低了CPU操作效率。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

一種解決方法就是將IO操作和CPU操作分別由單獨的線程來完成，各玩各的互不影響。單Reactor線程完成IO操作、復用工作線程池來完成CPU操作就是一種解決思路。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

在這種模式種由Reactor線程完成連接的管理和數(shù)據(jù)讀取&寫回，完全掌管IO操作。工作線程池處理來自上游分發(fā)的任務，對其中的數(shù)據(jù)進行解碼、計算、編碼再返回給Reactor線程和客戶端完成交互。這種模式有效利用了多核，但是單Reactor線程來完成IO操作在高并發(fā)場景中仍然會出現(xiàn)瓶頸。換句話說，連接實在太多了，一個Reactor線程忙不過來建立新連接和響應舊連接這些事情，因此Reactor線程也需要幾個幫手。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

5.4 多Reactor線程和線程池模式

水平擴展往往是提供性能的有效方法。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

我們將Reactor線程進行擴展，一個Reactor線程負責處理新連接，多個Reactor線程負責處理連接成功的IO數(shù)據(jù)讀寫。也就是進一步將監(jiān)聽&創(chuàng)建連接和處理連接分別由兩個及以上的線程來完成，進一步提高了IO操作部分的效率。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

這種模式算是比較高配的版本了，在實際生產(chǎn)環(huán)境也有使用。

5.5 拓展：同步IO和異步IO

我們可以輕易區(qū)分什么是阻塞IO和非阻塞IO，那么什么是同步IO和異步IO呢?前面提到Reactor模式其中非常重要的一環(huán)就是調(diào)用read/write函數(shù)來完成數(shù)據(jù)拷貝，這部分是應用程序自己完成的，內(nèi)核只負責通知監(jiān)控的事件到來了，所以本質(zhì)上Reactor模式屬于非阻塞同步IO。還有一種Preactor模式，借助于系統(tǒng)本身的異步IO特性，由操作系統(tǒng)進行數(shù)據(jù)拷貝，在完成之后來通知應用程序來取就可以，效率更高一些，但是底層需要借助于內(nèi)核的異步IO機制來實現(xiàn)。

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

底層的異步IO機制可能借助于DMA和Zero-Copy技術(shù)來實現(xiàn)，理論上性能更高。當前Windows系統(tǒng)通過IOCP實現(xiàn)了真正的異步I/O，而在Linux 系統(tǒng)的異步I/O還不完善，比如Linux中的boost.asio模塊就是異步IO的支持，但是目前Linux系統(tǒng)還是以基于Reactor模式的非阻塞同步IO為主。

6. 小結(jié)

本文從IO事件和IO復用出發(fā)，闡述了網(wǎng)絡架構(gòu)最底層的組成。繼續(xù)展開了基于線程模型和基于事件驅(qū)動模型的網(wǎng)絡框架特點及其設計要素。之后重點描述了反應堆模式的核心本質(zhì)，以及生產(chǎn)環(huán)境中的多種形式。最后簡單介紹了同步IO和異步IO的區(qū)別，以及Preactor模式的優(yōu)勢。希望讀者朋友可以摒棄專業(yè)術(shù)語和表述，抓住問題的本質(zhì)和重點，找到一個適合自己思維方法去理解和掌握高性能網(wǎng)絡架構(gòu)的設計之道?；蛟S，高性能網(wǎng)絡框架只是一個紙老虎。

上述內(nèi)容就是怎么深入理解Linux高性能網(wǎng)絡架構(gòu)，你們學到知識或技能了嗎？如果還想學到更多技能或者豐富自己的知識儲備，歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

怎么深入理解Linux高性能網(wǎng)絡架構(gòu)

猜你喜歡

最新資訊

相關推薦

相關標簽