溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Linux網(wǎng)絡(luò)包從中斷到接收的示例分析

發(fā)布時(shí)間:2021-11-02 17:19:04 來源:億速云 閱讀:190 作者:柒染 欄目:系統(tǒng)運(yùn)維

這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)Linux網(wǎng)絡(luò)包從中斷到接收的示例分析,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

 

Linux網(wǎng)絡(luò)包從中斷到接收的示例分析

linux

既然要講,那就把一個(gè)包的整個(gè)包生都說了算了

觸發(fā)中斷

  • 在非虛擬化環(huán)境下,網(wǎng)卡通過DMA將packet寫入內(nèi)核的rx_ring環(huán)形隊(duì)列緩沖區(qū),并觸發(fā)中斷。

  • 如果在虛擬化環(huán)境下,VMM配置GIC ITS (Interrupt Translation Service)  ,建立物理中斷與虛擬中斷的映射完成中斷虛擬化使得網(wǎng)卡能直接向VM發(fā)出中斷,同時(shí)通過IO虛擬化,網(wǎng)卡通過IOMMU將packet直接寫入虛擬機(jī)內(nèi)核的rx_ring

Top Half

  • CPU在收到中斷之后,調(diào)用網(wǎng)卡ISR也就是所謂的中斷handler

  • 分配sk_buf并入input_pkt_queue(如果隊(duì)列已滿則丟棄)

  • 發(fā)出一個(gè)軟中斷NET_RX_SOFTIRQ,軟中斷可以被調(diào)度例如通過tasklet

Bottom Half

  • sk_buf從input_pkt_queue傳入process_queue,根據(jù)協(xié)議類型調(diào)用網(wǎng)絡(luò)層協(xié)議的handler

  • ip_rcv執(zhí)行包頭檢查,ip_router_input()進(jìn)行路由,決定本機(jī)/轉(zhuǎn)發(fā)/丟棄

  • tcp_v4_rcv執(zhí)行包頭檢查,tcp_v4_lookup查詢對(duì)應(yīng)的socket和connection,如果正常,tcp_prequeue將skb放進(jìn)socket接收隊(duì)列

  • socket隨即喚醒所在的進(jìn)程

Linux網(wǎng)絡(luò)包從中斷到接收的示例分析

kqueue

因?yàn)閑poll沒有論文,就說說kqueue是怎么做的吧,kqueue會(huì)根據(jù)socket綁定的knote鏈表(每個(gè)監(jiān)聽的kqueue都可能創(chuàng)建一個(gè)knote),將knote通過反向指針獲得kqueue,將knote加入kqueue的就緒隊(duì)列末尾。如果此時(shí)恰好有進(jìn)程正在監(jiān)聽的話,將會(huì)喚醒進(jìn)程,kqueue會(huì)被掃描,并從就緒隊(duì)列處獲得所有的event,從而了解已經(jīng)就緒的所有socket。

  • 喚醒的進(jìn)程調(diào)用socket recv系統(tǒng)調(diào)用,如果是TCP則調(diào)用tcp_recvmsg從sk_buffer拷貝數(shù)據(jù)

Batch

netif_receive_skb_list()

Linux的NAPI還會(huì)繼續(xù)延遲軟中斷的處理,等待其積累足夠的skb后進(jìn)行輪詢,一次性處理所有的skb。

SKB

skb并不是直接存儲(chǔ)報(bào)文,而是存儲(chǔ)指針,指針只需要移動(dòng),就能完成解包,而本身的報(bào)文并不需要修改。上一層的協(xié)議棧會(huì)在處理當(dāng)前層的同時(shí)設(shè)置好下一層的頭指針,并且移動(dòng)data指針。與此同時(shí),skb本身是雙向鏈表實(shí)現(xiàn)的隊(duì)列。qlen為鏈表元素長度,lock為添加元素時(shí)的鎖。

Linux網(wǎng)絡(luò)包從中斷到接收的示例分析

skb結(jié)構(gòu)

談到指針的用法,這里舉個(gè)做OS lab時(shí)印象深刻的奇淫巧技,也是C的指針變態(tài)的地方

#define list_entry(ptr, type, field) \     container_of(ptr, type, field) #define container_of(ptr, type, field) \     ((type *)((void *)(ptr) - (u64)(&(((type *)(0))->field))))

(u64)(&(((type  *)(0))->field))))指的是field在結(jié)構(gòu)體type中的偏移量,通過減去這個(gè)偏移量我們就能找出某個(gè)對(duì)象所在上級(jí)type對(duì)象的地址,也就是container。

一般來說,我們都會(huì)使用下面這樣的方式,讓鏈表節(jié)點(diǎn)去包裹數(shù)據(jù)。

struct page_list_node {         struct page p;     struct list_node *prev;     struct list_node *next; };

但是,通過指針操作,卻可以讓數(shù)據(jù)去包裹鏈表節(jié)點(diǎn)

struct list_head {     struct list_head *prev;     struct list_head *next; };  struct page{     struct list_head      list_node; }

在僅僅知道鏈表節(jié)點(diǎn)的情況下,借助成員偏移量即可知道容器對(duì)象的位置并取出

list_entry(somenode,struct page,list_node);

list_head本身可以存在于任何對(duì)象上,而他們的entry卻能根據(jù)參數(shù)而指向不同的類型,感覺有點(diǎn)泛型的味道了。

內(nèi)容來自SJTU,IPADS OS-16-Network

上述就是小編為大家分享的Linux網(wǎng)絡(luò)包從中斷到接收的示例分析了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI