您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么理解TCP的SYN隊(duì)列和Accept隊(duì)列”,在日常操作中,相信很多人在怎么理解TCP的SYN隊(duì)列和Accept隊(duì)列問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”怎么理解TCP的SYN隊(duì)列和Accept隊(duì)列”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!
首先我們必須明白,處于“LISTENING”狀態(tài)的TCP socket,有兩個(gè)獨(dú)立的隊(duì)列:
SYN隊(duì)列(SYN Queue)
Accept隊(duì)列(Accept Queue)
這兩個(gè)術(shù)語(yǔ)有時(shí)也被稱為“reqsk_queue”,“ACK backlog”,“l(fā)isten backlog”,甚至“TCP backlog”,但是這篇文章中我們使用上面兩個(gè)術(shù)語(yǔ)以免造成混淆。
<!-- more -->
SYN隊(duì)列存儲(chǔ)了收到SYN包的連接(對(duì)應(yīng)內(nèi)核代碼的結(jié)構(gòu)體:struct inet_request_sock)。它的職責(zé)是回復(fù)SYN+ACK包,并且在沒(méi)有收到ACK包時(shí)重傳,直到超時(shí)。在Linux下,重傳的次數(shù)為:
$ sysctl net.ipv4.tcp_synack_retries net.ipv4.tcp_synack_retries = 5
文檔中對(duì)tcp_synack_retries的描述如下:
tcp_synack_retries - int整型 對(duì)于一個(gè)被動(dòng)TCP連接,重傳SYNACKs的次數(shù)。該值不能超過(guò)255。 默認(rèn)值為5,如果初始RTO是1秒,那么對(duì)應(yīng)的最后一次重傳是31秒。 對(duì)應(yīng)的最后一次超時(shí)是63秒之后。
發(fā)送完SYN+ACK之后,SYN隊(duì)列等待從客戶端發(fā)出的ACK包(也即三次握手的最后一個(gè)包)。當(dāng)收到ACK包時(shí),首先找到對(duì)應(yīng)的SYN隊(duì)列,再在對(duì)應(yīng)的SYN隊(duì)列中檢查相關(guān)的數(shù)據(jù)看是否匹配,如果匹配,內(nèi)核將該連接相關(guān)的數(shù)據(jù)從SYN隊(duì)列中移除,創(chuàng)建一個(gè)完整的連接(對(duì)應(yīng)內(nèi)核代碼的結(jié)構(gòu)體:struct inet_sock),并將這個(gè)連接加入Accept隊(duì)列。
Accept隊(duì)列中存放的是已建立好的連接,也即等待被上層應(yīng)用程序取走的連接。當(dāng)進(jìn)程調(diào)用accept(),這個(gè)socket從隊(duì)列中取出,傳遞給上層應(yīng)用程序。
這就是Linux處理SYN包的一個(gè)簡(jiǎn)單描述。順便一提,當(dāng)socket開(kāi)啟了TCP_DEFER_ACCEPT
和TCP_FASTOPEN
時(shí),工作方式將會(huì)有細(xì)微不同,本文不做介紹。
應(yīng)用程序通過(guò)調(diào)用系統(tǒng)調(diào)用listen(2),傳入backlog參數(shù),來(lái)設(shè)置SYN隊(duì)列和Accept隊(duì)列的最大大小。比如下面這樣,將SYN隊(duì)列和Accept隊(duì)列的最大大小同時(shí)設(shè)置為1024:
listen(sfd, 1024)
注意,在4.3版本之前的內(nèi)核,SYN隊(duì)列的大小是用另一種方式計(jì)算。
SYN隊(duì)列的最大大小以前是用net.ipv4.tcp_max_syn_backlog
來(lái)配置,但是現(xiàn)在已經(jīng)不再使用了?,F(xiàn)在用net.core.somaxconn
來(lái)同時(shí)表示SYN隊(duì)列和Accept隊(duì)列的最大大小。在我們的服務(wù)器上,我們將它設(shè)置為16k:
$ sysctl net.core.somaxconn net.core.somaxconn = 16384
知道了上面這些信息后,你可能會(huì)問(wèn),隊(duì)列設(shè)置為多大合適?
答案是:看情況。對(duì)于大多數(shù)的TCP服務(wù)來(lái)說(shuō),這并不太重要。比如,Go語(yǔ)言1.11版本之前,并沒(méi)有提供設(shè)置隊(duì)列大小的方法。
盡管如此,也存在一些合理的原因,需要增大隊(duì)列的大?。?/p>
當(dāng)建立連接的請(qǐng)求速度確實(shí)很大時(shí),即使是對(duì)于一個(gè)高性能的服務(wù)來(lái)說(shuō),SYN隊(duì)列也可能需要設(shè)置的大一些。
SYN隊(duì)列的大小,換言之就是等待ACK包的連接數(shù)。也即與客戶端的平均往返時(shí)間越大,堆積在SYN隊(duì)列中的連接就越多。對(duì)于那些大部分客戶端都距離服務(wù)器很遠(yuǎn)的場(chǎng)景,比如說(shuō)往返時(shí)間幾百毫秒以上,可以將隊(duì)列大小設(shè)置的大一些。
TCP_DEFER_ACCEPT
選項(xiàng)如果打開(kāi)了,會(huì)導(dǎo)致socket在SYN-RECV
狀態(tài)下維持更長(zhǎng)的時(shí)間,也即增大了處于SYN隊(duì)列中的時(shí)間。
但是,將backlog設(shè)置的過(guò)大也會(huì)帶來(lái)不好的影響:
SYN隊(duì)列中的每一個(gè)槽位都需要占用一些內(nèi)存。當(dāng)遇到SYN Flood攻擊時(shí),我們沒(méi)有必要為這些發(fā)起攻擊的包浪費(fèi)資源。SYN隊(duì)列中的inet_request_sock
結(jié)構(gòu)體,在4.14內(nèi)核下,每個(gè)將占用256字節(jié)的內(nèi)存。
linux下,如果想查看SYN隊(duì)列的當(dāng)前狀態(tài),我們可以使用ss命令來(lái)查詢SYN-RECV
狀態(tài)的socket。比如如下執(zhí)行結(jié)果,表示80端口的SYN隊(duì)列中當(dāng)前有119個(gè)元素,443端口則為78。
$ ss -n state syn-recv sport = :80 | wc -l 119 $ ss -n state syn-recv sport = :443 | wc -l 78
還可以通過(guò)我們的SystemTap腳本來(lái)觀察這個(gè)數(shù)據(jù):resq.stp
如果程序調(diào)用accept()不夠快會(huì)發(fā)生什么呢?
后續(xù)收到的SYN包,不會(huì)被SYN隊(duì)列處理
后續(xù)收到的(用于建立連接的)ACK包,不會(huì)被SYN隊(duì)列處理
TcpExtListenOverflows / LINUX_MIB_LISTENOVERFLOWS
計(jì)數(shù)增加
TcpExtListenDrops / LINUX_MIB_LISTENDROPS
計(jì)數(shù)增加
發(fā)生這種情況時(shí),我們只能寄希望于程序的處理性能稍后能恢復(fù)正常,客戶端重新發(fā)送被服務(wù)端丟棄的包。
內(nèi)核的這種表現(xiàn)對(duì)于大部分服務(wù)來(lái)說(shuō)是可接受的。順便一提,可以通過(guò)調(diào)整net.ipv4.tcp_abort_on_overflow
這個(gè)全局參數(shù)來(lái)修改這種表現(xiàn),但是最好還是不要改這個(gè)參數(shù)。
可以通過(guò)查看nstat的計(jì)數(shù)來(lái)觀察Accept隊(duì)列溢出的狀態(tài):
$ nstat -az TcpExtListenDrops TcpExtListenDrops 49199 0.0
但是這是一個(gè)全局的計(jì)數(shù)。觀察起來(lái)不夠直觀,比如有時(shí)我們觀察到它在增長(zhǎng),但是所有的服務(wù)程序看起來(lái)都是正常的。此時(shí)我們可以使用ss命令來(lái)觀察單個(gè)監(jiān)聽(tīng)端口的Accept隊(duì)列大?。?/p>
$ ss -plnt sport = :6443|cat State Recv-Q Send-Q Local Address:Port Peer Address:Port LISTEN 0 1024 *:6443 *:*
Recv-Q
這一列顯示的是處于Accept隊(duì)列中的socket數(shù)量,Send-Q
顯示的是隊(duì)列的最大大小。在上面的例子中,我們發(fā)現(xiàn)并沒(méi)有未被程序accept()的socket,但是我們依然發(fā)現(xiàn)ListenDrops計(jì)數(shù)在增長(zhǎng)。
這是因?yàn)槲覀兊某绦蛑皇侵芷谛缘亩虝嚎ㄗ〔惶幚硇碌倪B接,而非永久性的不處理,過(guò)段時(shí)間程序又恢復(fù)了正常。這種情況下,用ss命令比較難觀察這種現(xiàn)象,因此我們寫(xiě)了一個(gè)SystemTap腳本,它會(huì)hook進(jìn)內(nèi)核,把被丟棄的SYN包打印出來(lái):
$ sudo stap -v acceptq.stp time (us) acceptq qmax local addr remote_addr 1495634198449075 1025 1024 0.0.0.0:6443 10.0.1.92:28585 1495634198449253 1025 1024 0.0.0.0:6443 10.0.1.92:50500 1495634198450062 1025 1024 0.0.0.0:6443 10.0.1.92:65434 ...
通過(guò)上面的操作,可以觀察到哪些SYN包被ListenDrops影響了。從而我們也就可以知道哪些程序在丟失連接。
到此,關(guān)于“怎么理解TCP的SYN隊(duì)列和Accept隊(duì)列”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。