您好,登錄后才能下訂單哦!
Golang 的 1.13 版本 與 1.14 版本對(duì) defer 進(jìn)行了兩次優(yōu)化,使得 defer 的性能開銷在大部分場(chǎng)景下都得到大幅降低,其中到底經(jīng)歷了什么原理?
這是因?yàn)檫@兩個(gè)版本對(duì) defer 各加入了一項(xiàng)新的機(jī)制,使得 defer 語(yǔ)句在編譯時(shí),編譯器會(huì)根據(jù)不同版本與情況,對(duì)每個(gè) defer 選擇不同的機(jī)制,以更輕量的方式運(yùn)行調(diào)用。
堆上分配
在 Golang 1.13 之前的版本中,所有 defer 都是在堆上分配,該機(jī)制在編譯時(shí)會(huì)進(jìn)行兩個(gè)步驟:
這種機(jī)制的主要性能問(wèn)題存在于每個(gè) defer 語(yǔ)句產(chǎn)生記錄時(shí)的內(nèi)存分配,以及記錄參數(shù)和完成調(diào)用時(shí)參數(shù)移動(dòng)的系統(tǒng)調(diào)用開銷。
棧上分配
Go 1.13 版本新加入 deferprocStack 實(shí)現(xiàn)了在棧上分配的形式來(lái)取代 deferproc,相比后者,棧上分配在函數(shù)返回后 _defer 便得到釋放,省去了內(nèi)存分配時(shí)產(chǎn)生的性能開銷,只需適當(dāng)維護(hù) _defer 的鏈表即可。
編譯器有自己的邏輯去選擇使用 deferproc 還是 deferprocStack,大部分情況下都會(huì)使用后者,性能會(huì)提升約 30%。不過(guò)在 defer 語(yǔ)句出現(xiàn)在了循環(huán)語(yǔ)句里,或者無(wú)法執(zhí)行更高階的編譯器優(yōu)化時(shí),亦或者同一個(gè)函數(shù)中使用了過(guò)多的 defer 時(shí),依然會(huì)使用 deferproc。
開放編碼
Go 1.14 版本繼續(xù)加入了開發(fā)編碼(open coded),該機(jī)制會(huì)將延遲調(diào)用直接插入函數(shù)返回之前,省去了運(yùn)行時(shí)的 deferproc 或 deferprocStack 操作,在運(yùn)行時(shí)的 deferreturn 也不會(huì)進(jìn)行尾遞歸調(diào)用,而是直接在一個(gè)循環(huán)中遍歷所有延遲函數(shù)執(zhí)行。
這種機(jī)制使得 defer 的開銷幾乎可以忽略,唯一的運(yùn)行時(shí)成本就是存儲(chǔ)參與延遲調(diào)用的相關(guān)信息,不過(guò)使用此機(jī)制需要一些條件:
該機(jī)制還引入了一種元素 —— 延遲比特(defer bit),用于運(yùn)行時(shí)記錄每個(gè) defer 是否被執(zhí)行(尤其是在條件判斷分支中的 defer),從而便于判斷最后的延遲調(diào)用該執(zhí)行哪些函數(shù)。
延遲比特的原理:
同一個(gè)函數(shù)內(nèi)每出現(xiàn)一個(gè) defer 都會(huì)為其分配 1 個(gè)比特,如果被執(zhí)行到則設(shè)為 1,否則設(shè)為 0,當(dāng)?shù)竭_(dá)函數(shù)返回之前需要判斷延遲調(diào)用時(shí),則用掩碼判斷每個(gè)位置的比特,若為 1 則調(diào)用延遲函數(shù),否則跳過(guò)。
為了輕量,官方將延遲比特限制為 1 個(gè)字節(jié),即 8 個(gè)比特,這就是為什么不能超過(guò) 8 個(gè) defer 的原因,若超過(guò)依然會(huì)選擇堆棧分配,但顯然大部分情況不會(huì)超過(guò) 8 個(gè)。
用代碼演示如下:
deferBits = 0 // 延遲比特初始值 00000000 deferBits |= 1<<0 // 執(zhí)行第一個(gè) defer,設(shè)置為 00000001 _f1 = f1 // 延遲函數(shù) _a1 = a1 // 延遲函數(shù)的參數(shù) if cond { // 如果第二個(gè) defer 被執(zhí)行,則設(shè)置為 00000011,否則依然為 00000001 deferBits |= 1<<1 _f2 = f2 _a2 = a2 } ... exit: // 函數(shù)返回之前,倒序檢查延遲比特,通過(guò)掩碼逐位進(jìn)行與運(yùn)算,來(lái)判斷是否調(diào)用函數(shù) // 假如 deferBits 為 00000011,則 00000011 & 00000010 != 0,因此調(diào)用 f2 // 否則 00000001 & 00000010 == 0,不調(diào)用 f2 if deferBits & 1<<1 != 0 { deferBits &^= 1<<1 // 移位為下次判斷準(zhǔn)備 _f2(_a2) } // 同理,由于 00000001 & 00000001 != 0,調(diào)用 f1 if deferBits && 1<<0 != 0 { deferBits &^= 1<<0 _f1(_a1) }
總結(jié)
以往 Golang defer 語(yǔ)句的性能問(wèn)題一直飽受詬病,最近正式發(fā)布的 1.14 版本終于為這個(gè)爭(zhēng)議畫上了階段性的句號(hào)。如果不是在特殊情況下,我們不需要再計(jì)較 defer 的性能開銷。
參考資料
[1] Ou Changkun - Go 語(yǔ)言原本
[2] 峰云就她了 - go1.14實(shí)現(xiàn)defer性能大幅度提升原理
[3] 34481-opencoded-defers
到此這篇關(guān)于Go語(yǔ)言defer語(yǔ)句的三種機(jī)制整理的文章就介紹到這了,更多相關(guān)探究Go語(yǔ)言defer語(yǔ)句的三種機(jī)制內(nèi)容請(qǐng)搜索億速云以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持億速云!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。