溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

發(fā)布時(shí)間:2020-07-04 04:09:44 來(lái)源:網(wǎng)絡(luò) 閱讀:155 作者:wx5dc550bfa80d2 欄目:系統(tǒng)運(yùn)維

String,相信大家都不陌生,我們?cè)诰帉懗绦驎r(shí),使用String類型還算比較多。那么你經(jīng)常使用它,是否真的“了解”它?請(qǐng)帶著問(wèn)題,一步一步揭開(kāi)它神秘的面紗,看看它究竟何許“人”也!

一、思考

在 Swift 開(kāi)發(fā)使用字符串的過(guò)程中,你是否有思考過(guò)以下問(wèn)題?

  • 1 個(gè)字符串變量占用多少內(nèi)存?
  • 字符串 str1、str2 的底層存儲(chǔ)有什么不同?
    String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

  • 如果對(duì) str1、str2 進(jìn)行拼接操作,str1、str2 的底層存儲(chǔ)又會(huì)發(fā)生什么變化?
    String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

如果你能準(zhǔn)確地回答以上問(wèn)題,那說(shuō)明對(duì) Swift 字符串的底層存儲(chǔ)機(jī)制還是比較了解的。

二、1 個(gè)字符串變量占用多少內(nèi)存?

方法 1:MemoryLayout

首先,可以借助 Swift 自帶的 MemoryLayout 來(lái)測(cè)試一下
String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

方法 2:匯編

另外,我們也可以借助一個(gè)強(qiáng)有力的底層分析助手—匯編語(yǔ)言,來(lái)窺探一下 String 的底層存儲(chǔ)

  • 實(shí)際上分析其他語(yǔ)法、系統(tǒng)庫(kù)的底層,都可以借助匯編語(yǔ)言

    • 比如多態(tài)的原理、泛型的原理、Array 的底層、枚舉的底層等等
  • 另外,不僅僅是 Swift,C、C++、OC 的底層分析,依然可以借助匯編語(yǔ)言

    • 畢竟你寫的每一行有效代碼,最終都是要轉(zhuǎn)成機(jī)器指令(0 和 1)
    • 而機(jī)器指令是跟匯編指令一一對(duì)應(yīng)的,每一條機(jī)器指令都能翻譯成與之對(duì)應(yīng)的匯編指令
    • 能讀懂匯編指令,就相當(dāng)于能讀懂機(jī)器指令,知道 CPU 具體在干嘛(操作了什么寄存器,操作了哪塊內(nèi)存)
  • 本教程的代碼是直接跑在 Mac 的命令行(CommandLineTools)項(xiàng)目上
    • 因此展示的匯編代碼是基于 X64 的 AT&T 格式匯編,并非 iOS 真機(jī)設(shè)備的 ARM 匯編
    • 其實(shí)不同種類的匯編之間有極大的相似性,只是有些指令的叫法不一樣

跟微軟的 Visual Studio 一樣,Xcode 也內(nèi)置了非常方便的反匯編功能,可以輕松查看每一句代碼對(duì)應(yīng)的匯編指令,打開(kāi)反匯編界面的步驟如下

  • 在某一行需要調(diào)試的代碼打上斷點(diǎn)(反匯編界面會(huì)在斷點(diǎn)調(diào)試狀態(tài)下顯示出來(lái))

  • 菜單:Debug > Debug Workflow > Always Show Disassembly
    • Assembly 譯為匯編, Disassembly 譯為反匯編

String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

  • 運(yùn)行程序,看到反匯編界面

String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

如果你的反匯編經(jīng)驗(yàn)十足,根據(jù)第 16、17 行的匯編就可以推敲出來(lái),String 是占用 16 個(gè)字節(jié)

  • 因?yàn)樗昧?rax、rdx 寄存器存放字符串 str 的內(nèi)容,而 rax、rdx 都是 8 字節(jié)的

匯編的內(nèi)容太多了,因?yàn)闀r(shí)間和篇幅關(guān)系,文章里并不會(huì)對(duì)每一句匯編指令進(jìn)行詳細(xì)地講解,更多的是想說(shuō)明匯編的重要性。

三、字符串的底層存儲(chǔ)

窺探內(nèi)存

此前我寫了個(gè)可以窺探 Swift 變量?jī)?nèi)存的小工具:https://github.com/CoderMJLee/Mems

  • 現(xiàn)在用它來(lái)窺探下字符串的 16 字節(jié)里面,究竟存儲(chǔ)著什么數(shù)據(jù)

  • Mems.memStr(ofVal:) 默認(rèn)情況下按照 8 個(gè)字節(jié)一組來(lái)顯示內(nèi)存數(shù)據(jù)

  • 傳遞參數(shù) alignment: .one 是按照 1 個(gè)字節(jié)一組來(lái)顯示內(nèi)存數(shù)據(jù)
    String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

字符 '0'~'9' 的 ASCII 值是 0x30~0x39,認(rèn)真觀察最初 str1 的 16 個(gè)字節(jié)數(shù)據(jù),你發(fā)現(xiàn)了什么?

  • 它直接將所有字符的 ASCII 值存儲(chǔ)在 str1 的 16 字節(jié)中

  • 最后 1 個(gè)字節(jié) 0xea 中的 0xa 就是字符的數(shù)量,也是共 10 個(gè)字符

拼接

String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)
可以發(fā)現(xiàn),當(dāng)對(duì) str1 進(jìn)行拼接 "ABCDE" 的時(shí)候

  • 它最終是將 "0123456789ABCDE"十五個(gè)字符的 ASCII 值都存儲(chǔ)在了 str1 的 16 字節(jié)中

  • 最后 1 個(gè)字節(jié) 0xef 中的 0xf 就是字符的數(shù)量,也是共 15 個(gè)字符

  • 可以看得出來(lái),目前 16 個(gè)字節(jié)已經(jīng)存滿了,那如果再拼接 1 個(gè)字符呢?

    String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

可以看到,str1 里面存儲(chǔ)的數(shù)據(jù)發(fā)生了非常大的變化,每一個(gè)字符的 ASCII 值不見(jiàn)了,

  • 那里面的 16 字節(jié)具體是什么含義呢?

  • 所有字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?

其他情況

如果一開(kāi)始初始化的時(shí)候(未拼接之前),字符串的內(nèi)容就是超過(guò) 15 個(gè)字符呢?

String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

相信你能猜到是這個(gè)結(jié)果

  • 這 16 個(gè)字節(jié)里面并沒(méi)有出現(xiàn)任何一個(gè)字符的 ASCII 值
  • 而且這 16 個(gè)字節(jié)跟 第27行的str1 還是有所區(qū)別
    • 雖然它們的字符串內(nèi)容都是"0123456789ABCDEF"

如果對(duì) str2 進(jìn)行拼接操作
String背后的匯編奧秘——探索數(shù)據(jù)結(jié)構(gòu)

不難發(fā)現(xiàn):這時(shí) str2 的 16 字節(jié)又發(fā)生了變化,跟 第27行的str1 是有點(diǎn)相似的

如何解決上述疑問(wèn)?

上述的種種疑問(wèn),光看打印出來(lái)的內(nèi)存數(shù)據(jù)是無(wú)法解決的,但是都可以利用【?。。R編?。。 縼?lái)解決,分析匯編指令,立馬就得出結(jié)論,因?yàn)槲恼碌钠邢?,平時(shí)工作也比較忙,我把上述問(wèn)題的詳細(xì)剖析過(guò)程錄制成了長(zhǎng)達(dá) 2 個(gè)多小時(shí)的視頻,有興趣的朋友可以用 1.5~2 倍速度觀看

  • 鏈接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA

    • 提取碼:kzrk
  • 視頻對(duì)于沒(méi)有匯編基礎(chǔ)的朋友來(lái)說(shuō),可能會(huì)有點(diǎn)難度,最好挑一個(gè)頭腦清醒的時(shí)間去觀看

  • 看完視頻后,希望大家能夠確切地感受到匯編語(yǔ)言的重要性,不要永遠(yuǎn)只停留在編寫高級(jí)語(yǔ)言代碼、沉迷于語(yǔ)法糖的層面。

四、最后

匯編語(yǔ)言雖然是編程中的基礎(chǔ)語(yǔ)言,但確是我們用到最多的計(jì)算機(jī)語(yǔ)言,應(yīng)用領(lǐng)域也不僅僅是在你的工作當(dāng)中,日常生活中也是可以用到的。

我作為一個(gè)在IT行業(yè)摸爬滾打了數(shù)年的人,也確實(shí)積累了比較多的經(jīng)驗(yàn)及資源,平時(shí)也會(huì)給大家做分享,如果想獲取更多免費(fèi)的編程學(xué)習(xí)資源及干貨,可以手動(dòng)添加微信:19950277730!來(lái)跟我一起探索編程的世界吧!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI