您好,登錄后才能下訂單哦!
這篇文章主要介紹“String長度的限制是多少”,在日常操作中,相信很多人在String長度的限制是多少問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”String長度的限制是多少”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
String
首先要知道String的長度限制我們就需要知道String是怎么存儲字符串的,String其實(shí)是使用的一個char類型的數(shù)組來存儲字符串中的字符的。
那么String既然是數(shù)組存儲那數(shù)組會有長度的限制嗎?是的有限制,但是是在有先提條件下的,我們看看String中返回length的方法。
由此我們看到返回值類型是int類型,Java中定義數(shù)組是可以給數(shù)組指定長度的,當(dāng)然不指定的話默認(rèn)會根據(jù)數(shù)組元素來指定:
int[] arr1 = new int[10]; // 定義一個長度為10的數(shù)組
int[] arr2 = {1,2,3,4,5}; // 那么此時數(shù)組的長度為5
整數(shù)在java中是有限制的,我們通過源碼來看看int類型對應(yīng)的包裝類Integer可以看到,其長度最大限制為2^31 -1,那么說明了數(shù)組的長度是0~2^31-1,那么計算一下就是(2^31-1 = 2147483647 = 4GB)
看到這我們嘗試通過編碼來驗(yàn)證一下上述觀點(diǎn)。
以上是我通過定義字面量的形式構(gòu)造的10萬個字符的字符串,編譯之后虛擬機(jī)提示報錯,說我們的字符串長度過長,不是說好了可以存21億個嗎?為什么才10萬個就報錯了呢?
其實(shí)這里涉及到了JVM編譯規(guī)范的限制了,其實(shí)JVM在編譯時,如果我們將字符串定義成了字面量的形式,編譯時JVM是會將其存放在常量池中,這時候JVM對這個常量池存儲String類型做出了限制,接下來我們先看下手冊是如何說的。
常量池中,每個 cp_info 項(xiàng)的格式必須相同,它們都以一個表示 cp_info 類型的單字節(jié) “tag”項(xiàng)開頭。后面 info[]項(xiàng)的內(nèi)容 由tag 的類型所決定。
我們可以看到 String類型的表示是 CONSTANT_String ,我們來看下CONSTANT_String具體是如何定義的。
這里定義的 u2 string_index 表示的是常量池的有效索引,其類型是CONSTANT_Utf8_info 結(jié)構(gòu)體表示的,這里我們需要注意的是其中定義的length我們看下面這張圖。
在class文件中u2表示的是無符號數(shù)占2個字節(jié)單位,我們知道1個字節(jié)占8位,2個字節(jié)就是16位 ,那么2個字節(jié)能表示的范圍就是2^16- 1 = 65535 。范中class文件格式對u1、u2的定義的解釋做了一下摘要:
這里對java虛擬機(jī)規(guī)摘要部分
1、class文件中文件內(nèi)容類型解釋
定義一組私有數(shù)據(jù)類型來表示 Class 文件的內(nèi)容,它們包括 u1,u2 和 u4,分別代表了 1、2 和 4 個字節(jié)的無符號數(shù)。
每個 Class 文件都是由 8 字節(jié)為單位的字節(jié)流組成,所有的 16 位、32 位和 64 位長度的數(shù)據(jù)將被構(gòu)造成 2 個、4 個和 8 個 8 字節(jié)單位來表示。
2、程序異常處理的有效范圍解釋
start_pc 和 end_pc 兩項(xiàng)的值表明了異常處理器在 code[]數(shù)組中的有效范圍。
start_pc 必須是對當(dāng)前 code[]數(shù)組中某一指令的操作碼的有效索引,end_pc 要么是對當(dāng)前 code[]數(shù)組中某一指令的操作碼的有效索引,要么等于 code_length的值,即當(dāng)前 code[]數(shù)組的長度。start_pc 的值必須比 end_pc 小。
當(dāng)程序計數(shù)器在范圍[start_pc, end_pc)內(nèi)時,異常處理器就將生效。即設(shè) x 為異常句柄的有效范圍內(nèi)的值,x 滿足:start_pc ≤ x < end_pc。
實(shí)際上,end_pc 值本身不屬于異常處理器的有效范圍這點(diǎn)屬于 Java 虛擬機(jī)歷史上的一個設(shè)計缺陷:如果 Java 虛擬機(jī)中的一個方法的 code 屬性的長度剛好是 65535個字節(jié),并且以一個 1 個字節(jié)長度的指令結(jié)束,那么這條指令將不能被異常處理器所處理。不過編譯器可以通過限制任何方法、實(shí)例初始化方法或類初始化方法的code[]數(shù)組最大長度為 65534,這樣可以間接彌補(bǔ)這個 BUG。
注意:這里對個人認(rèn)為比較重要的點(diǎn)做了標(biāo)記,首先第一個加粗說白了就是說數(shù)組有效范圍就是【0-65565】但是第二個加粗的地方又解釋了,因?yàn)樘摂M機(jī)還需要1個字節(jié)的指令作為結(jié)束,所以其實(shí)真正的有效范圍是【0-65564】,這里要注意這里的范圍僅限編譯時期,如果你是運(yùn)行時拼接的字符串是可以超出這個范圍的。
接下來我們通過一個小實(shí)驗(yàn)來測試一下我們構(gòu)建一個長度為65534的字符串,看看是否就能編譯通過。
首先通過一個for循環(huán)構(gòu)建65534長度的字符串,在控制臺打印后,我們通過自己度娘的一個在線字符統(tǒng)計工具計算了一下確實(shí)是65534個字符,如下:
然后我們將字符復(fù)制后以定義字面量的形式賦值給字符串,可以看到我們選擇這些字符右下角顯示的確實(shí)是65534,于是乎運(yùn)行了一波,果然成功了。
看到這里我們來總結(jié)一下:
問:字符串有長度限制嗎?是多少?
答:首先字符串的內(nèi)容是由一個字符數(shù)組 char[] 來存儲的,由于數(shù)組的長度及索引是整數(shù),且String類中返回字符串長度的方法length() 的返回值也是int ,所以通過查看java源碼中的類Integer我們可以看到Integer的最大范圍是2^31 -1,由于數(shù)組是從0開始的,所以數(shù)組的最大長度可以使【0~2^31-1】通過計算是大概4GB。
但是通過翻閱java虛擬機(jī)手冊對class文件格式的定義以及常量池中對String類型的結(jié)構(gòu)體定義我們可以知道對于索引定義了u2,就是無符號占2個字節(jié),2個字節(jié)可以表示的最大范圍是2^16 -1 = 65535。
其實(shí)是65535,但是由于JVM需要1個字節(jié)表示結(jié)束指令,所以這個范圍就為65534了。超出這個范圍在編譯時期是會報錯的,但是運(yùn)行時拼接或者賦值的話范圍是在整形的最大范圍。
到此,關(guān)于“String長度的限制是多少”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注億速云網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。