溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

JDK9對(duì)String字符串怎么進(jìn)行優(yōu)化

發(fā)布時(shí)間:2021-03-17 09:22:05 來(lái)源:億速云 閱讀:154 作者:小新 欄目:開(kāi)發(fā)技術(shù)

小編給大家分享一下JDK9對(duì)String字符串怎么進(jìn)行優(yōu)化,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

String類(lèi)可以說(shuō)是Java編程中使用最多的類(lèi)了,如果能對(duì)String字符串的性能進(jìn)行優(yōu)化,那么程序的性能必然能大幅提升。

這不JDK9就對(duì)String字符串進(jìn)行了改進(jìn)升級(jí),在某些場(chǎng)景下可以讓String字符串內(nèi)存減少一半,進(jìn)而減少JVM的GC次數(shù)。

String的底層存儲(chǔ)

在面試的時(shí)候我們通常會(huì)說(shuō)String字符串有不可變的特性,每次都要?jiǎng)?chuàng)建新的字符串。那么,為什么String字符串是不可變的呢?

先來(lái)看一下String字符串的底層存儲(chǔ)結(jié)構(gòu):

public final class String
  implements java.io.Serializable, Comparable<String>, CharSequence {
  
  private final char value[];

  public String() {
    this.value = "".value;
  }

  public String(String original) {
    this.value = original.value;
    this.hash = original.hash;
  }
  // ...
}

看到什么了?當(dāng)我們new一個(gè)String對(duì)象時(shí),對(duì)應(yīng)的字符串其實(shí)是以char數(shù)組的形式存儲(chǔ)在String對(duì)象內(nèi)部。而這個(gè)char數(shù)組是final的,也就是說(shuō)不可變的。

這也就是為什么我們說(shuō)String字符串擁有不可變的特性,當(dāng)字符串改變了,char數(shù)組不可變,就只能創(chuàng)建一個(gè)新的對(duì)象,新的char數(shù)組了。

底層存儲(chǔ)的優(yōu)化

上面說(shuō)的情況是JDK8及以前版本,到了JDK9,String中字符串的存儲(chǔ)不再用char數(shù)組了,改用byte數(shù)組。

public final class String
  implements java.io.Serializable, Comparable<String>, CharSequence {

  @Stable
  private final byte[] value;

  private final byte coder;
  
  @Native static final byte LATIN1 = 0;
  @Native static final byte UTF16 = 1;
  
  static final boolean COMPACT_STRINGS;
 
  public String() {
    this.value = "".value;
    this.coder = "".coder;
  }

  @HotSpotIntrinsicCandidate
  public String(String original) {
    this.value = original.value;
    this.coder = original.coder;
    this.hash = original.hash;
  }
  
  // ...
}

不僅將char數(shù)組改為byte數(shù)組,而且新增了一個(gè)coder的成員變量。

在程序中,絕大多數(shù)字符串只包含英文字母數(shù)字等字符,使用Latin-1編碼,一個(gè)字符占用一個(gè)byte。如果使用char,一個(gè)char要占用兩個(gè)byte,會(huì)占用雙倍的內(nèi)存空間。

但是,如果字符串中使用了中文等超出Latin-1表示范圍的字符,使用Latin-1就沒(méi)辦法表示了。這時(shí)JDK會(huì)使用UTF-16編碼,那么占用的空間和舊版(使用char[])是一樣的。

coder變量代表編碼的格式,目前String支持兩種編碼格式Latin-1和UTF-16。Latin-1需要用一個(gè)字節(jié)來(lái)存儲(chǔ),而UTF-16需要使用2個(gè)字節(jié)或者4個(gè)字節(jié)來(lái)存儲(chǔ)。

據(jù)說(shuō)這一改進(jìn)方案是JDK的開(kāi)發(fā)人員用大數(shù)據(jù)和人工能智能,調(diào)研了成千上萬(wàn)的應(yīng)用程序的heapdump信息后,得出:大部分的String都是以Latin-1字符編碼來(lái)表示的,只需要一個(gè)字節(jié)存儲(chǔ)就夠了,兩個(gè)字節(jié)完全是浪費(fèi)。

COMPACT_STRINGS屬性則是用來(lái)控制是否開(kāi)啟String的compact功能。默認(rèn)情況下是開(kāi)啟的。可以使用-XX:-CompactStrings參數(shù)來(lái)對(duì)此功能進(jìn)行關(guān)閉。

改進(jìn)的好處

改進(jìn)的好處是非常明顯的,首先如果項(xiàng)目中使用Latin-1字符集居多,內(nèi)存的占用大幅度減少,同樣的硬件配置可以支撐更多的業(yè)務(wù)。

當(dāng)內(nèi)存減少之后,進(jìn)一步導(dǎo)致減少GC次數(shù),進(jìn)而減少Stop-The-World的頻次,同樣會(huì)提升系統(tǒng)的性能。

隨著JDK的迭代String字符串的內(nèi)存結(jié)構(gòu)及方法等也在不斷地進(jìn)行演變。這是因?yàn)镾tring字符串往往是JVM中占用內(nèi)存最多的類(lèi),通過(guò)對(duì)它的改造升級(jí),對(duì)性能的提升會(huì)更加明顯。

看完了這篇文章,相信你對(duì)“JDK9對(duì)String字符串怎么進(jìn)行優(yōu)化”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI