<address id="aejqr"></address>

<td id="aejqr"></td>

<address id="aejqr"></address>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

詳解Java中String類型與默認(rèn)字符編碼

發(fā)布時(shí)間：2020-09-07 09:03:26 來源：腳本之家閱讀：279 作者：Nuub 欄目：編程語言

為什么寫這個(gè)

至于為什么要寫這個(gè)，主要是一句mmp一定要講，繞了一上午，暈死
Java程序中的中文亂碼問題一直是一個(gè)困擾程序員的難題，自己也不例外，早在做項(xiàng)目時(shí)就遇到過很多編碼方式的坑，當(dāng)時(shí)想填來著，但是嫌麻煩。這次終于忍不住了，一定要弄個(gè)明白

String類型的編碼方式

從網(wǎng)上查的資料都說，Java默認(rèn)的字符編碼是Unicode，而String類型的編碼方式是與JVM編碼方式和本機(jī)操作系統(tǒng)默認(rèn)字符集有關(guān)的。于是我做出了測試
在Java中可以這樣顯示查看本地編碼方式（JVM還是OS呢？）

// Gets the system property indicated by the specified key.
System.out.println(System.getProperty(file.encoding));

看注釋上說是獲取系統(tǒng)字符集，但是我對這個(gè)系統(tǒng)的概念表示存疑，為什么呢，因?yàn)楸娝苤?，我們中國人的電腦大部分默認(rèn)的字符編碼方式就是GBK，在CMD中輸入chcp可以獲得一個(gè)數(shù)值936，這就表示了是GBK的編碼方式。

但是我自己運(yùn)行出這句話的結(jié)果竟然是UTF-8，我是在IDEA中運(yùn)行的，并且已經(jīng)使用IDEA設(shè)置了項(xiàng)目的編碼方式是UTF-8，出現(xiàn)這樣的結(jié)果我只能是猜測其實(shí)上面這句話是獲取JVM（跟隨項(xiàng)目的編碼方式）的編碼方式

接下來我們來回歸正題，String類型的默認(rèn)編碼方式是什么，有下面這幾句語句:

/* 測試String類型默認(rèn)的編碼方式
*/

// 使用String的有參構(gòu)造方法
String str = new String("hhhh ty智障%shfu摸淑芬十分uif內(nèi)服NSF黑");
// 1.以GBK編碼方式獲取str的字節(jié)數(shù)組，再用String有參構(gòu)造函數(shù)構(gòu)造字符串
System.out.println(new String(str.getBytes("GBK")));
// 2.以UTF-8編碼方式獲取str的字節(jié)數(shù)組，再以默認(rèn)編碼構(gòu)造字符串
System.out.println(new String(str.getBytes("UTF-8")));

下面來看一下運(yùn)行結(jié)果：

// 1.
hhhh ty��%shfu��ʮ��uif�ڷ�NSF��i��ظ��u��Ϊ��ؼu ��δ��δ�� hhhh ty智障%shfu摸淑芬十分uif內(nèi)服NSF黑i飛鳥回復(fù)額u發(fā)為呢丶u 房未婚夫未婚夫
// 2.
hhhh ty智障%shfu摸淑芬十分uif內(nèi)服NSF黑i飛鳥回復(fù)額u發(fā)為呢丶u 房未婚夫未婚夫

可以很明顯的可以看出，這里String類型默認(rèn)的字符編碼方式就是與我們查看本地系統(tǒng)的編碼方式相同。因此我們得出結(jié)論：String類型的默認(rèn)編碼方式是和本地編碼方式相關(guān)

String.getBytes()方法

我們大多數(shù)情況下是不使用String類型的，而是使用byte數(shù)組來傳輸操作數(shù)據(jù)，一般會使用String.getBytes()方法來將字符串轉(zhuǎn)換成字節(jié)數(shù)組。但是這樣轉(zhuǎn)換的時(shí)候，會不會牽涉到編碼問題呢？仔細(xì)查看了String.getBytes()的源碼，分為無參的和有參的兩種：

// 1.無參的getBytes()方法
  public byte[] getBytes() {
    // 再繼續(xù)深入encode()方法可以發(fā)現(xiàn)使用的是系統(tǒng)默認(rèn)的字符編碼
    return StringCoding.encode(value, 0, value.length);
  }

// 2.帶參數(shù)的getBytes(String charsetName)方法
  public byte[] getBytes(String charsetName)
      throws UnsupportedEncodingException {
    if (charsetName == null) throw new NullPointerException();
    // 繼續(xù)深入可以發(fā)現(xiàn)，會使用參數(shù)字符集編碼方式來返回字節(jié)數(shù)組，如果參數(shù)字符集不存在，則使用本地系統(tǒng)默認(rèn)的字符編碼
    return StringCoding.encode(charsetName, value, 0, value.length);
  }

綜上，在這里再強(qiáng)調(diào)一下，因?yàn)樾薷牧隧?xiàng)目的編碼方式，導(dǎo)致了本地系統(tǒng)的編碼方式也變成了UTF-8，所以上述的實(shí)驗(yàn)都是基于IDE修改了工程項(xiàng)目編碼方式的基礎(chǔ)上

ByteBuffer與byte數(shù)組的互相轉(zhuǎn)換

在NIO中，一般都是使用ByteBuffer來當(dāng)作字符緩沖，而有的時(shí)候我們只有byte[]數(shù)組，所以是需要它們之間進(jìn)行相互轉(zhuǎn)換的

// ByteBuffer ----> byte[]
byte[] bytes = ByteBuffer.array();

// byte[] ------> ByteBuffer
byte[] bytes = new byte[1024];
ByteBuffer byteBuffer = ByteBuffer.wrap(bytes);

So

綜上所述，再在這里總結(jié)一下：

本地JVM的編碼方式是和本機(jī)OS默認(rèn)的字符編碼方式相關(guān)的，但是JVM的編碼方式可以被修改
Java程序的默認(rèn)字符集是Unicode，在程序中聲明的String類型的編碼方式是和JVM編碼方式相關(guān)的
String.getBytes()方法默認(rèn)的編碼方式是JVM編碼方式；同時(shí)還可以接收一個(gè)字符集名稱當(dāng)作參數(shù)，優(yōu)先使用參數(shù)的字符集
因?yàn)镴ava代碼使用的Unicode字符集，允許各編碼方式之間轉(zhuǎn)換，但不保證bit損失，所以String類型可以得到不同編碼方式的byte數(shù)組，只要按照編碼解碼的方式獲取字符串類型顯示即可
文件的流通道是根據(jù)文件的編碼方式?jīng)Q定的，所以不同編碼方式的文件讀寫時(shí)要注意編碼解碼
ByteBuffer聲明的buffer可以與byte數(shù)組之間進(jìn)行轉(zhuǎn)換，但要注意的是ByteBuffer的大小一定要足夠大以承載下所有的byte數(shù)組

小總結(jié)

搞清楚了這些甚是豁然開朗，其實(shí)很多時(shí)候中文的亂碼問題根源就是編碼方式與解碼方式不一致，或者是不同編碼方式之間轉(zhuǎn)換時(shí)造成了bit損失。所以我們還是要注意規(guī)范化編碼與解碼方式，畢竟有的轉(zhuǎn)換操作是不可逆的。

以上所述是小編給大家介紹的Java中String類型與默認(rèn)字符編碼詳解整合，希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時(shí)回復(fù)大家的。在此也非常感謝大家對億速云網(wǎng)站的支持！

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
iOS網(wǎng)絡(luò)編程-解決iCloud文檔存儲過程中文檔沖突問題
下一篇新聞：
Android Studio 3.6中新的視圖綁定工具ViewBinding 用法詳解

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼