溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

Java避免UTF-8的csv文件打開(kāi)中文出現(xiàn)亂碼怎么辦

發(fā)布時(shí)間:2021-07-13 15:40:18 來(lái)源:億速云 閱讀:152 作者:小新 欄目:編程語(yǔ)言

這篇文章主要為大家展示了“Java避免UTF-8的csv文件打開(kāi)中文出現(xiàn)亂碼怎么辦”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“Java避免UTF-8的csv文件打開(kāi)中文出現(xiàn)亂碼怎么辦”這篇文章吧。

具體如下:

最近又遇到了需要提供csv下載功能的需求,不同的時(shí)需要用java來(lái)實(shí)現(xiàn),心想簡(jiǎn)單,就把以前php的版本重寫(xiě)了一遍,然后生成一份csv,用excel2007打開(kāi)一看,里面的中文都是亂碼,一下就懵了,以前好好的功能怎么突然不行了??以前也一直用2007的??!于是開(kāi)始了漫長(zhǎng)的google之旅。

看來(lái)看去,說(shuō)的都是輸出utf-8格式的csv需要在文件頭先輸出BOM(BOM不懂的可以google了),即0xEF 0xBB 0xBF三個(gè)字節(jié),這樣更摸不著頭腦了,明明是對(duì)的,偏偏不成功,直到發(fā)現(xiàn)一個(gè)帖子:http://stackoverflow.com/a/9337150/1794493 ,里面提到2007需要裝sp3才能識(shí)別BOM,shit!原來(lái)是這回事!里面同時(shí)又提到,用utf-16le編碼輸出貌似更通用,經(jīng)測(cè)試確實(shí)如此,但是utf-16le的BOM是0xFF 0xFE,帖子里面說(shuō)錯(cuò)了!下面是一個(gè)簡(jiǎn)單的測(cè)試結(jié)果:

excel版本附加包編碼 測(cè)試結(jié)果
2007sp3utf-8yes
2007無(wú)utf-8no
2007sp3utf-16leyes
2007無(wú)utf-16leyes
2011無(wú)utf-8no
2011無(wú)utf-16leyes

因?yàn)闂l件有限,只測(cè)試了這幾個(gè)版本,可見(jiàn)utf-16le是更通用的編碼格式。下面附上java代碼,main方法中采用utf-16le編碼,最后調(diào)用了utf8編碼的方法,最后會(huì)輸出兩種編碼格式的csv文件:

import java.io.*;
/**
 * Created by zhaozhi on 15-5-29.
 */
public class TestCSV {
  public static String join(String[] strArr, String delim) {
    StringBuilder sb = new StringBuilder();
    for(String s : strArr) {
      sb.append(s);
      sb.append(delim);
    }
    String ret;
    if (strArr.length > 1) {
      ret = sb.substring(0, sb.length()-1);
    }
    else {
      ret = sb.toString();
    }
    return ret;
  }
  public static void main (String[] args) throws Exception {
    String[] heads = {"日期", "產(chǎn)品", "訂單數(shù)"};
    String[][] rows = {
        {"20150228", "安卓", "23"},
        {"20150301", "web", "34"}
    };
    byte[] bom = {(byte)0xFF, (byte)0xFE};
    String fname = "d:\\utf-16le.csv";
    BufferedOutputStream bo = new BufferedOutputStream(new FileOutputStream(fname));
    bo.write(bom);
    bo.write(join(heads, "\t").getBytes("utf-16le"));
    bo.write("\n".getBytes("utf-16le"));
    for (String[] row : rows) {
      bo.write(join(row, "\t").getBytes("utf-16le"));
      bo.write("\n".getBytes("utf-16le"));
    }
    bo.close();
    UTF8();
  }
  public static void UTF8() throws IOException {
    String line = "中文,標(biāo)題,23";
    OutputStream os = new FileOutputStream("d:/utf-8.csv");
    os.write(239);  // 0xEF
    os.write(187);  // 0xBB
    os.write(191);  // 0xBF
    PrintWriter w = new PrintWriter(new OutputStreamWriter(os, "UTF-8"));
    w.print(line);
    w.flush();
    w.close();
  }
}

以上是“Java避免UTF-8的csv文件打開(kāi)中文出現(xiàn)亂碼怎么辦”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI