您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“Java避免UTF-8的csv文件打開(kāi)中文出現(xiàn)亂碼怎么辦”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“Java避免UTF-8的csv文件打開(kāi)中文出現(xiàn)亂碼怎么辦”這篇文章吧。
具體如下:
最近又遇到了需要提供csv下載功能的需求,不同的時(shí)需要用java來(lái)實(shí)現(xiàn),心想簡(jiǎn)單,就把以前php的版本重寫(xiě)了一遍,然后生成一份csv,用excel2007打開(kāi)一看,里面的中文都是亂碼,一下就懵了,以前好好的功能怎么突然不行了??以前也一直用2007的??!于是開(kāi)始了漫長(zhǎng)的google之旅。
看來(lái)看去,說(shuō)的都是輸出utf-8格式的csv需要在文件頭先輸出BOM(BOM不懂的可以google了),即0xEF 0xBB 0xBF三個(gè)字節(jié),這樣更摸不著頭腦了,明明是對(duì)的,偏偏不成功,直到發(fā)現(xiàn)一個(gè)帖子:http://stackoverflow.com/a/9337150/1794493 ,里面提到2007需要裝sp3才能識(shí)別BOM,shit!原來(lái)是這回事!里面同時(shí)又提到,用utf-16le編碼輸出貌似更通用,經(jīng)測(cè)試確實(shí)如此,但是utf-16le的BOM是0xFF 0xFE,帖子里面說(shuō)錯(cuò)了!下面是一個(gè)簡(jiǎn)單的測(cè)試結(jié)果:
excel版本 | 附加包 | 編碼 | 測(cè)試結(jié)果 |
---|---|---|---|
2007 | sp3 | utf-8 | yes |
2007 | 無(wú) | utf-8 | no |
2007 | sp3 | utf-16le | yes |
2007 | 無(wú) | utf-16le | yes |
2011 | 無(wú) | utf-8 | no |
2011 | 無(wú) | utf-16le | yes |
因?yàn)闂l件有限,只測(cè)試了這幾個(gè)版本,可見(jiàn)utf-16le是更通用的編碼格式。下面附上java代碼,main方法中采用utf-16le編碼,最后調(diào)用了utf8編碼的方法,最后會(huì)輸出兩種編碼格式的csv文件:
import java.io.*; /** * Created by zhaozhi on 15-5-29. */ public class TestCSV { public static String join(String[] strArr, String delim) { StringBuilder sb = new StringBuilder(); for(String s : strArr) { sb.append(s); sb.append(delim); } String ret; if (strArr.length > 1) { ret = sb.substring(0, sb.length()-1); } else { ret = sb.toString(); } return ret; } public static void main (String[] args) throws Exception { String[] heads = {"日期", "產(chǎn)品", "訂單數(shù)"}; String[][] rows = { {"20150228", "安卓", "23"}, {"20150301", "web", "34"} }; byte[] bom = {(byte)0xFF, (byte)0xFE}; String fname = "d:\\utf-16le.csv"; BufferedOutputStream bo = new BufferedOutputStream(new FileOutputStream(fname)); bo.write(bom); bo.write(join(heads, "\t").getBytes("utf-16le")); bo.write("\n".getBytes("utf-16le")); for (String[] row : rows) { bo.write(join(row, "\t").getBytes("utf-16le")); bo.write("\n".getBytes("utf-16le")); } bo.close(); UTF8(); } public static void UTF8() throws IOException { String line = "中文,標(biāo)題,23"; OutputStream os = new FileOutputStream("d:/utf-8.csv"); os.write(239); // 0xEF os.write(187); // 0xBB os.write(191); // 0xBF PrintWriter w = new PrintWriter(new OutputStreamWriter(os, "UTF-8")); w.print(line); w.flush(); w.close(); } }
以上是“Java避免UTF-8的csv文件打開(kāi)中文出現(xiàn)亂碼怎么辦”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。