您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“java讀取文件里面部分漢字內(nèi)容亂碼怎么辦”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“java讀取文件里面部分漢字內(nèi)容亂碼怎么辦”吧!
讀取一個txt文件,到代碼中打印出來,發(fā)票有部分漢字的內(nèi)容是亂碼的。
我開始的方式是這樣的, 如下,這是完全錯誤的,漢字是兩個字節(jié)的,如果每次讀固定個字節(jié),可能會把漢字截斷。
就會出現(xiàn)部分亂碼的情況。
package susq.path; import java.io.File; import java.io.FileInputStream; import java.io.IOException; /** * @author susq * @since 2018-05-18-19:28 */ public class WrongMethodReadTxt { public static void main(String[] args) throws IOException { ClassLoader classLoader = WrongMethodReadTxt.class.getClassLoader(); String filePath = classLoader.getResource("").getPath() + "/expect1.txt"; System.out.println(filePath); File file = new File(filePath); try (FileInputStream in = new FileInputStream(file)) { byte[] bytes = new byte[1024]; StringBuffer sb = new StringBuffer(); int len; while ((len = in.read(bytes)) != -1) { sb.append(new String(bytes, 0, len)); } System.out.println(sb.toString()); } } }
如果存在漢字,就要按字符的方式讀?。?/p>
package susq.path; import java.io.BufferedReader; import java.io.File; import java.io.FileReader; import java.io.IOException; /** * @author susq * @since 2018-05-18-17:39 */ public class SysPath { public static void main(String[] args) throws IOException { ClassLoader classLoader = SysPath.class.getClassLoader(); String filePath = classLoader.getResource("").getPath() + "/expect1.txt"; System.out.println(filePath); File file = new File(filePath); try (BufferedReader br = new BufferedReader(new FileReader(file))) { StringBuffer sb = new StringBuffer(); while (br.ready()) { sb.append(br.readLine()); } System.out.println(sb); } } }
情況:用IO流讀取數(shù)據(jù)時,若是不設(shè)置編碼格式,出來的數(shù)據(jù)未必是我們所要的
代碼:(字符串設(shè)置對應(yīng)的編碼即可,但這種方式,會導(dǎo)致個別中文亂碼,貌似是byte[]導(dǎo)致的)
//這里我通過socket方式,獲取流,并讀取數(shù)據(jù) //代理需要外置配置(代理配置需要判斷,若有配置,則添加,若無配置,則不添加) Socket socket = new Socket("192.168.99.100", 80); String url = "GET " + href + " HTTP/1.1\r\n\r\n"; socket.getOutputStream().write(new String(url).getBytes()); InputStream is = socket.getInputStream(); byte[] bs = new byte[1024]; int i; StringBuilder str = new StringBuilder(); while ((i = is.read(bs)) > 0) { //一定要加編碼,不然,在輸出到文件時,部分?jǐn)?shù)據(jù)會亂 str.append(new String(bs, 0, i,"UTF-8")); //由于socket讀取不會斷開,所以只能自斷開連接讀取 if(new String(bs, 0, i,"UTF-8").contains("</html>")){ break; } }
代碼:
//代理需要外置配置(代理配置需要判斷,若有配置,則添加,若無配置,則不添加) Socket socket = new Socket("192.168.99.100", 80); //Socket socket = new Socket(); String url = "GET " + href + " HTTP/1.1\r\n\r\n"; socket.getOutputStream().write(new String(url).getBytes()); InputStream is = socket.getInputStream(); //解決個別中文亂碼 StringBuilder str = new StringBuilder(""); InputStreamReader isr = new InputStreamReader(is,"UTF-8"); BufferedReader br = new BufferedReader(isr); String line = null; while ((line = br.readLine()) != null) { str.append(line + "\n"); if(line.contains("</html>")){ break; } }
到此,相信大家對“java讀取文件里面部分漢字內(nèi)容亂碼怎么辦”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。