溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

java讀取文件里面部分漢字內(nèi)容亂碼怎么辦

發(fā)布時間:2021-06-17 10:16:15 來源:億速云 閱讀:242 作者:chen 欄目:開發(fā)技術(shù)

本篇內(nèi)容主要講解“java讀取文件里面部分漢字內(nèi)容亂碼怎么辦”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“java讀取文件里面部分漢字內(nèi)容亂碼怎么辦”吧!

java讀取文件里面部分漢字內(nèi)容亂碼

讀取一個txt文件,到代碼中打印出來,發(fā)票有部分漢字的內(nèi)容是亂碼的。

我開始的方式是這樣的, 如下,這是完全錯誤的,漢字是兩個字節(jié)的,如果每次讀固定個字節(jié),可能會把漢字截斷。

就會出現(xiàn)部分亂碼的情況。

package susq.path;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

/**
 * @author susq
 * @since 2018-05-18-19:28
 */
public class WrongMethodReadTxt {
    public static void main(String[] args) throws IOException {
        ClassLoader classLoader = WrongMethodReadTxt.class.getClassLoader();
        String filePath = classLoader.getResource("").getPath() + "/expect1.txt";

        System.out.println(filePath);

        File file = new File(filePath);
        try (FileInputStream in = new FileInputStream(file)) {
            byte[] bytes = new byte[1024];
            StringBuffer sb = new StringBuffer();
            int len;
            while ((len = in.read(bytes)) != -1) {
                sb.append(new String(bytes, 0, len));
            }
            System.out.println(sb.toString());
        }
    }
}

如果存在漢字,就要按字符的方式讀?。?/p>

package susq.path;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;

/**
 * @author susq
 * @since 2018-05-18-17:39
 */
public class SysPath {
    public static void main(String[] args) throws IOException {
        ClassLoader classLoader = SysPath.class.getClassLoader();
        String filePath = classLoader.getResource("").getPath() + "/expect1.txt";

        System.out.println(filePath);

        File file = new File(filePath);
        try (BufferedReader br = new BufferedReader(new FileReader(file))) {
            StringBuffer sb = new StringBuffer();
            while (br.ready()) {
                sb.append(br.readLine());
            }
            System.out.println(sb);
        }
    }
}

java的IO流讀取數(shù)據(jù)時,解決中文亂碼,還有個別中文亂碼問題

情況:用IO流讀取數(shù)據(jù)時,若是不設(shè)置編碼格式,出來的數(shù)據(jù)未必是我們所要的

解決:讀取數(shù)據(jù)時,設(shè)置編碼

代碼:(字符串設(shè)置對應(yīng)的編碼即可,但這種方式,會導(dǎo)致個別中文亂碼,貌似是byte[]導(dǎo)致的)

//這里我通過socket方式,獲取流,并讀取數(shù)據(jù)
    //代理需要外置配置(代理配置需要判斷,若有配置,則添加,若無配置,則不添加)
    Socket socket = new Socket("192.168.99.100", 80);
 String url = "GET " + href + " HTTP/1.1\r\n\r\n";
 socket.getOutputStream().write(new String(url).getBytes());  
    InputStream is = socket.getInputStream();
    byte[] bs = new byte[1024]; 
 int i;
 StringBuilder str = new StringBuilder();
 while ((i = is.read(bs)) > 0) {
  //一定要加編碼,不然,在輸出到文件時,部分?jǐn)?shù)據(jù)會亂
  str.append(new String(bs, 0, i,"UTF-8"));
        //由于socket讀取不會斷開,所以只能自斷開連接讀取
  if(new String(bs, 0, i,"UTF-8").contains("</html>")){
     break;
  }
 }

解決個別中文亂碼問題:

代碼:

//代理需要外置配置(代理配置需要判斷,若有配置,則添加,若無配置,則不添加)
  Socket socket = new Socket("192.168.99.100", 80);
  //Socket socket = new Socket();
  String url = "GET " + href + " HTTP/1.1\r\n\r\n";
  socket.getOutputStream().write(new String(url).getBytes());
  InputStream is = socket.getInputStream();
  
  //解決個別中文亂碼
  StringBuilder str = new StringBuilder("");
  InputStreamReader isr = new InputStreamReader(is,"UTF-8");
  BufferedReader br = new BufferedReader(isr);
  String line = null;  
  while ((line = br.readLine()) != null) {
    str.append(line + "\n");
       if(line.contains("</html>")){
        break;
       }
  }

到此,相信大家對“java讀取文件里面部分漢字內(nèi)容亂碼怎么辦”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI