溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Java語言中字符的處理方法是什么

發(fā)布時間:2022-01-10 09:11:04 來源:億速云 閱讀:155 作者:iii 欄目:編程語言

這篇文章主要介紹“Java語言中字符的處理方法是什么”的相關(guān)知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強,希望這篇“Java語言中字符的處理方法是什么”文章能幫助大家解決問題。

----Java是一種編程語言、一個運行系統(tǒng)、一套開發(fā)工具和一個應(yīng)用程序編程界面(api)。Java建立在C++的熟悉、有用的特征之上,而取消了C++的復(fù)雜的、危險的和多余的元素。它是一個更安全、更簡單、更容易使用的語言。

1、Java的字符表達(dá)

----Java語言和C語言對字符進(jìn)行了互不相同的描述,Java使用16位的Unicode字符集(該標(biāo)準(zhǔn)描述了許多語言的各種不同字符),因此Java字符是一個16位的無符號整數(shù),字符變量用來存放單個字符,而不是完整的字符串。

----一個字符(character),就是單個字母(letter),許多字母構(gòu)成一個單詞,一組單詞組成句子,以此類推。但是對于含有諸如中文信息的字符,就不是那么簡單了。

----Java的基本的char類型被定義成無符號的16位,它是Java中唯一的一個無符號類型。使用16位表達(dá)字符的主要原因是要讓Java能夠支持任何Unicode字符,因此而使得Java適用于描述或顯示任何被Unicode支持的語言,可移植性也就會更好。但是,能夠支持某種語言的字符串顯示,和能夠正確打印某種語言的字符串,常常是兩個不同的問題。由于Oak(Java最初的代號)開發(fā)組的主要環(huán)境是unix系統(tǒng)和某些源于Unix的系統(tǒng),所以對開發(fā)人員來說,最為方便實用的字符集是ISOLatin-1。相應(yīng)地,這一開發(fā)組就帶有Unix遺傳性,也就導(dǎo)致了Java的I/O系統(tǒng)在很大程度上以Unix的流概念為模型,而在Unix系統(tǒng)中,每一種I/O設(shè)備都是用一串8比特的流來表示。這種在I/O系統(tǒng)方面取模于Unix的做法,使得Java語言擁有16位的Java字符,而卻只有8位的輸入設(shè)備,這樣就給Java帶來了些不足。因此在任何一處Java字符串按8位來讀入或?qū)懗龅牡胤?,都得有一小段程序代碼,被稱為"劈(hack)",來將8位的字符映射成為16位Unicode,或?qū)?6位的Unicode劈成8位字符。

2、問題及解決

----我們要實現(xiàn)從一個文件讀取信息,尤其是讀取含有中文信息的文件,并將讀取到的信息顯示在屏幕上,一般我們使用FileInputStream函數(shù)打開文件、readChar函數(shù)讀入字符。如下:


import java.io.*;
public class rf{
 public static void main(String args[]) {
 FileInputStream fis;
 DataInputStream dis;
 char c;

 try {
 fis = new FileInputStream("xinxi.txt");
 dis = new DataInputStream(fis);
 while (true) {
 c = dis.readChar();
 System.out.print(c);
 System.out.flush();
 if (c == 'n') break;
 }
 fis.close();
 } catch (Exception e) { }
 System.exit(0);
 }
}

----但是事實上,運行這一程序,所能得到的輸出結(jié)果是一堆無用的亂碼。不能正確輸出xinxi.txt文件內(nèi)容,其原因是readChar函數(shù)讀入的是16位的Unicode字符,而System.out.print卻將其當(dāng)作八位的ISO latin-1字符輸出。

----Java 1.1版本引入了一套全新的Readers和Writers接口來處理字符。我們可以利用InputStreamReader類而不是DataInputStream來處理文件。修改上面的程序如下:
import java.io.*;


public class rf {
 public static void main(String args[]) {
 FileInputStream fis;
 InputStreamReader irs;
 char ch;

 try {
 fis = new FileInputStream("xinxi.txt");
 irs = new InputStreamReader(fis);
 while (true) {
 ch = (char) irs.read();
 System.out.print(c);
 System.out.flush();
 if (ch == 'n') break;
 }
 fis.close();
 } catch (Exception e) { }
 System.exit(0);
 }
}

----這樣才能正確輸出xinxi.txt中的文本(尤其是中文信息)。另外,當(dāng)xinxi.txt文件來自不同的機器,即來自不同操作平臺(或漢字內(nèi)碼不同)的機器,比如: 文件來自客戶端(客戶端上傳文件給服務(wù)器),而讀取文中信息的操作由服務(wù)器端執(zhí)行。如果用上面的程序來實現(xiàn)這一功能,就有可能仍然不能得到正確的結(jié)果。其原因就是輸入編碼轉(zhuǎn)換失敗,我們還需要進(jìn)行如下的改動:


 ...... 
 int c1;
 int j=0;
 StringBuffer str=new StringBuffer();
 char lll[][]= new char[20][500];
 String ll="";
 try {
 fis = new FileInputStream("fname.txt");
 irs = new InputStreamReader(fis);
 c1=irs.read(lll[1],0,50);
 while (lll[1][j]!=' ') {
 str.append(lll[1][j]);
 j=j+1; 
 }
 ll=str.toString();
 System.out.println(ll);
 } catch (IOException e) {
 System.out.println(e.toString());}
 ......

----這樣,輸出的結(jié)果就正確了。當(dāng)然,上面的程序是不完整的,只是說明了一下解決的方法。

關(guān)于“Java語言中字符的處理方法是什么”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識,可以關(guān)注億速云行業(yè)資訊頻道,小編每天都會為大家更新不同的知識點。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI