您好,登錄后才能下訂單哦!
Java中字符流與字節(jié)流的區(qū)別
1. 什么是流
Java中的流是對(duì)字節(jié)序列的抽象,我們可以想象有一個(gè)水管,只不過現(xiàn)在流動(dòng)在水管中的不再是水,而是字節(jié)序列。和水流一樣,Java中的流也具有一個(gè)“流動(dòng)的方向”,通??梢詮闹凶x入一個(gè)字節(jié)序列的對(duì)象被稱為輸入流;能夠向其寫入一個(gè)字節(jié)序列的對(duì)象被稱為輸出流。
2. 字節(jié)流
Java中的字節(jié)流處理的最基本單位為單個(gè)字節(jié),它通常用來處理二進(jìn)制數(shù)據(jù)。Java中最基本的兩個(gè)字節(jié)流類是InputStream和OutputStream,它們分別代表了組基本的輸入字節(jié)流和輸出字節(jié)流。InputStream類與OutputStream類均為抽象類,我們?cè)趯?shí)際使用中通常使用Java類庫中提供的它們的一系列子類。下面我們以InputStream類為例,來介紹下Java中的字節(jié)流。
InputStream類中定義了一個(gè)基本的用于從字節(jié)流中讀取字節(jié)的方法read,這個(gè)方法的定義如下:
public abstract int read() throws IOException;
這是一個(gè)抽象方法,也就是說任何派生自InputStream的輸入字節(jié)流類都需要實(shí)現(xiàn)這一方法,這一方法的功能是從字節(jié)流中讀取一個(gè)字節(jié),若到了末尾則返回-1,否則返回讀入的字節(jié)。關(guān)于這個(gè)方法我們需要注意的是,它會(huì)一直阻塞知道返回一個(gè)讀取到的字節(jié)或是-1。另外,字節(jié)流在默認(rèn)情況下是不支持緩存的,這意味著每調(diào)用一次read方法都會(huì)請(qǐng)求操作系統(tǒng)來讀取一個(gè)字節(jié),這往往會(huì)伴隨著一次磁盤IO,因此效率會(huì)比較低。有的小伙伴可能認(rèn)為InputStream類中read的以字節(jié)數(shù)組為參數(shù)的重載方法,能夠一次讀入多個(gè)字節(jié)而不用頻繁的進(jìn)行磁盤IO。那么究竟是不是這樣呢?我們來看一下這個(gè)方法的源碼:
public int read(byte b[]) throws IOException { return read(b, 0, b.length); }
它調(diào)用了另一個(gè)版本的read重載方法,那我們就接著往下追:
public int read(byte b[], int off, int len) throws IOException { if (b == null) { throw new NullPointerException(); } else if (off < 0 || len < 0 || len > b.length - off) { throw new IndexOutOfBoundsException(); } else if (len == 0) { return 0; } int c = read(); if (c == -1) { return -1; } b[off] = (byte)c; int i = 1; try { for (; i < len ; i++) { c = read(); if (c == -1) { break; } b[off + i] = (byte)c; } } catch (IOException ee) { } return i; }
從以上的代碼我們可以看到,實(shí)際上read(byte[])方法內(nèi)部也是通過循環(huán)調(diào)用read()方法來實(shí)現(xiàn)“一次”讀入一個(gè)字節(jié)數(shù)組的,因此本質(zhì)來說這個(gè)方法也未使用內(nèi)存緩沖區(qū)。要使用內(nèi)存緩沖區(qū)以提高讀取的效率,我們應(yīng)該使用BufferedInputStream。
3. 字符流
Java中的字符流處理的最基本的單元是Unicode碼元(大小2字節(jié)),它通常用來處理文本數(shù)據(jù)。所謂Unicode碼元,也就是一個(gè)Unicode代碼單元,范圍是0x0000~0xFFFF。在以上范圍內(nèi)的每個(gè)數(shù)字都與一個(gè)字符相對(duì)應(yīng),Java中的String類型默認(rèn)就把字符以Unicode規(guī)則編碼而后存儲(chǔ)在內(nèi)存中。然而與存儲(chǔ)在內(nèi)存中不同,存儲(chǔ)在磁盤上的數(shù)據(jù)通常有著各種各樣的編碼方式。使用不同的編碼方式,相同的字符會(huì)有不同的二進(jìn)制表示。實(shí)際上字符流是這樣工作的:
我們通過一個(gè)demo來加深對(duì)這一過程的理解,示例代碼如下:
import java.io.FileWriter; import java.io.IOException; public class FileWriterDemo { public static void main(String[] args) { FileWriter fileWriter = null; try { try { fileWriter = new FileWriter("demo.txt"); fileWriter.write("demo"); } finally { fileWriter.close(); } } catch (IOException e) { e.printStackTrace(); } } }
以上代碼中,我們使用FileWriter向demo.txt中寫入了“demo”這四個(gè)字符,我們用十六進(jìn)制編輯器WinHex查看下demo.txt的內(nèi)容:
從上圖可以看出,我們寫入的“demo”被編碼為了“64 65 6D 6F”,但是我們并沒有在上面的代碼中顯式指定編碼方式,實(shí)際上,在我們沒有指定時(shí)使用的是操作系統(tǒng)的默認(rèn)字符編碼方式來對(duì)我們要寫入的字符進(jìn)行編碼。
由于字符流在輸出前實(shí)際上是要完成Unicode碼元序列到相應(yīng)編碼方式的字節(jié)序列的轉(zhuǎn)換,所以它會(huì)使用內(nèi)存緩沖區(qū)來存放轉(zhuǎn)換后得到的字節(jié)序列,等待都轉(zhuǎn)換完畢再一同寫入磁盤文件中。
4. 字符流與字節(jié)流的區(qū)別
經(jīng)過以上的描述,我們可以知道字節(jié)流與字符流之間主要的區(qū)別體現(xiàn)在以下幾個(gè)方面:
感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。