溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Java怎么使用字符流讀寫非文本文件

發(fā)布時間:2023-04-15 15:38:07 來源:億速云 閱讀:130 作者:iii 欄目:開發(fā)技術(shù)

今天小編給大家分享一下Java怎么使用字符流讀寫非文本文件的相關(guān)知識點,內(nèi)容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。

    使用字符流讀取文件(非文本)

    以Java的字符流讀取文件為例:它只能讀取0-65535之間的字符,可以看出來字符都是正數(shù),但是二進制的byte是可以為負數(shù)的。但是讀取的時候會被當(dāng)做正數(shù)來讀取,或者是無法在編碼表中找到的字符會返回一個奇怪的符號(你可能見過那個奇怪的 “?”)。

    但是在某些情況下,必須要使用字符來顯示二進制數(shù)據(jù),也不是沒有辦法的,下面就來介紹一個我們什么的方式–base64編碼。

    Base64編碼

    base64編碼簡介

    base64是網(wǎng)絡(luò)上常見的用于傳輸8Bit字節(jié)碼的編碼方式之一,Base64就是一種基于64個可打印字符來表示二進制數(shù)據(jù)的方法。Base64編碼是從二進制到字符的過程,可以用在HTTP環(huán)境下傳遞較長的標(biāo)識信息。采用Base64編碼后具有不可讀性,需要解碼后才能閱讀。它的中文名是基于64個可打印字符來表示二進制數(shù)據(jù)。

    編碼規(guī)則

    1. 把3個字節(jié)變成4個字節(jié).

    2. 沒76個字符加一個換行符。

    3. 最后的結(jié)束符也要處理。

    編碼方式的缺點

    從編碼規(guī)則可以看出來,base64要求把每三個8Bit的字節(jié)轉(zhuǎn)換成四個6Bit的字符(38 = 46 = 24),然后把6Bit再添加兩位高位0,組成四個8Bit的字節(jié)。也就是說,轉(zhuǎn)換后的字符串理論上將要比原來的長1/3(33%)。

    這里這是介紹一個概念,關(guān)于更加詳細的內(nèi)容,如果感興趣的話,可以取收集了解更多。

    Base64在 Java 里的應(yīng)用

    Java的Base64工具類提供了一套靜態(tài)方法獲取下面三種BASE64編解碼器:

    • 基本:輸出被映射到一組字符A-Za-z0-9+/,編碼不添加任何行標(biāo),輸出的解碼僅支持A-Za-z0-9+/。

    • URL:輸出映射到一組字符A-Za-z0-9+_,輸出是URL和文件。

    • MIME:輸出隱射到MIME友好格式。輸出每行不超過76字符,并且使用’\r’并跟隨’\n’作為分割。編碼輸出最后沒有行分割。

    分別對應(yīng)如下幾個方法:

    Encoder basicEncoder = Base64.getEncoder();
    Encoder mimeEncoder = Base64.getMimeEncoder();
    Encoder urlEncoder = Base64.getUrlEncoder();

    我寫了一個簡單的工具類來進行測試 基本(basic) 的編碼器。。

    package com.dragon;
    
    import java.io.BufferedInputStream;
    import java.io.ByteArrayOutputStream;
    import java.io.File;
    import java.io.FileInputStream;
    import java.io.FileNotFoundException;
    import java.io.IOException;
    import java.io.InputStream;
    import java.io.UnsupportedEncodingException;
    import java.util.Base64;
    import java.util.Base64.Decoder;
    import java.util.Base64.Encoder;
    
    /**
     * @author Alfred
     * */
    public class Base64Util {
    	private static Encoder encoder = Base64.getEncoder();
    	private static Decoder decoder = Base64.getDecoder();
    	private static String ENCODE = "UTF-8";
    	private static int LENGTH = 1024;
    	
    	/**
    	 * 靜態(tài)方法:
    	 * 將文件等二進制數(shù)據(jù)(文本和非文本都可以)
    	 * 轉(zhuǎn)為base64字符串。
    	 * @throws IOException 
    	 * @throws FileNotFoundException 
    	 * 
    	 * */
    	public static String dataToBase64(File src) throws FileNotFoundException, IOException {
    		Encoder encoder = Base64.getEncoder();
    		
    		int len = (int)src.length();
    		byte[] bar = new byte[(int)len];
    		int hasRead = 0;
    		byte[] b = new byte[LENGTH];
    		//使用專門處理 byte 的IO流比較方便,一次性讀取較大文件對內(nèi)存壓力較大
    		try (InputStream in = new BufferedInputStream(new FileInputStream(src));
    				ByteArrayOutputStream bos = new ByteArrayOutputStream(len)) {
    			while ((hasRead = in.read(b)) != -1) {
    				bos.write(b, 0, hasRead);
    			}
    			bar = bos.toByteArray();
    		}
    		return encoder.encodeToString(bar);
    	}
    	
    	public static String dataToBase64(String src) throws UnsupportedEncodingException {
    		return encoder.encodeToString(src.getBytes(ENCODE));
    	}
    	
    	public static byte[] base64ToData(String src) {
    		return decoder.decode(src);
    	}
    }

    將圖片轉(zhuǎn)為Base64字符串進行讀寫

    import java.io.BufferedReader;
    import java.io.BufferedWriter;
    import java.io.File;
    import java.io.FileNotFoundException;
    import java.io.FileReader;
    import java.io.FileWriter;
    import java.io.IOException;
    import java.io.UnsupportedEncodingException;
    import java.io.Writer;
    import java.nio.file.Path;
    import java.nio.file.Paths;
    
    public class Base64Test {
    	public static void main(String[] args) throws FileNotFoundException, IOException {
    		testPic();
    	}
    	
    	static void testPic() throws FileNotFoundException, IOException {
    		// 測試圖片文件。
    		Path picPath = Paths.get("./src/com/dragon/001.jpg");
    		File picFile = picPath.toFile();
    		String picToBase64 = Base64Util.dataToBase64(picFile);
    		System.out.println(picToBase64);
    		long oldSize = picFile.length();
    		long newSize = picToBase64.getBytes("UTF-8").length;
    		System.out.println("圖片原始大小(字節(jié)):" + oldSize);
    		System.out.println("轉(zhuǎn)換后數(shù)據(jù)大?。ㄗ止?jié)):" + newSize);
    		System.out.println("轉(zhuǎn)換后比原來擴大的比例為:" + (double)(newSize-oldSize)/(double)oldSize + " %");
    		
    		//將數(shù)據(jù)寫入文件
    		try (Writer writer = new BufferedWriter(new FileWriter("./src/com/dragon/002.txt"))) {
    			writer.write(picToBase64);
    		}
    		
    		//從文件中讀取數(shù)據(jù)
    		String line = null;
    		try (BufferedReader reader = new BufferedReader(new FileReader("./src/com/dragon/002.txt"))){
    			line = reader.readLine();
    		}
    		System.out.println(picToBase64.equals(line));
    	}
    }

    運行截圖

    Java怎么使用字符流讀寫非文本文件

    說明:這里將圖片轉(zhuǎn)為base64字符串后,使用字符流寫入了一個文本文件,然后再使用字符流讀取出來,再和原來的字符串進行比較結(jié)果為 true。 所以,就完成了對圖片數(shù)據(jù)的讀取,可能你這里說你讀取的并不是圖片的二進制數(shù)據(jù),但是其實所有的文件都是以二進制來存儲的!而且,這個base64字符串,也是可以直接作為圖片來使用的。

    注意:我這里已經(jīng)選取了一個非常小的圖片,可以看到原始大小才 3639字節(jié),也就是不到 4 KB,但是如果轉(zhuǎn)換成文字那就是不少了(所以,它會顯得很長,非常長。)。

    測試圖片

    Java怎么使用字符流讀寫非文本文件

    然后你可能會問怎么證明這個字符串就是上面這張圖片呢?這個也很好辦到,如果你對前端的知識有所了解的話,應(yīng)該知道前端的圖片是可以使用base64字符串來表示的,下面寫一個 html 文件測試一下。

    image.html

    <!DOCTYPE>
    <html>
        <head>
            <meta charset="UTF-8"/>
            <title>base測試</title>
        </head>
        <body>
            <img src=""/>
        </body>
    <html>

    打開瀏覽器測試一下

    Java怎么使用字符流讀寫非文本文件

    說明: 它的具體用法如下:

    <img src="https://img-blog.csdnimg.cn/2022010703315790409.jpeg">

    圖片的大小相對于字符來說,其實是很龐大了。我這里的html代碼是完整的圖片的base64編碼字符串,然后我的博客的字數(shù)就變大了很多。

    字符串轉(zhuǎn)base64編碼

    public class Base64Test {
    	public static void main(String[] args) throws FileNotFoundException, IOException {
    		testStr("I love you yesterday and today!");
    	}
    	
    	static void testStr(String src) throws UnsupportedEncodingException {
    		//測試文本數(shù)據(jù)。
    		String strToBase64 = Base64Util.dataToBase64(src);
    		System.out.println("base64編碼:" + strToBase64);
    		String base64ToStr = new String(Base64Util.base64ToData(strToBase64));
    		System.out.println("base64解碼:" + base64ToStr);
    	}
    }

    測試截圖

    Java怎么使用字符流讀寫非文本文件

    base64的用處

    Base64常用于在通常處理文本數(shù)據(jù)的場合,表示、傳輸、存儲一些二進制數(shù)據(jù)。包括MIME的email,email via MIME, 在XML中存儲復(fù)雜數(shù)據(jù)。 注1:互聯(lián)網(wǎng)上也有很多可以進行編解碼的網(wǎng)站,如果需要使用的話,可以取嘗試一下。

    注2:可以觀察一下這個base64字符串的特點,我上次學(xué)習(xí)Java爬蟲的時候,爬了一個網(wǎng)站,發(fā)現(xiàn)這個網(wǎng)站的一個 script 腳本中,含有一個json對象,其中有一個屬性是 url,但是對應(yīng)的鏈接卻看不懂(base64字符串是不可讀的),但是我感覺它就是base64字符串,所以我利用base64編解碼網(wǎng)站解碼一看,真的是一個網(wǎng)站的地址。然后,就可以寫一個解碼方法,當(dāng)爬到這個數(shù)據(jù)時,給它解碼了,哈哈。

    舉一個簡單的例子:

    {"url":"aHR0cHMlM0ElMkYlMkZ3d3cuYmFpZHUuY29tJTJG"}
    import java.io.UnsupportedEncodingException;
    import java.net.URLDecoder;
    import java.net.URLEncoder;
    import java.util.Base64;
    import java.util.Base64.Decoder;
    import java.util.Base64.Encoder;
    
    public class TestALittle {
    	public static void main(String[] args) throws UnsupportedEncodingException {
    		String base64Str = "aHR0cHMlM0ElMkYlMkZ3d3cuYmFpZHUuY29tJTJG";
    		String de_str = base64ToUrlEncoderToURL(base64Str);
    		System.out.println("解碼:" + de_str);
    	}
    	
    	//base64解密為urlencoder,再解碼為url
    	public static String base64ToUrlEncoderToURL(String base64Str) throws UnsupportedEncodingException {
    		Decoder decoder = Base64.getDecoder();
    		byte[] bt = decoder.decode(base64Str);
    		String en_str = new String(bt, 0, bt.length);
    		return URLDecoder.decode(en_str, "UTF-8");
    	}
    }

    Java怎么使用字符流讀寫非文本文件

    說明: 這個例子中的 url 進行了兩次編碼,第一次是將url中的非西歐字符編碼(可以去了解一下為什么這么做?),然后再使用base64編碼。但是,如果你掌握了解碼技術(shù),解碼也是很簡單的。(但是如果你看不出來它是base64編碼,那估計就沒有辦法了?。?/p>

    以上就是“Java怎么使用字符流讀寫非文本文件”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學(xué)習(xí)更多的知識,請關(guān)注億速云行業(yè)資訊頻道。

    向AI問一下細節(jié)

    免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

    AI