如何實(shí)現(xiàn)Base64與Base32

發(fā)布時間：2021-10-19 17:10:20 來源：億速云閱讀：173 作者：iii 欄目：編程語言

這篇文章主要介紹“如何實(shí)現(xiàn)Base64與Base32”，在日常操作中，相信很多人在如何實(shí)現(xiàn)Base64與Base32問題上存在疑惑，小編查閱了各式資料，整理出簡單好用的操作方法，希望對大家解答”如何實(shí)現(xiàn)Base64與Base32”的疑惑有所幫助！接下來，請跟著小編一起來學(xué)習(xí)吧！

Base64是干什么用的

要寫B(tài)ase32，就要先理解Base64，那么Base64是干什么用的呢？為什么要有Base64呢？這個是根本原因，把Base64產(chǎn)生的過程搞清楚了，那么Base32，我們就可以依葫蘆畫瓢了。

我們知道在計(jì)算機(jī)中，數(shù)據(jù)的單位是字節(jié)byte，它是由8位2進(jìn)制組成的，總共可以有256個不同的數(shù)。那么這些二進(jìn)制的數(shù)據(jù)要怎么進(jìn)行傳輸呢？我們要將其轉(zhuǎn)化為ASCII字符，ASCII字符中包含了33個控制字符（不可見）和95個可見字符，我們?nèi)绻軐⑦@些二進(jìn)制的數(shù)據(jù)轉(zhuǎn)化成這95個可見字符，就可以正常傳輸了。于是，我們從95個字符中，挑選了64個，將2進(jìn)制的數(shù)據(jù)轉(zhuǎn)化為這個64個可見字符，這樣就可以正常的傳輸了，這就是Base64的由來。那這64個字符是什么呢？

如何實(shí)現(xiàn)Base64與Base32

這就是Base64的那64個字符。那么如果我們要實(shí)現(xiàn)Base32呢？對了，我們要挑選出32個可見字符，具體如下：

private static final char[] toBase32 = {
  'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M',
  'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z',
  '0', '1', '2', '3', '4', '5'
};

我們挑選了大寫的A-Z，再加上0-5，一共32個可見字符。

Base32是什么規(guī)則

好了，32個可見字符已經(jīng)選好了，接下來就是將2進(jìn)制轉(zhuǎn)化成這32個字符的過程。我們先來看一下Base64是一個什么樣的轉(zhuǎn)化過程，我們一個字節(jié)是8位，而64是2的6次方，也即是一個字節(jié)（8位）的數(shù)據(jù)，我們要截取其中的6位進(jìn)行編碼，取到其可見字符。那么剩余的2位數(shù)怎么辦呢？它將和下一個自己的前4位組成一個6位的數(shù)據(jù)進(jìn)行編碼。那么我們需要多少字節(jié)才能得到一個完整的不丟位的編碼呢？我們要取6和8的最小公倍數(shù)，也就是24，24位恰好是3個字節(jié)，如果取6位進(jìn)行編碼，則可以取到4個編碼。我們看看下面的圖就可以更好地理解了，

如何實(shí)現(xiàn)Base64與Base32

M，a，n對應(yīng)的ASCII碼分別是77，97，110。
對應(yīng)的二進(jìn)制是01001101，01100001，01101110。
然后我們按照6位截取，恰好能夠截取4個編碼，對應(yīng)的6位二進(jìn)制分別為：010011，010110，000101，101110。
對應(yīng)的64位編碼為：T，W，F(xiàn)，u。

同理，如果我們要實(shí)現(xiàn)Base32怎么辦呢？32是2的5次方，那么我們再進(jìn)行2進(jìn)制截位時，要一次截取5位。那么一個字節(jié)8位，截取了5位，剩下的3位怎么辦？同理和下一個字節(jié)的前2位組成一個新的5位。那么多少個字節(jié)按照5位截取才能不丟位呢？我們要取5和8的最小公倍數(shù)，40位，按照5位截取，正好得到8個編碼。40位，正好5個字節(jié)，所以我們要5個字節(jié)分為一組，進(jìn)行Base32的編碼。如下圖：

如何實(shí)現(xiàn)Base64與Base32

對比前面的Base64，Base32就是按照5位去截取，然后去編碼表中找到對應(yīng)的字符。好了，原理我們明白了，下面進(jìn)入程序階段。

寫程序階段

原理明白了，程序怎么寫呢？這也就是程序猿的價值所在，把現(xiàn)實(shí)中的規(guī)則、功能、邏輯用程序把它實(shí)現(xiàn)。但是實(shí)現(xiàn)Base32也是比較難的，不過有先人給我們留下了Base64，我們參照Base64去實(shí)現(xiàn)Base32就容易多了。

Base32編碼

首先，我們要根據(jù)輸入字節(jié)的長度，確定返回字節(jié)的長度，以上面為例，輸入字節(jié)的長度是5，那么Base32轉(zhuǎn)碼后的字節(jié)長度就是8。那么如果輸入字節(jié)的長度是1，返回結(jié)果的字節(jié)長度是多少呢？這就需要補(bǔ)位了，也就是說輸入字節(jié)的長度不是5的倍數(shù)，我們要進(jìn)行補(bǔ)位，將其長度補(bǔ)成5的倍數(shù)，這樣編碼以后，返回字節(jié)的長度就是8的倍數(shù)。這樣做，我們不會丟失信息，比如，我們只輸入了一個字節(jié)，是8位，編碼時，截取了前5位，那么剩下的后3位怎么辦？不能舍棄吧，我們要在其后面補(bǔ)足40位，補(bǔ)位用0去補(bǔ)，前面截取有剩余的位數(shù)再加上后面補(bǔ)位的0，湊成5位，再去編碼。其余的，全是0的5位二進(jìn)制，我們編碼成“=”，這個和Base64是一樣的。

好了，我們先來看看編碼后返回字節(jié)的長度怎么計(jì)算。

//返回結(jié)果的數(shù)組長度
int rLength = 8 * ((src.length + 4) / 5);
//返回結(jié)果
byte[] result = new byte[rLength];

其中src是輸入的字節(jié)數(shù)組；
返回長度的公式我們要仔細(xì)看一下，對5取整，再乘以8，這是一個最基本的操作，我們用上面的例子套一下，輸入字節(jié)的長度是5個字節(jié)，8*(5/5) = 8，需要返回8個字節(jié)。我們再來看看加4的作用，比如我們輸入的是1個字節(jié)，那么返回幾個字節(jié)呢？按照前面的要求，如果二進(jìn)制長度不滿40位，要補(bǔ)滿40位，也就是輸入字節(jié)的長度要補(bǔ)滿成5的整數(shù)倍。這里先加4再對5取整，就可以補(bǔ)位后可以進(jìn)行完整編碼的個數(shù)，然后再乘以8，得到返回的字節(jié)數(shù)。大家可以隨便想幾個例子，驗(yàn)證一下結(jié)果對不對。
然后我們定義返回結(jié)果的數(shù)組。

返回結(jié)果的數(shù)組長度已經(jīng)確定了，接下來我們做什么呢？當(dāng)然是編碼的工作了，這里我們分為兩個步驟：

先處理可以正常進(jìn)行編碼的那些字節(jié)，也就是滿足5的倍數(shù)的那些字節(jié)，這些字節(jié)可以進(jìn)行5字節(jié)到8字節(jié)轉(zhuǎn)換的，不需要進(jìn)行補(bǔ)位。
然后處理最后幾位，這些是需要補(bǔ)位的，將其補(bǔ)成5個字節(jié)。

編碼的步驟已經(jīng)確定了，下面要確定可以正常編碼的字節(jié)長度，以及需要補(bǔ)位的長度，如下：

//正常轉(zhuǎn)換的長度
int normalLength = src.length / 5 * 5;
//補(bǔ)位長度
int fillLength = (5 - (src.length % 5)) % 5;

又是兩個計(jì)算公式，我們分別看一下：

可以正常編碼的字節(jié)長度，對5取整，再乘以5，過濾掉最后不滿足5的倍數(shù)的字節(jié)，這些過濾掉的字節(jié)需要補(bǔ)位，滿足5個字節(jié)；
這一步就是計(jì)算最后需要補(bǔ)幾位才能滿足5的倍數(shù)，最后可以得到需要補(bǔ)位的長度，如果輸入字節(jié)的長度恰好是5的倍數(shù)，不需要補(bǔ)位，則計(jì)算的結(jié)果是0，大家可以驗(yàn)證一下這兩個公式。

接下來，我們處理一下可以正常編碼的字節(jié)，如下：

//輸入字節(jié)下標(biāo)
int srcPos = 0;
//返回結(jié)果下標(biāo)
int resultPos = 0;
while (srcPos < normalLength) {
  long bits = ((long)(src[srcPos++] & 0xff)) << 32 |
    (src[srcPos++] & 0xff) << 24 |
    (src[srcPos++] & 0xff) << 16 |
    (src[srcPos++] & 0xff) << 8  |
    (src[srcPos++] & 0xff);

  result[resultPos++] = (byte) toBase32[(int)((bits >> 35) & 0x1f)];
  result[resultPos++] = (byte) toBase32[(int)((bits >> 30) & 0x1f)];
  result[resultPos++] = (byte) toBase32[(int)((bits >> 25) & 0x1f)];
  result[resultPos++] = (byte) toBase32[(int)((bits >> 20) & 0x1f)];
  result[resultPos++] = (byte) toBase32[(int)((bits >> 15) & 0x1f)];
  result[resultPos++] = (byte) toBase32[(int)((bits >> 10) & 0x1f)];
  result[resultPos++] = (byte) toBase32[(int)((bits >> 5) & 0x1f)];
  result[resultPos++] = (byte) toBase32[(int)(bits & 0x1f)];

}

我們先定義輸入字節(jié)的下標(biāo)和返回結(jié)果的下標(biāo)，用作取值與賦值；
再寫個while循環(huán)，只要輸入的字節(jié)下標(biāo)在正常轉(zhuǎn)換的范圍內(nèi)，就可以正常的編碼；
接下來看看while循環(huán)的處理細(xì)節(jié)，我們先要將5個字節(jié)拼成一個40位的二進(jìn)制，在程序中，我們通過位移運(yùn)算和 | 或運(yùn)算得到一個long型的數(shù)字，當(dāng)然它的二進(jìn)制就是我們用5個字節(jié)拼成的。
這里有個坑要和大家說明一下，我們第一個字節(jié)位移的時候用long轉(zhuǎn)型了，為什么？因?yàn)閕nt型在Java中占4個字節(jié)，32位，我們左移32位后，它會回到最右側(cè)的位置。而long占64位，我們左移32位是不會循環(huán)的。這一點(diǎn)大家要格外注意。
接下來就是將這40位的二進(jìn)制進(jìn)行分拆，同樣通過位移操作，每次從左側(cè)截取5位，我們分別向右移動35、30、25、20、15、10、5、0，然后將其和0x1f進(jìn)行與操作，0x1f是一個16進(jìn)制的數(shù)，其二進(jìn)制是0001 1111，對了，就是5個1，移位后和0x1f進(jìn)行與操作，只留取最右側(cè)的5位二進(jìn)制，并計(jì)算其數(shù)值，然后從32位編碼表中找到對應(yīng)的字符。

可以正常編碼的部分就正常結(jié)束了，大家要多多理解位移符號的運(yùn)用。接下來，我們再看看結(jié)尾字節(jié)的處理。先上代碼：

if (fillLength > 0) {
  switch (fillLength) {
    case 1:
      int normalBits1 = (src[srcPos] & 0xff) << 24 |
        (src[srcPos+1] & 0xff) << 16 |
        (src[srcPos+2] & 0xff) << 8  |
        (src[srcPos+3] & 0xff);
      result[resultPos++] = (byte) toBase32[(normalBits1 >> 27) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits1 >> 22) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits1 >> 17) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits1 >> 12) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits1 >> 7) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits1 >> 2) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits1 << 3) & 0x1f];
      result[resultPos++] = '=';
      break;
    case 2:
      int normalBits2 = (src[srcPos] & 0xff) << 16 |
        (src[srcPos+1] & 0xff) << 8 |
        (src[srcPos+2] & 0xff);
      result[resultPos++] = (byte) toBase32[(normalBits2 >> 19) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits2 >> 14) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits2 >> 9) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits2 >> 4) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits2 << 1) & 0x1f];
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      break;
    case 3:
      int normalBits3 = (src[srcPos] & 0xff) << 8 |
        (src[srcPos+1] & 0xff);
      result[resultPos++] = (byte) toBase32[(normalBits3 >> 11) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits3 >> 6) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits3 >> 1) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits3 << 4) & 0x1f];
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      break;
    case 4:
      int normalBits4 = (src[srcPos] & 0xff) ;
      result[resultPos++] = (byte) toBase32[(normalBits4 >> 3) & 0x1f];
      result[resultPos++] = (byte) toBase32[(normalBits4 << 2) & 0x1f];
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      result[resultPos++] = '=';
      break;
  }
}

fillLength就是需要補(bǔ)位的位數(shù)，如果等于0，我們就不需要補(bǔ)位了。大于0就需要進(jìn)行補(bǔ)位。
需要補(bǔ)位的情況，我們分為4種，分別為：補(bǔ)1位、補(bǔ)2位、補(bǔ)3位和補(bǔ)4位。
我嗯先看看補(bǔ)1位的情況，需要補(bǔ)1位，說明之前剩下4個字節(jié)，我們先將這4個字節(jié)拼起來，那么第一個字節(jié)要向左移動24位，這個和正常情況下第一個字節(jié)向左移動的位數(shù)是不一樣的。剩余的字節(jié)分別向左移動相應(yīng)的位數(shù)，大家可以參照程序計(jì)算一下。
然后將得到的32位二進(jìn)制數(shù)，從最高位每次截取5位，每次向右移動位數(shù)分別為27、22、17、12、7、2，注意，最后剩下2位，不足5位，我們要向左移動3位。移位后要和0x1f進(jìn)行與操作，這個作用和前面是一樣的，這里不贅述了。然后將得到的數(shù)字在32位編碼表中，去除對應(yīng)的字符。
剩下的位數(shù)我們統(tǒng)一使用=進(jìn)行補(bǔ)位。
其他的需要補(bǔ)1位、補(bǔ)2位和補(bǔ)3位的情況，我們重復(fù)步驟3-步驟5，里邊具體的移動位數(shù)有所區(qū)別，需要大家仔細(xì)計(jì)算。

整個的編碼過程到這里就結(jié)束了，我們將result數(shù)組返回即可。

到此，關(guān)于“如何實(shí)現(xiàn)Base64與Base32”的學(xué)習(xí)就結(jié)束了，希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí)，快去試試吧！若想繼續(xù)學(xué)習(xí)更多相關(guān)知識，請繼續(xù)關(guān)注億速云網(wǎng)站，小編會繼續(xù)努力為大家?guī)砀鄬?shí)用的文章！

向AI問一下細(xì)節(jié)

如何實(shí)現(xiàn)Base64與Base32

Base64是干什么用的

Base32是什么規(guī)則

寫程序階段

Base32編碼

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽