溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Nodejs進(jìn)階之服務(wù)端字符編解碼和亂碼處理的示例分析

發(fā)布時(shí)間:2021-07-13 16:06:35 來(lái)源:億速云 閱讀:129 作者:小新 欄目:web開(kāi)發(fā)

這篇文章將為大家詳細(xì)講解有關(guān)Nodejs進(jìn)階之服務(wù)端字符編解碼和亂碼處理的示例分析,小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

寫(xiě)在前面

在web服務(wù)端開(kāi)發(fā)中,字符的編解碼幾乎每天都要打交道。編解碼一旦處理不當(dāng),就會(huì)出現(xiàn)令人頭疼的亂碼問(wèn)題。

不少?gòu)氖耼ode服務(wù)端開(kāi)發(fā)的同學(xué),由于對(duì)字符編碼碼相關(guān)知識(shí)了解不足,遇到問(wèn)題時(shí),經(jīng)常會(huì)一籌莫展,花大量的時(shí)間在排查、解決問(wèn)題。

文本先對(duì)字符編解碼的基礎(chǔ)知識(shí)進(jìn)行簡(jiǎn)單介紹,然后舉例說(shuō)明如何在node中進(jìn)行編解碼,最后是服務(wù)端的代碼案例。本文相關(guān)代碼示例可在這里找到。

關(guān)于字符編解碼

在網(wǎng)絡(luò)通信的過(guò)程中,傳輸?shù)亩际嵌M(jìn)制的比特位,不管發(fā)送的內(nèi)容是文本還是圖片,采用的語(yǔ)言是中文還是英文。

舉個(gè)例子,客戶端向服務(wù)端發(fā)送"你好"。

客戶端 --- 你好 ---> 服務(wù)端

這中間包含了兩個(gè)關(guān)鍵步驟,分別對(duì)應(yīng)的是編碼、解碼。

1.客戶端:將"你好"這個(gè)字符串,編碼成計(jì)算機(jī)網(wǎng)絡(luò)需要的二進(jìn)制比特位。

2.服務(wù)端:將接收到的二進(jìn)制比特位,解碼成"你好"這個(gè)字符串。

總結(jié)一下:

1.編碼:將需要傳送的數(shù)據(jù),轉(zhuǎn)成對(duì)應(yīng)的二進(jìn)制比特位。

2.解碼:將二進(jìn)制比特位,轉(zhuǎn)成原始的數(shù)據(jù)。

上面有些重要的技術(shù)細(xì)節(jié)沒(méi)有提到,答案在下一小節(jié)。

  • 客戶端怎么知道"你好"這個(gè)字符對(duì)應(yīng)的比特位是多少?

  • 服務(wù)端收到二進(jìn)制比特位之后,怎么知道對(duì)應(yīng)的字符串是什么?

關(guān)于字符集和字符編碼

上面提到字符、二進(jìn)制的轉(zhuǎn)換問(wèn)題。既然兩者可以互相轉(zhuǎn)換,也就是說(shuō)存在明確的轉(zhuǎn)換規(guī)則,可以實(shí)現(xiàn)字符<->二進(jìn)制的相互轉(zhuǎn)換。

這里提到的轉(zhuǎn)換規(guī)則,其實(shí)就是我們經(jīng)常聽(tīng)到的字符集&字符編碼。

字符集是一系列字符(文字、標(biāo)點(diǎn)符號(hào)等)的集合。字符集有很多,常見(jiàn)的有ASCII、Unicode、GBK等。不同字符集主要的區(qū)別在于包含字符個(gè)數(shù)的不同。

了解了字符集的概念后,接下來(lái)介紹下字符編碼。

字符集告訴我們支持哪些字符,但具體字符怎么編碼,是由字符編碼決定的。比如Unicode字符集,支持的字符編碼有UTF8(常用)、UTF16、UTF32。

概括一下:

  • 字符集:字符的集合,不同字符集包含的字符數(shù)不同。

  • 字符編碼:字符集中字符的實(shí)際編碼方式。

  • 一個(gè)字符集可能有多種字符編碼方式。

可以把字符編碼看成一個(gè)映射表,客戶端、服務(wù)端就是根據(jù)這個(gè)映射表,來(lái)實(shí)現(xiàn)字符跟二進(jìn)制的編解碼轉(zhuǎn)換。

舉個(gè)例子,"你"這個(gè)字符,在UTF8編碼中,占據(jù)三個(gè)字節(jié)0xe4 0xbd 0xa0,而在GBK編碼中,占據(jù)兩個(gè)字節(jié)0xc4 0xe3。

字符編解碼例子

上面已經(jīng)提到了字符編解碼所需的基礎(chǔ)知識(shí)。下面我們看一個(gè)簡(jiǎn)單的例子,這里借助了icon-lite這個(gè)庫(kù)來(lái)幫助我們實(shí)現(xiàn)編解碼的操作。

可以看到,在字符編碼時(shí),我們采用了gbk。在解碼時(shí),如果同樣采用gbk,可以得到原始的字符。而當(dāng)我們解碼時(shí)采用utf8時(shí),則出現(xiàn)了亂碼。

var iconv = require('iconv-lite');

var oriText = '你';

var encodedBuff = iconv.encode(oriText, 'gbk');
console.log(encodedBuff);
// <Buffer c4 e3>

var decodedText = iconv.decode(encodedBuff, 'gbk');
console.log(decodedText);
// 你

var wrongText = iconv.decode(encodedBuff, 'utf8');
console.log(wrongText);
// ??

實(shí)際例子:服務(wù)端編解碼

通常我們需要處理編解碼的場(chǎng)景有文件讀寫(xiě)、網(wǎng)絡(luò)請(qǐng)求處理。這里距網(wǎng)絡(luò)請(qǐng)求的例子,介紹如何在服務(wù)端進(jìn)行編解碼。

假設(shè)我們運(yùn)行著如下http服務(wù),監(jiān)聽(tīng)來(lái)自客戶端的請(qǐng)求??蛻舳藗鬏敂?shù)據(jù)時(shí)采用了gbk編碼,而服務(wù)端默認(rèn)采用的是utf8編碼。

如果此時(shí)采用默認(rèn)的utf8對(duì)請(qǐng)求進(jìn)行解碼,就會(huì)出現(xiàn)亂碼,因此需要特殊處理。

服務(wù)端代碼如下(為簡(jiǎn)化代碼,這里跳過(guò)了請(qǐng)求方法、請(qǐng)求編碼的判斷)

var http = require('http');
var iconv = require('iconv-lite');

// 假設(shè)客戶端采用post方法,編碼為gbk
var server = http.createServer(function (req, res) {
  var chunks = [];
  
  req.on('data', function (chunk) {
    chunks.push(chunk)
  });

  req.on('end', function () {
    chunks = Buffer.concat(chunks);

    // 對(duì)二進(jìn)制進(jìn)行解碼
    var body = iconv.decode(chunks, 'gbk');
    console.log(body);

    res.end('HELLO FROM SERVER');
  });

});

server.listen(3000);

對(duì)應(yīng)的客戶端代碼如下:

var http = require('http');
var iconv = require('iconv-lite');

var charset = 'gbk';

// 對(duì)字符"你"進(jìn)行編碼
var reqBuff = iconv.encode('你', charset);

var options = {
  hostname: '127.0.0.1',
  port: '3000',
  path: '/',
  method: 'POST',
  headers: {
    'Content-Type': 'text/plain',
    'Content-Encoding': 'identity',
    'Charset': charset // 設(shè)置請(qǐng)求字符集編碼
  }
};

var client = http.request(options, function(res) {
  res.pipe(process.stdout);
});

client.end(reqBuff);

關(guān)于“Nodejs進(jìn)階之服務(wù)端字符編解碼和亂碼處理的示例分析”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI