溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python開發(fā)中的編碼方式怎么對比使用

發(fā)布時間:2020-11-30 09:44:34 來源:億速云 閱讀:170 作者:小新 欄目:編程語言

這篇文章將為大家詳細(xì)講解有關(guān)python開發(fā)中的編碼方式怎么對比使用,小編覺得挺實(shí)用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

編碼方式的歷史大致為ASCII ->gb2312->unicode->utf-8,期間具體詳細(xì)信息感興趣的可以去做一些查詢,正因?yàn)榇嬖谶@樣的過渡,因此對同一模塊的不同使用,需要我們?nèi)ミM(jìn)行有選擇性的挑選使用,因此,這就衍生出了我們今天的主題,怎么去對比使用這些存在的編碼方式。

來個編碼解碼的小例子先,記住中文可以進(jìn)行GBK和utf-8編碼,在GBk一個中文字符對應(yīng)兩個字節(jié),在utf-8一個中文字符對應(yīng)三個字節(jié),中文不能進(jìn)行ASCII編碼。

>>> '爬森'.encode('GBK')
b'\xc1\xf5\xc8\xf3\xc9\xad'
>>> '爬森'.encode('ascii')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
>>> 'Runsen'.encode('ascii')
b'Runsen'
>>> "爬森".encode('utf-8')
b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae'
>>> '爬森'.encode('GBK').decode('GBK')
'爬森'
>>> '爬森'.encode('GBK').decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte

關(guān)于python開發(fā)中的編碼方式怎么對比使用就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI