溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

處理Python字符編碼轉(zhuǎn)換的方法是什么

發(fā)布時間:2020-09-01 10:45:52 來源:億速云 閱讀:243 作者:小新 欄目:編程語言

這篇文章主要介紹了處理Python字符編碼轉(zhuǎn)換的方法是什么,具有一定借鑒價值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。

python 有str object 和 unicode object 兩種字符串, 都可以存放字符的字節(jié)編碼,但是他們是不同的type,這一點很重要,也是為什么會有encode 和decode。

encode 和 decode在pyhton 中的意義可表示為

encode將

unicode-----> str

decode

unicode <-------str

幾種常用法:

str_string.decode('codec') 是把str_string轉(zhuǎn)換為unicode_string, codec是源str_string的編碼方式

unicode_string.encode('codec') 是把unicode_string 轉(zhuǎn)換為str_string,codec是目標(biāo)str_string的編碼方式

str_string.decode('from_codec').encode('to_codec') 可實現(xiàn)不同編碼的str_string之間的轉(zhuǎn)換

比如:

>>> t='長城'
>>> t
'\xb3\xa4\xb3\xc7'
>>> t.decode('gb2312').encode('utf-8')
'\xe9\x95\xbf\xe5\x9f\x8e'

str_string.encode('codec') 是先調(diào)用系統(tǒng)的缺省codec去把str_string轉(zhuǎn)換為unicode_string,然后用encode的參數(shù)codec去轉(zhuǎn)換為最終的str_string. 相當(dāng)于str_string.decode('sys_codec').encode('codec')。

unicode_string.decode('codec') 基本沒有意義,unicode 在python里只用一種unicode編碼,UTF16或者UTF32(編譯python時就已經(jīng)確定),沒有編碼轉(zhuǎn)換的需要。 

注:缺省codec在site-packages下的sitecustomize.py文件中指定,比如

import sys

sys.setdefaultencoding('utf-8')

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享處理Python字符編碼轉(zhuǎn)換的方法是什么內(nèi)容對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,遇到問題就找億速云,詳細(xì)的解決方法等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI