溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

python換編碼的方法

發(fā)布時(shí)間:2020-08-03 11:31:48 來源:億速云 閱讀:140 作者:清晨 欄目:編程語言

這篇文章將為大家詳細(xì)講解有關(guān)python換編碼的方法,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。


1:Python和unicode

為了正確處理多語言文本,Python在2.0版后引入了Unicode字符串。

2:python中的print

雖然python內(nèi)部需要將文本編碼轉(zhuǎn)換為unicode編碼來處理,而終端顯示工作則由傳統(tǒng)的Python字符串完成(實(shí)際上,Python的print

語句根本無法打印出雙字節(jié)的Unicode編碼字符)。

python的print會(huì)對(duì)輸出的unicode編碼(對(duì)其它非unicode編碼,print會(huì)原樣輸出)做自動(dòng)的編碼轉(zhuǎn)換(輸出到控制臺(tái)時(shí)),而文件對(duì)象

的write方法就不會(huì)做,因此,當(dāng)一些字符串用print輸出正常時(shí),write到文件確不一定和print的一樣。

在linux下是按照環(huán)境變量來轉(zhuǎn)換的,在linux下使用locale命令就可以看到。print語句它的實(shí)現(xiàn)是將要輸出的內(nèi)容傳送了操作系統(tǒng),操作

系統(tǒng)會(huì)根據(jù)系統(tǒng)的編碼對(duì)輸入的字節(jié)流進(jìn)行編碼。

>>>str='學(xué)習(xí)python'
>>> str
'\xe5\xad\xa6\xe4\xb9\xa0python' #asII編碼
>>> print str
學(xué)習(xí)python
>>> str=u'學(xué)習(xí)python'
>>> str ####unicode編碼
'\xe5u\xad\xa6\xe4\xb9\xa0python'


3: python中的decode
將其他字符集轉(zhuǎn)化為unicode編碼(只有中文字符才需要轉(zhuǎn)換)

>>> str='學(xué)習(xí)'
>>> ustr=str.decode('utf-8')
>>> ustr
u'\u5b66\u4e60'

這樣就對(duì)中文字符進(jìn)行了編碼轉(zhuǎn)換,可用python進(jìn)行后續(xù)的處理;(如果不轉(zhuǎn)換的話,python會(huì)根據(jù)機(jī)器的環(huán)境變量進(jìn)行默認(rèn)的編碼轉(zhuǎn)換,這樣就可能出現(xiàn)亂碼)
4:python中的encode
將unicode轉(zhuǎn)化為其它字符集

>>> str='學(xué)習(xí)'
>>> ustr=str.decode('utf-8')
>>> ustr
u'\u5b66\u4e60'
>>> ustr.encode('utf-8')
'\xe5\xad\xa6\xe4\xb9\xa0'
>>> print ustr.encode('utf-8')

關(guān)于python換編碼的方法就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI