溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python字符編碼

發(fā)布時(shí)間:2020-07-08 02:01:42 來源:網(wǎng)絡(luò) 閱讀:557 作者:assembl 欄目:編程語言

字符編碼

一、ascii碼:

基于拉丁字母的一套電腦編碼系統(tǒng),主要用于顯示現(xiàn)代英語和其他西歐語言,最多只能用8位標(biāo)識(shí),即2**8=256-1,所以最多只能表示255個(gè)字符。
python字符編碼

計(jì)算機(jī)沿用中國,中文顯然遠(yuǎn)大于255字符,必須要對(duì)中文進(jìn)行編碼

二、中文編碼

為處理漢字,程序設(shè)計(jì)用于簡體中文GB2132和繁體中文big5

GB2312(1980年) 共7445個(gè)字符,包括6763個(gè)漢字和682個(gè)其它符號(hào),
GBK1.0(1995年)收錄了21886個(gè)符號(hào),它分為漢字區(qū)和圖形符號(hào)區(qū)。漢字區(qū)包括21003個(gè)字符
GB18030(2000)取代GBK1.0證實(shí)成為國家標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)收錄了27484個(gè)漢字,同時(shí)還收錄了藏文、蒙文、維吾爾文等主要的少數(shù)民族文字?,F(xiàn)在的PC平臺(tái)必須支持GB18030,對(duì)嵌入式產(chǎn)品暫不作要求。所以手機(jī)、MP3一般只支持GB2312。
總結(jié):1、從ASCII,GB2312,GBK到GB18030,編碼方法向下兼容。
2、中文版Windows的缺省內(nèi)碼還是GBK,可以通過GB18030升級(jí)包升級(jí)到GB18030

三、unicode碼

顯然ASCII碼無法將世界上的各種文字和符號(hào)全部表示,所以,就需要新出一種可以代表所有字符和符號(hào)的編碼,即:Unicode。它為每種語言中每個(gè)字符設(shè)定了統(tǒng)一并且唯一的二進(jìn)制編碼。最少2個(gè)字節(jié),可能更多

四、utf-8:

對(duì)Unicode編碼的壓縮和優(yōu)化,他不再使用最少使用2個(gè)字節(jié),而是將所有的字符和符號(hào)進(jìn)行分類:ascii碼中的內(nèi)容用1個(gè)字節(jié)保存、歐洲的字符用2個(gè)字節(jié)保存,東亞的字符用3個(gè)字節(jié)保存...

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI