您好,登錄后才能下訂單哦!
編碼的發(fā)展過程:
美國ASCII碼:1個(gè)字節(jié)
↓
各國編碼,如中國GB2312編碼:2個(gè)字節(jié)
↓
統(tǒng)一編碼:Unicode 通常為2個(gè)字節(jié),字節(jié)固定,浪費(fèi)
↓
UTF-8:將Unicode的字節(jié) 自動(dòng)縮減合適字節(jié)存儲(chǔ),字母為1個(gè)字節(jié),普通漢字為3個(gè)字節(jié)
字符 | ASCII | Unicode | UTF-8 |
---|---|---|---|
A | 01000001 | 00000000 01000001 | 01000001 |
中 | 無 | 01001110 00101101 | 11100100 10111000 10101101 |
此表格參考:https://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001386819196283586a37629844456ca7e5a7faa9b94ee8000
ASCII字符與數(shù)字轉(zhuǎn)換:
#!/usr/bin/python
a = 65;
print ord('a'); #字符轉(zhuǎn)數(shù)字
print chr(a); #數(shù)字轉(zhuǎn)字符
漢字字符輸出:
#!/usr/bin/python
# -*- coding: utf-8 -*- ##告訴Python解釋器,按照UTF-8編碼讀取源代碼
print u'文'; #u'...' 用unicode編碼字符輸出
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。