溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

HTML頁面編碼charset選擇的示例分析

發(fā)布時間:2022-02-24 10:57:46 來源:億速云 閱讀:139 作者:小新 欄目:web開發(fā)

這篇文章主要介紹了HTML頁面編碼charset選擇的示例分析,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

一、編碼重要性

編碼可招致閱讀者經(jīng)由過程IE時分網(wǎng)頁亂碼,也可導致div+css的兼容性Hack。

二、編碼的位子

通常這段網(wǎng)頁編碼放在html網(wǎng)頁中的<head>和</head>兩頭。
HTML頁面編碼charset選擇的示例分析
 

三、html編碼格局

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

顛末竄改charset=utf-8中的utf-8即可以篡改網(wǎng)頁的編碼。
一般我們在寫CSS文件時候也需要在CSS文件頂部應用@charset "utf-8";來界說此CSS文件編碼類型。一般html源代碼和css文件編碼要抗衡,假定不對抗會招致CSS hack,頁面亂碼網(wǎng)頁頁面排版亂等兼容問題。

四、常用html編碼種類

外洋常用的盛行的有utf-8、gb2312這兩種。通常這兩品種型就能滿足國內(nèi)網(wǎng)頁編碼需求。固然法度模范與數(shù)據(jù)庫中也會用到這兩種編碼類型來處理網(wǎng)頁和存儲數(shù)據(jù)類型。

五、UTF-8 有一下個性:

  1. UCS 字符 U+0000 到 U+007F (ASCII) 被編碼為字節(jié) 0x00 到 0x7F (ASCII 兼容). 這意味著只征求 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 兩種編碼方式下是同樣的.

  2. 全體 >U+007F 的 UCS 字符被編碼為一個多個字節(jié)的串, 每個字節(jié)都有標識表記標幟位集. 因而, ASCII 字節(jié) (0x00-0x7F) 不成能作為任何其他字符的一一小部分.

  3. 表現(xiàn)非 ASCII 字符的多字節(jié)串的第一個字節(jié)總是在 0xC0 到 0xFD 的范疇里, 并指出這個字符包含幾何個字節(jié). 多字節(jié)串的另外字節(jié)都在 0x80 到 0xBF 領域里. 這使得從新同步尤為容易, 并使編碼無邦畿, 且很少受迷失字節(jié)的影響.

  4. 可以編入全數(shù)或者的 231個 UCS 代碼

  5. UTF-8 編碼字符實際上可以至多到 6 個字節(jié)長, 然而 16 位 BMP 字符最多只用到 3 字節(jié)長.

  6. Bigendian UCS-4 字節(jié)串的布列順序是預約的.

  7. 字節(jié) 0xFE 和 0xFF 在 UTF-8 編碼中從未用到.

六、GB2312 有下列特性

GB2312尺度共收錄6763個漢字,此中一級漢字3755個,二級漢字3008個;同時,GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片化名字母、俄羅斯語西里爾字母在內(nèi)的682個全形字符。

GB2312的泛起,根底滿足了漢字的計較機措置需要,它所收錄的漢字已經(jīng)覆蓋99.75%的使用頻率。GB2312中對所收漢字發(fā)展了“分區(qū)”處理,每區(qū)含有94個漢字/符號。這種閃現(xiàn)方式也喻為區(qū)位碼。

01-09區(qū)為非凡符號。

16-55區(qū)為一級漢字,按拼音排序。

56-87區(qū)為二級漢字,按部首/筆劃排序。

10-15區(qū)及88-94區(qū)則未有編碼。

舉例來說,“啊”字是GB2312當中的第一個漢字,它的區(qū)位碼便是1601。字節(jié)布局在使用GB2312的法式中,通常接納EUC貯存門徑,以便兼容于ASCII。每個漢字及符號以兩個字節(jié)來顯現(xiàn)。第一個字節(jié)喻為“高位字節(jié)”,第二個字節(jié)稱為“低位字節(jié)”。 “高位字節(jié)”運用了0xA1-0xF7(把01-87區(qū)的區(qū)號加上0xA0),“低位字節(jié)”使用了0xA1-0xFE(把01-94加上0xA0)。譬喻“啊”字在大多數(shù)法度模范中,會以0xB0A1貯存。(與區(qū)位碼相比:0xB0=0xA0+16,0xA1=0xA0+1)。

所以GB2312編碼中漢字區(qū)碼的十進制是從176到247,位碼是從161到255.之以是存儲了6763小于82*94=6768,是因為在區(qū)碼為215,位碼為250-254之間共五個編碼不有漢字編碼,以是6768-5=6763個。

GB2312編碼可以通俗認識為國外普片的說話。

七、保舉charset使用編碼

UTF-8可以通俗分明簡體繁體可用此編碼如臺灣和要地本地運用此編碼。

八、因編碼導致網(wǎng)頁兼容過失標題問題:

假如編碼混排將使網(wǎng)頁亂碼也叫不兼容,額定是在CSS表明中運用了編碼混排將導致css hack。

感謝你能夠認真閱讀完這篇文章,希望小編分享的“HTML頁面編碼charset選擇的示例分析”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學習!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI