您好,登錄后才能下訂單哦!
本文將為大家詳細介紹“注意HTML中語言編碼的重要性”,內(nèi)容步驟清晰詳細,細節(jié)處理妥當,而小編每天都會更新不同的知識點,希望這篇“注意HTML中語言編碼的重要性”能夠給你意想不到的收獲,請大家跟著小編的思路慢慢深入,具體內(nèi)容如下,一起去收獲新知識吧。
1、簡易性:超級文本標記語言版本升級采用超集方式,從而更加靈活方便,適合初學前端開發(fā)者使用。 2、可擴展性:超級文本標記語言的廣泛應用帶來了加強功能,增加標識符等要求,超級文本標記語言采取子類元素的方式,為系統(tǒng)擴展帶來保證。 3、平臺無關性:超級文本標記語言能夠在廣泛的平臺上使用,這也是萬維網(wǎng)盛行的一個原因。 4、通用性:HTML是網(wǎng)絡的通用語言,它允許網(wǎng)頁制作人建立文本與圖片相結(jié)合的復雜頁面,這些頁面可以被網(wǎng)上任何其他人瀏覽到,無論使用的是什么類型的電腦或瀏覽器。
注意HTML的語言編碼的重要性
一、編碼重要性
編碼可導致瀏覽者通過IE時候網(wǎng)頁亂碼,也可導致p+css的兼容性Hack。
二、編碼的位置
一般這段網(wǎng)頁編碼放在html網(wǎng)頁中的<head>和</head>中間。
三、html編碼樣式
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
通過改變charset=utf-8中的utf-8就可以改變網(wǎng)頁的編碼。
一般我們在寫CSS文件時候也需要在CSS文件頂部使用@charset "utf-8";來定義此CSS文件編碼類型。一般html源代碼和css文件編碼要統(tǒng)一,如果不統(tǒng)一會導致CSS hack,頁面亂碼網(wǎng)頁頁面排版亂等兼容問題。
四、常用html編碼種類
國內(nèi)常用的流行的有utf-8、gb2312這兩種。一般這兩種類型就能滿足國內(nèi)網(wǎng)頁編碼需求。當然程序和數(shù)據(jù)庫中也會用到這兩種編碼類型來處理網(wǎng)頁和存儲數(shù)據(jù)類型。
五、UTF-8 有一下特性:
UCS 字符 U+0000 到 U+007F (ASCII) 被編碼為字節(jié) 0x00 到 0x7F (ASCII 兼容). 這意味著只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 兩種編碼方式下是一樣的.
所有 >U+007F 的 UCS 字符被編碼為一個多個字節(jié)的串, 每個字節(jié)都有標記位集. 因此, ASCII 字節(jié) (0x00-0x7F) 不可能作為任何其他字符的一部分.
表示非 ASCII 字符的多字節(jié)串的第一個字節(jié)總是在 0xC0 到 0xFD 的范圍里, 并指出這個字符包含多少個字節(jié). 多字節(jié)串的其余字節(jié)都在 0x80 到 0xBF 范圍里. 這使得重新同步非常容易, 并使編碼無國界, 且很少受丟失字節(jié)的影響.
可以編入所有可能的 231個 UCS 代碼
UTF-8 編碼字符理論上可以最多到 6 個字節(jié)長, 然而 16 位 BMP 字符最多只用到 3 字節(jié)長.
Bigendian UCS-4 字節(jié)串的排列順序是預定的.
字節(jié) 0xFE 和 0xFF 在 UTF-8 編碼中從未用到.
六、GB2312 有以下特性
GB2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄羅斯語西里爾字母在內(nèi)的682個全形字符。
GB2312的出現(xiàn),基本滿足了漢字的計算機處理需要,它所收錄的漢字已經(jīng)覆蓋99.75%的使用頻率。GB2312中對所收漢字進行了“分區(qū)”處理,每區(qū)含有94個漢字/符號。這種表示方式也稱為區(qū)位碼。
01-09區(qū)為特殊符號。
16-55區(qū)為一級漢字,按拼音排序。
56-87區(qū)為二級漢字,按部首/筆畫排序。
10-15區(qū)及88-94區(qū)則未有編碼。
舉例來說,“啊”字是GB2312之中的第一個漢字,它的區(qū)位碼就是1601。字節(jié)結(jié)構(gòu)在使用GB2312的程序中,通常采用EUC儲存方法,以便兼容于ASCII。每個漢字及符號以兩個字節(jié)來表示。第一個字節(jié)稱為“高位字節(jié)”,第二個字節(jié)稱為“低位字節(jié)”。 “高位字節(jié)”使用了0xA1-0xF7(把01-87區(qū)的區(qū)號加上0xA0),“低位字節(jié)”使用了0xA1-0xFE(把01-94加上0xA0)。例如“啊”字在大多數(shù)程序中,會以0xB0A1儲存。(與區(qū)位碼對比:0xB0=0xA0+16,0xA1=0xA0+1)。
所以GB2312編碼中漢字區(qū)碼的十進制是從176到247,位碼是從161到255.之所以存儲了6763小于82*94=6768,是因為在區(qū)碼為215,位碼為250-254之間共五個編碼沒有漢字編碼,所以6768-5=6763個。
GB2312編碼可以通俗理解為國內(nèi)通用的語言。
七、推薦charset使用編碼
UTF-8可以通俗理解簡體繁體可用此編碼如臺灣和內(nèi)地使用此編碼。
八、因編碼導致網(wǎng)頁兼容錯誤問題
如果編碼混排將使網(wǎng)頁亂碼也叫不兼容,特別是在CSS注釋中使用了編碼混排將導致css hack。
如果你能讀到這里,小編希望你對“注意HTML中語言編碼的重要性”這一關鍵問題有了從實踐層面最深刻的體會,具體使用情況還需要大家自己動手實踐使用過才能領會,如果想閱讀更多相關內(nèi)容的文章,歡迎關注億速云行業(yè)資訊頻道!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。