溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

網(wǎng)頁編碼不用gbk或者gb2312而用utf-8的原因分析

發(fā)布時(shí)間:2021-09-06 09:09:52 來源:億速云 閱讀:124 作者:小新 欄目:移動(dòng)開發(fā)

這篇文章給大家分享的是有關(guān)網(wǎng)頁編碼不用gbk或者gb2312而用utf-8的原因分析的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

能選擇的話還是應(yīng)該用UTF-8

事實(shí)上Windows系統(tǒng)自己的程序已經(jīng)全面轉(zhuǎn)向Unicode,而GBK只是為了應(yīng)付中國(guó)標(biāo)準(zhǔn)的權(quán)宜之計(jì)。

GBK的文字編碼是雙字節(jié)來表示的,即不論中、英文字符均使用雙字節(jié)來表示,只不過為區(qū)分中文,將其最高位都定成1。

至于UTF-8編碼則是用以解決國(guó)際上字符的一種多字節(jié)編碼,它對(duì)英文使用8位(即一個(gè)字節(jié)),中文使用24位(三個(gè)字節(jié))來編碼。對(duì)于英文字符較多的論壇則用UTF-8節(jié)省空間。 

GBK包含全部中文字符,

UTF-8則包含全世界所有國(guó)家需要用到的字符。

GBK是在國(guó)家標(biāo)準(zhǔn)GB2312基礎(chǔ)上擴(kuò)容后兼容GB2312的標(biāo)準(zhǔn)(好像還不是國(guó)家標(biāo)準(zhǔn))

UTF-8編碼的文字可以在各國(guó)各種支持UTF8字符集的瀏覽器上顯示。
比如,如果是UTF8編碼,則在外國(guó)人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。

所以,對(duì)于英文比較多的論壇 ,使用GBK則每個(gè)字符占用2個(gè)字節(jié),而使用UTF-8英文卻只占一個(gè)字節(jié)。

請(qǐng)注意:UTF-8版本雖然具有良好的國(guó)際兼容性,但中文需要比GBK/BIG5版本多占用50%的數(shù)據(jù)庫(kù)存儲(chǔ)空間,因此并非推薦使用,僅供對(duì)國(guó)際兼容性有特殊要求的用戶使用。

簡(jiǎn)單地說:
對(duì)于中文較多的論壇,適宜用GBK編碼節(jié)省數(shù)據(jù)庫(kù)空間。
對(duì)于英文較多的論壇,適宜用UTF-8節(jié)省數(shù)據(jù)庫(kù)空間。

gbk和gb2312的區(qū)別有哪些

首先大家要了解什么是gbk?什么是gb2312?我們要知道他們都是一種字符編碼,當(dāng)然字符編碼還有很多種。

而字符編碼我們可以這樣理解:

在計(jì)算機(jī)中存放的都是0和1的二進(jìn)制值。

8個(gè)位對(duì)應(yīng)一個(gè)字節(jié),常用16進(jìn)制來表示。

那么我們?nèi)绻胍谟?jì)算機(jī)上看到我們想要的字符顯示,而不是各種0和1的數(shù)字該怎么實(shí)現(xiàn)呢?

這里我們就需要使計(jì)算機(jī)把其所存儲(chǔ)的對(duì)應(yīng)的16進(jìn)制的數(shù)值,轉(zhuǎn)化為對(duì)應(yīng)的字符,包括英文和中文等其他語言的字符,然后輸出到屏幕上。

所以編碼也就是,定義了一套規(guī)則,去指定哪些數(shù)值,對(duì)應(yīng)著哪些字符。

那么字符編碼,就是定義了一套規(guī)則,指定了計(jì)算機(jī)中存放的這么多值中的哪個(gè)值,對(duì)應(yīng)了電腦屏幕顯示出來的哪個(gè)字母。

綜上所述,大家應(yīng)該都能理解GBK和GB2312是一種字符編碼了吧。

下面我們?cè)倬唧w說說他們的區(qū)別與相同點(diǎn):

相同點(diǎn):

1、GBK和GB2312 都是16位的!

2、它們通常用在網(wǎng)頁的meta標(biāo)簽內(nèi)。

不同點(diǎn):

1、GBK字符編碼支持簡(jiǎn)體中文和繁體中文!

GBK全稱《漢字內(nèi)碼擴(kuò)展規(guī)范》(GBK即“國(guó)標(biāo)”、“擴(kuò)展”漢語拼音的第一個(gè)字母,英文名稱:Chinese Internal Code Specification) ,中華人民共和國(guó)全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)1995年12月1日制訂,國(guó)家技術(shù)監(jiān)督局標(biāo)準(zhǔn)化司、電子工業(yè)部科技與質(zhì)量監(jiān)督司1995年12月15日聯(lián)合以技監(jiān)標(biāo)函1995 229號(hào)文件的形式,將它確定為技術(shù)規(guī)范指導(dǎo)性文件。

2、GB2312只支持簡(jiǎn)體中文!

《信息交換用漢字編碼字符集》是由中國(guó)國(guó)家標(biāo)準(zhǔn)總局1980年發(fā)布,1981年5月1日開始實(shí)施的一套國(guó)家標(biāo)準(zhǔn),標(biāo)準(zhǔn)號(hào)是GB 2312—1980。
GB 2312標(biāo)準(zhǔn)共收錄6763個(gè)漢字,其中一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè);同時(shí),GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內(nèi)的682個(gè)全角字符。

如果你的網(wǎng)頁主要面對(duì)使用漢語的中國(guó)人的話,使用 GB2312和GBK非常好,文字儲(chǔ)存體積要小,有一些優(yōu)點(diǎn)。如果你的網(wǎng)頁要面向世界的話,你再用GB2312和GBK作為網(wǎng)頁編碼的話,有些電腦上的瀏覽器沒有這種編碼,你的網(wǎng)頁漢字內(nèi)容就會(huì)變成無法識(shí)別的亂碼。

感謝各位的閱讀!關(guān)于“網(wǎng)頁編碼不用gbk或者gb2312而用utf-8的原因分析”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI