溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因

發(fā)布時(shí)間:2021-09-18 12:52:12 來(lái)源:億速云 閱讀:90 作者:chen 欄目:MySQL數(shù)據(jù)庫(kù)

這篇文章主要介紹“mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因”,在日常操作中,相信很多人在mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!

mysql中存入數(shù)據(jù)時(shí)發(fā)生的編碼轉(zhuǎn)換過(guò)程:
1、在終端(Terminal,可以是bash窗口,也可以是客戶端工具如navicat)中輸入,輸入的內(nèi)容由Terminal根據(jù)其自己的字符進(jìn)行編碼。
2、經(jīng)Terminal編碼后的二進(jìn)制流被傳輸?shù)絤ysql server。mysql server(mysql engine)根據(jù)參數(shù)character_set_client的字符設(shè)置來(lái)對(duì)該二進(jìn)制流進(jìn)行解碼。
3、解碼之后,mysql server再次根據(jù)目的表,即table的字符集來(lái)判斷是否需要字符編碼轉(zhuǎn)換。如果character_set_client的字符設(shè)置和table定義時(shí)的character設(shè)置一致,則無(wú)需字符編碼轉(zhuǎn)換。否則進(jìn)行轉(zhuǎn)換,然后將轉(zhuǎn)換后的二進(jìn)制流存放到數(shù)據(jù)文件(file)中去。
總結(jié):client ------> server(engine) -----> file     需要經(jīng)過(guò)三次編碼,兩次編碼轉(zhuǎn)化。

mysql中取出數(shù)據(jù)時(shí)發(fā)生的編碼轉(zhuǎn)換過(guò)程:
1、從數(shù)據(jù)文件(file)中讀出二進(jìn)制數(shù)據(jù)流,將該數(shù)據(jù)流根據(jù)table定義時(shí)的character設(shè)置來(lái)進(jìn)行解碼。
2、在用table character對(duì)二級(jí)制數(shù)據(jù)流進(jìn)行解碼之后,在mysql engine(mysql server)中,需要根據(jù)參數(shù)character_set_client的字符集設(shè)置對(duì)解碼后的數(shù)據(jù)庫(kù)流再一次進(jìn)行編碼,將編碼之后的二級(jí)制數(shù)據(jù)庫(kù)流傳輸?shù)絚lient端。
3、client端,即終端(Terminal)根據(jù)其自己的字符集編碼來(lái)展示查詢結(jié)果。
總結(jié):  file ------> server(engine) -----> client  需要經(jīng)過(guò)三次編碼,兩次編碼轉(zhuǎn)化。

可能會(huì)有些疑問(wèn),在上面的分析中,數(shù)據(jù)都是以二進(jìn)制流的方式在各個(gè)節(jié)點(diǎn)之間流動(dòng)的。那么為什么需要編碼轉(zhuǎn)化了?
1、client 和 server(engine) 之間的轉(zhuǎn)換,或者說(shuō)編解碼是為了對(duì)傳進(jìn)來(lái)的二進(jìn)制流做語(yǔ)法和詞法解析,否則你不會(huì)知道傳進(jìn)來(lái)的是insert還是update。
2、file 和 server(engine) 之間的轉(zhuǎn)換是為了在從數(shù)據(jù)文件讀入數(shù)據(jù)后,在存儲(chǔ)引擎內(nèi)部進(jìn)行字符級(jí)別的操作。

經(jīng)過(guò)以上分析,應(yīng)該很快發(fā)現(xiàn)導(dǎo)致亂碼出現(xiàn)的原因是有以下幾種:
1、數(shù)據(jù)在存入的時(shí)候和取出的時(shí)候,編碼不一致。比如存入時(shí)用的utf8,取出時(shí)用的GBK。
2、編碼轉(zhuǎn)換不是無(wú)損編碼轉(zhuǎn)換導(dǎo)致亂碼出現(xiàn)。比如clien是utf8,mysql server中的character_set_client設(shè)置為gbk,表結(jié)構(gòu)的字符集設(shè)置為utf8。這里會(huì)有兩次編碼轉(zhuǎn)化,client到server時(shí),utf8要轉(zhuǎn)為gbk,然后server到file時(shí),gbk要轉(zhuǎn)為utf8。由于gbk到utf8是有損編碼轉(zhuǎn)化,導(dǎo)致了亂碼出現(xiàn)。

無(wú)損編碼轉(zhuǎn)換:假設(shè)我們要把用編碼A表示的字符X,轉(zhuǎn)化為編碼B的表示形式,而編碼B的字形集中并沒(méi)有X這個(gè)字符,那么此時(shí)我們就稱這個(gè)轉(zhuǎn)換是有損的。
但不是任何兩種字符集編碼之間的轉(zhuǎn)換都是有損,轉(zhuǎn)換是否有損取決于以下幾點(diǎn):
------被轉(zhuǎn)換的字符是否同時(shí)在兩個(gè)字符集中
------標(biāo)字符集是否能夠?qū)Σ恢С肿址?,保留其原有表達(dá)形式。(比如latin1在遇到自己無(wú)法表示的字符時(shí),會(huì)保留原字符集的編碼數(shù)據(jù),并跳過(guò)忽略該字符進(jìn)而處理后面的數(shù)據(jù)。)

因此只要客戶端,MySQL Server的character-set-client,table charset的三個(gè)字符集完全一致就可以保證一定不會(huì)有亂碼出現(xiàn)了。

到此,關(guān)于“mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI