溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

URL地址中的中文亂碼怎么解決

發(fā)布時(shí)間:2021-08-26 17:54:30 來源:億速云 閱讀:263 作者:chen 欄目:編程語言

本篇內(nèi)容主要講解“URL地址中的中文亂碼怎么解決”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“URL地址中的中文亂碼怎么解決”吧!

1.  問題的引出
   在Restful的服務(wù)設(shè)計(jì)中,查詢某些信息的時(shí)候,一般的URL地址設(shè)計(jì)為: get /basic/service? keyword=歷史 , 之類的URL地址。 但是,在實(shí)際的開發(fā)和使用中,確是有亂碼情況的發(fā)生,在后臺的讀取keyword信息為亂碼,無法正確讀取。
2. 亂碼是如何產(chǎn)生的?
   由于我們利用URL傳遞參數(shù)這種方式是依賴與瀏覽器環(huán)境中的,也就是說URL及URL中包含的各個(gè)key=value格式的傳遞參數(shù)鍵值對參數(shù)是在瀏覽器地址欄中的處理原理處理相應(yīng)編碼后傳遞至后臺進(jìn)行解碼的。
  由于我們沒有進(jìn)行任何處理,此時(shí)javascript請求URL并傳參數(shù)存在中文時(shí)(也就是說輸入框中輸入中文時(shí)),對URL的中文參數(shù)進(jìn)行編碼是按照瀏覽器機(jī)制進(jìn)行編碼的。此時(shí)編碼存在亂碼問題。
3. 初次編碼, javascript中利用encodeURI()方法進(jìn)行編碼。
   利用encodeURI()在javascript中對中文URL參數(shù)進(jìn)行編碼時(shí),“測試”二字會被轉(zhuǎn)換為“%E6%B5%8B%E8%AF%95”。 但是問題依然存在。原因是在編碼后的字符串信息,瀏覽器機(jī)制會認(rèn)為“%”是一個(gè)轉(zhuǎn)義字符,瀏覽器會把地址欄URL中的傳遞的已轉(zhuǎn)換參數(shù)“%”與“%”之間 的已轉(zhuǎn)義字符進(jìn)行處理傳遞到后臺中。這樣會造成與實(shí)際經(jīng)過encodeURI()編碼后的URL不符,因?yàn)闉g覽器誤認(rèn)為“%”是轉(zhuǎn)義字符字符了,它并未將 “%”認(rèn)為是個(gè)普通字符。
4. 二次編碼,使用encodeURI
   操作: 

1encodeURI(encodeURI("/order?name=" + name));

   處理后的URL不在是通過一次 encodeURI()轉(zhuǎn)換后的字符串”%E6%B5%8B%E8%AF%95“,而是經(jīng)過上一步兩層encodeURI()處理URL處理后的字符 串”%25E6%B255%258B%25E8%AF%2595“,通過再次編碼原有被瀏覽起解析為轉(zhuǎn)義字符的”%“被再次編碼,轉(zhuǎn)換成了普通字符 轉(zhuǎn)”%25“。 
     此時(shí)前端javascript代碼對帶有中文的URL編碼已經(jīng)完成,并通過URL傳遞參數(shù)的方式傳遞到后臺等待處理,Action獲取到正常轉(zhuǎn)換切無亂碼 的參數(shù)為”%25E6%B255%258B%25E8%AF%2595“,此字符串對應(yīng)的中文正是我們輸入的”測試“二字。
5. 后臺如何正確解析中文字符信息?
  進(jìn)入后臺的信息,在經(jīng)過二次encodeURI()之后,直接讀取是無法后去正確的信息的。 需要繼續(xù)如下處理:

1URLDecoder.decode("chinese string","UTF-8")

      URLDecoder的decode(String str,String ecn)方法有兩個(gè)參數(shù),第一個(gè)參數(shù)為待解碼的字符串,第二個(gè)參數(shù)為解碼時(shí)的對應(yīng)編碼。
6.   encodeURI, encodeURIComponent, escape
    6.1  escape()函數(shù)
    escape() 函數(shù)可對字符串進(jìn)行編碼,這樣就可以在所有的計(jì)算機(jī)上讀取該字符串。
   返回值:已編碼的 string 的副本。其中某些字符被替換成了十六進(jìn)制的轉(zhuǎn)義序列。
   說明 :該方法不會對 ASCII 字母和數(shù)字進(jìn)行編碼,也不會對下面這些 ASCII 標(biāo)點(diǎn)符號進(jìn)行編碼: - _ . ! ~ * ' ( ) 。其他所有的字符都會被轉(zhuǎn)義序列替換。所有的空格符、標(biāo)點(diǎn)符號、特殊字符以及其他非ASCII字符都將被轉(zhuǎn)化成%xx格式的字符編碼(xx等于該字符在字 符集表里面的編碼的16進(jìn)制數(shù)字)。比如,空格符對應(yīng)的編碼是%20。不會被此方法編碼的字符: @ * / +
  6.2 encodeURI() 方法
把URI字符串采用UTF-8編碼格式轉(zhuǎn)化成escape格式的字符串。不會被此方法編碼的字符:! @ # $& * ( ) = : / ; ? + '
 6.3  encodeURIComponent() 方法
    把URI字符串采用UTF-8編碼格式轉(zhuǎn)化成escape格式的字符串。與encodeURI()相比,這個(gè)方法將對更多的字符進(jìn)行編碼,比如 / 等字符。所以如果字符串里面包含了URI的幾個(gè)部分的話,不能用這個(gè)方法來進(jìn)行編碼,否則 / 字符被編碼之后URL將顯示錯(cuò)誤。
不會被此方法編碼的字符:! * ( ) '
    因此,對于中文字符串來說,如果不希望把字符串編碼格式轉(zhuǎn)化成UTF-8格式的(比如原頁面和目標(biāo)頁面的charset是一致的時(shí)候),只需要使用 escape。如果你的頁面是GB2312或者其他的編碼,而接受參數(shù)的頁面是UTF-8編碼的,就要采用encodeURI或者 encodeURIComponent。
7. 另一種處理URL的中文亂碼方案
    請求端的中字符有encodeURI進(jìn)行一次轉(zhuǎn)碼,如:

1var url="/ajax?name="+encodeURI(name);

   服務(wù)器端代碼:

1name=new String(name.getBytes("iso8859-1"),"UTF-8");

注: name為獲得的字符串,iso8859-1為項(xiàng)目的默認(rèn)字符編碼,如果為中文編碼gbk,gb2312等則不用這一步進(jìn)行處理.
  分析: 經(jīng)過程序驗(yàn)證,結(jié)果可行的。 由此可知,瀏覽器本身默認(rèn)的編碼方式是iso8859-1的方式,即使使用了encodeURI進(jìn)行了utf-8編碼處理,主要的字符串內(nèi)容,比如 ascii字符和可見字符都還是基于iso8859-1瀏覽器自身的字符。原因就是這些字符在編碼上和UTF-8字符串是重合的。而encodeURI之 類的轉(zhuǎn)義函數(shù)主要解決,特殊字符%,/之類的字符的轉(zhuǎn)義問題。

到此,相信大家對“URL地址中的中文亂碼怎么解決”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

url
AI