您好,登錄后才能下訂單哦!
前言
經(jīng)常有讀者在公眾號上問 JavaWeb 亂碼的問題,昨天又有一個小伙伴問及此事,其實這個問題很簡單,但是想要說清楚卻并不容易,因為每個人亂碼的原因都不一樣,給每位小伙伴都把亂碼的原因講一遍也挺費時間的,因此,松哥今天決定寫一篇文章,和大伙好好捋捋 JavaWeb 中的亂碼問題。
對于一些老司機而言,其實并不太容易遇到亂碼問題,但是對于一些新手來說,亂碼幾乎是家常便飯,而且每當亂碼時,網(wǎng)上搜了一大堆解決方案,發(fā)現(xiàn)自己的問題還是沒能解決,其實這就是平時研究代碼不求甚解導致的,亂碼問題,也要去分析,然后才能對癥下藥,才能藥到病除。
整體思路
首先出現(xiàn)亂碼之后,要先去確認亂碼的地方,當一個網(wǎng)頁上出現(xiàn)亂碼,有可能是瀏覽器顯示問題,也有可能是 Java 編碼問題,也有可能數(shù)據(jù)庫中的數(shù)據(jù)本身就是亂碼的,所以我們要做的第一件事就是確認亂碼發(fā)生的位置,縮小 bug 范圍,通過打印日志或者 debug 首先去確認亂碼發(fā)生的位置,然后再去進一步解決,一般來說,亂碼的原因大致上可以分為兩類:
請求亂碼,可能是因為參數(shù)放在 URL 地址中亂碼,也有可能是參數(shù)放在請求體中亂碼,不同傳參方案也對應了不同的亂碼解決方案。如果是響應亂碼,那么原因就會比較多了,一般來說,有如下幾種可能的原因:
對于不同的亂碼原因,會有不同的解決方案,對癥下藥,才能藥到病除,所以當出現(xiàn)亂碼時,大家要做的第一件事就是分析亂碼發(fā)生的原因,找到原因了,才能找到解決方案。
基本原則
發(fā)生亂碼是因為各自編碼不同導致的,所以,大家首先要有一個良好的開發(fā)習慣,項目編碼,文件編碼都要統(tǒng)一起來,松哥有個同事就因為 Freemarker 亂碼,找了半天沒找到原因,后來在松哥建議下修改了項目編碼,亂碼問題才解決了,一般來說,公司制度稍微成熟一些,都會對項目編碼,文件編碼有硬性規(guī)定的。在Eclipse 中,設置項目編碼方式如下(工程的編碼要提前設置,如果項目已經(jīng)開發(fā)一半再去設置,已有的中文就會亂碼):
Window->Preferences->General
然后對于 JSP 文件也需要提前設置好編碼方式,如下:
這是在 Eclipse 中設置文件編碼,如果是在 IntelliJ IDEA中,則不需要設置JSP文件編碼,因為默認就是 UTF-8,只需要提前設置下工程編碼即可:
除了開發(fā)工具的編碼,數(shù)據(jù)庫的編碼也要統(tǒng)一,一般來說,主要是設置一下數(shù)據(jù)庫的編碼和數(shù)據(jù)表的編碼,如下:
設置數(shù)據(jù)庫編碼:
CREATE DATABASE `vhr` DEFAULT CHARACTER SET utf8;
設置數(shù)據(jù)表編碼:
DROP TABLE IF EXISTS `adjustsalary`; CREATE TABLE `adjustsalary` ( `id` int(11) NOT NULL AUTO_INCREMENT, `eid` int(11) DEFAULT NULL, PRIMARY KEY (`id`), ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
這些是準備工作,這些工作做好了,還是有可能會遇到亂碼問題,接下來我們就具體問題具體分析。
請求亂碼
請求亂碼,就是說數(shù)據(jù)在瀏覽器中顯示是正常的,但是傳到 Java 后端之后,就亂碼了,這種亂碼一般來說,分為兩種:
兩種亂碼原因,對應了兩種不同的解決方案。分別來看。
URL 地址中的參數(shù)亂碼
這種亂碼主要發(fā)生在 GET 請求中,因為在 GET 請求中我們一般通過 URL 來傳遞參數(shù),這個問題可以在代碼中解決,但是太過于麻煩,因此一般我們直接在Tomcat配置中解決,修改 Tomcat的conf/server.xml 文件,修改 URL 編碼格式,如下:
這樣就可以搞定 URL 地址中的參數(shù)亂碼。
請求體中的參數(shù)亂碼
請求體中的參數(shù)亂碼,我們可以在解析參數(shù)之前通過設置 HttpServletRequest 的編碼來解決,如下:
request.setCharacterEncoding("UTF-8");
但是一樣也太過于麻煩,所以如果是普通的 Servlet/JSP 項目,我們就可以直接定義一個過濾器來處理,如下:
public class EncodingFilter implements Filter { @Override public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException { request.setCharacterEncoding("UTF-8"); chain.doFilter(request, response); } }
過濾器配置:
<filter> <filter-name>encodingFilter</filter-name> <filter-class>org.sang.filter.EncodingFilter</filter-class> </filter> <filter-mapping> <filter-name>encodingFilter</filter-name> <url-pattern>/*</url-pattern> </filter-mapping>
在工程編碼和JSP/HTML編碼都沒問題的情況下,請求亂碼基本上就是這兩種情況。
響應亂碼
如果在瀏覽器上加載頁面看到了亂碼,大家首先要確認在從服務端往瀏覽器寫數(shù)據(jù)的前一刻,這個數(shù)據(jù)還沒有亂碼(即數(shù)據(jù)庫中查詢出來的數(shù)據(jù)是OK的,沒有發(fā)生亂碼的問題),那么對于這種亂碼,我們只需要設置響應數(shù)據(jù)的 ContentType 就可以了,如下:
response.setContentType("text/html;charset=UTF-8");
如果從數(shù)據(jù)庫中查詢出來的數(shù)據(jù)就是亂碼的,那么就需要去確認數(shù)據(jù)庫中的編碼是否 OK 。
框架處理
前面提到的方案,都是在 Servlet/JSP 項目中我們可以采用的方案,在 SSM 框架中當然也可以使用,但是,SpringMVC 框架本身也提供了一個過濾器,我們可以借用這個過濾器更加高效的解決響應亂碼問題,如下:
<filter> <filter-name>encoding</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>UTF-8</param-value> </init-param> <init-param> <param-name>forceRequestEncoding</param-name> <param-value>true</param-value> </init-param> <init-param> <param-name>forceResponseEncoding</param-name> <param-value>true</param-value> </init-param> </filter> <filter-mapping> <filter-name>encoding</filter-name> <url-pattern>/*</url-pattern> </filter-mapping>
當然,上面這段配置并不能代替 Tomcat 中 conf/server.xml 中的編碼配置,如果是在 Spring Boot 中,配置可以更加簡單,只需要在 application.properties 中添加如下配置即可:
server.tomcat.uri-encoding=UTF-8 spring.http.encoding.force-request=true spring.http.encoding.force-response=true
其他亂碼
其他亂碼主要是指使用一些第三方框架導致的亂碼,例如使用 Alibaba 的 fastjson,開發(fā)者就需要在配置 HttpMessageConverter 時指定編碼格式,否則就有可能出現(xiàn)亂碼,這種第三方框架的亂碼松哥沒法窮舉,大伙在使用時需要注意看官方文檔,fastjson 的 HttpMessageConverter 配置如下:
@Bean FastJsonHttpMessageConverter fastJsonHttpMessageConverter() { FastJsonHttpMessageConverter converter = new FastJsonHttpMessageConverter(); FastJsonConfig config = new FastJsonConfig(); config.setCharset(Charset.forName("UTF-8")); converter.setFastJsonConfig(config); converter.setDefaultCharset(Charset.forName("UTF-8")); return converter; }
一個隱蔽的亂碼
除了前面介紹的這幾種亂碼之外,還有一個比較隱蔽的亂碼,容易被很多初學者忽略的地方,就是數(shù)據(jù)在從 Java 應用傳遞到 MySQL 的過程中,發(fā)生了亂碼,這種問題一般在 Windows 上不易發(fā)生,如果數(shù)據(jù)庫裝在 Linux 上,則這個問題就很容易發(fā)生,數(shù)據(jù)在代碼中命名沒有亂碼,存到 MySQL 上就亂碼了,但是如果直接使用 Navicat 等工具往 MySQL 上存儲數(shù)據(jù),又不會亂碼,或者 MySQL 中數(shù)據(jù)沒有亂碼,但是用 Java 查詢出來就亂碼了,這種都是數(shù)據(jù)在 應用 和 數(shù)據(jù)庫 之間傳遞時發(fā)生了亂碼,解決方式很簡單,在數(shù)據(jù)庫連接地址上指定編碼即可,如下:
db.url=jdbc:mysql:///yuetong?useUnicode=true&characterEncoding=UTF-8
大致就這些,還有一些非常偶爾的情況可能會用到 @RequestMapping 注解中的 produces 屬性,在這里指定數(shù)據(jù)類型即可。
好了,差不多就這些,下次有人問你為啥我的又亂碼了,直接把這篇文章甩給他。大伙有什么解決亂碼的獨門密器也可以一起來討論。
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對億速云的支持。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。