溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Emoji表情符號入MySQL數(shù)據(jù)庫報(bào)錯(cuò)的解決方案

發(fā)布時(shí)間:2020-08-15 08:21:52 來源:ITPUB博客 閱讀:373 作者:bestpaydata 欄目:MySQL數(shù)據(jù)庫

    auther:Jane.Hoo
    上周有開發(fā)人員反饋一個(gè)問題:前臺(tái)應(yīng)用抓取微博信息,每天總有幾條數(shù)據(jù)插入不成功。應(yīng)用日志顯示:
  java.sql.SQLException: Incorrect string value: '\xF0\x9F\x92\xAA",...' for column 'raw_json' at row 1, 異常:org.springframework.jdbc.UncategorizedSQLException:
  其中raw_json字段顯示如下:

Emoji表情符號入MySQL數(shù)據(jù)庫報(bào)錯(cuò)的解決方案

  由上圖可知,插入的字段里面包含emoji表情符。基本可以判定是字符編碼的問題。我們的數(shù)據(jù)庫里面使用的是utf8編碼,普通的字符串或者表情都是占位3個(gè)字節(jié),所以utf8足夠用了,但是移動(dòng)端的表情符號占位是4個(gè)字節(jié),普通的utf8就不夠用了,為了應(yīng)對無線互聯(lián)網(wǎng)的機(jī)遇和挑戰(zhàn)、避免 emoji 表情符號帶來的問題、涉及無線相關(guān)的 MySQL 數(shù)據(jù)庫建議都提前采用utf8mb4 字符集,這必須要作為移動(dòng)互聯(lián)網(wǎng)行業(yè)的一個(gè)技術(shù)選型的要點(diǎn)。

utf8與utf8mb4說明:
  UTF- 8:Unicode Transformation Format-8bit,允許含BOM,但通常不含BOM。是用以解決國際上字符的一種多字節(jié)編碼,它對英文使用8位(即一個(gè)字節(jié)),中文使用24為(三個(gè)字節(jié))來

編碼。UTF-8包含全世界所有國家需要用到的字符,是國際編碼,通用性強(qiáng)。UTF-8編碼的文字可以在各國支持UTF8字符集的瀏覽器上顯示。如,如果是UTF8編碼,則在外國人的英文IE上也能

顯示中文,他們無需下載IE的中文語言支持包。
  UTF8MB4:MySQL在5.5.3之后增加了utf8mb4的編碼,mb4就是most bytes 4的意思,專門用來兼容四字節(jié)的unicode。
  

既然找到了原因就來執(zhí)行吧.既然只有raw_json列含表情符,就先修改此列的字符集:
 ALTER TABLE xx_pnl_weibo_usershow  MODIFY ` raw_json` varchar(3000) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci ;
  改完后測試,插入失敗。
  修改表的字符集:
  alter table xx_pnl_weibo_usershow CHARSET=utf8mb4 ;
  改完后測試,插入失敗。
  修改庫級別的字符集
  vi /etc/my.cnf
  [client]
  default-character-set=utf8mb4
  [mysqld]
  character-set-server = utf8mb4
  service mysqld restart
  改完后測試,插入成功。
  emoji表情編碼參考: 

  http://punchdrunker.github.io/iOSEmoji/table_html/flower.html

 因?yàn)槭蔷€上生產(chǎn)業(yè)務(wù),需要先在測試環(huán)境做好測試工作。避免業(yè)務(wù)高峰期,線上申請停機(jī)窗口操作。



向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI