溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

mysql/Java服務(wù)端對(duì)emoji支持與問題的示例分析

發(fā)布時(shí)間:2021-06-22 11:18:40 來源:億速云 閱讀:195 作者:小新 欄目:MySQL數(shù)據(jù)庫

小編給大家分享一下mysql/Java服務(wù)端對(duì)emoji支持與問題的示例分析,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

問題描述

將底層抓取的微博數(shù)據(jù)存入mysql,有些數(shù)據(jù)存入失敗,查看Tomcat后,核心錯(cuò)誤信息如下:

// 拋出字符集不支持的異常
sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT' at row 1

原因分析

  • MYSQL 5.5 之前, utf8 編碼只支持1~3個(gè)字節(jié),即BMP這部分的unicode編碼區(qū)(基本就是0000~FFFF這一區(qū))。

  • Emoji表情是4個(gè)字節(jié),而mysql的utf8編碼最多3個(gè)字節(jié),所以導(dǎo)致數(shù)據(jù)插不進(jìn)去

  • 5.5之后,mysql加入utf8mb4編碼,可支持4個(gè)字節(jié),即一個(gè)字符最多能有4字符,因此utf8mb4編碼可支持更多的字符集。

  • 因此,如果項(xiàng)目要存儲(chǔ)移動(dòng)產(chǎn)品的用戶文本,必須將DB字符集從UTF8/GBK等傳統(tǒng)字符集升級(jí)到utf8mb4

【注】

  • utf8mb4兼容utf8,且比utf8能表示更多的字符。所以將DB字符集從UTF8或GBK等傳統(tǒng)字符集升級(jí)到utf8mb4時(shí)不用擔(dān)心字符的兼容性問題

解決方法

過濾特殊的表情符

content = content.replaceAll("[\\x{10000}-\\x{10FFFF}]", "");// 簡(jiǎn)單粗暴,不人性化

升級(jí)數(shù)據(jù)庫字符集

1、utf8mb4支持的mysql版本為5.5.3+,若mysql低于該版本請(qǐng)先升級(jí)

2、修改database、table和column字符集

3、修改mysql配置文件my.cnf(windows為my.ini),my.cnf一般在etc/mysql/目錄下,找到后在以下三部分里添加如下內(nèi)容:

[client] default-character-set = utf8mb4
[mysql] default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'

4、重啟mysql并查看字符集

在mysql命令行輸入:

SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';

重啟之前的字符集

mysql/Java服務(wù)端對(duì)emoji支持與問題的示例分析

重啟之后的字符集

mysql/Java服務(wù)端對(duì)emoji支持與問題的示例分析

【注】

  • 必須保證以下字段為utf8mb4

    • character_set_client

    • character_set_connection

    • character_set_database

    • character_set_results

    • character_set_server

以上4步完成后,利用mysql客戶端navicat在表中手動(dòng)加入Emoji表情?,若能保存成功說明數(shù)據(jù)庫已升級(jí)成功。

這些字符集配置的具體區(qū)別參考 深入Mysql字符集設(shè)置

5、檢查服務(wù)器端db配置文件

// 配置spring時(shí)使用的鏈接如下:
url="jdbc:mysql://localhost:3306/gzhou?allowMultiQueries=true&useUnicode=true&zeroDateTimeBehavior=convertToNull&transformedBitIsBoolean=true&autoReconnect=true&autoReconnectForPools=true&failOverReadOnly=false&maxReconnects=10"
// 若characterEncoding=utf8mb4,插入數(shù)據(jù)時(shí)報(bào)錯(cuò)Caused by: java.sql.SQLException: Unsupported character encoding 'utf8mb4'
// 去掉characterEncoding或characterEncoding=utf8

Emoji表情

android系統(tǒng)中,搜狗、百度輸入法自帶Emoji表情。

mysql/Java服務(wù)端對(duì)emoji支持與問題的示例分析

【注】

如果系統(tǒng)之間Emoji表情符號(hào)不兼容,只能看到方塊;

看完了這篇文章,相信你對(duì)“mysql/Java服務(wù)端對(duì)emoji支持與問題的示例分析”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI