溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

使用Java怎么將String字符串和Unicode字符進(jìn)行轉(zhuǎn)換

發(fā)布時間:2021-02-23 15:11:59 來源:億速云 閱讀:1476 作者:戴恩恩 欄目:編程語言

本文章向大家介紹使用Java怎么將String字符串和Unicode字符進(jìn)行轉(zhuǎn)換,主要包括使用Java怎么將String字符串和Unicode字符進(jìn)行轉(zhuǎn)換的使用實(shí)例、應(yīng)用技巧、基本知識點(diǎn)總結(jié)和需要注意事項(xiàng),具有一定的參考價值,需要的朋友可以參考一下。

Java是什么

Java是一門面向?qū)ο缶幊陶Z言,可以編寫桌面應(yīng)用程序、Web應(yīng)用程序、分布式系統(tǒng)和嵌入式系統(tǒng)應(yīng)用程序。

字符串轉(zhuǎn)換unicode java方法代碼片段:

 /**
	 * 字符串轉(zhuǎn)換unicode
	 * @param string
	 * @return
	 */
	public static String string2Unicode(String string) {
		StringBuffer unicode = new StringBuffer();
		for (int i = 0; i < string.length(); i++) {
			// 取出每一個字符
			char c = string.charAt(i);
			// 轉(zhuǎn)換為unicode
			unicode.append("\\u" + Integer.toHexString(c));
		}
 
		return unicode.toString();
	}

unicode轉(zhuǎn)換字符串java方法代碼片段:

/**
	 * unicode 轉(zhuǎn)字符串
	 * @param unicode 全為 Unicode 的字符串
	 * @return
	 */
	public static String unicode2String(String unicode) {
		StringBuffer string = new StringBuffer();
		String[] hex = unicode.split("\\\\u");
 
		for (int i = 1; i < hex.length; i++) {
			// 轉(zhuǎn)換出每一個代碼點(diǎn)
			int data = Integer.parseInt(hex[i], 16);
			// 追加成string
			string.append((char) data);
		}
 
		return string.toString();	

結(jié)合正則實(shí)現(xiàn)的代碼:

混有普通字符的Unicode轉(zhuǎn)換為字符串:

/**
	 * 含有unicode 的字符串轉(zhuǎn)一般字符串
	 * @param unicodeStr 混有 Unicode 的字符串
	 * @return
	 */
	public static String unicodeStr2String(String unicodeStr) {
		int length = unicodeStr.length();
		int count = 0;
		//正則匹配條件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}";
		String regex = "\\\\u[a-f0-9A-F]{1,4}";
		Pattern pattern = Pattern.compile(regex);
		Matcher matcher = pattern.matcher(unicodeStr);
		StringBuffer sb = new StringBuffer();
		
		while(matcher.find()) {
			String oldChar = matcher.group();//原本的Unicode字符
			String newChar = unicode2String(oldChar);//轉(zhuǎn)換為普通字符
			// int index = unicodeStr.indexOf(oldChar);
      // 在遇見重復(fù)出現(xiàn)的unicode代碼的時候會造成從源字符串獲取非unicode編碼字符的時候截取索引越界等
			int index = matcher.start();
 
			sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符
			sb.append(newChar);//添加轉(zhuǎn)換后的字符
			count = index+oldChar.length();//統(tǒng)計(jì)下標(biāo)移動的位置
		}
		sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符
		return sb.toString();
	}

完整代碼:

package util;
 
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
/**
 * 
 * <p>Title: String 與 Unicode 互相轉(zhuǎn)換的工具類</p>
 * <p>Description: </p>
 * <p>Company: SCAU@Copyright</p>
 * @Copyright 1.0
 * @author jodenhe (824923282@qq.com)
 * @version 1.0
 * @since 2017年8月17日 下午9:42:50
 */
public class StringUnicodeUtil {
	
	/**
	 * 含有unicode 的字符串轉(zhuǎn)一般字符串
	 * @param unicodeStr 混有 Unicode 的字符串
	 * @return
	 */
	public static String unicodeStr2String(String unicodeStr) {
		int length = unicodeStr.length();
		int count = 0;
		//正則匹配條件,可匹配“\\u”1到4位,一般是4位可直接使用 String regex = "\\\\u[a-f0-9A-F]{4}";
		String regex = "\\\\u[a-f0-9A-F]{1,4}";
		Pattern pattern = Pattern.compile(regex);
		Matcher matcher = pattern.matcher(unicodeStr);
		StringBuffer sb = new StringBuffer();
		
		while(matcher.find()) {
			String oldChar = matcher.group();//原本的Unicode字符
			String newChar = unicode2String(oldChar);//轉(zhuǎn)換為普通字符
			// int index = unicodeStr.indexOf(oldChar);
      // 在遇見重復(fù)出現(xiàn)的unicode代碼的時候會造成從源字符串獲取非unicode編碼字符的時候截取索引越界等
			int index = matcher.start();
			
			sb.append(unicodeStr.substring(count, index));//添加前面不是unicode的字符
			sb.append(newChar);//添加轉(zhuǎn)換后的字符
			count = index+oldChar.length();//統(tǒng)計(jì)下標(biāo)移動的位置
		}
		sb.append(unicodeStr.substring(count, length));//添加末尾不是Unicode的字符
		return sb.toString();
	}
	
	/**
	 * 字符串轉(zhuǎn)換unicode
	 * @param string
	 * @return
	 */
	public static String string2Unicode(String string) {
		StringBuffer unicode = new StringBuffer();
		for (int i = 0; i < string.length(); i++) {
			// 取出每一個字符
			char c = string.charAt(i);
			// 轉(zhuǎn)換為unicode
			unicode.append("\\u" + Integer.toHexString(c));
		}
 
		return unicode.toString();
	}
 
	/**
	 * unicode 轉(zhuǎn)字符串
	 * @param unicode 全為 Unicode 的字符串
	 * @return
	 */
	public static String unicode2String(String unicode) {
		StringBuffer string = new StringBuffer();
		String[] hex = unicode.split("\\\\u");
 
		for (int i = 1; i < hex.length; i++) {
			// 轉(zhuǎn)換出每一個代碼點(diǎn)
			int data = Integer.parseInt(hex[i], 16);
			// 追加成string
			string.append((char) data);
		}
 
		return string.toString();
	}
	
	public static void main(String[] args) {
		String str = "abc";
		String str2 = string2Unicode(str);
		System.out.println(str2);
		System.out.println(unicodeStr2String(str2));
		System.out.println(unicodeStr2String("\\u61HJ\\u62\\u63(sfkfdsl)"));
	}
}

代碼運(yùn)行結(jié)果圖:

使用Java怎么將String字符串和Unicode字符進(jìn)行轉(zhuǎn)換

重要代碼講解:

代碼的實(shí)現(xiàn)其實(shí)很簡單,因此只對核心主要代碼進(jìn)行講解,如對代碼有疑惑可私信或留下評論!

1、正則匹配規(guī)則:

String regex = \\\\u[a-f0-9A-F]{1,4};

這個是正則匹配的規(guī)則,可能你會疑惑為什么使用“\\\\u”來匹配javan字符串的“\\u”,原因很簡單,因?yàn)檫@樣才匹配得上嘛(開個玩笑)直接看測試圖1-2

測試圖1:

使用Java怎么將String字符串和Unicode字符進(jìn)行轉(zhuǎn)換

測試圖2:

使用Java怎么將String字符串和Unicode字符進(jìn)行轉(zhuǎn)換

很明顯在菜鳥上使用兩種匹配方式匹配到的結(jié)果是不同的,而java字符串需要轉(zhuǎn)義,上圖的“\u”java就應(yīng)該是“\\u”,因此就要使用“\\\\u”來進(jìn)行匹配!

[a-f0-9A-F]{1,4}

”[a-f0-9A-F]“ :這個意思就是a到f,0到9,A到F出現(xiàn)的數(shù)都符合要求,“{1,4}”意思是前面的字符出現(xiàn)1到4個(其實(shí)一般的Unicode都是“\u”后面家4個字符的,如“\u0061”代表“a”,因此該式子可改為“\\\\u[a-f0-9A-F]{4}”,這樣可能更符合實(shí)際要求)

到此這篇關(guān)于使用Java怎么將String字符串和Unicode字符進(jìn)行轉(zhuǎn)換的文章就介紹到這了,更多相關(guān)的內(nèi)容請搜索億速云以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持億速云!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI