您好,登錄后才能下訂單哦!
本文章向大家介紹如何在Java中使用pinyin4j將漢字轉(zhuǎn)為拼音的基本知識點總結(jié)和需要注意事項,具有一定的參考價值,需要的朋友可以參考一下。
Java主要應(yīng)用于:1. web開發(fā);2. Android開發(fā);3. 客戶端開發(fā);4. 網(wǎng)頁開發(fā);5. 企業(yè)級應(yīng)用開發(fā);6. Java大數(shù)據(jù)開發(fā);7.游戲開發(fā)等。
pinyin4j 是一個支持將簡體和繁體中文轉(zhuǎn)換到成拼音的Java開源類庫;
支持同一漢字有多個發(fā)音
還支持拼音的格式化輸出,比如第幾聲之類的,
同時支持簡體中文、繁體中文轉(zhuǎn)換為拼音…使用起來也非常簡單。下面是其官方網(wǎng)址,其中提供了下載:
pinyin4j的官方下載地址
doc : pinyin4j的api文檔
lib : pinyin4j的jar包
src: pinyin4j的源代碼
CHANGELOG.txt : pinyin4j的版本更新日志
COPYING.txt : LICENSE說明
README.txt : pinyin4j的概要介紹
pinyin4j使用了一個.txt的文本文件(uicode_to_hanyu_pinyin.txt)用來存儲漢字unicode編碼與拼音的對應(yīng)關(guān)系,通過讀取該配置文件達(dá)到轉(zhuǎn)換的目的。
該屬性文件存儲信息的基本格式如下:89E3 (jie3,jie4,xie4) //(對應(yīng)漢字”解”)89E3 是漢字對應(yīng)的unicode編碼的16進(jìn)制數(shù),(jie3,jie4,xie4)是該漢字對應(yīng)的三種讀音(在漢語里有多音字)
說明pinyin4j支持多音字的處理pinyin4j的處理過程是這樣的:
根據(jù)String的toCharArray方法得到每個字符(得到”解”字的unicode編碼,實際上是35299,由于java中char和String都是unicode編碼的可以直接轉(zhuǎn)為int型的編碼數(shù)據(jù)35299),然后利用Integer.toHexString(c1).toUpperCase()將其轉(zhuǎn)換成16進(jìn)制數(shù)[也就是89E3],通過讀取配置文件得到“解”字的拼音(jie3,jie4,xie4),那么這里有三個拼音,pinyin4j的默認(rèn)取值為第一個,也就是jie3[表示讀jie,聲調(diào)是三聲]
pinyin4j 提供的工具類為PinyinHelper,里邊提供了靜態(tài)方法
- toHanyuPinyinString()(過時)
- toHanyuPinyinStringArray()
pinyin4j 中有四個輔助類分別是:
- HanyuPinyinCaseType
- HanyuPinyinToneType
- HanyuPinyinVCharType
- HanyuPinyinOutputFormat
具體功能和用法見一下代碼:
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); // 控制大小寫 // UPPERCASE:大寫 (ZHONG) // LOWERCASE:小寫 (zhong) defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); // WITHOUT_TONE:無音標(biāo) (zhong) // WITH_TONE_NUMBER:1-4數(shù)字表示英標(biāo) (zhong4) // WITH_TONE_MARK:直接用音標(biāo)符(必須WITH_U_UNICODE否則異常) (zhòng) defaultFormat.setToneType(HanyuPinyinToneType.WITH_TONE_NUMBER); // WITH_V:用v表示ü (nv) // WITH_U_AND_COLON:用"u:"表示ü (nu:) // WITH_U_UNICODE:直接用ü (nü) defaultFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE); // oHanyuPinyinStringArray如果傳入的字符不是漢字不能轉(zhuǎn)換成拼音,那么會直接返回null。 String[] pinyin = PinyinHelper.toHanyuPinyinStringArray('重', defaultFormat); for(String str: pinyin){ System.out.println(str); }
結(jié)果:
ZHONG4
CHONG2
其他工具類
獲取獲得漢語拼音首字母
將字符串中的中文轉(zhuǎn)化為拼音,英文字符不變
/** * 獲得漢語拼音首字母 * * @param chines * 漢字 * @return */ public static String getAlpha(String chines) { String pinyinName = ""; char[] nameChar = chines.toCharArray(); HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); for (int i = 0; i < nameChar.length; i++) { if (nameChar[i] > 128) { try { pinyinName += PinyinHelper.toHanyuPinyinStringArray( nameChar[i], defaultFormat)[0].charAt(0); } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { pinyinName += nameChar[i]; } } return pinyinName; } /** * 將字符串中的中文轉(zhuǎn)化為拼音,英文字符不變 * * @param inputString * 漢字 * @return */ public static String getPingYin(String inputString) { HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat(); format.setCaseType(HanyuPinyinCaseType.LOWERCASE); format.setToneType(HanyuPinyinToneType.WITHOUT_TONE); format.setVCharType(HanyuPinyinVCharType.WITH_V); String output = ""; if (inputString != null && inputString.length() > 0 && !"null".equals(inputString)) { char[] input = inputString.trim().toCharArray(); try { for (int i = 0; i < input.length; i++) { if (java.lang.Character.toString(input[i]).matches( "[\\u4E00-\\u9FA5]+")) { String[] temp = PinyinHelper.toHanyuPinyinStringArray( input[i], format); output += temp[0]; } else output += java.lang.Character.toString(input[i]); } } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { return "*"; } return output; } /** * 漢字轉(zhuǎn)換為漢語拼音首字母,英文字符不變 * * @param chines * 漢字 * @return 拼音 */ public static String converterToFirstSpell(String chines) { String pinyinName = ""; char[] nameChar = chines.toCharArray(); HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); for (int i = 0; i < nameChar.length; i++) { if (nameChar[i] > 128) { try { pinyinName += PinyinHelper.toHanyuPinyinStringArray( nameChar[i], defaultFormat)[0].charAt(0); } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { pinyinName += nameChar[i]; } } return pinyinName; }
以上就是小編為大家?guī)淼娜绾卧贘ava中使用pinyin4j將漢字轉(zhuǎn)為拼音的全部內(nèi)容了,希望大家多多支持億速云!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。