JavaScript如何實現(xiàn)漢字轉(zhuǎn)拼音

發(fā)布時間：2021-08-02 13:58:19 來源：億速云閱讀：197 作者：小新欄目：web開發(fā)

這篇文章將為大家詳細講解有關(guān)JavaScript如何實現(xiàn)漢字轉(zhuǎn)拼音，小編覺得挺實用的，因此分享給大家做個參考，希望大家閱讀完這篇文章后可以有所收獲。

一.漢字轉(zhuǎn)拼音的現(xiàn)狀

首先應(yīng)該說，漢字轉(zhuǎn)拼音是個強需求，比如聯(lián)系人按拼音字母排序／篩選；比如目的地（典型如機票購買）
按拼音首字母分類等等。但是這個需求的解決方案，但好像沒聽過什么巧妙的實現(xiàn)（特別是瀏覽器端），大概都需要一個龐大的字典。
具體到JavaScript，查查github和npm，比較優(yōu)秀的處理漢字轉(zhuǎn)拼音的庫有pinyin
和pinyinjs，可以看到，兩者都自帶了龐大的字典。
這些字典動輒幾十上百KB（有的甚至幾MB），想在瀏覽器端使用還是需要一些勇氣的。所以當我們碰到漢字轉(zhuǎn)拼音的需求，也不怪我們第一反應(yīng)就是拒絕需求（或者服務(wù)端實現(xiàn)）。
現(xiàn)在，如果我告訴你可以瀏覽器端300行代碼實現(xiàn)漢字轉(zhuǎn)拼音，是不是不可置信？

二.從安卓4.2.2聯(lián)系人代碼說起

再次強調(diào)這篇博客——利用Android源碼，輕松實現(xiàn)漢字轉(zhuǎn)拼音功能。
今天和大家分享一個從Android系統(tǒng)源代碼提取出來的漢字轉(zhuǎn)成拼音實現(xiàn)方案，只要一個類，560多行代碼就可以讓你輕松實現(xiàn)漢字轉(zhuǎn)成拼音的功能，且無需其他任何第三方依賴。
是不是打破了你的思維定勢：難道有什么強大的算法可以拋棄字典？
第一遍看完博客，稍有些失望，并沒有什么算法解析，只是介紹了從安卓代碼發(fā)現(xiàn)的這幾百行代碼。第二遍時帶著移植到JavaScript的想法閱讀代碼，算是弄懂了原理，于是開始了踩坑的移植之旅。

三.手把手教你300行JavaScript代碼實現(xiàn)漢字轉(zhuǎn)拼音

首先直指核心：為什么有漢字轉(zhuǎn)拼音必須有龐大字典的思維定勢？
因為漢字的排布和拼音并有什么關(guān)聯(lián)，比如在漢字區(qū)間\u4E00-\u9FFF，前一個可能是ha，后一個可能就是ze，沒有辦法從漢字的unicode關(guān)聯(lián)到拼音，所以只能有一個龐大的字典記錄每個漢字（或常用漢字）的拼音。
但是，假設(shè)我們可以把所有漢字按拼音排序，比如按'A','AI','AN','ANG','AO','BA',...,'ZUI','ZUN','ZUO'排序，那么，我們只需要記住每個相同拼音的漢字隊列的第一個漢字就好了。那么，所需要的字典就會很?。ǜ采w所有拼音即可，拼音數(shù)量本身不多）。
現(xiàn)在，難點就是把漢字按拼音排序了。很幸運，ICU/本地化相關(guān)的API提供了這個排序API（如果沒有方便的排序／比較方法，那么本篇文章可能就不會出現(xiàn)了）。

所以，這就是為什么300行可以實現(xiàn)漢字轉(zhuǎn)拼音：Intl.CollatorAPI：Intl.Collator內(nèi)部實現(xiàn)了本土化相關(guān)的字符串排序。我們通過Intl.Collator.prototype.compare可以把所有漢字基本按照拼音來排序。
邊界漢字表：記錄了排序的邊界點。該漢字表的每個漢字都是排序后相同拼音的漢字集合的首個漢字（Eachunihansisthefirstonewithinsamepinyinwhencollatoriszh_CN）。
說到這里，可能仍然有沒說清楚的地方，所以直接上一段代碼：