^{<u id="dbugy"></u>}

<small id="dbugy"><tbody id="dbugy"><video id="dbugy"></video></tbody></small>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

PHP中國際化字符串排序和比較對象的示例分析

發(fā)布時間：2021-08-23 09:13:48 來源：億速云閱讀：242 作者：小新欄目：開發(fā)技術(shù)

小編給大家分享一下PHP中國際化字符串排序和比較對象的示例分析，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

排序

正常來說，如果我們對數(shù)組中的字符進行排序，按照的是字符的 ASC2 表的順序進行排列，如果是英文還好，但對于中文的話，排序出來的結(jié)果會是非常懵逼的。

$arr = ['我','是','硬','核','項', '目', '經(jīng)', '理'];
sort($arr);
var_dump( $arr );
// array(8) {
//     [0]=>
//     string(3) "我"
//     [1]=>
//     string(3) "是"
//     [2]=>
//     string(3) "核"
//     [3]=>
//     string(3) "理"
//     [4]=>
//     string(3) "目"
//     [5]=>
//     string(3) "硬"
//     [6]=>
//     string(3) "經(jīng)"
//     [7]=>
//     string(3) "項"
//   }

按照我們的習(xí)慣會以中文的拼音來對漢字進行排序，這個時候往往大家都會選擇自己寫排序的算法或者去找合適的 Composer 包。其實，PHP 中已經(jīng)為我們準備了一個對象就是用來處理這類問題的。

$coll = new Collator( 'zh_CN' );

$coll->sort($arr);
var_dump( $arr );
// array(8) {
//     [0]=>
//     string(3) "核"
//     [1]=>
//     string(3) "經(jīng)"
//     [2]=>
//     string(3) "理"
//     [3]=>
//     string(3) "目"
//     [4]=>
//     string(3) "是"
//     [5]=>
//     string(3) "我"
//     [6]=>
//     string(3) "項"
//     [7]=>
//     string(3) "硬"
//   }

沒錯，正是這個 Collator 類。它在實例化的時候需要指定當前的區(qū)域，比如我們指定為 zh_CN ，也就是中文字符區(qū)域，這時候再使用它的 sort() 方法就可以完成對中文字符的拼音排序。

$coll->sort($arr, Collator::SORT_NUMERIC );
var_dump( $arr );
// array(8) {
//     [0]=>
//     string(3) "核"
//     [1]=>
//     string(3) "經(jīng)"
//     [2]=>
//     string(3) "理"
//     [3]=>
//     string(3) "目"
//     [4]=>
//     string(3) "是"
//     [5]=>
//     string(3) "我"
//     [6]=>
//     string(3) "項"
//     [7]=>
//     string(3) "硬"
//   }

$coll->sort($arr, Collator::SORT_STRING );
var_dump( $arr );
// array(8) {
//     [0]=>
//     string(3) "核"
//     [1]=>
//     string(3) "經(jīng)"
//     [2]=>
//     string(3) "理"
//     [3]=>
//     string(3) "目"
//     [4]=>
//     string(3) "是"
//     [5]=>
//     string(3) "我"
//     [6]=>
//     string(3) "項"
//     [7]=>
//     string(3) "硬"
//   }

Collator 對象的 sort() 方法還支持第二個參數(shù)，用于指定當前的排序是按照字符還是數(shù)字格式進行排序。對于純中文的內(nèi)容來說，這個沒有什么區(qū)別。

除了 sort() 方法之外，它還有一個 asort() 方法，就和普通的 asort() 函數(shù)一樣的功能，只不過它也是支持不同的區(qū)域語言的。

$arr = [
    'a' => '100',
    'b' => '7',
    'c' => '50'
];
$coll->asort($arr, Collator::SORT_NUMERIC );
var_dump( $arr );
// array(3) {
//     ["b"]=>
//     string(1) "7"
//     ["c"]=>
//     string(2) "50"
//     ["a"]=>
//     string(3) "100"
//   }

$coll->asort($arr, Collator::SORT_STRING );
var_dump( $arr );
// array(3) {
//     ["a"]=>
//     string(3) "100"
//     ["c"]=>
//     string(2) "50"
//     ["b"]=>
//     string(1) "7"
//   }

$arr = [
    '中' => '100',
    '的' => '7',
    '文' => '50'
];
$coll->asort($arr, Collator::SORT_NUMERIC );
var_dump( $arr );
// array (
//     '的' => '7',
//     '文' => '50',
//     '中' => '100',
//   )

$coll->asort($arr, Collator::SORT_STRING );
var_dump( $arr );
// array (
//     '中' => '100',
//     '文' => '50',
//     '的' => '7',
//   )

asrot() 方法是根據(jù)鍵和值一起進行排序的，所以在這里指定 SORT_STRING 和 SORT_NUMERIC 就有明顯的效果了。我們可以看出，如果是根據(jù)數(shù)字排序，那么結(jié)果就是以數(shù)字內(nèi)容為準的，如果是根據(jù)字符排序，那么結(jié)果就是以鍵值中的字符串部分為基礎(chǔ)進行排序的。

不管是 sort() 還是 asrot() 本質(zhì)上都和普通的 PHP 默認提供的 sort() 和 asrot() 函數(shù)一樣的。只是它們多了區(qū)域語言的功能而已。

另外，Collator 對象中還提供了一個 sortWithSortKeys() 方法，這個是普通的 PHP 排序函數(shù)中沒有的。

$arr = ['我','是','硬','核','項', '目', '經(jīng)', '理'];
$coll->sortWithSortKeys($arr);
var_dump( $arr );
// array (
//     0 => '核',
//     1 => '經(jīng)',
//     2 => '理',
//     3 => '目',
//     4 => '是',
//     5 => '我',
//     6 => '項',
//     7 => '硬',
//   )

它與 sort() 方法是類似的，但使用的是 ucol_getSortKey() 來生成的 ICU 排序鍵，在大型數(shù)組上的速度更快。

ICU 的全稱是 International Components for Unicode ，也就是 Unicode 的國際化組件，它提供了翻譯相關(guān)的功能，也就是我們系統(tǒng)中以及各類編程語言要實現(xiàn)國際化能力的基礎(chǔ)。

比較

接下來就是字符串的比較，比如說我們都知道，"a" 是比 "A" 要大的，因為在 ASC2 碼表中，"A" 是 65 ，"a" 是 97 。當然，這只是默認情況下的比較，在使用 Collator 對象的函數(shù)進行比較時，則是根據(jù)字典庫中的排序索引進行比較的，對于中文來說，基本上就也是按照拼音的順序來比較了。

var_dump($coll->compare('Hello', 'hello')); // int(1)
var_dump($coll->compare('你好', '您好')); // int(-1)

compare() 方法就是用來進行比較的，如果兩個字符串相等，返回的就是 0 ，如果第一個字符串大于第二個，返回的是 1 ，否則返回的是 -1 。從代碼中，我們可以看出 "Hello" 是大于 "hello" 的，"你好" 是小于 "您好" 的（因為 "您" 多了一個 g ）。

屬性設(shè)置

Collator 對象中還可以設(shè)置一些對象的屬性。

$coll->setAttribute(Collator::CASE_FIRST, Collator::UPPER_FIRST);
var_dump($coll->getAttribute(Collator::CASE_FIRST)); // int(25)
var_dump($coll->compare('Hello', 'hello')); // int(-1)

$coll->setAttribute(Collator::CASE_FIRST, Collator::LOWER_FIRST);
var_dump($coll->getAttribute(Collator::CASE_FIRST)); // int(24)
var_dump($coll->compare('Hello', 'hello')); // int(1)

$coll->setAttribute(Collator::CASE_FIRST, Collator::OFF);
var_dump($coll->getAttribute(Collator::CASE_FIRST)); // int(16)
var_dump($coll->compare('Hello', 'hello')); // int(1)

這里我們是為對象指定 CASE_FIRST 屬性，屬性值可以指定大寫優(yōu)先、小寫優(yōu)先之類的，對于英文字符來說，這個可以影響排序以及對比的結(jié)果。

另外，我們還可以通過一個方法獲得當前區(qū)域語言的信息。

var_dump($coll->getLocale(Locale::VALID_LOCALE)); // string(10) "zh_Hans_CN"
var_dump($coll->getLocale(Locale::ACTUAL_LOCALE)); // string(2) "zh"

這兩個參數(shù)分別是獲得有效的區(qū)域設(shè)置信息和實際的區(qū)域信息。

排序信息

當然，我們也可以看到具體的排序信息，也就是字符在 Collator 中的編碼。

var_dump(bin2hex($coll->getSortKey('Hello'))); // string(20) "b6b0bebec4010901dc08"
var_dump(bin2hex($coll->getSortKey('hello'))); // string(18) "b6b0bebec401090109"
var_dump(bin2hex($coll->getSortKey('你好'))); // string(16) "7b9b657301060106"
var_dump(bin2hex($coll->getSortKey('您好'))); // string(16) "7c33657301060106"

$coll = collator_create( 'en_US' );

var_dump($coll->compare('Hello', 'hello')); // int(1)
var_dump($coll->compare('你好', '您好')); // int(-1)

var_dump($coll->getLocale(Locale::VALID_LOCALE)); // string(5) "en_US"
var_dump($coll->getLocale(Locale::ACTUAL_LOCALE)); // string(4) "root"

var_dump(bin2hex($coll->getSortKey('Hello'))); // string(20) "3832404046010901dc08"
var_dump(bin2hex($coll->getSortKey('hello'))); // string(18) "383240404601090109"
var_dump(bin2hex($coll->getSortKey('你好'))); // string(20) "fb0b8efb649401060106"
var_dump(bin2hex($coll->getSortKey('您好'))); // string(20) "fba5f8fb649401060106"

可以看出，不用同的區(qū)域語言獲取到的 getSortKey() 排序鍵信息是不同的，不過它們都是以 16進制存儲的，這和默認的 ASC2 碼完全不同了。

錯誤信息

$coll = new Collator( 'en_US' );;
$coll->compare( 'y', 'k' ); 
var_dump($coll->getErrorCode()); // int(0)
var_dump($coll->getErrorMessage()); // string(12) "U_ZERO_ERROR"

使用 getErrorCode() 可以獲得錯誤碼，使用 getErrorMessage() 可以獲得錯誤信息。關(guān)于返回的這個 U_ZERO_ERROR 并沒有查找到相關(guān)的資料，希望懂行的朋友可以回復(fù)說明，大家一起學(xué)習(xí)。

排序規(guī)則強度

另外就是 Collator 對象就還有一個排序強度的設(shè)定，不過我測試的效果并沒有體現(xiàn)出來。

$arr  = array( 'a', 'à' ,'A');
$coll = new Collator( 'de_DE' );

$coll->sort($arr);
var_dump($coll->getStrength());
var_dump( $arr ); // int(2)
// array(3) {
//     [0]=>
//     string(1) "a"
//     [1]=>
//     string(1) "A"
//     [2]=>
//     string(2) "à"
//   }

$coll->setStrength(Collator::IDENTICAL);
var_dump($coll->getStrength()); // int(15)
$coll->sort($arr);
var_dump( $arr );

$coll->setStrength(Collator::QUATERNARY);
var_dump($coll->getStrength()); // int(3)
$coll->sort($arr);
var_dump( $arr );

$coll->setStrength(Collator::PRIMARY);
var_dump($coll->getStrength()); // int(0)
$coll->sort($arr );
var_dump( $arr );

$coll->setStrength(Collator::TERTIARY);
var_dump($coll->getStrength()); // int(2)
$coll->sort($arr );
var_dump( $arr );

$coll->setStrength(Collator::SECONDARY);
var_dump($coll->getStrength()); // int(1)
$coll->sort($arr );
var_dump( $arr );

以上是“PHP中國際化字符串排序和比較對象的示例分析”這篇文章的所有內(nèi)容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內(nèi)容對大家有所幫助，如果還想學(xué)習(xí)更多知識，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Android如何自定義軟鍵盤
下一篇新聞：
C語言自定義類型的示例分析

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

<source id="nurtx"></source>