溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

PHP中區(qū)域語言信息的示例分析

發(fā)布時間:2021-07-07 09:41:08 來源:億速云 閱讀:168 作者:小新 欄目:編程語言

小編給大家分享一下PHP中區(qū)域語言信息的示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

PHP中針對區(qū)域語言標記信息的操作

相信大家對 zh_CN 這個東西絕對不會陌生,不管是 PHP 中,還是在我們的網(wǎng)頁上,都會見到它的身影。其實這就是指定我們的顯示編碼是什么國家或者地區(qū)的,使用何種語言。對于這種區(qū)域語言的標記來說,PHP 中也有很多好玩的內(nèi)容。今天,我們要學習的 Locale 類就是操作區(qū)域語言相關內(nèi)容的,它無法被實例化,所有全部功能方法都是靜態(tài)的。

獲取及設置當前的區(qū)域語言信息

首先就是我們可以動態(tài)地獲取和設置相應的區(qū)域語言信息。

// # echo $LANG;
// en_US.UTF-8
// php.ini
// intl.default_locale => no value => no value
echo Locale::getDefault(), PHP_EOL; // en_US_POSIX
ini_set('intl.default_locale', 'zh_CN');
echo Locale::getDefault(), PHP_EOL; // zh_CN
Locale::setDefault('fr');
echo Locale::getDefault(), PHP_EOL; // fr

默認情況下,使用 getDefault() 方法獲得的是 php.ini 文件中的 intl.default_locale 配置的內(nèi)容。如果在 php.ini 中也沒有配置的話,就會取操作系統(tǒng)的 $LANG 值里面的內(nèi)容,也就是我們上面例子中輸出的 en_US_POSIX ,POSIX 表示的就是來自操作系統(tǒng)的配置。

使用 ini_set() 直接修改 ini 的配置或者使用 setDefault() 方法都是可以動態(tài)地修改當前的區(qū)域語言設置的。

關于語言標記的規(guī)則

在繼續(xù)學習下面的內(nèi)容之前,我們先來學習一下語言標記的規(guī)范。對于大多數(shù)人來說,可能只接觸過 en_US 、 zh_CN 這類的標記,但其實它的完整定義是很長的,只是我們使用這種簡寫的方式時,很多內(nèi)容會以默認的形式提供。完整的標記規(guī)則是:

language-extlang-script-region-variant-extension-privateuse

語言文字種類-擴展語言文字種類-書寫格式-國家和地區(qū)-變體-擴展-私有

也就是說,我們的 zh_CN 可以這樣寫:

zh-cmn-Hans-CN-Latn-pinyin

代表的是:zh 語言文字種類,Hans 書寫格式為簡體中文,cmn 普通話,CN 國家和地區(qū),Latn 變體拉丁字母,pinyin 變體拼音。

是不是感覺突然一下這么簡單的東西一下子變得高大上了。另外,zh- 這個前綴現(xiàn)在已經(jīng)不是推薦使用的了,zh- 現(xiàn)在已經(jīng)不是語言 code 了,而是 macrolang 也就是宏語言,我們直接使用 cmn 、 yue(粵語)、wuu(吳語)、hsn(湘語,湖南話)這類的就可以當做 language 來使用了。因此,上面的那一段也可以這么寫:

cmn-Hans-CN-Latn-pinyin

在上篇文章中,我們講 NumberFormatter 時說過可以直接獲得中文的數(shù)字格式的輸出,現(xiàn)在我們想要繁體的結果呢?很簡單,加上 Hant 標識書寫格式為繁體中文即可。

關于語言標記規(guī)則的內(nèi)容,大家可以看看文末知乎的參考鏈接,介紹的更為詳盡。

$fmt = new NumberFormatter('zh-Hant', NumberFormatter::SPELLOUT);
echo $fmt->format(1234567.891234567890000), PHP_EOL; 
// 一百二十三萬四千五百六十七點八九一二三四五六七九

獲取指定語言標記規(guī)則中的各類信息

學習了語言標記的規(guī)則之后能干什么呢?Locale 類最主要的功能就在于可以分析獲取這些屬性信息。

單獨獲取各種屬性信息

echo Locale::getDisplayLanguage('cmn-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // cmn
echo Locale::getDisplayLanguage('zh-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // 中文
echo Locale::getDisplayName('cmn-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // cmn(簡體,中國,LATN_PINYIN)
echo Locale::getDisplayName('zh-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // 中文(簡體,中國,LATN_PINYIN)
echo Locale::getDisplayRegion('cmn-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // 中國
echo Locale::getDisplayRegion('zh-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // 中國
echo Locale::getDisplayScript('cmn-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // 簡體中文
echo Locale::getDisplayScript('zh-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // 簡體中文
echo Locale::getDisplayVariant('cmn-Hans-Latn-pinyin', 'zh_CN'), PHP_EOL; // LATN_PINYIN
echo Locale::getDisplayVariant('zh-Hans-CN-Latn-pinyin', 'zh_CN'), PHP_EOL; // LATN_PINYIN

我們分別使用兩種標記方式來測試代碼,可以看到結果的對比。

getDisplayLanguage() 方法用于獲取顯示的語言信息,也就是規(guī)則中的 language 內(nèi)容。

getDisplayName() 方法用于獲取標準的語言名稱,可以看到內(nèi)容更加地豐富。

getDisplayRegion() 方法很明顯地就是獲取到了國家信息。

getDisplayScript() 獲取到的是書寫格式的信息。

getDisplayVariant() 獲取到的就是變體信息

批量獲取屬性信息

當然,我們也可以批量地獲取到一些語言相關的信息。

$arr = Locale::parseLocale('zh-Hans-CN-Latn-pinyin');
if ($arr) {
    foreach ($arr as $key => $value) {
        echo "$key : $value ", PHP_EOL;
    }
}
// language : zh
// script : Hans
// region : CN
// variant0 : LATN
// variant1 : PINYIN

使用 parseLocale() 方法就能獲取到一個語言標記中的各類信息并保存在數(shù)組中,鍵為標記規(guī)則名,值為對應的內(nèi)容,看看是不是和我們上面介紹的內(nèi)容是一樣的。

獲取所有變體信息

從上面的代碼中可以看出,我們有兩個變體信息,這個也可以通過一個 getAllVariants() 方法來直接獲得語言標記中的所有變體信息的數(shù)組。

$arr = Locale::getAllVariants('zh-Hans-CN-Latn-pinyin');
var_export($arr);
echo PHP_EOL;
//  array (
//     0 => 'LATN',
//     1 => 'PINYIN',
//   )
獲取字符集相關信息
echo Locale::canonicalize('zh-Hans-CN-Latn-pinyin'), PHP_EOL; // zh_Hans_CN_LATN_PINYIN
$keywords_arr = Locale::getKeywords('zh-cn@currency=CMY;collation=UTF-8');
if ($keywords_arr) {
    foreach ($keywords_arr as $key => $value) {
        echo "$key = $value", PHP_EOL;
    }
}
// collation = UTF-8
// currency = CMY

canonicalize() 方法用于規(guī)范化地顯示語言標記信息,可以看到它把我們的中劃線變成了下劃線并且將后面的各種屬性轉成了大寫,這就是規(guī)范化的寫法。不過對于我們的應用程序和網(wǎng)頁來說中劃線以及大小寫都是支持的。當然,大家最好還是按照標準的寫法來定義。

getKeywords() 用于從 @ 符號后獲取語言相關的信息屬性,比如我們定義的這個 zh-cn ,然后定義了它的貨幣為 CMY ,字符集為 UTF-8 ,直接通過 getKeywords() 就能獲取貨幣和字符集屬性的數(shù)組。

匹配判斷語言標記信息

對于語言標記來說,我們可以判斷給定的兩個標記之間是否相互匹配,比如:

echo (Locale::filterMatches('cmn-CN', 'zh-CN', false)) ? "Matches" : "Does not match", PHP_EOL;
echo (Locale::filterMatches('zh-CN-Latn', 'zh-CN', false)) ? "Matches" : "Does not match", PHP_EOL;

當然,我們也可以使用另一個 lookup() 方法來確定給定的一系列語言標記哪個與指定的標記最接近。

$arr = [
    'zh-hans',
    'zh-hant',
    'zh',
    'zh-cn',
];
echo Locale::lookup($arr, 'zh-Hans-CN-Latn-pinyin', true, 'en_US'), PHP_EOL; // zh_hans

生成一個標準規(guī)則的語言標記

既然能夠獲取各類語言標記的屬性信息,那么我們能不能生成一個標準的語言標記內(nèi)容呢?

$arr = [
    'language' => 'en',
    'script' => 'Hans',
    'region' => 'CN',
    'variant2' => 'rozaj',
    'variant1' => 'nedis',
    'private1' => 'prv1',
    'private2' => 'prv2',
];
echo Locale::composeLocale($arr), PHP_EOL; // en_Hans_CN_nedis_rozaj_x_prv1_prv2

沒錯,composeLocale() 方法根據(jù)一個數(shù)組格式的內(nèi)容,就可以生成一個完整標準的語言標記格式內(nèi)容。當然,這個測試代碼是亂寫的,相當于是一個 en_CN 的標記,正常不會這么寫的。

acceptFromHttp 從請求頭中讀取語言信息

另外,Locale 類中還提供了一個從 header 頭中的 Accept Language 中獲取客戶瀏覽器語言信息的方法。

// Locale::acceptFromHttp($_SERVER['HTTP_ACCEPT_LANGUAGE']);
echo Locale::acceptFromHttp('en_US'), PHP_EOL; // en_US
echo Locale::acceptFromHttp('en_AU'), PHP_EOL; // en_AU
echo Locale::acceptFromHttp('zh_CN'), PHP_EOL; // zh
echo Locale::acceptFromHttp('zh_TW'), PHP_EOL; // zh

不過從測試的結果來說,其實它只需要一個字符串參數(shù)就可以了,所以我們在命令行也可以測試它。需要注意的是,對于中文來說,它不能返回區(qū)域信息,只能返回 language 信息。

以上是“PHP中區(qū)域語言信息的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業(yè)資訊頻道!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

php
AI