溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

PHP如何實(shí)現(xiàn)自動(dòng)轉(zhuǎn)換字符集并支持?jǐn)?shù)組轉(zhuǎn)換

發(fā)布時(shí)間:2021-10-14 15:27:47 來源:億速云 閱讀:143 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要介紹PHP如何實(shí)現(xiàn)自動(dòng)轉(zhuǎn)換字符集并支持?jǐn)?shù)組轉(zhuǎn)換,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

代碼如下:


// 自動(dòng)轉(zhuǎn)換字符集 支持?jǐn)?shù)組轉(zhuǎn)換
function auto_charset($fContents, $from='gbk', $to='utf-8') {
$from = strtoupper($from) == 'UTF8' ? 'utf-8' : $from;
$to = strtoupper($to) == 'UTF8' ? 'utf-8' : $to;
if (strtoupper($from) === strtoupper($to) || empty($fContents) || (is_scalar($fContents) && !is_string($fContents))) {
//如果編碼相同或者非字符串標(biāo)量則不轉(zhuǎn)換
return $fContents;
}
if (is_string($fContents)) {
if (function_exists('mb_convert_encoding')) {
return mb_convert_encoding($fContents, $to, $from);
} elseif (function_exists('iconv')) {
return iconv($from, $to, $fContents);
} else {
return $fContents;
}
} elseif (is_array($fContents)) {
foreach ($fContents as $key => $val) {
$_key = auto_charset($key, $from, $to);
$fContents[$_key] = auto_charset($val, $from, $to);
if ($key != $_key)
unset($fContents[$key]);
}
return $fContents;
}
else {
return $fContents;
}
}


當(dāng)我們?cè)诮邮芪粗蛻舳颂峤坏臄?shù)據(jù),由于各客戶端的編碼不統(tǒng)一,但在我們的服務(wù)器端最終只能以一種編碼方式來處理,這種情況下就會(huì)涉及到一個(gè)將接受到的字符轉(zhuǎn)換為特定編碼的問題。
這時(shí)可能會(huì)想到直接用iconv來進(jìn)行轉(zhuǎn)碼,但我們知道,iconv這個(gè)函數(shù)需要提供的兩個(gè)參數(shù)為輸入編碼和輸出編碼,而我們現(xiàn)在根本不知道接受的字符串是什么編碼,如果這個(gè)時(shí)候能得到接收字符是什么編碼就好了。
對(duì)于這樣的問題,一般會(huì)有兩種解決方案。

方案一
要客戶端提交數(shù)據(jù)時(shí),指定所提交的編碼,這時(shí)就需要多給一個(gè)用來指定編碼的變量。
$string = $_GET['charset'] === 'gbk' ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str'];
對(duì)于這種情況,如果在沒有約定或者我們不能控制客戶端的情況下,似乎這種方案使用不是很好。

方案二
直接由服務(wù)器端來檢測(cè)所接收的數(shù)據(jù)編碼。
這種方案當(dāng)然是最理想了的了,現(xiàn)在問題是怎么檢測(cè)一個(gè)字符的編碼嗎?對(duì)于這種情況,在php里,mb_string這個(gè)擴(kuò)展中的mb_check_encoding提供了我們所需要的功能。
$str = mb_check_encoding($_GET['str'],'gbk') ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str'];
但這需要打開mb_string這個(gè)擴(kuò)展,有些時(shí)候可能我們的生產(chǎn)服務(wù)器中沒有打開這個(gè)擴(kuò)展。對(duì)于這種情況,需要自己借助如下函數(shù)來判斷編碼。
以下函數(shù)非本人所寫

復(fù)制代碼 代碼如下:


function isGb2312($string) {
for($i=0; $i 127) {
if( ($v >= 228) && ($v < = 233) )
{
if( ($i+2) >= (strlen($string) - 1)) return true;
$v1 = ord( $string[$i+1] );
$v2 = ord( $string[$i+2] );
if( ($v1 >= 128) && ($v1 < =191) && ($v2 >=128) && ($v2 < = 191) )
return false;
else
return true;
}
}
}
return true;
}
function isUtf8($string) {
return preg_match('%^(?:
[\x09\x0A\x0D\x20-\x7E] # ASCII
| [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte
| \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs
| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte
| \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates
| \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3
| [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15
| \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16
)*$%xs', $string);
}


這里我們就可以使以上任何一個(gè)函數(shù)來實(shí)現(xiàn)編碼的檢測(cè)。并將其轉(zhuǎn)換成指定的編碼。
$str = isGb2312($_GET['str'],'gbk') ? iconv('gbk','utf-8',$_GET['str']) : $_GET['str'];

以上是“PHP如何實(shí)現(xiàn)自動(dòng)轉(zhuǎn)換字符集并支持?jǐn)?shù)組轉(zhuǎn)換”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

php
AI