溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在PHP中對UTF8中文字符進行截斷

發(fā)布時間:2021-01-05 16:19:23 來源:億速云 閱讀:157 作者:Leah 欄目:開發(fā)技術

這期內(nèi)容當中小編將會給大家?guī)碛嘘P怎么在PHP中對UTF8中文字符進行截斷,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

php中英文混合字符截斷不亂碼函數(shù)(utf8)

復制代碼 代碼如下:


//utf8格式下的中文字符截斷
//$sourcestr 是要處理的字符串
//$cutlength 為截取的長度(即字數(shù))
//$addstr 超過長度時在尾處加上的字符
function cut_str($sourcestr, $cutlength, $addstr='...'){
 $returnstr='';
 $i=0;
 $n=0;
 $str_length=strlen($sourcestr);//字符串的字節(jié)數(shù)
 while (($n<$cutlength) and ($i<=$str_length)){
  $temp_str=substr($sourcestr,$i,1);
  $ascnum=Ord($temp_str);//得到字符串中第$i位字符的ascii碼
  if ($ascnum>=224){ //如果ASCII位高與224,
   $returnstr=$returnstr.substr($sourcestr,$i,3); //根據(jù)UTF-8編碼規(guī)范,將3個連續(xù)的字符計為單個字符
   $i=$i+3; //實際Byte計為3
   $n++; //字串長度計1
  }elseif ($ascnum>=192){ //如果ASCII位高與192,
   $returnstr=$returnstr.substr($sourcestr,$i,2); //根據(jù)UTF-8編碼規(guī)范,將2個連續(xù)的字符計為單個字符
   $i=$i+2; //實際Byte計為2
   $n++; //字串長度計1
  }elseif ($ascnum>=65 && $ascnum<=90){ //如果是大寫字母,
   $returnstr=$returnstr.substr($sourcestr,$i,1);
   $i=$i+1; //實際的Byte數(shù)仍計1個
   $n++; //但考慮整體美觀,大寫字母計成一個高位字符
  }else{ //其他情況下,包括小寫字母和半角標點符號,
   $returnstr=$returnstr.substr($sourcestr,$i,1);
   $i=$i+1; //實際的Byte數(shù)計1個
   $n=$n+0.5; //小寫字母和半角標點等與半個高位字符寬...
  }
 }
 if ($str_length>$cutlength){
  $returnstr = $returnstr . $addstr;//超過長度時在尾處加上的字符
 }
 return $returnstr;
}

復制代碼 代碼如下:


<?php
/* UTF-8中文字符截斷程序 */
$str = "123這是測試字符串";
$str1 = "()()";
echo subUTF8str($str,0,3)."<br>";
echo subUTF8str($str,0,4)."<br>";
echo subUTF8str($str1,0,4)."<br>";
echo subUTF8str($str1,0,10)."<br>";
function subUTF8str($str,$start=0,$length=80){
$cur_len = 0; //人理解的字符串長度
$all_len = strlen($str); //機器理解字符串長度
if($length > $all_len)
{
return $str;
}
for($i = 0;$i < $all_len;)
{
if($cur_len == $start)
{
break;
}
if (ord($str[$i]) > 127)
{
$i += 3;
}else{
$i += 1;
}
$cur_len ++;
}
$start_pos = $i;
$temp_pos = $cur_len;
for(;$cur_len - $temp_pos < $length;)
{
if($i >= $all_len)
break;
if (ord($str[$i]) > 127)
{
$i += 3;
}else{
$i += 1;
}
$cur_len ++;
}
$end_pos = $i;
return substr($str,$start_pos,$end_pos);
}
?>


其實,PHP原生就有多charset下字符截取方案,額,所以就是這個樣子...囧..
Multibyte String Functions函數(shù)族中,

string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] ) 用來字符串截取
int mb_strlen ( string $str [, string $encoding ] ) 返回字符串長度

上述就是小編為大家分享的怎么在PHP中對UTF8中文字符進行截斷了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI