php截取中文字符串的方法

我们在使用substr截取中文字符串经常输出结果为�;

因为substr函数原型为:string substr ( string $string , int $start [, int $length ] ),其中$length表示返回字节长度,而一个中文占两个字节,对于一个UTF-8的中文字符,会把它当做3个字节来处理

php给出一个函数mb_substr,然而这个函数并不是内置函数,打开php.ini中的extension=php_mbstring.dll这一项

另外一种方法编写函数去判断是否是中文然后进行截取

<?php
//中文字符串截取
function substr_UTF8($string,$sublen,$start=0,$code='UTF-8'){
 if($code=='UTF-8'){
  $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
  preg_match_all($pa,$string,$t_string);
  if(count($t_string[0])-$start > $sublen){
   return join('',array_slice($t_string[0],$start,$sublen))."...";
   //array_slice()在数组中根据条件取出一段值,参数(数组,开始位置,[长度])
  }else{
   return join('',array_slice($t_string[0],$start,$sublen));
  }
 }else{
  $start = $start*2;
  $sublen = $sublen*2;
  $strlen = strlen($string);
  $tmpstr = '';
  for($i=0;$i<$strlen;$i++){
   if($i>$start && $i<($start+$sublen)){
    if(ord(substr($string,$i,1))>129){
    //ord():返回字符串第一个字符的ASCII值
    //substr():返回字符串的一部分
     $tmpstr .= substr($string,$i,2);
    }else{
     $tmpstr .= substr($string,$i,1);
    }
   }
   if(ord(substr($string,$i,1))>129){
    $i++;
   }
   if(strlen($tmpstr)<$strlen){
    $tmpstr .= "...";
   }
  }
  return $tmpstr;
 }
}
$string ="顶置车顶起困境檲上盯协押畏奇才趄肯困楞右脚可爱有";
echo substr_zh($string,10,0,'gb2312');
?>

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://sulao.cn/post/268.html