我们在使用substr截取中文字符串经常输出结果为�;
因为substr函数原型为:string substr ( string $string , int $start [, int $length ] ),其中$length表示返回字节长度,而一个中文占两个字节,对于一个UTF-8的中文字符,会把它当做3个字节来处理
php给出一个函数mb_substr,然而这个函数并不是内置函数,打开php.ini中的extension=php_mbstring.dll这一项
另外一种方法编写函数去判断是否是中文然后进行截取
<?php //中文字符串截取 function substr_UTF8($string,$sublen,$start=0,$code='UTF-8'){ if($code=='UTF-8'){ $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/"; preg_match_all($pa,$string,$t_string); if(count($t_string[0])-$start > $sublen){ return join('',array_slice($t_string[0],$start,$sublen))."..."; //array_slice()在数组中根据条件取出一段值,参数(数组,开始位置,[长度]) }else{ return join('',array_slice($t_string[0],$start,$sublen)); } }else{ $start = $start*2; $sublen = $sublen*2; $strlen = strlen($string); $tmpstr = ''; for($i=0;$i<$strlen;$i++){ if($i>$start && $i<($start+$sublen)){ if(ord(substr($string,$i,1))>129){ //ord():返回字符串第一个字符的ASCII值 //substr():返回字符串的一部分 $tmpstr .= substr($string,$i,2); }else{ $tmpstr .= substr($string,$i,1); } } if(ord(substr($string,$i,1))>129){ $i++; } if(strlen($tmpstr)<$strlen){ $tmpstr .= "..."; } } return $tmpstr; } } $string ="顶置车顶起困境檲上盯协押畏奇才趄肯困楞右脚可爱有"; echo substr_zh($string,10,0,'gb2312'); ?>