我们在使用substr截取中文字符串经常输出结果为�;
因为substr函数原型为:string substr ( string $string , int $start [, int $length ] ),其中$length表示返回字节长度,而一个中文占两个字节,对于一个UTF-8的中文字符,会把它当做3个字节来处理
php给出一个函数mb_substr,然而这个函数并不是内置函数,打开php.ini中的extension=php_mbstring.dll这一项
另外一种方法编写函数去判断是否是中文然后进行截取
<?php
//中文字符串截取
function substr_UTF8($string,$sublen,$start=0,$code='UTF-8'){
if($code=='UTF-8'){
$pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
preg_match_all($pa,$string,$t_string);
if(count($t_string[0])-$start > $sublen){
return join('',array_slice($t_string[0],$start,$sublen))."...";
//array_slice()在数组中根据条件取出一段值,参数(数组,开始位置,[长度])
}else{
return join('',array_slice($t_string[0],$start,$sublen));
}
}else{
$start = $start*2;
$sublen = $sublen*2;
$strlen = strlen($string);
$tmpstr = '';
for($i=0;$i<$strlen;$i++){
if($i>$start && $i<($start+$sublen)){
if(ord(substr($string,$i,1))>129){
//ord():返回字符串第一个字符的ASCII值
//substr():返回字符串的一部分
$tmpstr .= substr($string,$i,2);
}else{
$tmpstr .= substr($string,$i,1);
}
}
if(ord(substr($string,$i,1))>129){
$i++;
}
if(strlen($tmpstr)<$strlen){
$tmpstr .= "...";
}
}
return $tmpstr;
}
}
$string ="顶置车顶起困境檲上盯协押畏奇才趄肯困楞右脚可爱有";
echo substr_zh($string,10,0,'gb2312');
?>
内容版权声明:除非注明,否则皆为本站原创文章。
转载注明出处:https://sulao.cn/post/266
相关阅读
- etcd集群异常节点重新加入集群
- linux下僵尸进程的查找和处理方法
- docker部署php以后追加编译扩展模块的方法
- docker-compose编排lnmp(nginx+php+mysql)环境
- Centos7下编译安装lnmp环境(nginx1.18.0+mysql5.7.44+php7.4.33)
- centos7上安装配置samba实现文件共享
- ThinkPHP5中raw的作用
- sqlalchemy使用vscode报错Instance of 'SQLAlchemy' has no 'Table' member的解决方法
- ThinkPHP使用Layui实现下拉加载
- Thinkphp5使用Layui实现文件异步上传的方法
评论列表