PHP函数-字符长度与截取

不多说 直接贴代码:

$str = 'abcd一二efgh三四五ik';//10个字符加5个汉字
echo strlen($str),'<br/>'; //10+5*3 = 25 	一个字母占一个字节 一个汉字占三个字节
echo mb_strlen($str),'<br/>';//10+5 =15	一个字母占一个字节 一个汉字占一个字节
echo mb_strwidth($str),'<br/>';//10+5*2=20 一个字母占一个字节 一个汉字占两个字节
echo substr($str,4,10),'<br/>';//4+2*3 = 10 
echo mb_substr($str,5,10),'<br/>';//5+5 =10
echo mb_strimwidth($str,4,10),'<br/>';
echo mb_strimwidth($str,5,10),'<br/>';

输出结果

25
15
20
一二efgh
二efgh三四五ik
一二efgh三
二efgh三四

由以上结果可以看出:

1. strlen substr函数中一个汉字占三个字节

2.mb_strlen  mb_substr 函数中一个汉字占一个字节

3.mb_strwidth mb_strimwidth 函数中一个汉字占两个字节

注:看mb_strimwidth函数的第二个参数在给定4和5的时候 默认是一个汉字占一个字节的 这很特殊

abcd四个字节起始位置0是故“一”的起始位为4,按照一个汉字占两个字节 那么位置45则表示汉字“一”,显然再我第二次执行mb_strimwidth给参数5的时候 缺输出了”二“,很疑惑!!!按道理不是应该还是从“一”输出的吗???

新增一个中英混合的截取:

function cubstr($string, $beginIndex, $length){
			if(strlen($string) < $length){
				return substr($string, $beginIndex);
			}
			$char = ord($string[$beginIndex + $length - 1]);
			if($char >= 224 && $char <= 239){
			  $str = substr($string, $beginIndex, $length - 1);
			  return $str;
			}
			$char = ord($string[$beginIndex + $length - 2]);
			if($char >= 224 && $char <= 239){
				$str = substr($string, $beginIndex, $length - 2);
				return $str;
			}
			return substr($string, $beginIndex, $length);
		}


猜你喜欢

转载自blog.csdn.net/slyjit/article/details/72247637
今日推荐