正则达式抓取所需数据

preg_match_all( [\x{4e00}-\x{9fa5}]*)/u', $str, $arr);

用此语句抓取文本中的中文字符时结果为乱码, 原因是编码问题引起, 在运行前需声明编码格式, header('content-type:text/html;charset=utf-8'), 并且要加修饰符u.    这样一来似乎用 .* 也能正常得到中文字符.

注意匹配换行符 \n ,    回车符 \r.

猜你喜欢

转载自blog.csdn.net/d429667292/article/details/80783899