中文匹配汉字多次失败
$str = '中国';
preg_match_all($pattern,$str,$out); //这个这则匹配汉字,很艰难
$pattern_1 = '/[[x80-xff]]/';
$pattern_2 = '/[x4e00-x9fa5]/';
print_r($out); //汉字部分都是乱码
编码格式是gbk,还是utf-8,都测试都无效.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
这个我已经解决了,还是感谢下,哈~
我后来查了下,相关版本 比如: [u4e00-u9fa5] [x{4e00}-x{9fa5}]/u ,关于正则匹配的问题涉及到编码问题,还是需要细细考虑下。
over。
php里面是这样的
这个函数是phpcms 2008 中的截取字符串的函数,写的有点多,所以我希望要找个正则匹配的,简单好维护,呵呵
这是一段匹配除了中文以外的字符串
http://regexpal.com/ 测试
http://unicodelookup.com (资料)