mb_detect_encoding()函数检测不准确。
我想通过mb_detect_encoding()
函数动态获取某个字符的编码集,再通过iconv进行编码转换,但是mb_detect_encoding()
判断的编码类型不准,导致iconv()
失效或乱码。
//片段
if (is_string($k)) {
$encoding = getEncoding($k);
$k = iconv($encoding, "utf-8", $k);
}
//获取编码集
function getEncoding($data)
{
return mb_detect_encoding($data, array("ASCII","GB2312","GBK",'BIG5','UTF-8'));
}
//测试
$k = "哈哈";
$encoding = getEncoding($k);
var_dump($encoding,$k);
$k = iconv($encoding, "utf-8", $k);
var_dump(getEncoding($k),$k);exit;
//输出:string(5) "CP936" string(6) "哈哈" string(5) "CP936" string(9) "鍝堝搱"
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
mb_detect_encoding — 检测字符的编码
可见第二个参数是非必填的, 如果省略了 $encoding_list 将会使用 mb_detect_order() 自动获取字符集, 所以可对代码做如下调整:
修改后的code
// 示例图
@蒋建勇
老哥,我不是要抬杠哈,比如我输入了一串英文,获取字符集结果为ASCII,然后通过iconv转成utf-8了,后面应该返回utf-8才对。为什么还是返回的ASCII呢?我是比较疑惑的这一点。