php界iconv编码疑云!
输入 ?
$str=json_encode($str);
$str=preg_replace('#(\\\ud[0-9a-f]{3}|\\\u2(6|7)[0-9a-f]{2})#ie','addslashes("\\1")',$str);
$str=json_decode($str);
输出 \ud83d\udc38
那么 问题来了!!!
\ud83d\udc38
应该经过怎样的处理得到 🐸
下面是我写的处理,但是不能输出我想要的数值,iconv("UCS-2","UTF-8",pack("H4","\\1")) 不起作用有时得到乱码。
$str=preg_replace('#(\\\u[0-9a-f]{4}\\\u[0-9a-f]{4})#ie','iconv("UCS-2","UTF-8",pack("H4","\\1"))',$str);
更改mysql的数据类型这个方案不能考虑
我完整的需求是这样的:
1、我输入一段话 例如 “一二三四五上山打老虎?”,我在保存进mysql时,需要将?转换成能写进mysql的编码,但是“一二三四五上山打老虎”这部分我需要原文存进数据库,这里就需要对输入的文本进行的正则过滤,然后将?转码,其他正常符号中英文不转码。
2、从数据库输出数据时,我用正则匹配出?的转码,将其输出为?和(🐸
或0x1f438
),因为我在前端显示的静态的图片表示?,图片的来源于twitter的emoji库,图片的名称就是以1f438
命名的。
完整的需求就是这样的。求大神指点下。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
? 的unicode 是 0x1f438,无法用两字节的 UCS-2 编码,用 UCS-4 可以。
大概是这么个思路:
用mb,
iconv纯属扯淡
在线等 哼哼