如何用PHP匹配并替换iOS标准的emoji表情符号
遇到一个问题,要储存iOS键盘输出的emoji表情到MySQL,我知道用blob+utf8是可以存的。但是现在我的这张表已经太大了,不可能去改类型。所以就想把emoji表情匹配出来,替换掉,再存。
但是,iOS键盘输入的emoji表情,并不是标准的0xe001 - 0xe537这种,而是变化过的。
例如:第一个大笑的表情,标准emoji unicode是 0xe415 而iOS键盘输出的是 0xd83dxde04 两位。
我用preg_match() 去做匹配
preg_match('/\\x{d83d}\\x{de04}/', $str_with_emoji_emotion, $matches); var_dump($matches);
打印出来是个 NULL
求助各位大神,怎么才能匹配这种表情符号啊。。。
补充:我用 preg_match('/[\x{0000}-\x{FFFF}]/u', $str_with_emoji_emotion, $matches); 去匹配都匹配不到。。。我怀疑是这个表情符号的问题,继续研究。。。继续求解。。。
补充2:今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(5)
今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php
试试这个
其实已经有个开源转换程序了。
http://code.iamcal.com/php/emoji/
https://github.com/iamcal/php-emoji
希望这个能帮到你。
http://stackoverflow.com/questions/12807176/php-writing-a-simple-removeemoji-function#
参考这篇文章 http://www.bubuko.com/infodetail-1022211.html
里边推导了一个公式,可以把 0xd83d0xde04 转成 1f604 ,而 U+1F604 就是 Unified 编码的笑脸表情代码。
文中是 js 的函数,我提取出来了关键几行代码,转成 PHP 代码如下:
$h = 0xd83d; //高位
$l = 0xde04; //低位
$code = ($h - 0xD800) * 0x400 + 0x10000 + $l - 0xDC00; // 转换算法
echo "U+" . strtoupper(dechex($code));
//echo 结果是 U+1F604
另外不同编码方式的转换,@seeyoup 已经说了