ruby 1.8.7 中的正则表达式将检测 4 字节 Unicode 字符

发布于 2024-12-09 17:04:13 字数 255 浏览 4 评论 0原文

谁能告诉我如何在 ruby 1.8.7 中编写 ruby 正则表达式来检测 4 字节 unicode 字符（特别是表情符号）的存在？我正在尝试处理 mysql 默认情况下不这样做的事实，允许您存储 4 字节 emoji unicode 字符，现在 iOS 5 使用。

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

硬不硬你别怂 2024-12-16 17:04:13

这似乎与表示表情符号的四个字节中的前两个字节匹配。这是在 ruby 1.8.7 中运行的。

str.match(/\360\237/)

This appears to match the first two bytes of the four bytes that represent emoji. This is being run in ruby 1.8.7.

str.match(/\360\237/)

回复收藏 0 原文

白日梦 2024-12-16 17:04:13

使用非阻塞在线方法更改表可能是可行的，例如 Maatkit 的 online-schema-change： http://www.percona.com/doc/percona-toolkit/pt-online-schema-change.html

来自文档：

简而言之，该工具的工作原理是创建一个临时表，该表是
原始表格的副本（被更改的表格）。（临时
表不是像 CREATE TEMPORARY TABLE 那样创建的；我们称之为临时的
因为它最终取代了原始表。）临时表
表被更改，然后在原始表上定义触发器
捕获对其所做的更改并将其应用到临时表。这
保持两个表同步。然后所有行都从
原始表到临时表；这部分可能需要一段时间。什么时候
复制行后，使用 RENAME TABLE 交换两个表。
此时该表有两个副本：旧表
曾经是原始表，而新表曾经是
临时表，但现在与原始表同名。如果
指定 --drop-old-table ，则删除旧表。