如何使用 Ruby 正则表达式捕获非英语单词?
我正在尝试使用 Ruby 1.8.7 验证“单词”。
我目前捕获单词的正则表达式是:
/[a-zA-Z]\'*\-*/
这只会捕获英语单词;有没有办法捕获非英语 UTF-8 字符?
I am trying to validate 'words' with Ruby 1.8.7.
My regex to catch a word is currently:
/[a-zA-Z]\'*\-*/
This will only catch English words; Is there a way to catch non-English UTF-8 characters?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
即使 1.8.x 正则表达式引擎也支持 UTF-8,您只需要使用正确的表达式,它比仅使用
/\w/
稍微多一点:您会得到:
Even the 1.8.x Regex engine is UTF-8 aware, you just need to use the right expression, and it's slightly more than just using
/\w/
:and you get: