如何使用 Ruby 正则表达式捕获非英语单词？

发布于 2024-11-14 01:29:02 字数 139 浏览 3 评论 0原文

我正在尝试使用 Ruby 1.8.7 验证“单词”。

我目前捕获单词的正则表达式是：

/[a-zA-Z]\'*\-*/

这只会捕获英语单词；有没有办法捕获非英语 UTF-8 字符？

原文

I am trying to validate 'words' with Ruby 1.8.7.

My regex to catch a word is currently:

/[a-zA-Z]\'*\-*/

This will only catch English words; Is there a way to catch non-English UTF-8 characters?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

瑕疵 2024-11-21 01:29:02

即使 1.8.x 正则表达式引擎也支持 UTF-8，您只需要使用正确的表达式，它比仅使用 /\w/ 稍微多一点：

s = "résumé and some other words"
puts s[/[a-z]+/u]
puts s[/\w+/u]

您会得到：

r
résumé

Even the 1.8.x Regex engine is UTF-8 aware, you just need to use the right expression, and it's slightly more than just using /\w/:

s = "résumé and some other words"
puts s[/[a-z]+/u]
puts s[/\w+/u]

and you get:

r
résumé

回复收藏 0 原文

~没有更多了~

关于作者

彩虹直至黑白

暂无简介

文章

25 人气

关注发私信

饮湿

文章 0 评论 0

关注

明月

文章 0 评论 0

关注

02

文章 0 评论 0

关注

hs1283

文章 0 评论 0

关注

风向决定发型

文章 0 评论 0

关注

落花浅忆

文章 0 评论 0

友情链接

文江博客

如何使用 Ruby 正则表达式捕获非英语单词？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

饮湿

明月

02

hs1283

风向决定发型

落花浅忆

友情链接

如何使用 Ruby 正则表达式捕获非英语单词？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

饮湿

明月

02

hs1283

风向决定发型

落花浅忆

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。